我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。
歡迎瀏覽我們的案例。
6月27日,高通公司AI產(chǎn)品技術(shù)中國區負責人萬(wàn)衛星在2024世界移動(dòng)通信大會(huì )(MWC上海)“人工智能領(lǐng)域的投資、創(chuàng )新與生態(tài)系統發(fā)展”主題會(huì )議上發(fā)表題為“終端側生成式AI的未來(lái)” 的演講。
萬(wàn)衛星表示,生成式AI的能力和用例正不斷豐富和擴展,高通通過(guò)其創(chuàng )新的SoC系統設計,憑借面向生成式AI全新設計的NPU和異構計算系統,為終端側AI規?;瘮U展提供了有力支持。
“生成式AI正在從云端遷移到邊緣云和終端側,未來(lái)端云協(xié)同的混合AI將推動(dòng)生成式AI的規?;瘮U展。通過(guò)在云和邊緣及終端側之間分配工作負載,我們提供更強大、更高效和高度優(yōu)化的體驗。”萬(wàn)衛星說(shuō),針對新的AI用例和工作負載,高通重新定義和設計了SoC,定義了一個(gè)專(zhuān)為AI而打造的SoC的系統,推出了高通AI引擎這個(gè)異構計算系統。高通AI引擎中包含CPU、GPU、NPU,以及超低功耗的高通傳感器中樞。
演講中,萬(wàn)衛星詳細介紹了高通SoC的異構計算系統如何滿(mǎn)足豐富的生成式AI用例的多樣化要求,包括對算力等各種KPI的要求。同時(shí),他還介紹了高算力、低功耗NPU的演進(jìn)路線(xiàn),以及如何利用第三代驍龍8移動(dòng)平臺率先實(shí)現多模態(tài)大模型的端側運行。
去年高通發(fā)布的第三代驍龍8移動(dòng)平臺,可以支持完整運行100億參數以上的模型。在A(yíng)I方面,特別是NPU與前代產(chǎn)品相比有哪些提升?據萬(wàn)衛星介紹,第一,利用微架構升級提供極致性能;第二,手機作為一個(gè)集成度非常高的產(chǎn)品,其功耗一直都是需要重點(diǎn)解決的問(wèn)題,因此高通為NPU設置了加速器專(zhuān)用電源,實(shí)現了更加出色的能效;同時(shí),高通還升級了微切片技術(shù),在算子深度融合層面充分釋放硬件算力和片上內存。除此之外,其他的提升和改進(jìn)還包括更大的帶寬、更高的主頻等,從而打造出擁有卓越AI性能和能效的SoC。
“從參數量級的角度來(lái)說(shuō),2024年及以后我們將有望看到更多100億參數以上的大模型在端側運行,并帶來(lái)較好的用戶(hù)體驗。”萬(wàn)衛星說(shuō)。
除提供手機SoC,高通也涉足汽車(chē)、PC、物聯(lián)網(wǎng)、XR等領(lǐng)域,高通AI軟件棧已經(jīng)賦能其所有產(chǎn)品線(xiàn)的絕大多數AI平臺。“這就意味著(zhù),我們的合作伙伴和開(kāi)發(fā)者朋友們,只要在高通的一個(gè)平臺上完成模型的部署,就可以非常方便地遷移到高通的其他產(chǎn)品線(xiàn)。”萬(wàn)衛星說(shuō)。
另?yè)f(wàn)衛星介紹,除了提供領(lǐng)先的硬件和靈活的軟件之外,高通也在構建AI生態(tài)系統,支持國內外廣泛的終端側生成式AI模型,持續推動(dòng)AI技術(shù)的發(fā)展和創(chuàng )新。
【責任編輯:周靖杰】