<mark id="qyzvb"><track id="qyzvb"></track></mark>
      <ins id="qyzvb"></ins>
    1. <code id="qyzvb"></code>
    2. <tr id="qyzvb"><nobr id="qyzvb"><ol id="qyzvb"></ol></nobr></tr>
      <output id="qyzvb"></output>
            展會信息港展會大全

            【芯視野】后ChatGPT時代,AI芯片如何繼往開來
            來源:互聯網   發布日期:2023-02-27 09:40:59   瀏覽:5886次  

            導讀:集微網消息:英偉達是否低估了芯片危機? 2022年9月,《經濟學人》雜志向黃仁勛發出了這樣的質疑,彼時的英偉達,正被加密貨幣泡沫破裂、高端GPU出口遭限等事件連番打擊,股價創下兩年新低,市值距離2021年末的高點已蒸發逾60%。 雜志記者略顯刻薄地評論道:...

            集微網消息:“英偉達是否低估了芯片危機?”

            2022年9月,《經濟學人》雜志向黃仁勛發出了這樣的質疑,彼時的英偉達,正被加密貨幣泡沫破裂、高端GPU出口遭限等事件連番打擊,股價創下兩年新低,市值距離2021年末的高點已蒸發逾60%。

            雜志記者略顯刻薄地評論道:“當他透過眼鏡打量他覺得會改變AI面貌的花哨新模型,以及像元宇宙這樣更模糊的概念,他是否存在低估此時此地殘酷性的危險?”

            一百多天后如火如荼的ChatGPT熱潮下,黃仁勛在加州大學伯克利分校喊出“這是人工智能的iPhone時刻”,一吐胸中塊壘。

            的確,ChatGPT既是熱度空前的“殺手應用”,也為英偉達股價注入強心劑,伴隨去年末ChatGPT熱度起勢,英偉達在幾家大芯片巨頭中,也走出了久違的領漲表現,同期在外圍市場,但凡能編織出“ChatGPT與我的故事”,不少芯片企業也獲得了投資者的追捧。

            不過在短暫的集體狂歡后,“ChatGPT概念”也必將分化,各路企業描繪的新藍圖成色幾何,需要一把技術的標尺加以衡量。

            垂直一體化模式的松動

            毋庸置疑,ChatGPT遠超前輩AlphaGo的熱度,已經像火炬般清晰照亮了大模型應用前景。然而回顧iPhone當年橫空出世之時,不少外界觀察者仍習慣以現有廠商格局線性外推,認為蘋果公司探明的“新大陸”,最終仍將是諾基亞囊中之物。

            在“人工智能的iPhone時刻”后,AI產業新機遇,同樣并非理所當然應許給舊玩家。

            值得指出的是,從0到1完成復現乃至超越ChatGPT實際體驗的大模型,對許多團隊而言面臨工程能力和經濟成本的雙重約束。

            從工程能力要求看,大型語言模型(LLM)參數量短短幾年從億級邁入千億級,對算力需求已遠超處理器性能迭代速度,分布式并行計算也因此進入“深水區”,易并行(embarrassingly parallel)方法撞上天花板,必須開發子計算任務與處理器之間更為復雜的調度方法,相關人才目前十分稀缺。

            而在經濟成本上,以ChatGPT的“母體”GPT-3模型為例,據稱如使用英偉達V100 GPU集群訓練一次,不考慮調參排故的理論最低成本也將達到460萬美元,微軟公司專門為其開發者OpenAI打造的超算系統據稱擁有超過28萬個CPU內核和1萬個GPU,整體性能可以達到2020年時全球TOP500超級計算機榜單前五,如果這一宣傳基本屬實,則相當于OpenAI在用一套完整的天河2號超算系統專門支撐其模型訓練,這對大多數企業而言無疑太過奢侈。

            以此觀之,人工智能廠商目前從數據、算法到AI芯片、硬件終端、項目實施的端到端垂直一體化模式,未來或將走向更明晰的專業分工,少數擁有巨型算力集群的科技巨頭在云端進行大規模預訓練模型迭代,并將接口開放給下游廠商、開發者,產業鏈下游則基于領域特定知識在邊側、端側以更低代價、更短周期完成模型精調,實現對垂直應用場景的高可用交付。

            面對呼之欲出的“范式轉變”,對大多數新老廠商而言,比起搶發“我司也有類似模型開發中”的新聞,更重要的工作,恐怕是對如何挖掘特定場景商業價值深思熟慮。

            針對該話題的采訪中,思必馳研發總監樊帥指出,“從現實來講,平臺巨頭企業在研發投入、團隊投入等方面擁有優勢,這是毋庸置疑的”。不過隨著ChatGPT的應用延伸,上下游企業都將在產業鏈關鍵環節做出貢獻,對于下游廠商而言,“探索類GPT產品的市場應用,實現技術的商業價值是企業關注的重點,無論是產品工具還是產品方案,挖掘潛力場景,進行技術融合,輸出整體性、結果導向性的實用解決方案才是現實問題。”

            作為國內專業的對話式人工智能平臺型公司,思必馳在類GPT模型的應用落地上也有頗多洞察。

            樊帥表示,現在ChatGPT是以文本交互機器人的形式呈現,這種文本生成的方式其實有很大的應用空間,比如在智能客服方向,現在的智能客服是檢索式AI,但是生成式AI主動性更高,更具親和力和有效性。不論是搜索引擎、電商客服還是AI輔助生成,ChatGPT應用級創新能力很強。

            樊帥預測,在需要基于一定背景知識的創作型產業,以及剛需AIGC的場景、具有SOP(標準作業程序)的行業,比如智能寫作、智能客服、文檔管理、代碼生成、甚至游戲NPC等,是ChatGPT適宜落地的土壤。大模型技術可通過強化上下文理解能力、思維鏈推理、增強指令學習,來實現場景的融合應用。例如,在會議場景下,根據上千字的會議記錄,工具可以迅速根據需求指令,整理出會議綱要及重點,清晰列出待辦事項。

            進一步具體到語音交互領域,樊帥認為,“未來往語音對話機器人去進階,強化語音、文本、圖像等深度融合的多模態交互技術應用,應對復雜場景的變化。這些都給大家留下思考、應用和探索的空間。思必馳聚焦對話技術,從對話能力輸出上來看,具備情感化、高度擬人化的語音TTS存在發展潛力”,他還介紹稱,思必馳在這一方向上已進行了探索,推出過具有“高興、撒嬌、抱歉”情感的語音合成技術,應用在有聲閱讀、智能客服、語音助手、視頻配音等行業場景,能夠滿足更接近真人情感化表達的語音效果。

            AI芯片路線之辨

            正如上文所述,類GPT大模型的開發極度依賴于算力支撐,隨著大模型參數量從百億、千億向萬億演進,新的人工智能產業競爭將進一步向算力環節聚焦,與此同時,上下游推理、訓練工作負載的需求差異將越來越顯著,也對芯片技術演進帶來了新的牽引。

            圍繞這一議題,集微網采訪了國內通用GPU領域產業化步伐領先的天數智芯半導體有限公司(簡稱天數智芯),該公司是國內首家實現通用GPU產品量產及規模應用的廠商,其天垓100產品目前已支撐近百個客戶應用,產品涵蓋數百個人工智能模型的訓練業務場景。

            天數智芯產品線總裁鄒分析,ChatGPT背后的GPT3.5是一種顛覆性的底層技術,其驚艷的應用效果建立在巨量語料庫以及超大規模的AI算力基礎之上。隨著應用場景的演進, 核心技術會加速發展,包括AI模型的復雜度還會不斷演進, 這將產生對算力的產生井噴需求。

            國內頂尖的企業和機構正在進行ChatGPT相關的技術研究及商用級產品開發。面對國內應用環境及中文語料,相關算法及模型預計將在未來1年左右逐步成熟。在互聯網入口,家庭接入設備,辦公等各不同領域,針對不同的場景可能會有不同的算法及產品出現,而支撐這些模型的算力底座需要具有良好的通用性及擴展性,才能夠快速的支持這些變化的需求,實現商業的可持續化演化。

            鄒表示,未來繼續看好通用GPU架構訓練產品的發展空間,其通用性、兼容性、以及生態成熟度仍是未來一段時間內人工智能算法及應用構建的主要支撐。

            與云側對通用性、擴展性的需求相比,

            在邊側、端側,推理芯片面對的需求則有所差異。

            思必馳研發總監樊帥表示,AI專用芯片可以在側重于場景化的端側實現特定場景低能耗,高算力,從定制化來看,ASIC專用AI芯片從效率角度更具優勢,隨著大模型的普及及應用,能夠提升相關芯片產品的性價比。

            與此同時,由于數據量的急劇提升,無論在云側還是端側,對于數據的隱私保護也提出了更高要求。樊帥強調,為了保證AI的良序發展,我們的確需要去嵌入一些相應的限制手段和規則約束;贏I的應用和其他衍生的工具級產品,在隱私安全、知識產權風險等方面亟待規范。

            鄒也談到,在近期的客戶交流中能夠感受到各界對ChatGPT的關注及開發態度,希望其成為效率提升的有效工具。不過用戶也有對數據隱私的擔憂,未來隨應用擴展,亟需提供隱私計算的技術方案,實現“可用不可見“的計算方式,這也要求更強及更通用的算力支撐。

            值得一提的是,對于大模型訓練芯片,特斯拉、Cerepas等海外廠商正試圖探索另一條前無古人的道路通過設計等效超算集群的單個處理器訓練大模型,完全繞過分布式并行計算的調度瓶頸。

            特斯拉近期公布的Dojo D1自研AI芯片,就是將25個裸片通過硅中介層互聯,構成單塊“Dojo Training Tile”,更為激進的Cerepas,則推出了面積達462平方厘米的WSE-2處理器,聲稱具有85萬個用于張量運算的可編程內核,單張WSE-2支撐的CS-2機柜,據稱最多可支撐萬億參數規模的大模型訓練。

            鄒表示,新興技術是針對目標問題的探索,會呈現出百花齊放的局面,在開放環境下競爭將驅使其收斂,市場是最終檢測的試金石。在技術發展路線上需要從各個方向去嘗試,最終都是為產業的發展貢獻自己的力量。

            結語

            “人工智能的iPhone時刻”,的確代表了許多人對ChatGPT熱潮的感受,全球公眾與行業機構被“卷入”其中的速度,已經清晰昭示出未來更多、更大應用創新沿著這一方向噴薄而出的圖景。

            在警惕短期過度炒作和跟風的同時,類GPT模型對人工智能商業模式和產業格局帶來的長期影響,亟需相關廠商冷靜觀察,沉著應付,有所作為。

            贊助本站

            人工智能實驗室
            AiLab云推薦
            展開

            熱門欄目HotCates

            Copyright © 2010-2023 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯系我們 | 廣告服務 | 公司動態 | 免責聲明 | 隱私條款 | 工作機會 | 展會港