<mark id="qyzvb"><track id="qyzvb"></track></mark>
      <ins id="qyzvb"></ins>
    1. <code id="qyzvb"></code>
    2. <tr id="qyzvb"><nobr id="qyzvb"><ol id="qyzvb"></ol></nobr></tr>
      <output id="qyzvb"></output>
            展會信息港展會大全

            AI 工程師的崛起
            來源:互聯網   發布日期:2023-07-22 10:25:34   瀏覽:101740次  

            導讀:【 編者按: 大模型涌現的能力也催生新的工程師角色:遠遠超越提示工程師和軟件工程師。近期,IT博主 Shawn Wang發表了名為The Rise of the AI engineer (AI 工程師的崛起) 的文章,探討AI 工程師角色的興起,以及人工編程和大語言模型 (large languagemodel...

            編者按:大模型涌現的能力也催生新的工程師角色:遠遠超越提示工程師和軟件工程師。近期,IT博主 Shawn Wang發表了名為“The Rise of the AI engineer (AI 工程師的崛起)” 的文章,探討AI 工程師角色的興起,以及人工編程和大語言模型 (large languagemodel, LLM) 在軟件3.0應用中的重要性。文章指出,基礎大模型的新興能力、開源和API的可用性正推動AI工程師這個角色的崛起,使得AI應用能夠以前所未有的速度和效率解決各種問題。雖然提示工程曾被炒作,但其仍然是AI工程師工具中不可或缺的一部分。同時,AI的進步也促使AI工程師和其它工程師相互融合,直至將來無法區分。在這個充滿機遇和挑戰的時代,我們期待AI工程師的嶄新角色將推動技術創新和產業發展的飛速前進。

            我們正在目睹一次十年一遇的應用AI“向右轉移”,這得益于新興的能力和基礎模型的開源/API可用性。

            在2013年,許多AI任務需要五年時間和一個研究團隊才能完成,而在2023年,現在只需要API文檔和一個空閑的下午即可。

            AI 工程師的崛起

            API的界限是滲透性的 - AI工程師可以向左轉來調整/托管模型,而研究工程師也可以向右轉來在API之上構建。但是,它們的相對優勢和“主要領域”是清晰的。

            “從數量上來看,AI工程師的數量可能會遠遠超過機器學習工程師和大語言模型工程師的數量。在這個角色中,一個人可以非常成功,而無需進行任何訓練。” - Andrej Karpathy

            然而,細節決定成敗 - 在成功評估、應用和產品化AI方面,面臨著無盡的挑戰:

            模型:從評估最大的GPT-4和Claude模型,到最小的開源Huggingface、LLaMA和其他模型。

            工具:從最受歡迎的鏈式、檢索和向量搜索工具,如LangChain、LlamaIndex和Pinecone,到新興的自主智能體領域,如Auto-GPT和BabyAGI(Lilian Weng的必讀總結)。

            新聞:除此之外,每天發表的論文、模型和技術的數量隨著興趣和資金的增加呈指數級增長,以至于跟上這一切幾乎成了一份全職工作。

            我認真地對待這一點,我認為這是一份全職工作。我認為軟件工程將孕育出一個新的子學科,專門研究AI應用,并有效地利用新興技術棧,就像“站點可靠性工程師”、“開發運維工程師”、“數據工程師”和“分析工程師”一樣涌現出來。

            這個新興且最具吸引力的職位似乎是:AI工程師。

            我所了解的每個創業公司都有一些關于AI討論的Slack頻道。隨著Amplitude、Replit和Notion等公司的做法,這些頻道將從非正式的群組轉變為正式的團隊。成千上萬的軟件工程師正在致力于將AI API和開源模型投入生產,無論是在公司時間內還是在晚上和周末,在企業的Slack或獨立的Discord平臺上,他們將逐漸形成一個職稱AI工程師。這很可能會成為未來十年來需求最高的工程職位。

            AI工程師無處不在,從微軟和谷歌等大型公司,到Figma(通過Diagram收購)、Vercel(如HassanEl Mghari的病毒式RoomGPT)和Notion(如Ivan Zhao和Simon Last的Notion AI)等前沿創業公司,再到像Simon Willison、Pieter Levels(Photo/InteriorAI的創始人)和Riley Goodside(現在在Scale AI工作)這樣的獨立黑客。他們在Anthropic進行快速工程提示,可以獲得30萬美元/年的收入,在OpenAI構建軟件可以獲得90萬美元的收入。他們在AGI House度過閑暇的周末,分享/r/LocalLLaMA上的技巧。他們共同的特點是,他們將AI的進步轉化為實際產品,幾乎在一夜之間就被數百萬人使用。

            沒有一個博士學位出現在他們的履歷中。在推出AI產品時,你需要的是工程師,而不是研究人員。

            AI與ML工程師的對決

            我只是在提醒大家關注這一趨勢,而不是發起它。在Indeed網站上,ML工程師的職位數量是AI工程師職位數量的十倍,但“AI”領域的更高增長率使我預測這一比例將在5年內發生逆轉。

            AI 工程師的崛起

            每個月的工作趨勢每個正在招聘的HN

            所有職位名稱都有缺陷,但有些是有用的。我們對于關于AI和ML之間區別的無休止的語義爭論既謹慎又疲倦,我們也很清楚普通的“軟件工程師”角色完全有能力構建AI軟件。然而,最近在Ask HN(Hacker News的問答專欄)上發布的一個問題是如何進入AI工程師領域,這說明了在市場上仍然存在的根本看法:

            AI 工程師的崛起

            “如何進入AI工程”的最佳答案

            大多數人仍然將AI工程視為機器學習或數據工程的一種形式,因此他們推薦相同的先決條件。但是我向你保證,上面提到的高效AI工程師中沒有一個人完成了Andrew Ng在Coursera上的課程,也不知道PyTorch,也不知道數據湖和數據倉庫之間的區別。

            在不久的將來,沒有人會推薦通過閱讀《Attention is All You Need》來開始學習AI工程,就像你不會通過閱讀Ford Model T的設計圖來開始開車一樣。當然,理解基礎知識和歷史總是有幫助的,并且可以幫助你找到尚未為大眾所知的想法和提高效率/能力的方法。但有時候你可以簡單地使用產品,并通過經驗學習它們的特點。

            我并不希望這種課程的“轉變”會在一夜之間發生。人類天性就是希望填充簡歷,填寫市場地圖,并通過引用更深入的主題來脫穎而出。換句話說,提示工程和AI 工程在很長一段時間內會感覺比具有良好數據科學/機器學習背景的人要遜色。然而,我認為供需經濟學將占上風。

            為什么AI工程師現在開始崛起

            基礎模型是“少樣本學習者”,展現出上下文學習甚至零樣本遷移的能力,可以泛化到超越模型訓練者最初意圖的領域。換句話說,創建這些模型的人并不完全知道它們的能力。那些不是大語言模型(LLM)研究者的人,只需花更多時間與這些模型互動,并將它們應用于研究所低估的領域(例如Jasper在文案撰寫方面),就能找到并利用它們的能力。

            微軟、谷歌、Meta和大型基礎模型實驗室已經壟斷了稀缺的研究人才,實際上提供了“AI研究即服務”的API。你不能雇傭他們,但你可以租用他們如果你有懂得如何與他們合作的軟件工程師。全球大約有5000名LLM研究者,但有約5000萬名軟件工程師。供應限制決定了一個“中間”類別的AI工程師將會崛起來滿足需求。

            GPU囤積。當然,OpenAI/微軟是第一批,但StabilityAI通過強調他們擁有4000個GPU的集群,開啟了初創公司之間的GPU競爭。

            AI 工程師的崛起

            還記得2022年10月嗎?

            從那時起,新的初創公司,如Inflection(13億美元)、Mistral(1.13億美元)、Reka(5800萬美元)、Poolside(2600萬美元)和Contextual(2000萬美元),都普遍獲得了巨額的種子輪融資,以擁有自己的硬件。甚至Dan Gross和Nat Friedman也宣布了他們的100億美元的Andromeda GPU集群,專門為他們投資的初創公司而設。全球芯片短缺的問題還在不斷加劇。在API線的另一側,AI工程師將有更多的能力來使用模型,而不僅僅是訓練它們。

            “先點火,然后準備,再瞄準”,與其在訓練一個特定領域的模型并投入生產之前,要求數據科學家/機器學習工程師進行費時的數據收集工作,產品經理/軟件工程師可以向LLM發出提示,構建/驗證產品創意,然后再獲取特定的數據進行微調。

            (注:“先點火,然后準備,再瞄準” 是英語俚語,指的是先行動再考慮后果。作者在此使用這個俚語暗示AI工程師們能夠更迅速地進行實際應用,而無需過多的數據預處理和訓練。)

            假設后者的數量比前者多100到1000倍,而通過提示LLM原型的“先點火,然后準備,再瞄準”的工作流程使您能夠比傳統的ML快10到100倍。因此,AI工程師將能夠以1,000到10,000倍更便宜的成本驗證AI產品。這就像瀑布流(Waterfall)和敏捷開發(Agile)的較量一樣,AI就是敏捷的。

            Python →JavaScript。數據/AI傳統上是極度依賴Python的,而且最早的AI工程工具,如LangChain、LlamaIndex和Guardrails,都是出自同一社區。然而,至少有與Python開發者一樣多的JavaScript開發者,因此現在工具正在越來越多地迎合這個廣泛擴展的受眾,從LangChain.js和Transformers.js到Vercel的新AI SDK。這意味著總地址市場(TAM)的擴張和機會是巨大的。

            生成AI vs分類器ML。“生成AI”作為一個術語已經不再受歡迎,讓位于其他類比,如“推理引擎”,但在簡明地闡述現有一組MLOps工具和ML從業者之間的區別時仍然有用。而AI工程師則使用LLMs和文本到圖像生成器,并且他們正在構建寫作應用程序、個性化學習工具、自然語言電子表格和類似Factorio的可視化編程語言,與現有一代的ML可能更關注欺詐風險、推薦系統、異常檢測和特征存儲不同。

            每當出現一個完全不同背景、使用不同語言、生產完全不同產品、使用完全不同工具的子群體時,它們最終都會分成自己的小組。

            1+2=3:從軟件2.0到軟件3.0演進中的代碼角色

            6年前,Andrej Karpathy撰寫了一篇非常有影響力的文章,描述了“軟件2.0” - 將精確建模邏輯的“經典棧”手工編碼編程語言與“機器學習”神經網絡的新棧進行對比,后者近似邏輯,使軟件能夠解決比人類能夠建模的問題更多。今年,他繼續指出,最熱門的新編程語言是英語,最終填補了他在原始文章中留下未標記的灰色區域。

            AI 工程師的崛起

            更新:Karpathy回應了!有一些不同意見!

            去年,提示工程成為了一種基本概念,描述了人們開始利用GPT-3和Stable Diffusion的工作方式將如何改變。人們嘲笑AI初創公司為“OpenAI封裝器”,并擔心LLM應用程序容易受到提示注入和反向提示工程的影響。沒有堡壘可以找到?

            但2023年最重要的主題之一是重新建立人工編寫代碼的作用,用以編排和取代LLM的功能。從超過2億美元的龐然大物Langchain,到由Nvidia支持的Voyager,顯示了代碼生成和重用的不可置疑的重要性(我最近參加了與Harrison舉行的鏈式應用與自主智能體的網絡研討會,在那里我擴展了代碼核心與LLM核心應用的論點)。

            AI 工程師的崛起

            主要的架構劃分:“智能之上的軟件”vs“智能軟件”

            提示工程既被過度炒作又穩定存在,但在軟件3.0應用中重新出現的軟件1.0范式既是一個巨大的機遇/混亂領域,也為一大批初創公司創造了白色空間:

            AI 工程師的崛起

            如果你不能記住這個地圖,你還算VC嗎?

            當然,這不僅僅是人工編寫的代碼。我最近與smol-developer、更大范圍的gpt-engineer以及其他代碼生成智能體如Codium AI、Codegen.ai和Morph/Rift的合作將越來越成為AI工程師工具包的一部分。隨著人類工程師學會駕馭AI,AI也將越來越多地進行工程工作,直到一個遙遠的未來,我們將在某一天抬頭望去,再也無法區分它們的區別。

            贊助本站

            人工智能實驗室
            相關內容
            AiLab云推薦
            展開

            熱門欄目HotCates

            Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯系我們 | 廣告服務 | 公司動態 | 免責聲明 | 隱私條款 | 工作機會 | 展會港
            台湾佬电影网_台湾佬影院_免费电影在线看
            <mark id="qyzvb"><track id="qyzvb"></track></mark>
              <ins id="qyzvb"></ins>
            1. <code id="qyzvb"></code>
            2. <tr id="qyzvb"><nobr id="qyzvb"><ol id="qyzvb"></ol></nobr></tr>
              <output id="qyzvb"></output>