封面:WOMBO AI 生成
CyberDaily:
阿西莫機器人三大定律,可能還要增加多幾條才行。
微軟在AI上一路狂飆,前新Bing植入ChatGPT挑戰谷歌老大哥,后整合自家軟件體系ChatGPT化,現在他們想要讓ChatGPT有一個“物理身體”,機器覺醒?以后,我們都會有一個ChatGPT機器人。
2月20日,微軟在其官網發布了一篇技術文章,ChatGPT操控機器人的設計規劃。通俗來說,未來企業或人們可以通過ChatGPT來控制各種機器人。
根據文章介紹,微軟將ChatGPT的功能應用到機器人領域,并使用語言直觀地控制了多個平臺,如機械臂、無人機和家庭助手機器人。(文字太多,先看視頻)
來源:https://www.microsoft.com/en-us/research/group/autonomous-systems-group-robotics/articles/chatgpt-for-robotics/
比如說,你是否曾經想過用自己的語言告訴機器人該做什么,就像對人說話一樣?你是否希望只需告訴家庭助手機器人:“請幫我加熱午餐”,就可以讓它自己找到微波爐?盡管語言是我們表達意圖最直觀的方式,但目前我們仍然嚴重依賴手寫代碼來控制機器人。而微軟團隊一直在探索如何改變這種現實,使用OpenAI的新AI語言模型ChatGPT實現自然的人機交互。
ChatGPT是一個基于大量文本和人類交互訓練的語言模型,可以生成一系列連貫和語法正確的回答,以回答各種提示和問題。微軟的目標是看看ChatGPT是否可以超越文本,思考物理世界以幫助機器人完成任務。他們希望幫助人們更輕松地與機器人交互,無需學習復雜的編程語言或機器人系統的詳細信息。
這里的關鍵挑戰是如何教授ChatGPT如何考慮物理定律、操作環境的上下文以及機器人的物理動作如何改變世界的狀態。
事實證明,ChatGPT可以自己做很多事情,但它仍然需要一些幫助。微軟在技術論文描述了一系列設計原則,可用于指導語言模型解決機器人任務。來看看,ChatGPT是如何控制機器人的。
根據研究文章的介紹,當前的機器人流程始于需要將任務要求轉換為系統代碼的工程師或技術用戶。工程師處于“in the loop”的狀態,這意味著他們需要編寫新的代碼和規范來糾正機器人的行為?傮w而言,這個過程是緩慢的(用戶需要編寫低級代碼)、昂貴的(需要深入了解機器人的高技能用戶)和低效的(需要多次交互才能正常工作)。
ChatGPT開啟了新的機器人范式,允許(潛在的非技術性)用戶坐在“on the loop”上,為大型語言模型(LLM)提供高級反饋,同時監控機器人的性能。通過遵循我們的一套設計原則,ChatGPT可以生成用于機器人場景的代碼。在沒有任何微調的情況下,微軟可以利用LLM的知識控制了不同機器人形態的不同任務。
在我們的工作中,微軟展示了ChatGPT解決機器人難題的多個示例,以及在操作、空中和導航領域中進行的復雜機器人部署。
ChatGPT眼中的機器人
提示LLM是一門高度經驗主義的科學。通過不斷試錯,微軟建立了一種方法論和一套用于編寫機器人任務提示的設計原則,幫助人們用ChatGPT更好操控機器人:
首先,微軟定義一組高級機器人API或函數庫。這個庫可以特定于特定的機器人,并應該映射到機器人控制堆;蚋兄獛熘鞋F有的低級實現。對于高級API,使用描述性名稱非常重要,以便ChatGPT可以推斷其行為。
接下來,我們為ChatGPT編寫一個文本提示,描述任務目標,同時明確指出高級庫中可用的函數。提示還可以包含有關任務約束的信息,或者ChatGPT應如何形成其答案(特定的編碼語言,使用輔助解析元素);
用戶保持在循環中,通過直接檢查或使用模擬器來評估ChatGPT的代碼輸出。如有需要,用戶可以使用自然語言向ChatGPT提供有關答案質量和安全性的反潰
當用戶對解決方案感到滿意時,可以將最終代碼部署到機器人上。
但是還不完善,仍需要更全面的提示系統
良好的提示工程對于LLM(如ChatGPT)在機器人任務中的成功至關重要,F在來看,提示是一門經驗主義科學,缺乏全面且易于訪問的資源,其中包含有關不同機器人類別的良好(和不良)示例,以幫助領域內的研究人員和愛好者。為了填補這一空白,微軟提供了一個 叫PromptCraft 的協作開源平臺,任何人都可以在其中共享不同機器人類別的提示策略案例,以豐富整個提升庫。目前,微軟提供了本研究中使用的所有提示好和對話,給到公眾使用(https://github.com/microsoft/PromptCraft-Robotics)
除了提示設計外,微軟還希望增加包括多個機器人模擬器和接口,以允許用戶測試其ChatGPT生成的算法。
微軟將機器人技術帶出實驗室走向世界,而不是毀滅世界
微軟發布這項技術研究,目的是讓更多人低成本的接觸到機器人技術,并且更好地使用它。但是,這一研究發布后,也引起了不少人的恐慌,比如西部世界、天終結者,機械公敵...科幻電影的場景,就要走入了現實。
但是,微軟堅信基于語言的機器人交互控制,是將機器人技術帶出科學實驗室并進入大眾生活的基矗
也就是說,微軟再次確實強調,ChatGPT 的輸出不應該在未經仔細分析的情況下就直接部署在機器人上。他們鼓勵用戶利用模擬的力量,以便在潛在的現實生活部署之前評估這些算法,并始終采取必要的安全預防措施。
因此,微軟希望借助“ChatGPT控制機器人”的方式能激發未來的大部分工作,讓人們從繁忙勞作中解放,去花更多時間享受世界,陪伴家人。
參考文獻:https://www.microsoft.com/en-us/research/group/autonomous-systems-group-robotics/articles/chatgpt-for-robotics/