Figure“人形GPT”首发:OpenAI大模型加持 已进厂测试

更新 發佈閱讀 4 分鐘

当地时间3月14日,明星初创公司Figure发布了首个接入了OpenAI大模型的机器人demo——Figure 01,这也是该公司与OpenAI合作增强人形机器人能力的首批成果。

虽只用到了一个神经网络,但官方发布的一系列视频显示,Figure 01能够与人类进行对话交互,理解并执行人类指令,整套操作动作十分流畅。

vocus|新世代的創作平台

上个月,Figure刚刚获得了来自OpenAI、微软、英伟达等约6.75亿美元的投资,用于开发为重复且危险的仓库及零售等工作提供劳动力补充的人形机器人,公司估值飙升至26亿美元。

同时,该公司还与OpenAI签订了合作协议——将多模态大模型(VLM)的能力扩展到机器人的感知、推理和交互上,即“具身智能”

如今Figure 01的正式发布,距其刚刚完成的B轮融资仅仅过去了13天

Figure 01视频演示

根据Figure发布的视频,Figure 01可以流畅地执行递苹果、将垃圾收拾进筐里、将杯盘归置在沥水架上等操作。

vocus|新世代的創作平台

重要的是,Figure 01的大部分举动和回答都基于提问者的一些开放性问题和要求,透过自己的逻辑思考得出了解决方案,这意味着它能对话、能思考、能学习,比一般的机器人更像“人”。

vocus|新世代的創作平台

在视频的开头,Figure声明该机器人的行为均基于语音的逻辑推理,并使用端到端神经网络,且全程一镜到底拍摄,并无任何加速或剪辑。

vocus|新世代的創作平台

Figure创始人Brett Adcock也在推文中强调,Figure 01的所有行为都是通过学习获得的,并无任何远程操作,且机器人的速度较之前有显著提升,正逐步贴近人类的速度。

Figure 01”最强大脑“

官方表示,Fugure 01是世界上首个在商业上可行的通用人形机器人。机器人身高5英尺6英寸(约1.68米),体重60千克,可实现20千克的有效载重,续航5小时,每秒可移动1.2米。

vocus|新世代的創作平台

在Figure 01中,OpenAI大模型提供了高级视觉和语言智能功能,Figure的神经网络则支持快速、低级且灵巧的机器人动作。

本月初,Figure宣布将基于OpenAI最新的GPT模型开发下一代人形机器人的AI模型,并专门训练Figure收集的机器人动作数据,以便其人形机器人可以与人交谈,看到东西并执行复杂任务。

成品视频发布后,Figure 01高级AI工程师Corey Lynch在X上细述了其运行的技术原理:Figure 01可以描述其视觉体验、规划未来行动、反思自己的记忆并口头陈述推理过程。

vocus|新世代的創作平台

具体来说,该机器人的语音能力基于“文本——语音”的大模型。Figure AI将机器人摄像头拍摄的图像和麦克风捕获的语音转录为文本,一并输入OpenAI训练的多模态模型中,实现对图像与文本的同时理解。之后,该模型将对所有信息打包处理,从文本生成语言响应。

执行环节,同一个模型负责决定以哪种内化的闭环行为对给定指令作出响应,将特定的神经网络权重加载到GPU(图形处理器)来执行相应的策略。

vocus|新世代的創作平台

Brett Adcock也在X中提到,Figure整合了Figure 01的所有关键组成部分,如电机、中间件操作系统、传感器、机械结构等,均由Figure工程师设计。

未来已来:具身智能落地

英伟达创始人兼CEO黄仁勋曾表示:”具身智能将引领下一波AI浪潮。“

Figure成立于2022年,在与OpenAI合作之前,该公司就已在AI方面收获颇丰。当时Brett Adcock就已透露,Figure将在未来的1-2年内专注于开发涵盖AI系统、低级控制等功能的人形机器人。

2024年1月,Figure 01通过引入端到端神经网络,实现自行纠错,在10个小时的训练后学会了做咖啡;2月,Figure 01就已在仓库中执行搬运任务,拥有自主导航、识别物体和为任务优先级排序的能力,但速度只有人类的16.7%。

vocus|新世代的創作平台

除此之外,Figure也积极尝试向场景落地的转化。近期,Figure与宝马公司签署了意向商业协议,欲将通用机器人部署至汽车制造环节,Figure 01也已开始在美国南卡罗来纳州的一家工厂中接受测试。

尽管许多AI研究者认为通用机器人的普及还需数十年,但机器人专家Eric Jang提醒道:“别忘了,ChatGPT的诞生仿几乎就在一夜之间。”

OpenAI大模型加持下的Figure 01可能会有更高的价格,但Figure方面尚未透露任何相关信息,但Brett Adcock曾对Figure 01的适当降价表明了乐观态度。

#OpenAI##人工智能##ChatGPT#

留言
avatar-img
Stefan Lee的沙龍
0會員
152內容數
Stefan Lee的沙龍的其他內容
2024/12/23
12月16日,在上周五大涨24.4%,创下单日最大涨幅纪录后,博通公司(Broadcom Inc.)周一继续上扬11.2%。根据道琼斯统计,博通周五的涨幅为公司创造了2,060 亿美元的市值收益,排名历史第六。目前,该股有望创下有史以来最佳的月度表现——12月至今的涨幅已经超过了50%。 博通上涨
2024/12/23
12月16日,在上周五大涨24.4%,创下单日最大涨幅纪录后,博通公司(Broadcom Inc.)周一继续上扬11.2%。根据道琼斯统计,博通周五的涨幅为公司创造了2,060 亿美元的市值收益,排名历史第六。目前,该股有望创下有史以来最佳的月度表现——12月至今的涨幅已经超过了50%。 博通上涨
2024/12/06
刚进入12月,法国政府就爆出大雷。 12月2日,法国总理巴尼耶打算绕过议会,强行批准不受欢迎的预算法案,导致极右翼国民联盟和左翼政党均威胁启动不信任投票,法国政府解散几成定局。 起因为何? 今年10月,法国总理巴尼耶在一次部长级会议上提出了2025年的预算草案。该草案的目标是通过削减约400亿
2024/12/06
刚进入12月,法国政府就爆出大雷。 12月2日,法国总理巴尼耶打算绕过议会,强行批准不受欢迎的预算法案,导致极右翼国民联盟和左翼政党均威胁启动不信任投票,法国政府解散几成定局。 起因为何? 今年10月,法国总理巴尼耶在一次部长级会议上提出了2025年的预算草案。该草案的目标是通过削减约400亿
2024/11/13
日元汇率自 7 月份以来首次跌破1美元兑155日元,这增加了日本将进入货币市场试图减缓贬值的风险。 在唐纳德·特朗普(Donald Trump)再次当选美国总统后,日元兑美元汇率下跌了0.3%,至155.04。国债收益率的飙升对日元构成了压力,两年期国债收益率达到了7月份以来的最高水平。 日元汇
2024/11/13
日元汇率自 7 月份以来首次跌破1美元兑155日元,这增加了日本将进入货币市场试图减缓贬值的风险。 在唐纳德·特朗普(Donald Trump)再次当选美国总统后,日元兑美元汇率下跌了0.3%,至155.04。国债收益率的飙升对日元构成了压力,两年期国债收益率达到了7月份以来的最高水平。 日元汇
看更多
你可能也想看
Thumbnail
科幻電影描繪的場景即將成真?AI機器人問世?
Thumbnail
科幻電影描繪的場景即將成真?AI機器人問世?
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
一家名為Figure的新創公司於本週三發布了一段令人印象深刻的影片,展示了他們與OpenAI合作後的最新成果。在這段影片中,名為Figure 01的人形機器人展示了與人類的交流能力和任務執行能力。 影片中,Figure 01機器人被要求執行各種任務,例如回應一般性的指令,如提供食物或清理垃圾。
Thumbnail
一家名為Figure的新創公司於本週三發布了一段令人印象深刻的影片,展示了他們與OpenAI合作後的最新成果。在這段影片中,名為Figure 01的人形機器人展示了與人類的交流能力和任務執行能力。 影片中,Figure 01機器人被要求執行各種任務,例如回應一般性的指令,如提供食物或清理垃圾。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
生成式AI對話機器人產業市場預計在2030年達到36.2億美元。目前醫療保健、製造業、零售業與金融相關組織是採用生成式AI對話機器人的領先產業。文章介紹利用AI對話機器人(GeniAltX)能幫助個人及企業提升效率的情境與案例。企業正利用AI打造對話機器人,成為客戶服務或企業內部助理的關鍵角色。
Thumbnail
生成式AI對話機器人產業市場預計在2030年達到36.2億美元。目前醫療保健、製造業、零售業與金融相關組織是採用生成式AI對話機器人的領先產業。文章介紹利用AI對話機器人(GeniAltX)能幫助個人及企業提升效率的情境與案例。企業正利用AI打造對話機器人,成為客戶服務或企業內部助理的關鍵角色。
Thumbnail
這篇文章總結了各種類型的機器人,包括人形機器人、機器狗、家用機器人和聊天機器人。同時,也提到了一些討論點和機器人可能的未來方向。
Thumbnail
這篇文章總結了各種類型的機器人,包括人形機器人、機器狗、家用機器人和聊天機器人。同時,也提到了一些討論點和機器人可能的未來方向。
Thumbnail
DeepAI 提供「聊天機器人」及「生成圖像」兩種服務,不用註冊就可以免費使用,聊天機器人有多種角色做選擇,能為你的創作和思考過程帶來新的靈感;至於圖像生成功能,也提供多種風格供你選擇,讓你每次生成的圖像都有不同的風格和特色。
Thumbnail
DeepAI 提供「聊天機器人」及「生成圖像」兩種服務,不用註冊就可以免費使用,聊天機器人有多種角色做選擇,能為你的創作和思考過程帶來新的靈感;至於圖像生成功能,也提供多種風格供你選擇,讓你每次生成的圖像都有不同的風格和特色。
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
什麼是 AI? Artificial Intellgent ㄧ個數位大腦 電腦新物種 模擬人類的腦神經 整合2D與3D的繪圖視覺 在Bing 裡面基本上分為這幾個類型: 逼真的3D動畫 動畫虛擬人偶 展示攝影 可愛貼圖 二為圖例 電腦科幻虛擬人偶 公司標誌 卡通電影海
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News