🤖 阿里巴巴 Qwen 組建「機器人小隊」:AI 從雲端走進真實世界的關鍵一步

更新 發佈閱讀 7 分鐘

阿里巴巴旗下 Qwen(通義千問)宣布成立「機器人/具身智能」研發團隊,正式把大模型推進「會動的 AI」時代。本文將用四個段落,帶你理解這則新聞的重點、發展脈絡、什麼是「具身大模型」、以及它對產業與台灣的啟示。


🌐 新聞重點:阿里要讓 AI「長出手腳」

2025 年 10 月 9 日,阿里巴巴旗下的 Qwen(通義千問)對外宣布,成立一個專門的「機器人/具身智能」小組。這個新團隊的使命,並不是單純升級模型的算力或參數,而是讓 AI 不再只是停留在雲端、在螢幕上回覆你,而是能夠真的「走下雲端」,具備行動力,進入物理世界。

換句話說,阿里的計畫是讓大模型不只是「會說話的聊天機器人」,而是進化為「能做事的助手」。從能看圖、能理解語音,進一步到「能抓取東西、能移動、能與環境互動」。這正是所謂的 「具身智能」(Embodied Intelligence)

這個消息立刻引起外界關注。因為它代表中國互聯網巨頭們已經不滿足於大模型的語言戰場,而是開始搶攻下一個 AI 前沿:讓 AI 進入工廠、倉庫、家庭,甚至走上街頭。這與國際趨勢高度契合——Google 的 RT-2、NVIDIA 的 GR00T、特斯拉的 Optimus,都在做類似的事。

阿里之前也有一些蛛絲馬跡:2025 年 9 月,阿里雲領投了一家叫「自變量機器人」的新創,投入超過 10 億人民幣,對方的核心產品就是「通用具身大模型」與「機器人平台」。這等於提前卡位,把上游技術與硬體合作夥伴綁進生態。如今 Qwen 公布自研團隊,形成「投資+自研」雙管齊下的局面。

從市場氛圍來看,這個宣布的時機點也很巧妙。因為就在 2024–2025 年,全球 AI 社群都在談「Physical AI(物理人工智慧)」:NVIDIA 在 GTC 上推出了專為人形機器人打造的基座模型 GR00T,Google DeepMind 的 RT-2 展示了如何把網路上的知識轉換成實體操作,而中國的人形機器人製造商也在成本與量產上加速。阿里的加入,意味著競爭已經進入「生態對抗」的新階段。


📅 背後脈絡:大模型走向「能行動」的時間線

要理解阿里這一步的重要性,我們得把時間線拉長來看。

第一階段:2023 年,語言模型爆發。

ChatGPT 帶來全球性震盪,阿里也在這一年推出了自家大模型「通義千問」,與百度、科大訊飛一起加入中國的大模型戰局。這個階段的重點是「會說話」,模型能看圖、能回答問題,但仍停留在語言與文字世界。

第二階段:2024 年,走向「會做事」。

Google DeepMind 發表 RT-2,能把文字指令轉換成機器人操作。NVIDIA 推出 Project GR00TJetson Thor,定義了「為人形機器人打造的基座模型+硬體算力模組」。這些舉動,都顯示大模型必須走出實驗室,進入機械、電腦視覺與感測器的領域。

第三階段:2025 年,中國硬體加速。

中國大量人形機器人原型在展會亮相,並快速壓低成本。這對「具身智能」至關重要,因為訓練一個能與環境互動的模型,需要成千上萬次的真實世界數據,而這必須仰賴大量、便宜、可用的機器人硬體來完成。

第四階段:2025 年 9 月,阿里投資鋪路。

阿里雲領投「自變量機器人」,鎖定的就是「具身大模型」與「通用平台」。這一步相當於先把「硬體試驗田」準備好。

第五階段:2025 年 10 月 9 日,Qwen 公布團隊。

從外部投資到內部成立團隊,阿里正式把「模型→智能體→具身智能」的三段路線打通。它要做的,不一定是造一台整機人形機器人,而是提供一個 「能思考、能規劃、能驅動機器」的 AI 核心,再交給合作廠商做各種應用。

從這條時間線來看,阿里的布局並不是突如其來,而是早有鋪陳。


🤔 補充說明:什麼是「具身大模型」?

讀到這裡,很多人可能會好奇:「具身大模型」到底跟一般的 ChatGPT 或 Qwen 有什麼不同?

第一,資料來源不同。

一般大模型讀的是文字、圖片、影音;具身大模型還要讀「動作資料」與「感測器資料」。例如手抓東西時的力道回饋、機器人走路時的關節角度、環境中的 3D 深度影像。這些資料讓模型能理解「怎麼做」而不只是「怎麼說」。

第二,目標不同。

普通大模型的目標是「輸出一句正確的文字答案」;具身大模型的目標是「完成任務」。例如當你說「幫我把桌上的杯子拿過來」,它要能規劃路徑、避開障礙、伸手抓取,再放到桌上。這裡需要長時序推理與即時調整,是完全不同的挑戰。

第三,系統架構不同。

聊天模型主要跑在雲端伺服器;具身智能需要「邊緣+雲端」協同。因為機器人要即時反應(例如避免摔倒),延遲不能太高,所以必須在本地運算(像 NVIDIA Jetson Thor)。而長期策略與模型更新,則由雲端處理。

阿里的優勢在於:

  • Qwen 的多模態大模型,能做語言、圖像與推理。
  • 阿里雲的算力與平台,能提供邊雲協同。
  • 還能結合 中國龐大的硬體製造鏈,快速落地大量機器人,形成資料閉環。

但挑戰也不小:

  • 可靠性與安全性:機器人不能只在 demo 成功,要能長時間穩定工作。
  • 成本與通用性:如何讓具身智能真正落地在物流、工廠、零售等場景,而不只是展示。
  • 國際生態競爭:NVIDIA、Google 等國際巨頭的工具鏈與社群成熟,阿里如何接軌仍是問題。

總之,「具身大模型」就是要讓 AI 不只停留在「嘴巴」,而是能用「手腳」去實際完成任務。


📌 結語:下一步會發生什麼?

阿里 Qwen 成立具身智能團隊,意義不僅是「中國又多了一個機器人玩家」,而是整個產業正進入 「AI 從雲端走到地面」 的新篇章。

對阿里來說,它的定位是「做平台」而不是「做整機」。也就是說,它更可能提供 AI SDK、智能體內核、算力服務,讓合作夥伴(例如倉儲機器人廠、教育機器人廠)去整合,這跟 NVIDIA 的「平台+生態」思路有點相似。

對全球產業來說,這是一個新的戰場:誰能掌握資料閉環,誰就能做出真正會學習、會行動的機器人。而這需要軟體、硬體、雲端的長期協作。

對台灣供應鏈來說,機會也很明顯。人形與具身智能機器人需要大量零組件:高扭矩伺服馬達、減速機、力矩感測器、3D 相機、邊緣運算板、電池模組、連接器等,這些正是台灣有優勢的領域。如果能與國際平台(如 NVIDIA Thor、ROS 社群)以及中國應用場景連結,台灣完全有機會成為關鍵供應商。

最後,如果你也想在科技浪潮裡找到真正有價值的趨勢,而不是只看表面熱鬧,歡迎追蹤 Mech Muse 🙌。下一篇,我將整理一份「具身大模型技術樹」,用圖表帶大家一次看懂資料、模型、硬體之間的關係。

留言
avatar-img
Mech muse 智慧新知
64會員
885內容數
因為喜歡分享科技新知,所以創立這個部落格,目前主要分享人型機器人,偶爾分享一些AI、小型核能的最新趨勢,讓你即時掌握最新消息。 聯絡我:[email protected]
Mech muse 智慧新知的其他內容
2025/10/10
Figure 推出第三代人形機器人 Figure 03,不只強化 AI 與手部感測,還以量產為目標走向家庭與商業應用。本文帶你了解發表重點、Figure 的發展時間線、技術細節與挑戰,最後給出產業觀察,幫助你掌握人形機器人進入日常生活的關鍵轉折。
Thumbnail
2025/10/10
Figure 推出第三代人形機器人 Figure 03,不只強化 AI 與手部感測,還以量產為目標走向家庭與商業應用。本文帶你了解發表重點、Figure 的發展時間線、技術細節與挑戰,最後給出產業觀察,幫助你掌握人形機器人進入日常生活的關鍵轉折。
Thumbnail
2025/10/10
讀完本篇,你將搞懂 UniPwn 如何從 BLE/Wi-Fi 一路拿下 root、為何具「蠕蟲化」風險、Unitree 修補重點與完整時間線,並拿到實驗室/企業可立即落地的防護清單。
2025/10/10
讀完本篇,你將搞懂 UniPwn 如何從 BLE/Wi-Fi 一路拿下 root、為何具「蠕蟲化」風險、Unitree 修補重點與完整時間線,並拿到實驗室/企業可立即落地的防護清單。
2025/10/09
這篇文章帶你看懂 Walmart 首度出現「人形機器人」上架的震撼事件 🤯,從新聞始末、產品時間線,到規格用途、價格落差與資安風險完整解析。讀完後,你將了解人形機器人如何從實驗室走進購物網站,以及這一步對未來科技與生活意味著什麼 🚀。
Thumbnail
2025/10/09
這篇文章帶你看懂 Walmart 首度出現「人形機器人」上架的震撼事件 🤯,從新聞始末、產品時間線,到規格用途、價格落差與資安風險完整解析。讀完後,你將了解人形機器人如何從實驗室走進購物網站,以及這一步對未來科技與生活意味著什麼 🚀。
Thumbnail
看更多
你可能也想看
Thumbnail
- AI機器人也能懂果實成熟度!5G遠端遙控成農村缺工解方 | 遠見雜誌 - 全球最大半導體展會上海閉幕 擺脫美國控制成焦點|工商時報 - 減少依賴中台技術!美國考慮和墨西哥合作開發半導體供應鏈|科技新報 - 中國政府機構禁用 Intel 和 AMD 台廠受惠、受害有限|經濟日報
Thumbnail
- AI機器人也能懂果實成熟度!5G遠端遙控成農村缺工解方 | 遠見雜誌 - 全球最大半導體展會上海閉幕 擺脫美國控制成焦點|工商時報 - 減少依賴中台技術!美國考慮和墨西哥合作開發半導體供應鏈|科技新報 - 中國政府機構禁用 Intel 和 AMD 台廠受惠、受害有限|經濟日報
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
一家名為Figure的新創公司於本週三發布了一段令人印象深刻的影片,展示了他們與OpenAI合作後的最新成果。在這段影片中,名為Figure 01的人形機器人展示了與人類的交流能力和任務執行能力。 影片中,Figure 01機器人被要求執行各種任務,例如回應一般性的指令,如提供食物或清理垃圾。
Thumbnail
一家名為Figure的新創公司於本週三發布了一段令人印象深刻的影片,展示了他們與OpenAI合作後的最新成果。在這段影片中,名為Figure 01的人形機器人展示了與人類的交流能力和任務執行能力。 影片中,Figure 01機器人被要求執行各種任務,例如回應一般性的指令,如提供食物或清理垃圾。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
即將舉辦的2024 COMPUTEX Forum將聚集全球科技領袖,共同探討生成式 AI 的未來發展,也代表臺灣在全球 AI 產業中的重要地位。文章也特別介紹了GeniAuto_X應用在企業內部(業務及行銷部門)和外部客服的生成式AI對話機器人,有助於臺灣企業與生成式AI的接軌,提升整體運營效率。
Thumbnail
即將舉辦的2024 COMPUTEX Forum將聚集全球科技領袖,共同探討生成式 AI 的未來發展,也代表臺灣在全球 AI 產業中的重要地位。文章也特別介紹了GeniAuto_X應用在企業內部(業務及行銷部門)和外部客服的生成式AI對話機器人,有助於臺灣企業與生成式AI的接軌,提升整體運營效率。
Thumbnail
人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
Thumbnail
人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
科幻電影描繪的場景即將成真?AI機器人問世?
Thumbnail
科幻電影描繪的場景即將成真?AI機器人問世?
Thumbnail
2024年7/6閉幕的上海 AI 人工智能大會,參觀人數突破30萬人次,線上流量突破19億,比上屆成長了90%,均創歷史新高,全世界對機器人的焦點持續增溫,但台股相關個股已經有過熱現象,美股目前對這議題發酵性討論性較低,因此我們將對基機器人產業及相關個股做一探討。
Thumbnail
2024年7/6閉幕的上海 AI 人工智能大會,參觀人數突破30萬人次,線上流量突破19億,比上屆成長了90%,均創歷史新高,全世界對機器人的焦點持續增溫,但台股相關個股已經有過熱現象,美股目前對這議題發酵性討論性較低,因此我們將對基機器人產業及相關個股做一探討。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這篇文章總結了各種類型的機器人,包括人形機器人、機器狗、家用機器人和聊天機器人。同時,也提到了一些討論點和機器人可能的未來方向。
Thumbnail
這篇文章總結了各種類型的機器人,包括人形機器人、機器狗、家用機器人和聊天機器人。同時,也提到了一些討論點和機器人可能的未來方向。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News