“具身智能”是指將人工智能融入機器人等物理實體,賦予它們感知、學習和 與環境動態交互的能力。在人工智能與物理世界深度融合的當下,具身智能正以顛 覆性姿態重塑產業格局。具身智能通過賦予機器“大腦”,使其具備感知、決 策與執行的全棧能力,正在工業、醫療、服務等領域催生萬億J市場機遇。2025年, 具身智能被寫入我國政府工作報告,標志著具身智能正式成為未來產業的重點 發展方向。目前,從層面到地方政府,我國出臺了一系列政策措施,重點圍繞 核心技術攻關、重點場景應用、資金和人才保障等方面,積極營造良好的發展環境, 積極推動具身智能產業飛速發展。整體來看,具身智能產業呈現多技術融合推動具 身智能系統能力泛化升J,具身智能數據生態向質量標準化、多元規;、通用協 同化發展邁進,仿真平臺大量涌現將重塑具身智能產業發展模式,具身智能機器人 應用場景分階段商業化落地,材料革命重塑具身智能產品形態和場景應用等發展趨 勢。然而,隨著具身智能相關技術和產品的快速迭代,應用發展過程中也帶來了網 絡安全、數據安全、倫理安全等前所未有的安全風險。
本期闡梳理了國外具身智能產業發展情況,總結了我國具身智能產業發展情況、 面臨的問題,分析了具身智能產業發展趨勢,以及具身智能應用發展面臨的安 全威脅,Z后從產業創新和安全風險應對兩方面提出了對策與建議。
附件:2025具身智能產業發展趨勢研究及安全威脅分析報告:網絡安全、數據安全、倫理安全等風險

工業制造領域,具身智能憑借其獨特優勢提高了生產效率、保障產品質量;醫療服務領域,具身智能產品能從精準醫療和高效護理兩方面發揮獨特優勢;智能家居領域帶來智能化變革
機器人大模型的進展從RT-1實現端到端動作輸出,再到PaLM-E 、RT2將多模態感知能力融合至統一模型空間,大模型已逐步具備“看圖識意、理解任務、生成動作”的完整 鏈條
多模態具身語言模型PaLM-E展現出優秀的泛化能力和任務遷移性能;RT2采用經動作信息訓練的VLA 模型,輸出1-5Hz 的動作序列;π0/π0-Fast/π0.5: 引入動作專家,輸出50Hz 動作軌跡
多模態大模型的突破,機器人首次具備了“感知—理解—決策”的潛力,通過融合圖像/視頻與語言等模態信息構建起跨模態的統一表征體系,機器人模型的核心迭代方向,是將動作模態融入現有的視覺語言模型
梳理了部分布局者的大模型及本體進展,對比本體廠、大廠和獨角獸公司的大模型技術路徑及進展;各公司對垂直行業的深度理解、豐富場景和海量數據,實現具身智能在垂直場景的率先落地
異構數據協同訓練是如何讓機器人從別人的經驗中學習;兩階段訓練為機器人打造通用大腦與專業小腦;真實家庭環境驗證在“整理抽屜”、“收集衣物”、“洗碗”等任務中表現
商超大模型機器人在仿真器中復現一個極度擁擠且充滿變數的零售商超環境。其實現聚焦三個關鍵模塊:程序化商店與動態消耗模擬(環境構建)、海量資產與幾何物理優化(底層加速)、長程任務與基準評測體系(驗證閉環)
軟體具身適配與多視角構建,設置了傳統的剛性機械臂和軟體機器人;大模型的部署與性能對抗;模型控制軟體機器人執行極高風險的“給人類嘴里喂棉花糖”任務
大模型機器人通過準確識別-三維定位-輕柔采摘大幅提升采摘效率與品質;大模型機器人通過實時感知與動態決策,實現按需調控、準確供給;大模型機器人通過早期監測與準確防控,有效降低病蟲害損失
大模型機器人能理解復雜、口語化的指令,支持多輪對話和上下文記憶;實現跨模態信息整合;大模型機器人可將指令拆解為可執行步驟;具備在線學習能力,能不斷優化行為策略