您的位置:首页资讯编程开发 → 达摩院开源具身智能“三大件” 机器人上下文协议首次开源

达摩院开源具身智能“三大件” 机器人上下文协议首次开源

时间:2025/8/11 12:48:33来源:www.a300.cn作者:xy我要评论(0)

8月11日消息,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型RynnVLA-001-7B、世界理解模型RynnEC、以及机器人上下文协议RynnRCP ,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。

具身智能领域飞速发展,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。达摩院将MCP(Model Context Protocol)理念引入具身智能,首次提出并开源了RCP(Robotics Context Protocol)协议以推动不同的数据、模型与本体之间的对接适配。达摩院打造了名为RynnRCP的一套完整的机器人服务协议和框架,能够打通从传感器数据采集、模型推理到机器人动作执行的完整工作流,帮助用户根据自身场景轻松适配。RynnRCP现已经支持Pi0、GR00T N1.5等多款热门模型以及SO-100、SO-101等多种机械臂,正持续拓展。

具体而言,RynnRCP包括RCP框架和RobotMotion两个主要模块。RCP框架旨在建立机器人本体与传感器的连接,提供标准化能力接口,并实现不同的传输层和模型服务之间的兼容。RobotMotion则是具身大模型与机器人本体控制之间的桥梁,能将离散的低频推理命令实时转换为高频的连续控制信号,实现平滑、符合物理约束的机器人运动。同时,RobotMotion还提供了一体化仿真-真机控制工具,帮助开发者快速上手,支持任务规控、仿真同步、数据采集与回放、轨迹可视化等功能,降低策略迁移难度。

大会上,达摩院还宣布开源两款具身智能大模型。RynnVLA-001是达摩院自主研发的基于视频生成和人体轨迹预训练的视觉-语言-动作模型,其特点是能够从第一人称视角的视频中学习人类的操作技能,隐式迁移到机器人手臂的操控上,从而让机械臂操控更加连贯、平滑,更接近于人类动作。

世界理解模型RynnEC将多模态大语言模型引入具身世界,赋予了大模型理解物理世界的能力。该模型能够从位置、功能、数量等11个维度全面解析场景中的物体,并在复杂的室内环境中精准定位和分割目标物体。无需3D模型,该模型仅靠视频序列就能建立连续的空间感知,还支持灵活交互。

据了解,达摩院正积极投入具身智能,聚焦于系统和模型研发,与多方共建产业基础设施,包括硬件本体和标准组件适配、数据采集,以及技术社区DAMO开发者矩阵等,希望拓展机器人的产业空间,加速场景落地。达摩院还在上月开源了WorldVLA模型,首次将世界模型与动作模型融合,提升了图像与动作的理解与生成能力,受到业界关注。


相关视频

    没有数据

相关阅读 银河通用亮相 2025 世界机器人大会,具身智能落地生花GitHub 呼吁欧盟设立专项基金 开源软件维护资金不足AI Agent大变天!谷歌开源A2A,一夜改变智能体交互谷歌开源发布A2A协议 Agent2Agent智能体交互协议详细介绍全国首个!深开鸿发布基于开源鸿蒙机器人操作系统M-Robots OSLIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一苦等一年 Meta终于放大招 正式发布开源大模型Llama 4刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测

文章评论
发表评论

热门文章 京东宣布百亿大计划:迄今最先进的AI模型!GPT5发布,槽点竟多过GPT-5正式发布:与Cla

最新文章 达摩院开源具身智能“马斯克宣布Grok4免费开 ISC.AI 2025:360 安全大模型深耕 “深水区大厂盯上AI玩具,你的下一个LABUBU可能出自GPT-5 演示闹“图表乌龙”,OpenAI 连夜勘误银河通用亮相 2025 世界机器人大会,具身智

人气排行 安卓模拟器BlueStacks安装使用教程编程语言排行榜2020年9月 TIOBE编程语言排行eclipse字体大小怎么设置 eclipse字体大小plsql developer怎么连接数据库 plsql deveTomcat9.0安装教程 Tomcat9.0环境变量配置方plsql developer怎么使用 plsql developerVisual Studio 2015环境搭建教程Eclipse优化设置教程 Eclipse优化设置技巧