地平线研究院:HoloBrain-0全栈开源的VLA基座模型
在具身智能迈向通用化的关键节点,地平线以全栈开源的姿态,交出了一份兼顾技术创新与工程落地的答卷。
2026年3月17日,在第四届具身智能机器人产业发展论坛上,地平线研究院机器人实验室具身操作方向负责人林天威,详细介绍了地平线在具身智能领域的最新突破——全栈开源的VLA基座模型HoloBrain-0。
林天威指出,尽管具身智能发展迅速,但在迈向通用化的道路上仍面临模型深度、广度和长度三大挑战。地平线发布的HoloBrain-0,通过创新的“本体感知”架构、高效的数据策略以及全栈开源的生态系统,为解决这些难题提供了全新的思路。该模型不仅在仿真和真实世界任务中取得了业界领先的效果,其轻量化版本更证明了在端侧芯片高效部署的可行性,为推动具身智能技术的普及与应用奠定了坚实基础。
林天威丨地平线研究院机器人实验室 具身操作方向负责人
以下为演讲内容整理:
突破传统VLA,构建本体感知的智能基座
当前主流的VLA模型大多采用从视觉到动作的“黑盒”端到端学习模式,忽略了机器人本体信息这一关键要素,导致模型泛化能力弱,难以适应不同的机器人形态。地平线HoloBrain-0的核心创新在于显式地将本体信息融入模型设计,打造了“本体感知”的VLA。
图源:演讲嘉宾素材
具体而言,HoloBrain-0通过“统一基座坐标系”,将多视角相机的图像特征与机器人的6D位姿统一投影到一个共同的坐标系下,使模型能够学习到对齐的空间表征,从而支持包括人类操作视频在内的更广泛数据类型。同时,模型内置了“空间增强器”,通过相机内外参和深度信息,显著提升了对三维空间的感知能力。在动作输出方面,HoloBrain-0设计了“混合相对动作空间”,同步输出关节的相对转角和末端执行器的相对运动,这不仅增强了模型的空间泛化能力,也使其能原生支持异构多源的数据,如VR遥操作数据。
构建全栈开源生态,加速VLA技术落地
为了解决行业内在数据、训练到部署全流程中的痛点,地平线不仅开源了HoloBrain-0模型本身,更推出了全栈开源的基建框架RoboOrchard,旨在打造一个易用、高效的VLA开发生态系统。
图源:演讲嘉宾素材
RoboOrchard提供了从数据采集、模型训练到最终部署的一站式解决方案。针对行业中标定流程繁琐、数据质量不可控、格式不统一等问题,RoboOrchard推出了一系列特色工具,如提供可视化校验功能的一体化标定工具RoboOrchard Deploy,支持图形化界面操作和实时质量监控的数据采集工具RoboOrchard DataRecorder,以及功能全面的FFmpeg Python封装库RoboOrchard Video,极大地简化了视频处理流程。这些工具共同构建了一个开放、灵活且可复现的VLA研发环境,有效解决了轨迹不连续、推理模式单一等行业难题,真正做到了“授人以渔”。
轻量化模型与创新推理策略,定义高效新范式
图源:演讲嘉宾素材
HoloBrain-0提供了两个版本的预训练模型:基于GroundingDINO的0.2B轻量版和基于Qwen2.5-VL的1.1B版。其中,0.2B版本以其极小的参数量,证明了在端侧芯片上高效部署复杂VLA模型的可行性。在仿真RoboTwin2.0基准测试的50项任务中,HoloBrain-0两个版本的平均成功率均超过90%,超越了现有模型。
图源:演讲嘉宾素材
在真实世界的机器人实验中,HoloBrain-0同样表现出色。面对叠毛巾、折纸盒、叠衣服等长程灵巧任务,以及任意物体抓取等通用任务,其表现优于对比模型。特别是在“任意物体抓取”任务中,通过采集多样化的物体数据进行混合训练,模型展现出了对物体几何形状的通用抓取能力,即便面对从未见过的异形或柔性物体,也能保持高成功率。此外,地平线还创新性地提出了SimplerTC异步推理策略,在提升推理效率30%以上的同时,也显著提高了复杂任务的成功率,为机器人的流畅、高效执行提供了新的解决方案。
关于地平线研究院
地平线研究院聚焦具身智能基础算法和框架的研发,推动通用机器人的实现。团队具有Manipulation、Mobility和Real2Sim三个主要研究方向,致力于探索机器人技术的工业化落地。
HoloBrain-0的发布,不仅是地平线在机器人算法研究上的一次重要突破,更是其践行“开放共赢”理念,通过全栈开源,赋能整个行业,与合作伙伴共同探索具身智能无限未来的关键一步。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
责任编辑:樊华
最新阅读
-
“深交所·创享荟”打造资本市场服务国企改革新典范
9月27日,深交所举办第九期“创享荟”国企专业化整合专场活动。“创享荟”是深交所着力打造的具有深市特色的市场服务品牌,目前已围绕热点主题举办了多期专场活动,影响力和吸引力不断增强。 深交所相关负...
-
微软在GitHub上线开发工具包,助力开发者使用Rust语言编写Wind
,微软Azure首席技术官MarkRussinovich日前在X平台发文,公开微软最近宣布“扩大采用Rust语言的成果”,微软同时还在GitHub中发布了一系列开发工具包,让开发者可以使用Rust语言...
-
“领头羊”计划走进广州番禺,超59家企业具备上市潜力
南方财经全媒体记者翁榕涛实习生曾日丽广州报道 9月26日下午,广州企业上市“领头羊”行动计划“番禺行动”启动仪式在番禺节能科技园交流中心举行。 据南方财经全媒体记者了解,今年7月以来,广州市地方金...
-
算力牛股中际旭创股价“反攻”800G能否助三季度业绩惯性增长?
21世纪经济报道记者雷晨实习生原婷婷北京报道 近期受国内外AI利好消息驱动,二级市场上,中际旭创股价重新抬头,9月26日、9月27日连续上涨。截至9月27日收盘,公司股价报收于114.07元/股,收...
-
索尼申请外置小型触摸屏专利,可“架在”PS5手柄上远程游玩游戏
,据外媒gamerant报道,索尼近日注册了一项新专利,从文件内容上来看,这项专利主要显示,外加可以使用一个“触摸屏”连接DualSense手柄,来游玩PS5游戏。 图源索尼 索尼于此前正式公布了...
-
国庆黄金周运输今日启动,长三角铁路预计发送超250万人次
国庆黄金周运输启动。 9月27日,澎湃新闻记者从中国铁路上海局集团有限公司获悉,今天是铁路国庆黄金周运输首日,长三角铁路预计发送旅客逾250万人次,较2019年同期多发送60余万人次,增幅超三成。 ...
-
阿里拟分拆菜鸟在港上市菜鸟子公司已申请上百项物流专利
9月26日,阿里巴巴港交所公告,拟通过以菜鸟股份于香港联交所主板独立上市的方式分拆菜鸟。拟议分拆完成后,阿里巴巴将继续持有菜鸟50%以上的股份,菜鸟将仍为其子公司。 天眼查App显示,菜鸟网络科技有...
-
分析机构:中国消费者平均需要119%月薪,才可购买苹果iPhone15P
,苹果公司本月发布了iPhone15系列手机,其中iPhone15ProMax国行起售价为9999元人民币,分析机构WorldofStatistics日前分享了相关统计数据,概述了全球各国家地区消费者...
-
中国光大银行北京分行奋力谱写金融助力绿色生态高质量发展新篇章
绿色金融是生态文明建设的重要组成部分,对推动经济社会绿色转型发展、实现“双碳”目标具有重要意义。党的十八大以来,在新发展理念的指引下,绿色低碳成为中国经济社会转型发展的重要方向。 中国光大银行坚决响...
-
极越汽车推出7kW家用直流充电桩,包安装服务7000元
,极越01于9月20日正式下线并开启预售,预售价25.99万元起。 极越已经上架了一款7kW直流家庭充电服务套包,输出范围为200-1000V、0-250A,充电桩+安装服务共7000元,而且下单购...



