《甜蜜陷阱:在线观看,揭秘浪漫惩罚的秘密》
06 2026-04
2026-04-06 来源:飞虎国语
-分享-
来源:飞虎国语 字号:【
文 | 硅谷101今年2月前后,小米、蚂蚁、阿里达摩院、宇树纷纷发布机器人开源模型。再之前,英伟达在CES上发布了GR00T N1.6,把自家号称"世界首个开放人形机器人基础模型"又再度升级。这些消费电子公司、互联网巨头、芯片帝国,最近都一股脑把机器人的"大脑"拿出来,免费给全世界用。机器人开源模型的生态中,有什么样的心机和万亿美元押注的博弈呢?本篇文章我们继续机器人系列,之前我们"机器人闭源模型"那篇文章分析了如今具身智能通用的VLA模型,拆解了特斯拉、Figure这些闭源巨头的不同路线,以及他们如何用硬件和数据优势构筑护城河。而这篇文章,我们与全球顶尖具身智能实验室的研究人员深聊之后,来扒一扒开源算法路线中的核心玩家和关键的技术领军人物们。同时我们来试图回答这三个问题:第一:这些开源模型分别走了什么技术路线,为什么能挑战巨头?第二:开源的动机是什么?什么是"真"开源,什么是"假"开源?第三:开源模型生态是什么样的?面对特斯拉这样的对手,开源社区拿什么打?01 开源模型全景,谁在做,走什么路?在开源模型派别中,VLA模型仍然是主流。简单来说,就是让机器人"看到"周围环境,"听懂"你的指令,然后"做出"正确的动作。目前,开源VLA模型大致可以分成四股力量:1. 学院派:参数不大,但能以小博大,代表模型是OpenVLA和Octo。2. 巨头生态派:不只做模型,还布局整套工具链,代表是英伟达的GR00T N1和谷歌的Gemini Robotics。3. 创业公司与中国力量:自变量、OpenMind、小米、蚂蚁等等。4. 技术极致派:追求极致精度和泛化能力,代表模型是Physical Intelligence的π₀。1.1:学院派的理想主义OpenVLA的一战成名,发生在2024年6月。这个只有70亿参数的开源模型,在29项机器人操作任务中,全面击败了"顶流"谷歌DeepMind的RT-2-X。RT-2-X有550亿参数,是OpenVLA的8倍大,背后站着整个谷歌的算力和数据资源。但结果是:OpenVLA的成功率比RT-2-X高出16.5%。OpenVLA以小博大,凭的是一个很聪明的架构设计:两个视觉编码器加大语言模型。对比谷歌RT-2-X,因为它只用了一个视觉编码器,你可以想象成一个超聪明但什么都自己做的人:能力很强,但信息处理效率更低。而OpenVLA用了两个视觉编码器,相当于有"两双眼睛"。第一双眼睛叫"DINOv2",负责理解空间关系;第二双眼睛叫"SigLIP",专门理解语义和常识。然后再由当时的开源大语言模型Llama 2充当"大脑",把空间信息和语义信息融合起来,处理指令和推理。简单来说,OpenVLA像一个三人小团队协同作战,把两类信息物理隔离、各自优化,再统一决策,整体反而更强。大家大概可以理解成"三个臭皮匠,顶个诸葛亮"。这个架构证明了:在具身智能领域,单纯的"大"并不代表"聪明"。OpenVLA还有一个数据集的优势,叫做"Open X-Embodiment",这也是开源生态的一个非常厉害的优势,后文会详细展开。另外,OpenVLA还在动作表示方式和训练策略上做了优化。所以它这次对谷歌的胜利靠的是"数据+架构+训练策略"的综合结果。而且,OpenVLA在胜出之后彻底开源:代码、模型权重、训练脚本全部公开。这样的开放姿态让整个行业都非常兴奋,开始各种后续的优化、推理加速和微调。这就是一个非常典型的开源故事,能用创新方式去"以小搏大",撬动整个技术领域的后续工作。我们再说说另外一个比较典型的开源路线"Octo"。如果说OpenVLA代表"规模化开源",Octo就是"普及型开源"。我们知道,机器人算法的"泛化性"是个很大的挑战,之前的标准做法是需要针对特定机器人用特定数据集来训练策略,但你换一个机器人、换一个环境,就要全部重新来训。而一些开源社区的大牛们就希望实现"通用机器人模型",通过zero-shot这样的技术将模型扩展到广泛的机器人和场景中。这样的路径被称为"通用机器人策略",Octo就是其中的代表。Octo只有数千万参数,比OpenVLA的规模更小。它是一个基于Transformer的扩散策略模型,设计强调灵活性和可扩展性,支持多种机器人平台和传感器配置,并能够通过微调快速适应新的观察和动作空间。这使得Octo可以广泛应用于不同的机器人学习场景。Octo的定位不是最强,而是人人可用,希望给开源社区提供一个更轻量、可快速适配的通用策略基础模型。1.2 巨头生态一条龙2025年3月的GTC大会上,黄仁勋亲自站台,发布了GR00T N1,号称"世界首个开放人形机器人基础模型"。到2026年1月CES,已经迭代到了N1.6版本。GR00T N1采用双系统架构:一个基于视觉语言模型的"System 2"负责慢思考,理解环境、解读指令、做出规划;一个基于扩散Transformer的"System 1"负责快思考,以高频率把规划转化为精确的关节动作。两个系统端到端联合训练,紧密耦合。22亿参数,模型权重和代码都公开了,不少头部人形机器人公司都获得了早期使用权。而且英伟达不只给了模型,还给了整套生态:用Omniverse做数字孪生,用Isaac Sim生成合成训练数据,用Cosmos生成视频数据,用Newton物理引擎做仿真,整个一条龙服务。Google在机器人通用策略上也在持续布局。早期的RT-1开源了代码和数据,但后续更强大的RT-2以及之后的RT系列就变成闭源模型了,并没有对外开放。最近Google也在加速。2025年发布了Gemini Robotics系列模型,还挖来了前波士顿动力首席技术官Aaron Saunders担任硬件工程副总裁。DeepMind CEO Demis Hassabis把这个愿景称为"机器人界的安卓",做通用的机器人操作系统,让Gemini成为各种机器人的"大脑"。在2026年CES上,波士顿动力和Google DeepMind宣布了战略合作,将Gemini Robotics模型整合到Atlas人形机器人中,联合研究即将在两家公司的实验室展开。Google从开源到闭源、再到想要打造"机器人界的安卓",赛道转换有点快、野心有点大,但它绝对是机器人行业的最重要玩家,我们也拭目以待它的下一步动向。中国在开源具身智能领域的参与正在加速,而且态势在从单纯的"跟跑"向"参与定义规则"转变。小米在2月12号刚发布的Xiaomi-Robotics-0,47亿参数,用MoT混合架构——把"大脑"(视觉语言理解)和"小脑"(动作执行)分开,改善了VLA模型普遍存在的推理延迟问题。模型开源,在消费级GPU上就能跑。蚂蚁集团的LingBot-VLA走了另一条路,强调跨形态泛化。这个模型在9种不同的双臂机器人上预训练了2万多小时的真机数据,目标是做到"一个大脑控制所有类型的机器人",有点像我们之前提到的"通用机器人策略"路线。清华AIR和上海AI实验室联合推出的X-VLA,刷新了五大仿真基准,代码、数据、权重全部公开,可以说是学术界最彻底的开源范本之一。星海图开源了真机数据集,以及旗下最新的G0 Plus VLA模型;智元机器人的GO-1已经部署到了真机上执行任务;星动纪元的ERA-42也在探索自己的路线。另外,自变量机器人是一家聚焦于通用机器人"大脑"研发的中国具身智能创业公司,CTO王昊在之前与硅谷101播客谈到了开源的初衷。在硅谷的初创公司中,我们对话了由斯坦福教授Jan Liphardt创立的OpenMind。他说,希望为不同厂商的人形机器人构建一个通用的软件层。OpenMind推出的OM1平台强调开源与跨硬件兼容,希望打破当前机器人系统各自封闭的局面,让不同设备可以共享能力与生态。他们也从一开始就以开源为核心理念来打造具身智能平台,代表了一种纯粹的开源路线。目前开源界最受瞩目的模型π₀,是Physical Intelligence推出的VLA模型,属于数十亿参数级别。π₀代表的是另一条思路:把"连续控制"做到极致。在动作生成部分,π₀使用了flow matching(流匹配)思路,直接生成连续的关节轨迹。这意味着模型输出的是一段平滑的控制信号。Physical Intelligence研究员、也是π₀、π₀.₅论文作者柯丽一鸣在接受硅谷101播客的时候就告诉我们,π₀控制频率约为50Hz,也就是每秒更新约50次动作。这种高频连续控制带来了一个质的飞跃:π₀能做折纸、玩扑克牌这种需要极高精度的任务——而这些是OpenVLA和Octo都很难胜任的。从设计理念上看,π₀更强调"控制质量"和"动作连续性"。相比把动作当作语言token预测,它更接近传统控制系统的形式,只不过控制信号由大模型生成。这一选择带来的好处是,在折叠衣物、抓取柔性物体、操作细小零件等任务中,动作更加流畅,减少了抖动和迟滞。同时,π₀的代码与权重通过OpenPI项目对外开放,使研究社区可以在它的基础上复现与扩展。这种做法在商业公司中并不常见,也成为开源阵营的重要力量。更令人关注的是π₀的迭代节奏。初版论文发布后不久,Physical Intelligence通过OpenPI项目公开了模型权重与代码。随后数月内,团队陆续发布更新版本,持续改进泛化能力与控制稳定性。随后引入强化学习机制以进一步优化策略表现,同时强调在开放环境中的适应能力。在机器人领域,这种快速迭代与持续公开更新并不常见,也成为π₀受到关注的重要原因之一。不同阵营背后的主导核心人物也并非对立关系,他们的关系紧密且错综复杂。而更有意思的是,曾经主导闭源模型的多位顶级科学家,后来成为了机器人开源社区的领导者。他们又被称为机器人界的"复仇者联盟"。OpenVLA来自斯坦福和伯克利的联合团队,核心人物是这个领域的明星人物Chelsea Finn。她MIT本科毕业,又在伯克利拿到博士学位,师从机器人学习教父级人物Pieter Abbeel和Sergey Levine。2019年她加入斯坦福任教,随后一路拿奖到手软。她同时还是Physical Intelligence的联合创始人,横跨学术和商业两个世界。可以说,Chelsea Finn一人就串起了开源和闭源阵营的半壁江山。在Finn教授以外,我们可以看到OpenVLA的作者名单上除了斯坦福和伯克利的一众研究人员,还有丰田研究院、Google DeepMind、Physical Intelligence、MIT的科学家。这说明,OpenVLA并不只是一个闭门造车的实验室产物。Octo和OpenVLA可以说是"同门师兄弟",同样来自伯克利,由Chelsea Finn和Sergey Levine的团队联合出品。Sergey Levine是机器人强化学习领域公认的开创者之一,他是伯克利教授、Google Brain前研究科学家,后来也成了Physical Intelligence的联合创始人和首席科学家,他跟Finn是博导和博士生的关系。有趣的是,Levine和Finn在Google时期参与了RT-1、RT-2这些闭源项目,离开后又推动了Octo和OpenVLA这些开源工作。这个领域中的同一批人,可以说既造了闭源的堡垒,也打开了开源的大门。PI的创始团队堪称是机器人AI领域的"复仇者联盟",联合创始人们各个都是来自学术界或者科技公司的大佬。其中,Karol Hausman是Google DeepMind机器人方向的资深研究科学家,也是RT-1、RT-2和SayCan等标志性机器人大模型工作的核心作者之一。Brian Ichter同样来自Google Brain,深度参与了这些项目的研发,是那一代机器人基础模型的重要推动者。Sergey Levine长期与Google Brain合作,在机器人学习和强化学习领域处于世界前沿,是这条技术路线的关键思想源头之一。我们前面提到好几次的Chels 在这个数字化时代,网络视频平台成为了我们生活中不可或缺的一部分。而其中,一些独具创意的影视作品更是吸引了无数观众的目光。今天,就让我们揭开《甜蜜惩罚》的神秘面纱,一起在线观看,揭秘浪漫惩罚的秘密。 《甜蜜惩罚》是一部以爱情为主题的短片,讲述了一对情侣在经历了一系列甜蜜的惩罚后,感情越发深厚的感人故事。短片以轻松幽默的方式,展现了现代都市中年轻人的爱情观和价值观。 故事的主人公是小明和小红,他们是一对热恋中的情侣。为了考验彼此的感情,小明想出了一个“甜蜜惩罚”的游戏。他规定,如果小红在一个月内完成他布置的任务,那么他就要答应小红的一个请求。而小红为了得到心仪的礼物,也毫不犹豫地答应了小明。 在这一个月的时间里,小明为小红布置了一系列看似甜蜜,实则充满挑战的任务。比如,每天给小红写一封情书,每天晚上为小红唱一首歌,每天给小红买一份早餐等等。这些任务看似简单,但对于忙碌的都市人来说,却是一项不小的挑战。 然而,在这些看似甜蜜的惩罚中,小明和小红的感情却越发深厚。他们一起度过了许多难忘的时光,也一起面对了许多困难。在这个过程中,他们学会了如何去理解对方,如何去包容对方,如何去珍惜彼此。 短片的高潮部分,是小明为了完成小红的心愿,不惜一切代价去努力。他甚至辞去了工作,全身心地投入到这个任务中。而小红也在这个过程中,逐渐明白了小明的付出和心意。 最终,小明完成了任务,小红也得到了她心仪的礼物。然而,这个礼物却并不是她最初想要的。她意识到,真正让她感到幸福的,是和小明一起度过的这段时光,是彼此之间的关爱和支持。 《甜蜜惩罚》这部短片,通过轻松幽默的方式,展现了现代都市中年轻人的爱情观。它告诉我们,爱情并不是一帆风顺的,而是在面对困难和挑战时,彼此相互扶持、共同成长的过程。 那么,如何在线观看这部感人至深的短片呢?其实,只需要打开你喜欢的视频平台,搜索《甜蜜惩罚》即可。在观看过程中,你可能会被短片中的甜蜜情节所打动,也可能会被小明和小红的爱情故事所感动。 总之,《甜蜜惩罚》是一部值得一看的短片。它不仅让我们感受到了爱情的美好,更让我们明白了珍惜眼前人、珍惜当下时光的重要性。在这个充满诱惑和挑战的时代,让我们一起在线观看《甜蜜惩罚》,感受浪漫惩罚的秘密,让爱情在我们的生活中绽放光彩。