Home
Categories
EXPLORE
True Crime
Comedy
Society & Culture
Business
News
Sports
TV & Film
About Us
Contact Us
Copyright
© 2024 PodJoint
Podjoint Logo
US
00:00 / 00:00
Sign in

or

Don't have an account?
Sign up
Forgot password
https://is1-ssl.mzstatic.com/image/thumb/Podcasts126/v4/96/d6/82/96d682e0-e42f-d8bf-68c3-c18ff9c20c8f/mza_15727650922171364471.jpg/600x600bb.jpg
硅谷101
硅谷101
218 episodes
6 days ago
失败、背叛、不被理解,硅谷精神领袖一直都不是完美的存在;他们是科学家,创造者,行动派,他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目,是一档分享当下最新鲜的技术、知识与思想的科技播客。 公众账号:硅谷101 联系邮箱:podcast@sv101.net
Show more...
Technology
Business,
Entrepreneurship
RSS
All content for 硅谷101 is the property of 硅谷101 and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
失败、背叛、不被理解,硅谷精神领袖一直都不是完美的存在;他们是科学家,创造者,行动派,他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目,是一档分享当下最新鲜的技术、知识与思想的科技播客。 公众账号:硅谷101 联系邮箱:podcast@sv101.net
Show more...
Technology
Business,
Entrepreneurship
https://media24.fireside.fm/file/fireside-images-2024/podcasts/images/f/f0f20376-8faf-4940-b920-84af6c734e2d/cover.jpg?v=6
E206|临近机器人GPT-3时刻,具身智能开源模型的加速演进
硅谷101
1 hour 10 minutes 44 seconds
1 month ago
E206|临近机器人GPT-3时刻,具身智能开源模型的加速演进

今年机器人模型领域最重要的突破,就是模型的通用性大幅提升,开始了泛化能力的探索,与此同时,这个行业依然面临着长尾问题、数据采集、缺乏统一维护平台等挑战,这期节目我们就来聊聊,业内将如何面对这些挑战?中国和美国的机器人发展路径又有何区别?
本期节目我们邀请了中国具身智能公司自变量机器人的CTO王昊,在这期节目上线时,他们刚开源了大规模真实数据训练的端到端具身基础模型WALL-OSS;以及来自美国具身智能公司Physical Intelligence的研究员柯丽一鸣(Kay Ke),她是π₀、π₀.₅论文作者。
在节目中,嘉宾们表示目前具身智能模型已达到了GPT-2的水平,在最近2到3年将优先在半结构化场景应用,那么我们距离全场景的通用机器人又还有多远?机器人公司又该如何平衡商业化与研发的节奏?

【主播】
泓君,硅谷101创始人,播客主理人
【嘉宾】
王昊,自变量机器人CTO
柯丽一鸣(Kay Ke),Physical Intelligence研究员,π₀、π₀.₅论文作者

【硅谷101科技峰会】
《硅谷101》的年度科技大会又回来了,这是我们将有趣的技术干货与故事带到线下的第二年,用最好的内容让大家亲身感受前沿科技的酷炫和温度一直是硅谷101的目标。硅谷10月5日,期待与各位见面,从这里驶向未来!
欢迎点击前往购票地址,输入粉丝专属折扣码“VALLEY101FANS”,享85折优惠。

【蚂蚁外滩大会】
硅谷101播客主理人泓君将主持9月11日~12日在上海举行的蚂蚁外滩大会,聊聊AI时代的全球趋势和创新最前沿,感兴趣的朋友欢迎点击领取硅谷101粉丝专属参会凭证。

【你将听到】
行业突破与泛化能力
05:36 2025年关键进展:模型通用性提升,开始泛化能力探索
07:38 何为模型泛化能力:从熟悉环境到陌生环境的能力一致性
11:44 泛化核心难点:长尾问题、数据采集与缺乏标准评测体系
16:04 如何评判具身智能模型能力:对比任务学习数据量与现实应用表现

数据挑战与硬件瓶颈
17:17 其他两大难点:数据质量与数量平衡、硬件维护缺乏统一平台
20:03 为何需要至少100万小时的数据,才能构成优秀的大模型?
23:06 人类VS机器人学习机制对比:人类的进化已包含了“预训练”
27:14 合成数据在机器人领域的应用:降低数据收集成本,但难以模拟现实物理交互

模型架构与技术路径
31:35 具身智能开源模型WALL-OSS发布:上万小时真实数据,补足当前开源模型的欠缺能力
35:36 WALL-OSS模型开源动机与优势:降低研究门槛,加速生态创新
38:03 架构之争:端到端统一训练VS分层系统设计,模型技术路径尚未统一
40:58 从VLA(视觉语言模型)出世后,具身智能模型路线开始走向趋同化
44:10 具身模型已达到GPT-2的水平,将在1~2年时间达到GPT-3水平
45:31 中美机器人技术路径区别:美国自上而下、先做大模型,中国从现实需求出发、双轨并行
52:31 抓到耗子的都是好猫:算法与操控的难度平衡
54:12 模型高频控制的意义:对未来情况做决策,但更高频率无意义
58:13 视觉难以对未来做精确的预测和建模,但能弥补触觉缺失与力的反馈
01:00:20 传感器比想象更成熟,但机器人还是依赖视觉作为主要训练参数

商业化与落地前景
01:01:31 家用机器人预测:2~3年内进入半结构化场景,5~10年全场景使用
01:05:29 如何平衡商业化与研发:尽可能服务于开放式场景,提高公司组织能力
01:08:43 现实部署的机器人量越大、场景越多样,数据反馈和模型迭代效果将越好

【节目中提到的相关公司和术语】

  • Physical Intelligence (PI):美国具身智能公司,推出了π₀、π₀.₅模型
  • 自变量机器人:中国具身智能公司,开源了端到端具身基础模型WALL-OSS
  • RT-2:Robotics Transformer 2,谷歌DeepMind推出的新一代AI学习模型
  • Genie3:谷歌世界模型的第3代,是DeepMind首个支持“实时交互”的世界模型
  • VLA:Vision-Language-Action,视觉-语言-动作模型架构
  • Covariant Robotics:一家专注于机器人大脑软件开发的硅谷公司
  • 长程任务:Long-Horizon Task,包含一系列连续步骤、需要机器人进行多步推理、规划并执行,最终才能完成的复杂任务

【监制】
泓君
【后期】
AMEI
【运营】
王梓沁、孙泽平
【BGM】
Ever Forward - Francis Wells
Mixed Emotions - Arthur Benson
Supine - Peter Sandberg

【在这里找到我们】
公众号:硅谷101
收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓FM|荔枝FM|网易云音乐|QQ音乐
其他平台:YouTube|Bilibili 搜索「硅谷101播客」
联系我们:podcast@sv101.net

Special Guests: 柯丽一鸣 and 王昊.

硅谷101
失败、背叛、不被理解,硅谷精神领袖一直都不是完美的存在;他们是科学家,创造者,行动派,他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目,是一档分享当下最新鲜的技术、知识与思想的科技播客。 公众账号:硅谷101 联系邮箱:podcast@sv101.net