波士顿动力与 Google DeepMind牵手,推进机器人向“通用工人”的进步
近日,波士顿动力与 Google DeepMind宣布成立全新合作伙伴关系,该合作将把 Gemini 模型整合到 Atlas 和 Spot 机器人的身上。该举措被视为深度改造机器人能力的关键一步。
首先,波士顿动力将在现代汽车工厂进行试验,搭载 Gemini 的 Atlas 将尝试执行多种制造任务,以检验其在真实工业环境中的适应性与可靠性。对比传统依赖固定程序的机器人,这一轮试验的目标是验证机器人能否在复杂、动态的场景中一边感知一边学习,并根据情境调整行为策略。
波士顿动力首席执行官 Robert Playter 表示,他们团队希望打造的是具备“情境理解力”和高水平“手部灵巧操作能力”的新一代机器人。理想状态下,这些机器可以对周围环境做到上下文感知,并运用机械手操控各种形状不规则的物体,而汽车制造工厂正是验证这一能力的理想场景之一。
目前,Atlas 已经在体能和机动性方面展现出高度成熟的技术水平,包括完成高难度体操动作和舞蹈表演等,但这些场景基本来自脚本化编排。随着多模态 Gemini 模型的加入,Atlas 和 Spot 将有望实时解读传感器数据、识别并抓取非标准化物体,并在非结构化环境下自主规划运动路径,从而向贴近人类“物理智能”的方向发展。
波士顿动力与 Google DeepMind 的合作,在一定程度上也是与前东家“再度牵手”,结合其硬件积累与Google 在通用 AI 方面的技术优势,尝试在工业机器人领域开辟新的路线。Google DeepMind 机器人部门高级总监 Carolina Parada 表示,Gemini 的架构正是为了这类“通用机器人”场景而设计,希望构建可为广泛实体机器人平台提供智能的大模型。
与以往被限定于高度重复、固定工序的专用机器人不同,这一轮试验有望让接入 Gemini 的系统能够在长期运行过程中持续从环境中学习。波士顿动力机器人的实地数据也将反哸 Gemini 模型,帮助其更好理解物理世界的交互规律,从而进一步提升感知和控制能力。
不过,将更高智能引入工业机器人,也带来了新的安全考量。Parada 表示,Gemini 将通过对自身动作进行推理和约束,增加一层行为安全检查,以避免潜在的危险动作。Playter 也强调,即便体型较小的机器人,如果缺乏足够安全设计和限制,在复杂环境中同样可能造成伤害,因此在提升自主性的同时必须坚持严格的安全标准。
目前,通用人形机器人的竞争正在迅速升温,美国已有十多家公司投入相关研发,包括 Agility Robotics、Figure AI、Apptronik、1X 和特斯拉等。行业机构的统计显示,在中国已有大约 200 家企业涉足人形机器人领域,资本与技术力量正加速涌入这一赛道。
在不少 AI 企业看来,让模型更紧密地参与物理世界交互,是实现更高级通用智能的下一阶段前提。对 DeepMind 来说,与波士顿动力的合作,体现出其战略重心从纯软件系统向“具身智能”(embodied AI)转移的趋势。
DeepMind 首席执行官 Demis Hassabis 此前曾表示,并不打算自建机器人硬件,而是希望 Gemini 成为类似“Android”的基础平台,让各类制造商在统一智能底座上开发不同形态的机器人。随着 Atlas 和 Spot 等平台在现代工厂展开测试,这一“AI 操作系统”式愿景也迈出了落地应用的关键一步。
近日,波士顿动力与 Google DeepMind宣布成立全新合作伙伴关系,该合作将把 Gemini 模型整合到 Atlas 和 Spot 机器人的身上。该举措被视为深度改造机器人能力的关键一步。
首先,波士顿动力将在现代汽车工厂进行试验,搭载 Gemini 的 Atlas 将尝试执行多种制造任务,以检验其在真实工业环境中的适应性与可靠性。对比传统依赖固定程序的机器人,这一轮试验的目标是验证机器人能否在复杂、动态的场景中一边感知一边学习,并根据情境调整行为策略。
波士顿动力首席执行官 Robert Playter 表示,他们团队希望打造的是具备“情境理解力”和高水平“手部灵巧操作能力”的新一代机器人。理想状态下,这些机器可以对周围环境做到上下文感知,并运用机械手操控各种形状不规则的物体,而汽车制造工厂正是验证这一能力的理想场景之一。
目前,Atlas 已经在体能和机动性方面展现出高度成熟的技术水平,包括完成高难度体操动作和舞蹈表演等,但这些场景基本来自脚本化编排。随着多模态 Gemini 模型的加入,Atlas 和 Spot 将有望实时解读传感器数据、识别并抓取非标准化物体,并在非结构化环境下自主规划运动路径,从而向贴近人类“物理智能”的方向发展。
波士顿动力与 Google DeepMind 的合作,在一定程度上也是与前东家“再度牵手”,结合其硬件积累与Google 在通用 AI 方面的技术优势,尝试在工业机器人领域开辟新的路线。Google DeepMind 机器人部门高级总监 Carolina Parada 表示,Gemini 的架构正是为了这类“通用机器人”场景而设计,希望构建可为广泛实体机器人平台提供智能的大模型。
与以往被限定于高度重复、固定工序的专用机器人不同,这一轮试验有望让接入 Gemini 的系统能够在长期运行过程中持续从环境中学习。波士顿动力机器人的实地数据也将反哸 Gemini 模型,帮助其更好理解物理世界的交互规律,从而进一步提升感知和控制能力。
不过,将更高智能引入工业机器人,也带来了新的安全考量。Parada 表示,Gemini 将通过对自身动作进行推理和约束,增加一层行为安全检查,以避免潜在的危险动作。Playter 也强调,即便体型较小的机器人,如果缺乏足够安全设计和限制,在复杂环境中同样可能造成伤害,因此在提升自主性的同时必须坚持严格的安全标准。
目前,通用人形机器人的竞争正在迅速升温,美国已有十多家公司投入相关研发,包括 Agility Robotics、Figure AI、Apptronik、1X 和特斯拉等。行业机构的统计显示,在中国已有大约 200 家企业涉足人形机器人领域,资本与技术力量正加速涌入这一赛道。
在不少 AI 企业看来,让模型更紧密地参与物理世界交互,是实现更高级通用智能的下一阶段前提。对 DeepMind 来说,与波士顿动力的合作,体现出其战略重心从纯软件系统向“具身智能”(embodied AI)转移的趋势。
DeepMind 首席执行官 Demis Hassabis 此前曾表示,并不打算自建机器人硬件,而是希望 Gemini 成为类似“Android”的基础平台,让各类制造商在统一智能底座上开发不同形态的机器人。随着 Atlas 和 Spot 等平台在现代工厂展开测试,这一“AI 操作系统”式愿景也迈出了落地应用的关键一步。