5620亿参数！谷歌发布史上最大“通才”AI模型PaLM-E，可让机器人

栏目：国内作者：文辉发布时间：2023-03-09 13:16 阅读量：16825

，周一，来自谷歌和柏林工业大学的一组人工智能研究人员推出了史上最大的视觉语言模型 ——PaLM-E，参数量高达 5620 亿。

PaLM-E 是迄今为止已知的最大 VLM。作为一种多模态具身 VLM，它不仅可以理解图像，还能理解、生成语言，执行各种复杂的机器人指令而无需重新训练。它还展示出了强大的涌现能力(模型有不可预测的表现)。

据谷歌称，当得到一个高级命令，如“把抽屉里的米片拿给我”，PaLM-E 可以为带有手臂的移动机器人平台生成一个行动计划，并自行执行这些行动。

PaLM-E 通过分析来自机器人摄像头的数据来实现这一目标，而无需对场景进行预处理。这消除了人类对数据进行预处理或注释的需要，使机器人控制更加自主。

PaLM-E 还很有弹性，能够对环境做出反应。例如，PaLM-E 模型可以引导机器人从厨房里拿一袋薯片，由于 PaLM-E 集成到了控制回路中，它对任务中可能发生的中断有了抵抗力。在一个视频例子中，一名研究人员从机器人手中抓起薯片并移动它们，但机器人找到了薯片并再次抓起它们。

另外，PaLM-E 模型也可控制机器人自主完成原需人类指导的复杂任务。除了机器人技术外，谷歌研究人员还观察到使用大型语言模型作为 PaLM-E 核心的几个有趣效果，其中一个是 PaLM-E 能表现出“正向转移”，这意味其可将从一个任务中学到的知识和技能转移到另一个任务中，相较单任务机器人模型能有更好的表现。

谷歌研究人员计划未来将探索 PaLM-E 在现实世界中有更多应用，例如家庭自动化或工业机器人，也希望 PaLM-E 能够激发更多关于多模态 AI 的应用。

IT之家曾报道，身为谷歌 AI 劲敌的微软近期也发表了「ChatGPT for Robotics」的论文，以类似的方式结合视觉数据和大型语言模型来控制机器人。

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

分享到微信

市监总局指导4家行业协会发出联合倡议：制止餐饮浪费

勤俭节约是中华民族的传统美德和优良作风。
用绿色制造推动可持续发展奇瑞捷豹路虎为实现“双碳目标”贡献力量

工业化发展到今天，环境问题已经迫在眉睫。
社会荣誉纳入司机星级评选服务分考评嘀嗒出租车三化助力强化司机职业荣誉感

近日，一位出租车司机因为紧急送一名失去意
CounterPoint：苹果iPhone主导2022年十大最畅销智能手

，根据CounterPointResea
英特尔新款至强W2400系列处理器即将上架：可选12-24核，支持4通道

，英特尔至强W2400系列工作站处理器即
为MotoX40的国际版本，摩托罗拉Edge40手机通过FCC认证

，根据国外科技媒体thetechoutl
P社新作《城市：天际线2》正式公布：年内登陆Xbox、PS、PC平台，首

感谢IT之家网友华南吴彦祖、哥谭黑化蝙蝠
OPPOPad2平板电脑现身Geekbench：搭载骁龙芯片，运行安卓1

，OPPO第一款平板电脑OPPOPad于
TikTok推出付费视频功能，视频最长可达20分钟

，TikTok正在为创作者增加一种新的在

5620亿参数！谷歌发布史上最大“通才”AI模型PaLM-E，可让机器人

最新文章

热点内容