强化学习适用于特定任务,但不能广泛推广。例如,我们不能向代理发出任何指令并要求它执行由键盘和鼠标控制的各种任务。当时,它适用于我们设计它的特定任务,但它根本没有概括。这让我进入了下一个阶段,那就是去斯坦福大学。
我开始在斯坦福大学跟随 Favilli 教授攻读博士学位,重点研智能(Embodied AI)。他在斯坦福大学期间从 6 点到 . ,我见证了斯坦福视觉实验室的转变,从Favilli教授领导的静态计算机视觉,如图像和视频识别,到体现计算机视觉,即交互环境中的代理学习感知和行动。
该环境可以是虚拟的(模拟的)或物理世界。这是我 马来西亚手机号码数据 的博士阶段,主要是从静态视觉转向具身智能。获得博士学位后,我加入了 Nvidia,并一直在那里工作至今。我将博士论文中的研究内容带到了 Nvidia,并至今仍在继续研究具身智能。
Sonia Huang 您目前负责 Nvidia 的 Embodied Intelligence 计划,您能简单描述一下这个项目是什么以及您希望实现什么目标吗?吉姆·范肯定是。我目前领导的团队称为 GER,代表 Generalist Embodied Agent Research。
简单地说,我们团队的工作可以用三个词来概括:“产生行动”。因为我们构建了具体的智能代理,而这些代理在不同的世界中采取行动。如果这些动作发生在虚拟世界,那就是人工智能和模拟,如果它们发生在物理世界,那就是机器人技术。
事实上,在今年 3 月的 GTC 会议上,Jensen 在他的主题演讲中展示了一个名为 Project Groot 的项目。这是 Nvidia 为构建人形机器人基础模型所做的重要努力,也是 GER 团队目前正在开展的工作。
我们希望为人形机器人及其他机器人打造人工智能大脑。 Stephanie Zhan 您认为 Nvidia 在构建这些技术方面有哪些竞争优势?吉姆·范 这是一个非常好的问题。首先,计算资源是毫无疑问的。