© PKU EPIC Lab. All rights reserved. Commercial distribution prohibited.

© PKU EPIC Lab. 版权所有。禁止商业传播。

作者:吕江燃 修订: 指导老师:王鹤,弋力

O、前言

随着具身智能的关注度不断升高,越来越多的研究者涌入这一领域,相关论文数量也呈现井喷式增长。然而,其中不少工作的质量令人担忧:有的只是单纯“讲故事”,有的则一味追求“刷榜”,但这些却反而获得了大量的关注和追捧。在这样的科研环境下,为新同学提供正确的引导,帮助他们少走弯路、健康成长,是一个重要的任务。

因此,我们撰写本文的目的,就是希望为刚进入具身智能科研领域的同学提供一个清晰的guide,帮助大家理解具身智能究竟该研究什么,以及如何正确地入门。希望能帮助到初学者积累必要基础知识的同时,建立起正确的研究认知。

本文章也将作为 PKU EPIC Lab 本科生的入门材料,并会在实践和培养的过程中不断更新和完善。

一、基础概念 (Basic Concepts)

1. 什么是具身智能 (What is Embodied AI)

具身智能(Embodied AI)是指能够在物理或虚拟环境中通过感知、行动和交互来学习与完成任务的人工智能。不同于仅在静态数据(文本、图像、语音等)上进行训练和推理的传统 AI,具身智能的智能体(agent)往往有一个“身体”(body)或“化身”(avatar),它们可以与环境交互,改变环境,并随着环境的改变自己作出调整。

典型的具身智能研究对象包括机器人和虚拟环境中的智能体,本文主要面向机器人领域(Robotics)。

核心特征:

2. 具身智能与其他AI的区别 (Differences from Traditional AI)

具身智能与传统 AI 的主要区别在于它的主动性、交互性,以及对数据的依赖方式。传统 AI 可以利用互联网上丰富的图像、文本、语音等大规模数据集进行训练(参考LLM的成功),而具身智能体必须通过与环境的真实交互来收集数据,这使得数据获取代价高昂且规模有限。一言以蔽之,数据问题是具身智能目前最大的bottleneck。那么很自然的两个关键问题是,