当ChatGPT有了身体?
市场对于继ChatGPT之后层出不穷的AI聊天机器人似乎已经有些审美疲劳,但AI产业正在迎来新的发展方向。
在ITF World 2023半导体大会上,英伟达CEO黄仁勋又放出豪言,人工智能的下一个浪潮将是具身智能。
什么是具身智能?具身智能兴起将带来哪些投资机会?国盛证券分析师宋嘉吉等认为具身智能将成为通信、计算和存储的新载体。
什么是具身智能?
具身智能(EmbodiedIntelligence)是指在机器智能领域中,通过将智能算法与物理实体的感知、行动和环境交互相结合,使机器能够以更自然、更智能的方式与环境进行交互和解决问题的能力。
传统的人工智能系统主要关注于数据处理和符号推理,而具身智能强调机器通过感知和行动与环境直接交互,从中获取知识和经验,并在实践中逐步改进自身的能力。
简单来说,类似GPT-4这样的大模型,对物理世界并不能真的产生影响,而具身智能则多了一个身体,通过传感器收集环境信息,利用机械执行器进行物理操作,或者通过机器人等具体实体与人类和环境进行实时互动。
具身智能的目标是使机器能够更好地理解和适应复杂的环境,更高效地解决问题,并具备更灵活的行为能力。通过融合感知、决策和执行的过程,具身智能使机器能够更接近人类智能的表现,从而在机器人技术、自动驾驶、智能制造等领域发挥重要作用。
国盛证券分析师指出,具身智能可以理解、推理并与物理世界互动:
AIGC的“智能”表现在能够进行上下文理解和情景感知,输出文字、图像、声音,而具身智能能够在物理世界中进行操作和感知,输出各种机械动作。通过对物理环境的感知和实际操作,具身智能可以获得更全面的信息和数据,进一步提高对环境的理解和决策能力。按照具身智能的定义,目前具身智能的实例繁多,其中包括人形机器人、自动驾驶汽车等。
有望催化下一波人工智能应用浪潮
为什么黄仁勋认为,具身智能有望催化下一波人工智能应用浪潮?
分析师认为,具身智能有着物理反馈、物理输出的特性,可以成为成为通信、计算和存储的新载体:
当前物联网模组进入AIoT时代,集成了边缘算力的智能模组正在逐渐成为支撑边缘算力的核心形式。具身智能将边缘算力需求提升到了一个新高度,具身智能的“大脑”不仅要处理视觉信息、生成提示词,更要负责输出指令来执行机械动作,例如特斯拉针对Optimus开发了DOJOD1芯片,充沛的算力(362TFLPOS@FP8)驱动Optimus机器人流畅执行各种任务。
因此我们认为,在移动芯片无法满足所需算力的场景下,边缘IDC将是算力的有效补充措施。
具身智能的通信强调低时延、多连接、连续性能力。例如自动驾驶汽车上,L4级别需要带宽>100Mbps,时延5-10ms。具身智能未来也有望进化成结构复杂、体型庞大或者多点分布的产品,各子模块之间需要信息融合、多维感知、协同运行,本身也会需要稳定高速的无线连接。
我们认为,未来具身智能将会越来越强调边缘通信能力与边缘算力的匹配和耦合。
对于具身智能和GPT这样的非具身智能吾孰优孰劣,我们也专门询问了ChatGPT,它的回答如下:
具身智能和GPT在智能领域中属于不同的概念和应用方向。
具身智能强调机器通过与物理实体的感知和行动交互,以更自然、智能的方式与环境进行交互。它关注于将机器智能与物理世界相结合,通过传感器和执行器与环境进行实时互动,从中学习和适应。具身智能注重于解决实际问题,例如机器人技术、自动驾驶、智能制造等领域,要求机器能够感知周围环境、进行决策和执行相应的物理操作。
相比之下,GPT是一种基于大规模语言模型的自然语言处理技术。它在文本理解、生成和对话等任务上表现出色,可以生成具有语法正确性和一定逻辑连贯性的文本。GPT在处理大量文本数据时具有优势,并可以通过无监督预训练和有监督微调的方式进行训练。它在理解和生成自然语言方面取得了显著的成果,被广泛应用于文本生成、机器翻译、问题回答等领域。
因此,具身智能和GPT在应用范围和技术重点上存在差异。具身智能关注于机器与物理环境的交互和问题解决,而GPT则专注于自然语言处理任务。它们可以在不同领域和应用中发挥各自的优势。