作者:Shawn Hymel
原文链接:https://shawnhymel.com/3207/what-is-physical-ai/
近年来,人工智能(AI)领域的兴奋点主要集中在完全存在于数字世界中的系统:大语言模型(LLM)生成文本,图像分类器标记照片,推荐算法推荐电影或产品。一个日益增长的研究和行业发展方向正在将AI从云端推向与现实世界交互的机器。这种趋势通常被称为物理人工智能(Physical AI)。
从高层次来看,物理人工智能描述的是这样的系统:人工智能被用于感知环境、做出决策,并产生影响物理世界的行动。这些系统不仅仅是处理信息,而是通过真实硬件来感知、推理和行动。如果这听起来与机器人技术相似,你并没有错。物理人工智能与机器人技术高度重叠,但这个术语强调的是智能系统设计和部署方式的重大转变。
对于从事机器人技术、嵌入式系统和边缘AI的工程师来说,理解这种转变尤为重要,让我们花些时间来探讨这一日益增长的趋势。
从数字AI到物理系统
大多数现代AI系统遵循一个相当简单的模式:接收一些数据,用模型处理它,然后产生输出。例如,神经网络可能接收一张图像并输出分类标签,或者语言模型接收提示并生成文本。整个过程发生在软件中。即使这些模型在实时应用中运行,输出仍然是数字化的。
虽然这对于基于LLM的聊天机器人和自动图像分类系统效果很好,但许多新颖的创新AI系统需要将预测转化为行动。这对边缘AI来说尤为如此。
考虑一个在走廊中导航的机器人。系统可能使用摄像头或激光雷达来观察周围环境。机器学习模型处理传感器数据,识别障碍物或自由空间。然后,控制算法将这些信息转换为操纵机器人的电机命令。
另一个例子可能是智能建筑气候系统。建筑物周围的传感器测量温度、湿度和占用情况。机器学习模型分析这些输入,预测条件将如何随时间变化。系统不仅仅简单地报告这些信息,而是调整暖通空调控制(例如打开通风口、改变风速或激活冷却系统)来在尽量减少能源消耗的同时保持舒适。
在这两种情况下,AI系统都构成了感知、推理和行动之间持续反馈循环的一部分。这就是物理人工智能的本质:系统不是为人类产生答案,而是产生影响物理世界的决策。
有了物理人工智能,我们不仅仅是解读数据,而是进入了系统在实际世界中采取行动的领域。
物理人工智能与机器人技术
物理人工智能与机器人技术之间的联系是显而易见的,但这两个术语来自略微不同的传统。
机器人技术历史上专注于构建与环境交互和移动的机器。该领域的工程师研究机械设计,运动学,控制理论和运动规划。多年来,机器人系统主要依赖确定性算法而不是机器学习。例如,一个仓库机器人可能使用基于规则的导航和简单的传感器阈值来避开障碍物。这些系统在可预测的结构化环境中效果很好。
然而,在过去十年中,机器学习开始在机器人技术中发挥更大的作用。AI模型帮助机器人识别物体、理解场景、规划运动并适应不断变化的条件。因此,驱动这些机器的智能越来越多的是习得的而不是手工编程的。
当机器人系统将现代AI技术作为其感知和决策堆栈的核心部分时,物理人工智能基本上就产生了。简单来说,机器人提供机器,而物理人工智能指的是允许这些机器自主运行的智能。
具身AI和具身智能
在阅读关于物理人工智能的内容时,你经常会遇到两个密切相关术语:具身AI(Embodied AI)和具身智能(Embodied Intelligence)。虽然术语可能因上下文略有不同,但这些想法是密切相关的。
具身AI通常指的是在"身体"内运行的AI系统(一种能够通过传感器和执行器感知并与世界交互的物理设备)。
具身智能是一个更广泛的概念,表明智能是通过身体与其环境之间的交互而产生的。换句话说,智能不仅仅是算法的属性,而是感知、行动和经验的结合产生的。
这些想法部分受到人类和动物学习方式的启发。我们对世界的很多理解来自于与它的物理互动。婴儿探索物体、测试边界,并逐渐建立关于事物如何运作的内部模型。
探索具身AI的研究人员对以类似方式学习的机器感兴趣。这些系统不仅依赖标注数据集,而是通过试错、探索和交互来学习。这种方法与强化学习(RL)等技术密切相关,智能体通过从环境接收反馈来学习行动。
嵌入式系统的位置
对于从事嵌入式系统的工程师来说,物理人工智能尤其重要,因为这些系统最终在硬件设备上运行。物理世界不在数据中心内运行。机器人、无人机、工业机器和智能家电都依赖嵌入式处理器来执行计算,而且通常需要边缘AI运行AI模型所带来的延迟和可靠性。
典型的物理人工智能系统可能包括连接到嵌入式处理器的摄像头、IMU或麦克风等传感器。处理器运行机器学习模型来解释传感器数据并决定采取什么行动。然后将产生的决策转换为电机、伺服或转向系统等执行器的命令。
整个过程通常在严格约束下进行。嵌入式平台可能有有限的内存、有限的计算能力和紧张的功耗预算。在许多情况下,系统还必须满足实时截止日期。这些约束迫使工程师仔细优化他们的模型和软件流水线。模型量化、算子融合和硬件加速等技术对于在嵌入式设备上实现AI变得至关重要。
这就是为什么物理人工智能与边缘AI密切相关,机器学习模型直接在本地硬件上运行而不是在云中。然而,这两个想法并不相同。边缘AI指的是计算发生的位置(在设备上而不是在云中),而物理人工智能指的是AI决策影响物理世界行为的系统。许多物理人工智能系统依赖边缘AI来满足实时和可靠性要求,但并非所有边缘AI系统都直接与物理环境交互。
模拟到现实的迁移问题
物理人工智能的主要挑战之一是所谓的模拟到现实(Sim2Real)差距。
在现实世界中训练智能系统可能缓慢且昂贵。机器人在实验过程中可能会损坏,从物理系统收集大型数据集可能需要大量时间。为了加速开发,研究人员通常在模拟环境中训练模型。现代机器人模拟器可以复制物理、传感器和复杂环境,允许工程师比在现实世界中更快地运行数千次训练迭代。
然而,模拟环境永远不会完美复制现实。传感器行为不同,照明条件会变化,真实表面的行为可能与物理引擎预测的不完全相同。因此,在模拟中表现完美的模型在部署到真实硬件上时可能会遇到困难。在模拟环境和真实环境之间架起桥梁仍然是机器人技术和物理人工智能的一个活跃研究领域。
为了解决这个问题,研究人员经常使用领域随机化等技术,在训练过程中有意改变模拟的照明、纹理、传感器噪声和其他环境因素。其想法是让模型暴露在足够的变化中,使其学习能够推广到现实世界的行为。然而,即使使用这些技术,模拟到现实的迁移仍然是机器人技术和物理人工智能中的一个难题。
物理人工智能趋势
几个技术趋势正在使物理人工智能越来越实用。在过去十年中,传感器变得更便宜且性能更强。摄像头、IMU和深度传感器现在足够小且足够便宜,可以集成到从无人机到消费电子产品的所有东西中。同时,机器学习专用硬件(如NPU、AI加速器和嵌入式GPU)使得直接在嵌入式设备上运行神经网络成为可能,而不是依赖云端。
机器学习算法和模拟工具的进步也加速了开发。机器人模拟器和现代训练技术允许工程师比过去更快地进行实验、训练模型和测试行为。这些发展共同使系统能够以越来越复杂的方式感知周围环境、做出决策并与物理世界交互。
对于嵌入式工程师来说,这代表了几个传统上不同学科的融合。构建智能物理系统通常需要传感器、嵌入式软件、控制系统和机器学习的知识。因此,理解这些部分如何组合在一起的工程师在从机器人技术和自动驾驶汽车到工业自动化和智能消费设备的行业中变得越来越有价值。在许多方面,物理人工智能代表了计算进化的下一步——从只是处理信息的机器到主动与周围世界交互的机器。
本文转自:边缘人工智能,转载此文目的在于传递更多信息,版权归原作者所有。如不支持转载,请联系小编demi@eetrend.com删除。





