世界经济论坛发布《驾驭人工智能前沿:AI Agent的发展与影响》白皮书
2024年12月16日,世界经济论坛与凯捷咨询公司联合发布《驾驭人工智能前沿:AI Agent的发展与影响入门》,探讨了AI Agent(AI Agent)的演变、功能、影响及相关挑战,强调了负责任发展和治理的重要性,为理解和应对AI Agent的发展提供了全面视角。
一、AI Agent的定义
依据国际标准化组织定义,AI Agent是使用传感器感知环境并通过效应器响应的实体,具有自主性和权限,由用户输入、环境、传感器、控制中心、感知、效应器和动作等核心组件构成,各组件协同工作,使代理能根据环境输入做出决策并执行动作,改变环境。
二、AI Agent的演进
1、发展历程
始于 20 世纪 50 年代,从简单规则系统发展为复杂自主决策实体,早期行为确定,后能处理不确定性,1990 年代机器学习兴起,神经网络为深度学习奠定基础,2017 年后大语言模型推动其能力提升。
2、技术趋势
大模型:大语言模型和大多模态模型提升自然语言处理和多媒体生成能力,基于 Transformer 架构改善上下文理解,推动人工智能发展。
机器学习和深度学习技术:包括监督学习、强化学习、强化学习与人类反馈、迁移学习和微调等多种技术,提高模型效率和专业性,组合使用增强问题解决能力。
三、AI Agent的类型
1、确定性与非确定性
确定性代理:基于规则,行为可预测,输出由输入决定,如简单反射代理,但缺乏适应性。
非确定性代理:数据驱动,根据数据概率决策,能学习适应,处理复杂情况,如基于模型的反射代理、基于目标的代理和基于效用的代理。
2、具体类型及示例
简单反射代理:基于当前感知,遵循预定义规则,对环境刺激快速反应,如垃圾邮件过滤器、简单聊天机器人等。
基于模型的反射代理:利用存储信息跟踪环境,基于当前和过去经验决策,更具适应性,如智能恒温器、机器人吸尘器等。
基于目标的代理:考虑未来情景,规划行动实现目标,适合复杂决策任务,如高级国际象棋引擎、物流路线优化系统等。
基于效用的代理:处理复杂任务,用效用函数评估决策,平衡多目标,如自动驾驶系统、投资组合管理系统等。
四、高级AI Agent
架构组件:以用户输入为起点,经控制中心导向模型处理,核心组件包括控制中心(管理信息和指令流)、决策与规划(支持多步推理)、内存管理(维护交互记忆和上下文)、工具(访问外部功能和多模态数据)和效应器(执行动作),各组件协同工作,实现代理与环境的交互和任务执行。
示例:车载信息娱乐系统中的AI Agent,通过语音指令管理导航、娱乐等功能,根据实时信息优化服务,提升驾驶体验。
五、AI Agent系统
整合多个异构或同构AI Agent,通过混合代理或中央协调等设计,使各代理分工协作实现系统目标,如自动驾驶汽车中的感知、规划、定位和控制等代理协同工作,确保车辆安全高效运行,人工智能信息娱乐系统作为接口与乘客交互,提升整体驾驶体验。
六、AI Agent的未来:多代理系统
架构与协作:由多个独立代理或代理系统组成,通过网络架构或监督架构实现协作、竞争或协商,以完成复杂集体任务,如在智能交通管理中,车辆与基础设施通过 MAS 协作优化交通流。
互操作性挑战:不同代理和系统间有效通信依赖通用协议,包括预定义协议(稳定但缺乏适应性)和新兴协议(可学习适应但解码理解困难),互操作性问题影响系统可靠性和协调效率。
七、展望未来
1、关键优势
提高用户生产力,助力各行业解决技能短缺问题,在软件开发、医疗、客户体验提升、教育和金融等领域发挥重要作用,如辅助软件开发、改善医疗诊断、提供个性化服务等。
2、风险挑战
技术风险:可能因故障产生错误输出,存在能力和目标相关失败风险,如规格博弈、目标错误泛化、欺骗性对齐等,还可能被恶意利用,且复杂代理的验证和测试面临挑战。
社会经济风险:过度依赖可能导致人类监督减少、个体和集体认知能力受影响,面临社会抵制,影响就业结构,组织部署成本增加。
伦理风险:决策自主性引发伦理困境,缺乏透明度和可解释性影响信任,引发道德和法律责任问题。
3、应对措施
技术层面:提高信息透明度,实施行为监测,确保能理解和缓解故障。
社会经济层面:加强公众教育和意识培养,建立收集公众意见的平台,制定深思熟虑的部署策略,如组织开展员工再培训计划。
伦理层面:制定明确伦理准则,确保决策符合人类和社会价值观,实施行为监测以增强透明度和治理结构,提高利益相关者问责制。