新闻中心

新闻中心  >  数字世界的超级AI Agent,进行到哪一步了?
数字世界的超级AI Agent,进行到哪一步了?
背景图 2025-04-25 11:54:18

领跑AI品牌banner

在AI“泛滥”的当下,我们听到了太多AI怎么“说”——例如面对上述需求,众多热门AI都可以长篇大论给出买票的建议和攻略,却没有AI可以真正“代理人类”买到票。显然,如今我们更想看到AI能“做”什么。

今年3月份,横空出世的Manus以独立思考和执行复杂任务的惊艳表现正面回应了这个问题,是否意味着,无所不能、真正可以代理人类的“AI Agent”已经近在咫尺了?

拨开迷雾:抛开炒作概念,正确认识AI Agent

随着当前市场对AI Agent的热情逐渐高涨,国际知名分析机构Gartner发现,“Agent Washing”(智能体浪费) 现象也越来越多——某些供应商可能会夸大其产品的功能,将现有技术,如大语言模型、对话助手、自动化软件等包装为AI Agent。

根据Gartner的定义,真正的AI Agent是利用人工智能进行感知、决策、采取行动,并在数字或物理环境中自主或半自主地追求既定目标的软件实体。AI Agent应该具备适应、规划和独立行动的能力,从而能够在较长时间内实现组织的目标。

显然,真正的AI Agent所需能力超越了传统的AI助手、机器人流程自动化(RPA)工具与聊天机器人等等。尽管在2024年用AI Agent进行日常工作决策的比例仍是0%,但根据预测,到2028年,这一比例将迅速增加至15%甚至以上,AI Agent有望成为CIO们提高生产力的第一选择。

直面挑战:AI Agent的“成长阵痛”

和所有的新技术兴起的历程一样,AI Agent也正在面临一些难以跨越的“成长阵痛”。在2025年AI Engineer Summit会议上,国际知名前沿科技投资企业Lux Capital合伙人以“让OpenAI 订机票”为例子,展示了在“AI幻觉”之余,AI Agent也很可能会在行动中不断积累小错误,最终严重偏离既定目标:

  • 决策错误: 如系统可能预订飞往错误的目的地(例如将旧金山误定为秘鲁的旧金山),或在细节处理上过于复杂从而影响整体进度(比如连续调整计划影响出行)。
  • 实施错误: 例如因输入格式或捕获设置错误导致流程中断,甚至无法访问关键数据库。
  • 启发式错误: 模型可能忽略了最佳实践,比如没有为不同出发地点(如曼哈顿、布鲁克林等)预留足够时间,进而影响时间安排和交通预估。
  • 偏好错误: 系统可能忽视用户的个人偏好,或者从某些带有历史偏见的数据中学习,这都暴露出AI Agent在复杂价值判断中存在很大的潜在风险。

着眼当下:客观评估AI Agent的真实能力

虽然AI Agent还处于生长期,但不少政企单位已经开始尝试将其应用在业务环境中。那么,我们如何在日新月异的版本迭代中衡量AI Agent产品的真实能力呢?

Gartner认为可以从自主决策、适应性和学习、交互和协作、价值创造四个4个关键指标,来衡量AI Agent的能力是否达到实际应用的“落地级”。

自主决策能力

真正的AI Agent应能在最小人工干预的情况下理解复杂环境、制定决策并执行任务。这种能力不仅体现在执行预定任务上,更体现在面对未预见情况时的应对能力上。

适应性和学习能力

真正的AI Agent应能够从经验和反馈中学习,持续优化自身表现。这种学习不仅限于模式识别,还包括理解上下文、调整策略和改进决策过程。相比之下,“Agent Washing”产品通常缺乏这种持续学习的能力,它们的表现往往停留在初始设计的水平上,难以随时间推移而改进。

交互和协作能力

成熟的AI Agent应能够理解自然语言指令,与人类和其他系统进行有效沟通。随着技术发展,多Agent协作将成为趋势,真正的AI Agent应能够在复杂任务中与其他Agent协同工作。这种协作能力是区分真假AI Agent的另一个重要标准。

价值创造能力

真正的AI Agent应能够为企业创造可衡量的价值,如提高效率、改善决策或优化资源配置。即使技术先进,如果无法为用户创造实际价值,也难以被视为成功的智能体产品。企业在评估AI Agent产品时,应关注其能否解决实际业务问题,而非仅被概念营销所吸引。

未来图景:AI Agent与数字世界的共生进化

不仅仅是数字化转型的参与者们,也许在未来数字世界,人人都能拥有属于自己的“贾维斯”(钢铁侠的超级智能管家)——企业能在最少的人工干预下实现复杂业务流程的自动化,更快响应市场需求,真正发挥AI在数字世界的巨大效能。

在当下,就已经有政企单位朝着AI Agent与复杂业务流程融合——“智能体工作流”的方向不断探索,在部分场景中已经有所实践:

人力资源管理

人力资源部门的智能体工作流程可以加速和改善人才管理流程,包括招聘、入职和绩效管理。

以甲骨文公司为例,其引入了Oracle Cloud HCM( 嵌入了新的 AI agent),通过提供个性化职业支持、自动执行行政任务以及简化从入职和合同到绩效评估和福利的复杂流程,帮助员工改善体验并提高工作效率。

甲骨文公司应用开发执行副总裁 Chris Leone 表示:“员工在复杂 HR 流程上可能耗费过多的时间,以至于无法集中于主要职责。Oracle Cloud HCM 中全新的 AI agent 可帮助 HR 和业务负责人自动执行一些耗时的任务,让员工能够专注于真正重要的工作,并提高整个员工团队的工作效率。”

IT服务和运维

智能体工作流在IT支持和服务中的应用场景涉及多个领域,主要体现在故障检测、网络安全、技术支持和服务管理等方面。

AI agent可以实时监控IT基础设施,自动发现系统中的潜在故障或性能瓶颈。对于网络安全,AI agent能够监控网络流量,及时检测并应对安全威胁,如识别恶意攻击或未经授权的访问,自动采取隔离、封锁等措施,保护企业的IT环境不受侵犯。

目前已有不少头部厂商正在朝着这个方向不断前进。如深信服首发的国内第一个安全大模型——在2024年的大型攻防演练期间,安全GPT做到了全天候自主值守,不仅帮用户将安全告警平均降噪99%以上,更是做到真实攻击0漏报。其中最受用户认可的一点,是在“专家+AI agent”协作的方式下研判效率提高85%,“2人+XDR&GPT”即可达到以往14人团队的守护效果.........这都预示着网络安全正朝着“最少的人工干预下实现自动防护”的目标稳步前进。

项目管理

智能体工作流在企业项目管理中的应用场景包括任务分配、进度监控、资源调配和风险管理等方面。

AI agent能够自动跟踪项目的进展,实时监控任务完成情况,并根据项目的优先级和资源需求智能地重新分配任务。通过数据分析,AI agent还可以预测项目的未来趋势,优化项目规划,自动生成进度报告,并为项目经理提供实时决策支持。

同时,AI agent能够减轻项目经理的日常行政任务,让他们能够专注于战略决策和复杂问题的处理,从而提升整体项目执行的灵活性和成功率。

分割线

AI Agent的演进如火如荼,与其害怕被取代,不如思考如何驾驭AI Agent,终其内化为数字时代企业进化的核心基因。正如Gartner所预测——到2026年,成功应用AI Agent的企业将不是追求"完全自动化",而是构建"人类与AI的增强协作网络"。

文献参考:

《Gartner发布2025 年十大战略技术趋势》

《Gartner: 警惕 “Agent Washing” ,辨别炒作与实质》

《Oracle AI Agent 助力 HR 主管重塑员工体验》

《Agentic Workflow智能体工作流企业应用解析》