• 元宇宙:本站分享元宇宙相关资讯,资讯仅代表作者观点与平台立场无关,仅供参考.

巨头抢滩、资本沸腾 AI智能体如何跨越「幻觉」陷阱?

  • 2025年3月12日 03:43

作者:路世明

Manus的出现,激起了科技与资本市场的双重震荡,一时间AIAgent相关概念股集体大涨,阿里、谷歌、微软等科技巨头密集发布智能体研发计划......

而在这场热潮的背后,是AI技术从“被动应答”向“主动执行”的范式跃迁。

尽管市场的评价褒贬不一,但不能否认,Manus的突破性在于,它首次验证了通用型AIAgent在复杂场景下的商业化可行性。

传统的大语言模型虽能生成文本,却难以闭环执行任务,而Manus通过“规划-验证-执行”的架构,将AI大模型的认知能力转化为生产力工具。

根据麦肯锡等多份权威报告,在多元化需求驱动下,AIAgent市场呈爆发式增长态势,2024年全球AIAgent市场规模约为51亿美元,预计2030年将飙升至471亿美元,复合年增长率高达44.8%。

然而,这场“智能体浪潮”并非坦途。技术瓶颈与商业野心的碰撞,让AIAgent的竞争既充满想象力,又暗藏风险。破壁之战

本质上,AIAgent的是具备人类思维范式的数字劳动力。

如果说聊天机器人还停留在“对话”阶段,那么Agent则已经开始“行动”。简单来说,可以理解为一种更智能、更自主的AI应用,它不仅能回答问题,还能执行任务、完成交易。

它们可以被应用于各种场景,如客户服务、金融分析、软件开发等,极大地提高了生产力和效率。

以大语言模型为“大脑”,AIAgent不仅能理解指令表层语义,更能捕捉隐含需求。例如用户说“找性价比高的酒店”,Manus会结合季节、当地活动等上下文推理出“预算敏感型”或“体验优先型”需求。

而可以期待的是,随着大模型在多模态能力上的持续突破,特别是多模态融合技术的迭代升级,AIAgent将能够更精准地解析并反馈用户需求,逐步实现类人类的视听感知与交互能力。

这将使得AIAgent可以应用于更广泛的领域,如医疗诊断、自动驾驶、智能安防等。

此外,Manus发布后,券商PPT、分析师路演火速上线,不完全统计显示,中金、华泰、招商、中泰等数十家券商研究所进行了路演,其中有分析师上线了多场路演,路演内容从技术原理、AI应用、受益方向到落地场景、产业圈推演,内容丰富。

当然,在热潮的背后,也有不同的声音。不少业内人士认为,Manus属于AIAgent初级的应用,市场的反应过大了。

事实也的确如此,AI会进一步拉平信息差,大量收集信息、整理资料的工作可以交给AI,但真正距离生成投资决策,无疑还有很长的路要走。

其中,最大的挑战在于:AI幻觉的幽灵始终萦绕不去。技术瓶颈

AIAgent的竞争,入口为王。

当掌握更多用户流量的厂商,有望实现“流量-数据-使用体验”的正向循环,且随着开源模型能力升级弥补大厂及中小厂技术代差,AI产品工程化能力,或拉开产品使用体验差距。

可尽管展现出巨大的潜力,但AIAgent的爆发仍面临多重障碍。从商业模式到技术瓶颈,从法规缺失到用户认知,每个环节都在考验着行业的耐心。

首当其冲的原因就在于,现有技术还无法有效地解决AI幻觉的问题。

以当红的Manus来说,虽然在GAIA基准测试中取得了优异成绩,但在实际应用中,仍存在一些不稳定的情况。

GAIA基准测试排名来源:ManusAIX平台

有实测用户反馈,在处理复杂任务时,Manus偶尔会出现任务执行失败或结果不准确的问题。在进行股票数据分析时,Manus可能会因为数据接口的临时故障或数据格式的细微变化,导致分析结果出现偏差。

再以OpenAI的GPT4.5来说,毫无疑问,这是目前最强的大语言模型。但在SimpleQA基准测试中,GPT-4.5的准确率为62.5%,幻觉率为7.1%,尽管这一成绩要远优于GPT-4o、OpenAIo1和o3-mini等模型,但是依然存在着相当高的幻觉率。

而这种幻觉,在金融、医疗等高风险领域,任何一点误差,都可能引发系统性风险。

假设某医疗诊断Agent,其误判罕见病案例的概率为3%,客若应用于千万级用户群体,那么潜在误诊人数将高达30万。

除了幻觉,紧接着的是数据孤岛与通用能力的矛盾。

AIAgent的效能高度依赖场景数据,例如金融风控需要实时交易数据,而医疗诊断依赖患者病史库,数据割裂会导致通用型Agent难以跨领域迁移。

最后是伦理与监管的滞后性。AIAgent的自主决策涉及隐私泄露、责任归属等伦理问题,比如调用用户健康数据、自动驾驶事故等等,而全球监管框架尚未成熟。

由此可见,AIAgent的破局路径需从技术、生态与监管三端协同推进。而未来,谁能率先突破技术瓶颈并构建合规生态,毫无疑问,谁就将主导这场智能体时代的“诺曼底登陆”。

Copyright © 2021.Company 元宇宙YITB.COM All rights reserved.元宇宙YITB.COM