下一个风口吹向何方?Agent是大模型落地的正确方向吗?
2024-04-26

图片

当下,Agent得到了许多业界领袖的支持。Agent与Prompt Engineering(提示工程)或Copilot在本质上有何不同?为什么有这么多人坚定地看好Agent?未来,Agent是否是大模型落地的正确方向?

本文基于数势科技创始人&CEO黎科峰博士,百川智能联合创始人焦可,腾讯研究院副院长刘琼,蓝驰创投投资合伙人、TGO鲲鹏会(北京)学员石建平以及实在智能联合创始人、CMO张俊九等五位行业大咖在InfoQ主办的QCon全球软件开发大会的圆桌讨论整理。

 

Agent还是Copilot?理解Agent的本质

图片
图片

张俊九先生认为Agent是对底层逻辑的描述,产品化后可表现为各种各样的形式。与Agent不同,Copilot是在软件生态或其自身体系内的各种应用中提供辅助。例如,微软的Copilot或钉钉中的魔法棒等功能,它们主要通过底层API调用来实现场景中的辅助。而Agent则更多地基于底层技术,将大模型与现实世界连接起来。因此,Agent需要具备上下文记忆、规划执行操作工具等能力。在具体场景中,可能会表现为AI魔法棒、百度文心助手等多种形式。
 

焦可先生认为Copilot的概念在于帮助人们完成工作,而Agent在某些场景中可能会替代人类,百川去年5月份就提出了Agent as a Service的逻辑。后来Open AI的Lilian Weng提出了Agent架构的技术逻辑,她提出,仅有引擎或接口是不够的,还应具备记忆、规划和使用工具的能力。从产品角度来看,目前的ChatGPT类产品更像是模型能力的直接展示,不会是最终的产品形态,Agent架构是落地的必然路径,值得大家深入研究。   

石建平先生从变化的本质提出了他的观点:“对于未来的应用,可能会有根本性变化的东西产生,大家不应该拘泥于“Agent”或“Copilot”的术语称谓,我们更应该去抓住它的本质。”石建平先生进一步聚焦上一代的应用和这一代Agent的区别,阐述了他对Agent的理解。他指出,尽管两者都是软件,包含component、state 、logic 、interface(组件、状态、逻辑、接口)等元素,但关键的差异在于逻辑和接口的演变,以前的逻辑都是固定的,现在的逻辑在AI驱动的软件中变成模型驱动的、动态自适应的;以前的接口API也是固定的,任何接口的变化,都需要修改程序,下一代的接口是动态的、更灵活的,可能是自然语言。这是一个根本性的变化,为的是提升软件的智能化和自主提升能力,有可能从单纯的数字大脑转变为具有感知和动机能力的数字人脑。


 

Agent是连接大模型和现实世界的“最后一公里”  

图片
图片

刘琼女士指出Agent并非新概念,但随着大语言模型的发展,其潜力和应用场景将得到极大扩展。“Agent是大模型落地非常必要和可行的路径。首先,它是大模型未来在行业落地中的一个重要应用形态,在从任务到工作的终极目标中,Agent真正能替代人形成新的生产力,成为我们的数字伙伴的重要形态。其次,Agent是连接大模型和现实世界,包括许多应用和现实问题的‘最后一公里’。Agent具备自我决策和学习能力,以及规划、记忆和可扩展工具的能力,使其在特定领域具有无限发展潜力,是大模型实现具体应用的必要途径。”       

张俊九先生认为GPT这种聊天模式存在“光说不练”的问题。因此,GPT刚出来时更多是在AIGC等场景中提供能力,如图片、多模态材料的生成,这远远不能解决代替人进行操作的问题。“代替人进行操作可能会将大模型的应用场景更丰富地延伸出去。目前,我认为Agent的生命力比单纯的大模型要更加活跃,更具想象力。因此,Agent一定是目前能看到的,与应用结合较紧密的大模型落地路径。”      

黎科峰博士把Agent比喻成一个学了非常多知识的研究生。他学过金融学、法律、计算机、物理、化学等,但真正要让他成为一个业务上的小能手,还有很长的一段距离。真正要把它落到企业端,落到业务端,Agent需补充数据、知识库和方法论

“Agent可以接管除了通用大模型能力之外的所有知识处理、逻辑处理、业务流程。所以,我们依然非常看好Agent在To B领域能够真正理解业务、进行决策、自动化执行、为结果负责的新范式。”

图片       

大模型将颠覆哪些应用?

图片
图片

焦可先生带着大家一起思考“第一次使用ChatGPT时,你们认为它对哪个业务产生了冲击?”焦可先生认为有三类:信息需求、娱乐需求、交易需求,而最先变革的将发生在信息类业务。原因是大模型是基于高维语义空间的类比,完全不同于以往的关键词精准匹配逻辑。以前的搜索引擎是无法阅读文档,无法解析和理解图片,也没有记忆,无法进行多轮对话,这是革命性的,新时代的到来一定是做到了以前无法做到的事情。因此,他建议大家应关注那些由不可能变为可能的新机会。   

石建平先生建议在那些对人类附加值贡献较高且需要实际物理交互的领域寻找切入点,比如教育和医疗行业,应优先考虑是否能被更好地数字化、智能化。“任何行业在高度数字化之后,成本将逐渐显现边际递减效应。特别是那些高度依赖人力和资源供给的行业,其发展越容易受到限制。人类的智慧永远是有限的,但数字人的供给是无限的。这为行业提供了广阔的发展空间。” 

刘琼女士分享了一个数据,到2047年,AI在所有里程碑性任务列表上达到人类水平的可能性为50%(其中很多任务是通过Agent方式实现的),这比2022年做的预测提前了13年。

她补充道:“大模型落地可能比我们想象的要快很多。关键要看通用大模型的能力进化,它可以使我们现在完成什么样的工作,或者它能够产生什么样的新供给。”刘琼女士认为在培训、心理咨询和陪伴等领域,已经产生了一些新的供给,个人助理领域的发展空间和速度巨大。

张俊九先生认为会是一种百花齐放的场景。个人场景中,AI PC等技术可简化电脑设置,降低使用门槛。To B领域中,Agent能颠覆RPA。过去,需要描述业务场景及需求,设计业务流程,然后再用低代码实现整个流程。现在一句话就全搞定了,Agent能理解你想做什么,并且自动生成并执行流程,替代掉对工程师、数据分析师的依赖。“未来,真的很可能每个人都会配备强大的AI助理,它能在每一个具体的问题下,做出最合适的选择,马上让你看到不一样的效果。”

结语

Agent技术作为大模型落地的关键路径,其发展前景广阔。随着技术的不断成熟和应用场景的不断拓展,Agent技术有望成为推动社会进步和行业发展的重要驱动力。   


 

关于数势科技

数势科技是行业领先的数据智能产品提供商,拥有在大金融、高科技制造和泛零售等领域的专业洞察力及技术实力,为全球优秀企业提供基于大模型增强的智能指标平台(SwiftMetrics)、智能分析助手(SwiftAgent)、智能标签平台(SwiftCDP)及智能营销平台(SwiftMKT)系列产品,提升企业的数字化决策能力,推动企业数字化升级。

 

— END —

图片

图片

 

点击“阅读全文”了解数势科技

 

数势科技
企业数字化升级首选长期技术伙伴

商务合作:business@digitforce.com

市场合作:marketing@digitforce.com

电话:010-53383810 (工作日10:00-19:00)

地址:北京市海淀区花园路庚坊国际大厦15层

© 2024 数势科技. All Rights Reserved.京ICP备20023335号-2
客服