今天早上,OpenAI实施团队的 @shyamal在Github上开源了Swarm这个OpenAI官方的多智能体框架。不得不说,OpenAI官方下场,获得的社区影响就是不一样,在微信群、朋友圈里已经出现大量的解析文章。这个多智能体框架确实已经把多智能体的关键,说的很透彻了,Swarm 里面定义了两个
今天早上,OpenAI实施团队的 @shyamal在Github上开源了Swarm,这个OpenAI官方的多智能体框架。OpenAI官方的影响力显著,社区中已经出现大量解析文章,讨论热烈。
Swarm框架深入剖析了多智能体的关键,其中定义了两个核心部分:「Agents」和「Handoffs」,多智能体的核心在于「Handoffs」。经过简单的示例演示后,我认为这个多智能体框架还有改进的空间。借用云原生技术的发展历程,我认为我们需要的智能体框架应该是类似于k8s的框架,而不是像docker swarm。如果你熟悉云原生技术,你可能会理解我的观点。
单Agent部分,简单封装提示词和使用函数调用就可以完成业务,OpenAI提供了一个/api/chatcompletions接口来帮助我们完成这一部分。市场上大量的Agent产品都停留在单Agent上,但是在「Handoffs」这一块,Swarm的确做得非常优雅。
个人观点认为,Swarm的设计还不如我们的多智能体框架好用。我们的多智能体框架就像k8s,而Swarm则类似于docker swarm。我需要的是能像k8s一样编排智能体的框架。我们在9月26日发布了多智能体的工业设计产品,详见:智用研究院AI Agent Foundry赋能的首个多Agent驱动的工业设计平台圆满发布。
多智能体的核心难题在于不同智能体之间的通信问题。信息的传递方式和内容都非常重要。多个智能体协作时,只需要在必要的时候被调用起来。我们的智能体协作图如下:
当我们的多智能体应用接收到用户的请求时,借用Semantic kernel的设计理念实现“目标导向”的AI应用。这意味着它能够帮助确定目标,然后寻找实现这些目标的方法和步骤。在“目标导向”的方法中,首先需要确定目标,然后通过规划器(Planner)将目标分解为一系列需要执行的任务。这些任务可以逐个执行,以实现最终目标。这个过程对于人类来说是很自然的,但对于机器来说则相对复杂。借助LLM AI的力量,我们可以更轻松地实现这一过程。
这个接收到用户请求的智能体我们称之为路由智能体,他负责路由到具体执行任务的任务智能体。我们的智能体框架的Planner也类似于OpenAI的Swarm的「Handoffs」处理了交接的逻辑,但我们的Planner要比Handoffs处理得更完美。OpenAI的Swarm目前还处于实验阶段,期望它能发展成为类似于k8s的多智能体编排框架。
这个框架是用Python编写的,大家觉得用Python编写多智能体应用是一个好选择吗?我个人认为,对于应用开发来说,Python并不是最佳选择。Python之所以使用广泛,是因为当前人工智能的主导者是算法工程师,他们习惯使用Python。随着对复杂场景的人工智能应用需求增加,控制权逐步要回归到应用开发者手中。对于复杂度高、需要长期维护的应用系统,使用类似C#、Java等业务系统开发类的编程语言更为合适。
全能工具箱 专业版 4.1.0 2.61 MB
下载
湘ICP备2022002427号-10湘公网安备:43070202000427号
© 2013~2019 haote.com 好特网