当前,人工智能大语言模型最流行的概念当数“AI Agent(智能体)”,与普通的大模型智能单纯的输出内容相比,AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。智能体像人一样,它有记忆、有逻辑分析能力、有任务的拆解能力、问题的拆解能力和最后综合回来统一解决问题的能力。
我们在实践中注意到,对于智能体的上述定义,大部分大模型公司能够做到创造出不同性格或者有一定记忆能力的智能体,能够感知环境或给出决策建议。但在执行动作、独立解决问题上,往往还需要依靠外部软件,比如在大模型APP中直接要求其预订酒店,可能还需要跳转外部链接。
如果要让智能体做到执行“预订酒店”的动作,事实上需要大模型APP拥有一个完整的、囊括用户吃穿住行的生态。而纵览目前市面上符合这一要求的大模型以及配套APP,基于蚂蚁集团基础大模型“百灵”提供能力的支付宝智能助理是拥有执行能力的很好的案例。