Skip to content

第1章 AI 正式进入多 Agent 协作和自主决策的时代

1-1 多Agent融合自主决策,AI发展的必然趋势

本视频讲述了AI技术发展从聊天助手到自主代理(Agent)的演进脉络,系统梳理了2023年对话式AI、2024年Copilot副驾驶模式、2025年单Agent自动化任务执行(Agent元年)到2026年多Agent协同与反思式决策的Agentic AI范式,并指出掌握以多智能体协作、自主推理框架(如WEAT)、工具调用(MCP)及专业技能系统(Agent Skills)为核心的Agent架构能力,是面向未来不可替代的核心技术路径。

阶段时间核心特征技术形态生产力占比
Chatbot 模式2023对话式信息检索OpenAI 大模型对话AI 占比 < 10%,人类主导
Copilot 模式2024辅助编程,局部介入GitHub Copilot 等 AI 编辑器AI 占比 ~30%,人类仍需控制项目结构
Agent 模式2025端到端自动化执行Manus、Cursor ComposerAI 占比 ~66%,人类设定目标与规则
Multi-Agent 模式2026多智能体协同分工Agentic AI 架构多 Agent 协作,具备反思调整能力
二、核心技术概念解析
1. Agent(智能体)

定义:能够自主决策调用工具执行任务的 AI 实体,取代人类成为生产过程的主要操作者。

核心能力矩阵

plain
┌─────────────────────────────────────────┐
│  自主决策能力  │  基于 LLM 的逻辑推理与规划   │
├─────────────────────────────────────────┤
│  工具调用能力  │  MCP (Model Context Protocol) │
├─────────────────────────────────────────┤
│  专业技能能力  │  Agent Skills 工程化封装      │
├─────────────────────────────────────────┤
│  反思调整能力  │  执行-验证-修正的迭代循环      │
└─────────────────────────────────────────┘
2. ReAct 思维框架

技术定位:Agent 自主思考的底层逻辑框架

执行流程

plain
Thought(思考)→ Action(行动)→ Observation(观察)→ ... → Final Answer
3. 多 Agent 协同架构

两种设计范式

范式技术实现适用场景
工作流编排型Graph 引擎为核心的有向图编排流程确定、步骤清晰的任务
自主代理型Agent 自主决策,动态协作复杂、需灵活调整的任务

三、关键技术栈
1. MCP (Model Context Protocol)
  • 作用:标准化工具调用协议,使 Agent 能够统一调用外部工具(API、数据库、文件系统等)
  • 工程价值:解耦工具实现与 Agent 逻辑,提升可扩展性
2. Agent Skills
  • 定义:将专业领域的工作流程工程化封装为可复用的技能模块
  • 核心价值:Agent 不只是"能用工具",而是"按专业流程完成工作"
3. 主流开发框架
框架技术背景特点
JManusJava 生态Java 版 Manus 实现,适合企业级 Java 应用
AgentScope阿里云/魔搭社区阿里云主推的 Multi-Agent 框架,与通义千问生态深度集成
  • AI技术迭代的挑战与学习定位

    • AI技能的必然性与技术更迭加速 AI在现在及未来占比日益重要,将成为每个人必然掌握的技能;但其发展日新月异,所学技术极易被快速取代。
    • 典型技术生命周期例证 前一两年高频术语如提示词工程、RAG(检索增强生成)、大模型本地部署与微调,近期已显著减少提及甚至被替代。
    • 课程设立的根本动因 明确提出核心问题:应学习何种AI技术,方能确保所学不随技术浪潮淘汰?答案指向把握AI发展的底层脉络与趋势本质。
  • AI发展三阶段演进脉络

    • 2023年:对话式AI(Chat Mode) OpenAI推出后,AI进入聊天模式:用户输入问题,大模型理解意图并反馈准确信息;此时AI本质是“大号搜索引擎”,人类仍需手动打开Excel/PPT,复制粘贴结果完成工作;生产力主体仍是人类,AI仅占极小部分。
    • 2024年:Copilot式副驾驶模式 AI初步介入生产环节,以AI编程Copilot为最佳落地案例:通过对话辅助编写代码;但仅控制局部代码,项目整体结构、文件创建、Debug仍需人类主导;生产力占比约1/3由AI承担,2/3依赖人工;AI角色为辅助助手,人类是主要操作者。
    • 2025年:单Agent自动化模式(Agent元年)
      • Manners软件的颠覆性实践 AI可从头至尾全自动完成复杂项目,无需人类介入;例如用户指令“呈现某公司第三季度商业信息”,Manners自动完成网页数据抓取、季度数据筛选、写入本地Excel、数据分析、图表生成全流程。
      • Cloud Code编辑器的范式升级 区别于传统对话框式AI编辑器,用户仅需输入目标(如“生成XX功能”),代码编写、文件生成、项目架构均由Cloud Code自主完成;此即AI Agent模式:AI承担2/3生产环节,人类仅负责设定目标、提供资源与指令、设定规则;Agent作为操作者,可调用工具、基于大模型进行逻辑推理;虽初期限于流程确定性任务,但已确立“以Agent替代人类作为生产操作者”的根本趋势。
    • 2026年:Agentic AI(多智能体协同与反思式决策) Agent进化为多Agent分工协作:对复杂任务自动拆解,分派给具备对应专业领域技能的Agent执行;执行中具备反思调整能力——先执行步骤→检验目标达成度→未达则调整→直至结果与预设目标一致;此即当前Agentic AI模式,核心特征为多Agent协同、工具调用、大模型驱动的自主决策、专业领域知识系统、独立解决复杂任务。
  • 市场验证与技术永恒性判断

    • 市场规模与企业采纳 AI Agent市场规模自2026至2029年逐级递增;75%企业已试点或正式应用AI Agent进入生产环节;出现“一人即一公司数字员工”的行业共识。
    • 课程技术选型逻辑 拒绝流于表面、易被淘汰的新技术;聚焦处于AI发展趋势核心的Agenting模式——学习如何架构基于多智能体协同、Agent自主决策与专业技能的AI应用,实现用户零介入的复杂任务闭环;多Agent协同与Agent自主决策思维框架具有长期稳定性,不会随技术迭代而改变。
  • 课程主线与两大核心技术模块

    • 主线设计:以旅游规划为背景的Agent AI实践 全课程围绕Agent AI(自主型AI)展开,深度讲解多Agent协同与Agent自主思考执行两大核心。

    • 多Agent协同设计思想

      • Graph引擎工作流编排 以Graph引擎为核心的应用框架。

      • Agent自主代理设计(重点)

        聚焦两种主流框架:

        • Jay Manners:Java版Manners框架。
        • Agentscope:Steam AI(阿里巴巴生态)主推框架;因涉及Steam AI,课程同步涵盖ECSBAI(阿里巴巴基础)知识。
    • Agent自主思考执行

      • 自主思考逻辑:WEAT思维框架 掌握该框架,Agent即可实现自主推理,为课程重点内容。
      • 自主执行任务能力
        • 工具调用:MCP协议
        • 专业流程化执行:Agent Skills系统 不仅使用工具,更能依整套专业流程完成工作,是当前最热门的专业技能系统。
  • 课程收获总结 学员将掌握React自主决策模式、熟悉多Agent协同架构设计、掌握Agent Skills工程化封装、掌握热门技术栈的智能开发、提升复杂业务协同分解力、收获整套AI应用落地方案。

mermaid
mindmap
  root((Agentic AI(自主型AI))
    SpringAi Alibaba 1.1
    旅游规划
      多Agent协同
        工作流编排设计思想
          Graph为核心的应用框架
        Agent自主代理设计思想
          Agentic为核心的应用框架
            Jmanus(Java版Manus)
            AgentScope(SpringAi Alibaba生态)
      Agent自主思考执行
        自主思考
          ReAct思维框架
        自主执行
          工具使用
            MCP
            Function Calling
          专业技能系统
            Agent Skills

1-2 准备工作:安装ApiFox

API设计、开发、测试一体化协作平台, Apifox= Postman + Swagger + Mock + JMeter

创建项目/环境/接口/测试

1-3 准备工作:配置阿里大模型广场的ApiKey

阿里云百炼https://www.aliyun.com/product/bailian、百度千帆、火山方舟

1-4 准备工作:百度地图API秘钥(AK)

魔塔社区MCP服务器广场:https://modelscope.cn/mcp

百度地图开发平台控制台(创建APIKey):https://lbs.baidu.com/apiconsole/center

按下面内容填写

  • 应用类型:服务端
  • 请求校验方式:IP白名单IP白名单:0.0.0.0/0

1-5 准备工作: 安装Nacos 3

Nacos (docker)

sh
# 下载
sudo docker pull nacos/nacos-server:v3.1.0

# 运行
sudo docker run --rm --name nacos -e MODE=standalone -e NACOS_AUTH_ENABLE=false -e NACOS_AUTH_TOKEN=MjM1ZmU4NjAxMzU1... -v /mydata/nacos/logs:/home/nacos/logs -v /mydata/nacos/conf:/home/nacos/conf --restart -p 8848:8848 -p 9848:9848 -p 9849:9849 --restartnacos/nacos-server:v3.1.0

# 说明
# 8848:HTTP端口
# 9848:RPC端口
# 8080:控制台页面端口
# 控制台登录username:nacos
# 控制台登录password:nacos

1-6 仿Manus能自主决策的框架: Jmanus

manus: 多智能体的框架。通过manus大模型能够自动的帮我们完成一系列的工作,而不是单纯的画一张画,给我们提供一些信息而已。 Menus这个框架它的创新之处就是在于使用多个智能体互相协作来完成用户的需求。举例帮助用户进行购物的这么一个需求,他就使用了三个智能体。第一个智能体就是去挖掘用户的购物偏好。第二个智能体就是进行购物价格的对比。第三个智能体就是进行下单付款的操作。

Jmanus基于Openmanus开发的。是用java语言来进行开发的,多智能体互相协作的一个开发框架。

SpringAi Alibaba 文档 https://java2ai.com/

Spring Al Alibaba 仓库 https://github.com/alibaba/spring-ai-alibaba

下载https://github.com/leecheedoo/spring-ai-alibaba-jmanus的jmanus,启动项目,访问地址http://localhost:18080/ui/index.html,配置百炼key,然后测试访问问题(Prompt ):通过百度查询阿里巴巴最新股价,将结果保存到用户目录本地文件

1-7 具备ReAct核心能力的框架: AgentScope

两个多智能体的框架,jmanner、agentcope。这两个多智能体的框架,它们不只是一个多智能体的协同,更重要的它是一个agent自主代理的设计思想的一个多智能体框架。 也就是整个完成用户的需求的整个流程。包括了步骤的制定,包括了任务的分解以及分发,也包括了工具的使用,还包括了结果的认证。 这些都不需要人为的去介入,而是由智能体自主的去思考以及执行。

agents scope,它的出现比jmenus要晚一点,也就说明了这个agentcope它的在这个多智能体的协同,以及智能体的自主代理的核心架构上都比jminus要优秀。 而且agents cope它是完全基于springAIAlibaba的,他所使用的函数方法都是基于springAIAlibaba这个开发框架上面所改进出来的。 Agent cope它是分为两个版本,一个是python版本,一个是java版本。

AgentScope-Java 文档: https://java.agentscope.io/zh/intro.html

AgentScope 采用 ReAct(推理-行动)范式,使智能体能够自主规划和执行复杂任务。与传统的工作流方法不同,ReAct 智能体能够动态决定使用哪些工具以及何时使用,实时适应不断变化的需求。

核心亮点

  • 智能体自主,全程可控
  • 内置工具
  • 无缝集成
  • 生产级别

创建项目,导入依赖

xml

<groupId>com.imooc</groupId>
<artifactId>AgentScope_1_0_7</artifactId>
<version>1.0-SNAPSHOT</version>


<properties>
    <AgentScope.version>1.0.7</AgentScope.version>
    <logback.version>1.4.14</Logback.version>
    
    <maven.compiler.source>17</maven.compiler.source>
    <maven.compiler.target>17</maven.compiler.target>
    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
</properties>

<dependencies>
    <dependency>
        <groupId>io.agentscope</groupId>
        <artifactId> agentscope</artifactId>
        <version>${AgentScope.version}</version>
    </dependency>
    <dependency>
       <groupId>ch.qos.Logback</groupId>
        <artifactId>logback-classic</artifactId>
        <version>${logback.version}</version>
    </dependency>
</dependencies>