从 MCP 到 Skills：大模型 Agent 的「工具 + 技能」双引擎

GGBOND2026/1/29大约 6 分钟

从 MCP 到 Skills：解锁 Agent 的「工具 + 技能」双引擎

在 AI Agent 浪潮中，MCP（模型上下文协议） 和 Skills（技能体系） 是两大关键拼图。
MCP 解决工具的互联互通，Skills 解决如何高效使用工具。
两者结合，推动 Agent 能力大幅跃升。

一、为什么 LLM 不能直接调用工具，而 Agent 可以？

LLM 和 Agent 的核心区别

LLM：只有“大脑”。它擅长理解和生成文本，但没有执行能力。
例如让它“查北京天气”，它能告诉你用什么 API，却无法自己发请求。
Agent：大脑 + 手脚 + 目标。
在 LLM 基础上加了执行层（运行代码、调用 API）和目标驱动（主动规划、迭代）。

Agent 调用工具的真实分工

LLM 负责思考和决策：分析需求 → 决定调用哪个工具 → 输出工具名 + 参数。
执行层负责实际操作：接收指令 → 发网络请求 / 跑代码 → 把结果返回给 LLM。
LLM 拿到结果后 → 整理成自然语言 → 回复用户。

为什么不让 LLM 直接执行工具？（三个关键原因）

物理限制：LLM 只是服务器上的数学模型，只能处理文本，没有网络、文件系统等“物理”能力。
安全隔离：直接执行代码风险极高（可能删文件、跑恶意命令）。
通过沙箱 + 权限控制，执行层把危险操作限制在安全范围内。
模块化设计：思考和执行分离，更清晰、更易维护、升级。

一句话总结：
LLM = 只会思考的模型
Agent = 能思考 + 能执行 + 有目标的完整智能体

MCP 的作用：让执行层用统一标准对接各种工具，避免为每个工具写一套代码。

二、MCP：让 Agent 的工具箱无限扩展

MCP 是什么？

MCP（Model Context Protocol）是 Anthropic 于 2024 年 11 月推出的开放标准协议（现已获广泛采用）。
它相当于 AI 领域的 USB-C 接口：
让不同大模型（Claude、DeepSeek、Qwen 等）和各种工具（数据库、文件、API）实现即插即用，大幅降低集成成本。

MCP 的协作角色（简单类比）

LLM → 皇帝：只决策，不直接接触外部。
Agent → 钦差：接收指令、调用工具、反馈结果。
MCP → 标准化接口规范：让 Agent 轻松调用各种“地方工具”。

典型调用流程（以代码执行工具为例）

Agent 通过 MCP 获取可用工具列表（工具名、参数、描述）。
用户提问 → Agent 把问题 + 工具列表发给 LLM。
LLM 选工具、生成参数 → Agent 通过 MCP 调用工具。
工具执行 → 返回结果 → Agent 反馈给 LLM → LLM 整理回复用户。

MCP 的价值与痛点

价值：

工具一次开发，多模型复用（Claude、开源模型都行）。
开发者容易做自定义工具（企业内部系统、私有数据）。

痛点：
工具太多时，每次请求都要传完整工具列表 → 消耗大量 Token（像每次点菜都给整本菜单）。

三、Skills：教 Agent “怎么做事”

MCP 解决“有什么工具”，Skills 解决“怎么用好工具”。

Skills 是什么？

Skills 是结构化的做事方法论，本质是系统提示词的进阶版。
它明确规定：在某场景下，按什么顺序、调用什么工具、遵循什么逻辑。

例如“代码审查 Skill”：

先调用静态分析工具查语法/漏洞
再用关键词检索知识库找历史解决方案
最后整理成报告

Skills 的三大价值

标准化流程：把模糊需求变成清晰步骤，避免 Agent 乱试。
沉淀领域知识：把企业特有的运维/排查逻辑固化成可复用 Skill。
降低 LLM 负担：LLM 不用每次从零规划步骤，只需认可/微调 Skill 决策，效率显著提升。

MCP + Skills 的协同

MCP 提供工具可达性（能调用什么）
Skills 提供使用方法（怎么组合、先后顺序）
两者叠加 → Agent 能力指数级增长

四、实战示例：代码审查 Agent

步骤 1：基于 MCP 开发工具

工具 A：代码静态分析（输入路径 → 输出漏洞列表）
工具 B：知识库检索（输入关键词 → 输出历史解法）

步骤 2：定义 CodeReview Skill

触发条件：用户提交代码

执行步骤：
1. 调用 MCP 工具 A（静态分析），获取结果
2. 提取漏洞关键词
3. 对每个关键词调用 MCP 工具 B（知识库检索）
4. 整合结果，生成结构化报告

步骤 3：真实执行流程

用户上传代码 → 触发 Skill →
LLM 决策调用工具 A → 执行 → 结果回来
LLM 分析结果、提取关键词 → 决策调用工具 B → 执行 → 结果回来
LLM 整合 → 输出报告

关键点：LLM 始终是决策大脑（选工具、分析结果、规划下一步），执行层 + MCP 负责安全落地。

五、未来：MCP + Skills 的可能性

垂直领域 Agent 大爆发（金融投研、医疗辅助诊断、法律合同审查等）
工具 + 技能生态化，像应用商店一样共享 MCP 工具和 Skill 模板

掌握 MCP（工具扩展） + Skills（流程设计），是打造下一代 Agent 的核心竞争力。

一句话总结：

LLM 提供智能核心，但缺“手脚”；
Agent 通过执行层 + MCP + Skills补齐手脚、标准化工具接入和使用方法，最终成为能真正干活的完整智能体。

为什么既限制 LLM，又给它 Agent 和工具，然后只靠沙箱控制？

核心矛盾其实是能力与安全的天平：

不给工具 → LLM 再聪明也只能“纸上谈兵”，实用价值很低。
直接让 LLM 执行代码/网络请求 → 极度危险（越狱提示、生成恶意代码、泄露数据、删除文件等几乎不可避免）。
折中方案（当前主流） → 给 LLM “思考 + 提需求”的权利，但把执行权交给独立的、可严格受控的执行层：
- 执行层跑在沙箱里（网络、文件、系统调用都受限）
- 每个工具调用都要经过白名单、参数校验、用户确认（很多产品会弹窗让用户批准）
- MCP 这类协议进一步把工具标准化、集中管理，更容易在网关层加审计、限流、阻断等安全措施

换句话说：
我们想要 LLM 的理解力和规划力，但不信任它有物理破坏力。
所以才设计了“大脑放飞，双手戴铐”的架构——Agent 就是这个“戴着手铐但能干活”的折中产物。