🧩 MCP生态

AI Agent生产力栈深度拆解：CLI、MCP、Skill如何协同工作

发布时间：2026-05-27 分类： MCP生态

摘要：AI Agent生产力栈深度拆解——CLI、MCP、Skill如何成为“AI干活三件套”？钉钉、飞书、企业微信在同一周开源了自己的CLI，这个信号很明确：AI Agent的落地，需要一套标准化的“手脚”。但很多开发者还是一头雾水：CLI、MCP、Skill到底怎么配合？今天我们就把这套“AI干活三件套”拆开看明白。一、CLI：AI的“手脚”，负责执行具体命令CLI（命令行界面）是Agent与...

AI Agent生产力栈深度拆解——CLI、MCP、Skill如何成为“AI干活三件套”？

钉钉、飞书、企业微信在同一周开源了自己的CLI，这个信号很明确：AI Agent的落地，需要一套标准化的“手脚”。但很多开发者还是一头雾水：CLI、MCP、Skill到底怎么配合？今天我们就把这套“AI干活三件套”拆开看明白。

一、CLI：AI的“手脚”，负责执行具体命令

CLI（命令行界面）是Agent与外部世界交互的执行层。想象一下，AI大脑想好了“给客户发邮件”，但需要手去敲键盘——CLI就是这只手。

实际场景：你让AI助手“整理上周销售数据并生成报告”。AI的“思考”过程在模型内部完成，但“读取数据库→清洗数据→生成图表→保存文件”这些动作，都需要CLI来执行。

钉钉开源的ding-cli就典型：它封装了消息发送、日程创建、审批流触发等原子操作。开发者不用再从零写API调用，直接ding-cli send-msg --to group --content "报告已生成"就能让AI把结果发到群里。

代码示例：用CLI封装一个文件处理Agent

#!/bin/bash
# skill-file-organizer.sh
# 这是一个简单的“文件整理”Skill的CLI部分

ACTION=$1
FILE_PATH=$2

case $ACTION in
  "classify")
    # 调用AI模型分类，这里简化为按扩展名
    if [[ $FILE_PATH == *.pdf ]]; then
      echo "文档类"
    elif [[ $FILE_PATH == *.jpg ]]; then
      echo "图片类"
    else
      echo "其他"
    fi
    ;;
  "compress")
    # 执行压缩命令
    tar -czf "${FILE_PATH}.tar.gz" "$FILE_PATH"
    echo "已压缩: ${FILE_PATH}.tar.gz"
    ;;
  *)
    echo "用法: $0 {classify|compress} <文件路径>"
    ;;
esac

这个脚本就是最基础的CLI——AI通过调用它来执行文件分类或压缩。

二、MCP（模型上下文协议）：AI的“神经”，实现智能体间通信

单个CLI工具是孤立的。当需要多个Agent协作时（比如“销售Agent”调用“邮件Agent”再通知“日志Agent”），就需要通信协议。MCP就是为此而生的“神经网络”。

MCP定义了Agent之间如何发现彼此、描述能力、传递任务和结果。它不关心具体执行，只负责“协调”。

行业动态：飞书开源的feisu-mcp实现了任务队列和状态同步。企业微信的wecom-mcp则侧重会话上下文保持。这说明MCP正成为企业级Agent协作的事实标准。

实际应用：电商客服自动化流水线

用户咨询 → [接待Agent] --MCP--> [订单查询Agent] --MCP--> [物流Agent]
                    ↓                        ↓                    ↓
               [CLI:调用客服API]      [CLI:查询数据库]      [CLI:调快递API]

每个Agent通过MCP声明自己的能力（如“我能查订单”），其他Agent发现并调用它。整个过程对用户透明，体验就像跟一个全能客服对话。

三、Skill：AI的“肌肉”，封装可复用的专业能力

Skill是能力封装单元。它把“CLI命令+提示词模板+处理逻辑”打包成一个可插拔模块。如果说CLI是单个动作，Skill就是一套组合拳。

结构拆解：一个完整的Skill通常包含：

manifest.json：描述文件，声明这个Skill能干什么、需要什么参数
prompt_template.txt：提示词模板，指导AI如何使用这个Skill
executor.sh：CLI执行脚本（就是上面示例的升级版）
handler.py：可选的业务逻辑处理

代码示例：构建一个“会议纪要生成”Skill

// manifest.json
{
  "name": "meeting_minutes_generator",
  "description": "将会议录音转为结构化纪要",

![配图](https://yitb.com/usr/uploads/covers/cover_mcp_20260527_081931.jpg)

  "parameters": {
    "audio_file": "音频文件路径",
    "meeting_type": "周会/项目会/头脑风暴"
  },
  "cli_command": "./generate_minutes.sh",
  "output_format": "markdown"
}

#!/bin/bash
# generate_minutes.sh
AUDIO_FILE=$1
MEETING_TYPE=$2

# 1. 调用语音转文字CLI
transcript=$(whisper-cli "$AUDIO_FILE" --language zh)

# 2. 调用AI模型总结（通过MCP或直接API）
summary=$(ai-cli summarize --text "$transcript" --type "$MEETING_TYPE")

# 3. 生成Markdown文件
echo "# 会议纪要 - $(date)" > minutes.md
echo "## 类型: $MEETING_TYPE" >> minutes.md
echo "## 核心结论" >> minutes.md
echo "$summary" >> minutes.md

echo "已生成: minutes.md"

这个Skill把语音识别、AI总结、文件生成三个CLI命令串成了自动化流水线。开发者可以直接复用，不用每次重新造轮子。

四、三者协同：构建高效AI自动化工作流

真正的威力在于三者配合。以“龙虾官网内容自动发布”为例：

Skill层：“文章发布”Skill封装了“SEO检查→格式转换→多平台发布→数据回传”流程
CLI层：每个步骤对应具体CLI工具（seo-checker、markdown-to-html、platform-publisher）
MCP层：当Skill执行到“多平台发布”时，通过MCP发现可用的“龙虾发布Agent”、“微信公众号Agent”，分配任务并收集结果

部署实战：在服务器搭建Agent工作流

# 1. 安装基础CLI工具
npm install -g @lalongxia/cli-tools
pip install mcp-sdk

# 2. 下载现成Skill库
git clone https://github.com/lalongxia/skills-marketplace
cd skills-marketplace && ./install.sh

# 3. 启动MCP协调器
mcp-coordinator start --port 8080

# 4. 注册你的Agent
lalongxia-cli register-agent \
  --name "内容助手" \
  --skills "article_publish,seo_optimize" \
  --mcp-endpoint "http://localhost:8080"

现在，你就可以通过自然语言指令触发整个流水线：“帮我把这篇技术文章同步到龙虾官网和公众号”。

五、商业价值与下一步行动

这套栈的商业价值很直接：把定制化开发变成模块化组装。以前需要2周开发的自动化流程，现在可能2小时就能搭出来。

给开发者的行动清单：

立即体验：去GitHub下载钉钉/飞书开源的CLI，跑通一个“发送消息”的示例
拆解需求：把你工作中最重复的任务拆解成“CLI动作→Skill封装→MCP协调”
参与生态：龙虾官网的Agent市场正在征集Skill，把你封装好的模块提交上去，既能验证想法也可能获得收益
关注标准：MCP协议还在快速演进，加入相关技术社区（比如龙虾的开发者群），掌握第一手动态

AI Agent的落地不再是“一个模型包打天下”，而是CLI、MCP、Skill各司其职的工程化体系。现在入场，正是时候。

下一步：打开终端，运行curl -fsSL https://get.lalongxia.com/cli | sh，安装龙虾CLI工具包，亲手搭一个你的第一个Agent工作流。

返回首页