🧩 MCP生态

AI Agent生产力栈深度拆解:CLI、MCP、Skill如何协同工作

发布时间:2026-05-27 分类: MCP生态
摘要:AI Agent生产力栈深度拆解——CLI、MCP、Skill如何成为“AI干活三件套”?钉钉、飞书、企业微信在同一周开源了自己的CLI,这个信号很明确:AI Agent的落地,需要一套标准化的“手脚”。但很多开发者还是一头雾水:CLI、MCP、Skill到底怎么配合?今天我们就把这套“AI干活三件套”拆开看明白。一、CLI:AI的“手脚”,负责执行具体命令CLI(命令行界面)是Agent与...

封面

AI Agent生产力栈深度拆解——CLI、MCP、Skill如何成为“AI干活三件套”?

钉钉、飞书、企业微信在同一周开源了自己的CLI,这个信号很明确:AI Agent的落地,需要一套标准化的“手脚”。但很多开发者还是一头雾水:CLI、MCP、Skill到底怎么配合?今天我们就把这套“AI干活三件套”拆开看明白。

一、CLI:AI的“手脚”,负责执行具体命令

CLI(命令行界面)是Agent与外部世界交互的执行层。想象一下,AI大脑想好了“给客户发邮件”,但需要手去敲键盘——CLI就是这只手。

实际场景:你让AI助手“整理上周销售数据并生成报告”。AI的“思考”过程在模型内部完成,但“读取数据库→清洗数据→生成图表→保存文件”这些动作,都需要CLI来执行。

钉钉开源的ding-cli就典型:它封装了消息发送、日程创建、审批流触发等原子操作。开发者不用再从零写API调用,直接ding-cli send-msg --to group --content "报告已生成"就能让AI把结果发到群里。

代码示例:用CLI封装一个文件处理Agent

#!/bin/bash
# skill-file-organizer.sh
# 这是一个简单的“文件整理”Skill的CLI部分

ACTION=$1
FILE_PATH=$2

case $ACTION in
  "classify")
    # 调用AI模型分类,这里简化为按扩展名
    if [[ $FILE_PATH == *.pdf ]]; then
      echo "文档类"
    elif [[ $FILE_PATH == *.jpg ]]; then
      echo "图片类"
    else
      echo "其他"
    fi
    ;;
  "compress")
    # 执行压缩命令
    tar -czf "${FILE_PATH}.tar.gz" "$FILE_PATH"
    echo "已压缩: ${FILE_PATH}.tar.gz"
    ;;
  *)
    echo "用法: $0 {classify|compress} <文件路径>"
    ;;
esac

这个脚本就是最基础的CLI——AI通过调用它来执行文件分类或压缩。

二、MCP(模型上下文协议):AI的“神经”,实现智能体间通信

单个CLI工具是孤立的。当需要多个Agent协作时(比如“销售Agent”调用“邮件Agent”再通知“日志Agent”),就需要通信协议。MCP就是为此而生的“神经网络”。

MCP定义了Agent之间如何发现彼此、描述能力、传递任务和结果。它不关心具体执行,只负责“协调”。

行业动态:飞书开源的feisu-mcp实现了任务队列和状态同步。企业微信的wecom-mcp则侧重会话上下文保持。这说明MCP正成为企业级Agent协作的事实标准

实际应用:电商客服自动化流水线

用户咨询 → [接待Agent] --MCP--> [订单查询Agent] --MCP--> [物流Agent]
                    ↓                        ↓                    ↓
               [CLI:调用客服API]      [CLI:查询数据库]      [CLI:调快递API]

每个Agent通过MCP声明自己的能力(如“我能查订单”),其他Agent发现并调用它。整个过程对用户透明,体验就像跟一个全能客服对话。

三、Skill:AI的“肌肉”,封装可复用的专业能力

Skill是能力封装单元。它把“CLI命令+提示词模板+处理逻辑”打包成一个可插拔模块。如果说CLI是单个动作,Skill就是一套组合拳。

结构拆解:一个完整的Skill通常包含:

  1. manifest.json:描述文件,声明这个Skill能干什么、需要什么参数
  2. prompt_template.txt:提示词模板,指导AI如何使用这个Skill
  3. executor.sh:CLI执行脚本(就是上面示例的升级版)
  4. handler.py:可选的业务逻辑处理

代码示例:构建一个“会议纪要生成”Skill

// manifest.json
{
  "name": "meeting_minutes_generator",
  "description": "将会议录音转为结构化纪要",

![配图](https://yitb.com/usr/uploads/covers/cover_mcp_20260527_081931.jpg)

  "parameters": {
    "audio_file": "音频文件路径",
    "meeting_type": "周会/项目会/头脑风暴"
  },
  "cli_command": "./generate_minutes.sh",
  "output_format": "markdown"
}
#!/bin/bash
# generate_minutes.sh
AUDIO_FILE=$1
MEETING_TYPE=$2

# 1. 调用语音转文字CLI
transcript=$(whisper-cli "$AUDIO_FILE" --language zh)

# 2. 调用AI模型总结(通过MCP或直接API)
summary=$(ai-cli summarize --text "$transcript" --type "$MEETING_TYPE")

# 3. 生成Markdown文件
echo "# 会议纪要 - $(date)" > minutes.md
echo "## 类型: $MEETING_TYPE" >> minutes.md
echo "## 核心结论" >> minutes.md
echo "$summary" >> minutes.md

echo "已生成: minutes.md"

这个Skill把语音识别、AI总结、文件生成三个CLI命令串成了自动化流水线。开发者可以直接复用,不用每次重新造轮子。

四、三者协同:构建高效AI自动化工作流

真正的威力在于三者配合。以“龙虾官网内容自动发布”为例:

  1. Skill层:“文章发布”Skill封装了“SEO检查→格式转换→多平台发布→数据回传”流程
  2. CLI层:每个步骤对应具体CLI工具(seo-checkermarkdown-to-htmlplatform-publisher
  3. MCP层:当Skill执行到“多平台发布”时,通过MCP发现可用的“龙虾发布Agent”、“微信公众号Agent”,分配任务并收集结果

部署实战:在服务器搭建Agent工作流

# 1. 安装基础CLI工具
npm install -g @lalongxia/cli-tools
pip install mcp-sdk

# 2. 下载现成Skill库
git clone https://github.com/lalongxia/skills-marketplace
cd skills-marketplace && ./install.sh

# 3. 启动MCP协调器
mcp-coordinator start --port 8080

# 4. 注册你的Agent
lalongxia-cli register-agent \
  --name "内容助手" \
  --skills "article_publish,seo_optimize" \
  --mcp-endpoint "http://localhost:8080"

现在,你就可以通过自然语言指令触发整个流水线:“帮我把这篇技术文章同步到龙虾官网和公众号”。

五、商业价值与下一步行动

这套栈的商业价值很直接:把定制化开发变成模块化组装。以前需要2周开发的自动化流程,现在可能2小时就能搭出来。

给开发者的行动清单

  1. 立即体验:去GitHub下载钉钉/飞书开源的CLI,跑通一个“发送消息”的示例
  2. 拆解需求:把你工作中最重复的任务拆解成“CLI动作→Skill封装→MCP协调”
  3. 参与生态:龙虾官网的Agent市场正在征集Skill,把你封装好的模块提交上去,既能验证想法也可能获得收益
  4. 关注标准:MCP协议还在快速演进,加入相关技术社区(比如龙虾的开发者群),掌握第一手动态

AI Agent的落地不再是“一个模型包打天下”,而是CLI、MCP、Skill各司其职的工程化体系。现在入场,正是时候。


下一步:打开终端,运行curl -fsSL https://get.lalongxia.com/cli | sh,安装龙虾CLI工具包,亲手搭一个你的第一个Agent工作流。

返回首页