MCP Gateway — 谁在控制AI Agent的工具调用？

我的一个Claude Code会话连接了7个MCP服务器。GitHub、Notion、Google Calendar、Gmail、Chrome DevTools、NotebookLM，还有Telegram。这个Agent可以读我的邮件、创建日历事件、编辑Notion页面、打开Chrome标签页。

那谁在监控这一切？

没有人。至少在我的本地环境中是这样。

MCP成功了，安全层还没有

MCP（Model Context Protocol）的增长势头惊人。Python + TypeScript SDK合计月下载量超过9700万，Anthropic、OpenAI、Google、Microsoft、Amazon全部支持。2024年底由Anthropic创建，2025年12月捐赠给Linux Foundation的AAIF后，事实上成为了”AI Agent调用外部工具的方式”的标准。

问题在于，这个协议专注于连接，对控制关注甚少。

创建MCP服务器时定义工具（tool），客户端调用这些工具。认证？OAuth 2.1已经进入规范。但”这个Agent每天能调用这个工具多少次”、“返回敏感数据的工具必须经过审批才能调用”这样的策略层，MCP协议本身并不包含。那是实现方的责任。

于是MCP Gateway的概念应运而生。

MCP Gateway是什么

想象一下API Gateway。就像用Kong或AWS API Gateway在后端前面放一个反向代理一样，在MCP服务器群前面放一个代理。

Agent → MCP Gateway → MCP服务器群

Gateway的职责：

认证/授权：哪个Agent可以访问哪些工具
速率限制：限制工具调用频率
审计日志：记录谁在何时调用了什么工具
策略执行：某些工具需要人工审批后才能执行
流量路由：将请求转发到相应的MCP服务器

我在本地环境做了简单测试——用Node.js做一个MCP代理，夹在Claude Code和实际MCP服务器之间。

// 最简单的MCP Gateway骨架
import { Server } from "@modelcontextprotocol/sdk/server/index.js";
import { StdioServerTransport } from "@modelcontextprotocol/sdk/server/stdio.js";
import { CallToolRequestSchema } from "@modelcontextprotocol/sdk/types.js";

const gateway = new Server({ name: "mcp-gateway", version: "0.1.0" }, {
  capabilities: { tools: {} }
});

// 策略引擎 — 在这里允许/拒绝调用
const policy = {
  "gmail_read_message": { rateLimit: 10, requireApproval: false },
  "gmail_create_draft": { rateLimit: 5, requireApproval: true },
  "gcal_delete_event": { rateLimit: 2, requireApproval: true },
  "notion-update-page": { rateLimit: 20, requireApproval: false },
};

const callCount: Record<string, number> = {};

gateway.setRequestHandler(CallToolRequestSchema, async (request) => {
  const toolName = request.params.name;
  const rule = policy[toolName];
  
  // 速率限制检查
  callCount[toolName] = (callCount[toolName] || 0) + 1;
  if (rule && callCount[toolName] > rule.rateLimit) {
    return {
      content: [{ type: "text", text: `Rate limit exceeded for ${toolName}` }],
      isError: true,
    };
  }
  
  // 需要审批的工具进行拦截
  if (rule?.requireApproval) {
    console.error(`[GATEWAY] Approval required for: ${toolName}`);
    // 实际上这里会通过Slack/Telegram发送审批请求
  }
  
  // 审计日志
  console.error(`[AUDIT] ${new Date().toISOString()} | ${toolName} | args: ${JSON.stringify(request.params.arguments)}`);
  
  // 转发到实际MCP服务器（此处省略）
  return await forwardToUpstream(toolName, request.params.arguments);
});

这段代码能在生产环境中使用吗？说实话还不行。但核心思想已经表达清楚了——Agent的工具调用必须经过一个统一的节点，而这个节点要能执行策略。

实际跑起来才发现缺了什么

把上面的代码塞进Claude Code跑了一下。结论是——直接用不了。

第一个问题是工具列表同步。Gateway要拦截CallToolRequest，首先得告诉客户端（Claude Code）“我有这些工具”。上面的代码没有listTools处理器。你得连接upstream MCP服务器，拿到工具列表，原样转发给客户端。

import { ListToolsRequestSchema } from "@modelcontextprotocol/sdk/types.js";

gateway.setRequestHandler(ListToolsRequestSchema, async () => {
  const upstreamTools = await fetchToolsFromUpstream();
  return { tools: upstreamTools };
});

加了这个能跑起来，但upstream服务器有多个时工具名会冲突。我的环境里Gmail和Google Calendar都暴露了list这种generic名称，得加命名空间。

第二个问题是限流的生命周期。上面代码里的callCount在内存里。进程重启计数就归零。Claude Code每个会话都会重新启动MCP服务器，所以换个会话限制就重置了。“每天10次”这种策略根本执行不了。

第三，requireApproval往console.error输出完全没用。没人在实时看stderr。真要拿到审批，得往外部渠道（Telegram、Slack）发请求然后阻塞等响应——在stdio模式的MCP里实现异步等待相当麻烦。

想了想怎么一次性解决这三个问题，至少前两个的答案很简单：把审计日志写到SQLite里，而不是文件或内存。

审计日志写入SQLite

把原来通过console.error输出的审计日志存到SQLite表里，限流生命周期的问题也一并解决了。进程重启DB还在。

import Database from "better-sqlite3";

const db = new Database("mcp-audit.db");

db.exec(`
  CREATE TABLE IF NOT EXISTS audit_log (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    timestamp TEXT DEFAULT (datetime('now')),
    tool_name TEXT NOT NULL,
    args TEXT,
    result_status TEXT DEFAULT 'ok',
    latency_ms INTEGER,
    blocked INTEGER DEFAULT 0,
    block_reason TEXT
  )
`);

const insertLog = db.prepare(`
  INSERT INTO audit_log (tool_name, args, result_status, latency_ms, blocked, block_reason)
  VALUES (?, ?, ?, ?, ?, ?)
`);

const countToday = db.prepare(`
  SELECT COUNT(*) as cnt FROM audit_log
  WHERE tool_name = ? AND timestamp > datetime('now', '-1 day') AND blocked = 0
`);

用countToday查询替代内存里的callCount字典，即使换了会话也能准确追踪”今天Gmail读取调了几次”。Gateway处理器变成这样：

gateway.setRequestHandler(CallToolRequestSchema, async (request) => {
  const toolName = request.params.name;
  const rule = policy[toolName];
  const start = Date.now();

  if (rule) {
    const { cnt } = countToday.get(toolName) as { cnt: number };
    if (cnt >= rule.rateLimit) {
      insertLog.run(toolName,
        JSON.stringify(request.params.arguments),
        "blocked", 0, 1, "rate_limit");
      return {
        content: [{ type: "text",
          text: `Rate limit exceeded: ${toolName} (${cnt}/${rule.rateLimit} today)` }],
        isError: true,
      };
    }
  }

  const result = await forwardToUpstream(
    toolName, request.params.arguments);
  const latency = Date.now() - start;

  insertLog.run(toolName,
    JSON.stringify(request.params.arguments),
    "ok", latency, 0, null);
  return result;
});

积累的日志能干什么

跑了几天，mcp-audit.db里攒了不少数据。能做的事比想象的多。

工具调用频率——哪个工具被调用最多，一目了然。

SELECT tool_name, COUNT(*) as calls, ROUND(AVG(latency_ms)) as avg_ms
FROM audit_log WHERE blocked = 0
GROUP BY tool_name ORDER BY calls DESC LIMIT 10;

我这里notion-search遥遥领先。Agent做任何事之前都先搜一下Notion。看到这个数据我觉得缓存Notion搜索结果可能有意义。

拦截率——被限流挡住的调用占总数的百分比。

SELECT tool_name,
  SUM(CASE WHEN blocked = 1 THEN 1 ELSE 0 END) as blocked,
  COUNT(*) as total,
  ROUND(100.0 * SUM(blocked) / COUNT(*), 1) as block_rate
FROM audit_log GROUP BY tool_name HAVING blocked > 0;

拦截率高说明两件事之一：限制太严了，或者Agent有反复调用同一工具的低效模式。如果是后者，该调的是prompt。

时段分布——Agent什么时候最活跃。

SELECT strftime('%H', timestamp) as hour, COUNT(*) as calls
FROM audit_log GROUP BY hour ORDER BY hour;

结果不意外——调用集中在我的cron任务运行的11点到12点。团队环境下这个数据可以用来决定MCP服务器的负载均衡时机。

这些数据的真正价值在于它成为策略调优的依据。“Gmail读取每天10次够不够？“不用猜了，看实际使用模式就行。我的情况是gmail_read_message平均每天才调3次，限制10绰绰有余。而notion-search每天接近40次调用，限制20根本不够，调到了30。

什么时候真正需要它

“我们团队还没怎么用MCP”——这个借口快要过期了。

说一个我亲身经历的案例：在用Claude Code通过Notion MCP编辑页面时，我不小心碰到了另一个团队的页面。Agent从搜索结果中选了一个标题相似的页面，我没多想就按了批准按钮。数据没丢，但挺尴尬的。

这事发生在一个开发者的本地环境里，也就尴尬一下。但如果团队50人都在用Agent，每个Agent连接了5到10个MCP服务器呢？没有审计日志？无法追踪谁调用了什么？

企业需要MCP Gateway的真正原因不是安全，而是可见性。你得看得到Agent在干什么。

已经出现的解决方案

以MCP Gateway命名的开源和商业项目已经出现了。据我调研，主要有两种方式。

1. 代理模式 — 在Agent和MCP服务器之间放一个反向代理。与现有API Gateway架构相同。配置简单，可以复用现有基础设施。

2. Sidecar模式 — 给每个MCP服务器附加策略引擎。与服务网格（Istio、Linkerd）的sidecar模式相同。可以实现更细粒度的控制，但运维复杂度上升。

我认为小团队用代理模式就够了。走sidecar路线是在MCP服务器超过20个、各团队需要不同策略的场景下才有必要——到了那个规模，你应该已经有专职的平台工程师了。

但这是一个过渡方案

这里需要批判性地思考一下。

MCP Gateway之所以被需要，说明MCP协议本身缺少治理层。我们在HTTP上面搭API Gateway，不是因为HTTP没有认证，而是因为需要业务逻辑和流量管理。同理，MCP很可能会在协议层面推出定义策略的扩展。

到那时，现在构建的Gateway就变成了遗留系统。

我个人预计6个月内MCP规范会加入类似policy extension的东西。从捐赠给Linux Foundation后治理相关讨论的活跃程度来看，方向已经定了。但在这6个月里不加任何控制地运行Agent是有风险的，所以Gateway是填补这段空白的过渡方案。

还有一点——引入Gateway会拖慢Agent的响应速度。多经过一层代理，延迟增加是必然的。本地测试下来，每次工具调用增加约50到100毫秒的开销。大多数情况下感知不到，但当LLM在一个任务中调用工具20到30次时，总计多出1到2秒，这会影响用户体验。

还没解决的

用SQLite存日志、根据数据调策略，这些一个人就能做。但requireApproval——拿到人类审批这部分还没真正实现。

下一步想试的是接Telegram机器人。requireApproval: true的工具调用进来时，Gateway往Telegram发审批请求，用户点”OK”之前一直hold住请求。想法简单，但在stdio模式的MCP里做异步等待需要改结构。现在是同步流程——请求进来就得立刻返回响应。

而且从根本上说，这只在个人开发者的本地环境有意义。团队用的话需要Gateway本身的认证、多租户、策略管理UI——到了那个程度，该用产品而不是自己造。

给AI Agent工具的时候，“不能做什么”和”能做什么”一样重要。MCP Gateway是后者最现实的起点，光加一个SQLite就能让”我的Agent在干什么”变得可见。从那里开始，策略可以靠数据来定。

Reading Complete!

MCP Gateway — 谁在控制AI Agent的工具调用？

MCP成功了，安全层还没有

MCP Gateway是什么

实际跑起来才发现缺了什么

审计日志写入SQLite

积累的日志能干什么

什么时候真正需要它

已经出现的解决方案

但这是一个过渡方案

还没解决的

阅读其他语言版本

这篇文章有帮助吗？

关于作者

Kim Jangwook

Reading Complete!

MCP成功了，安全层还没有

MCP Gateway是什么

实际跑起来才发现缺了什么

审计日志写入SQLite

积累的日志能干什么

什么时候真正需要它

已经出现的解决方案

但这是一个过渡方案

还没解决的

阅读其他语言版本

这篇文章有帮助吗？

关于作者

Kim Jangwook

相关文章

AI集群构建SQLite克隆 — 多智能体分工的现实

NIST AI代理安全标准 — EM现在应该准备的框架

ADL(Agent Definition Language) — AI智能体治理的OpenAPI标准