DeepSeek Free API 服务 (持续维护版)

⚠️ 说明: 原项目 llm-red-team/deepseek-free-api 已归档停止维护。本项目为 接替维护版本，持续跟进 DeepSeek 官网协议更新。

Important

新项目推荐：基于小米大模型官网逆向、原生支持 HTTP MCP 协议的新一代网关 MiMo Free API MCP 现已发布！

[ 中文 | English ]

支持我 ❤️

如果你正在寻找 AI 插件与工具的最佳实践，欢迎访问我的核心项目：

👉 Awesome Open WebUI — 汇集 Open WebUI 的最佳实践、插件、教程与资源。

特性概览

🚀 多协议端点：同时支持 OpenAI Chat Completions、OpenAI Responses、Anthropic Messages 三种 API 协议
🔧 MCP 服务：内置 Streamable HTTP MCP Server，提供 search 工具，适配 Cursor / Claude Desktop
🧠 DeepSeek V4：支持 V4-Flash / V4-Pro，上下文上限 1M tokens
🔍 联网搜索：自动解析搜索结果并附加引用
💭 深度思考 (R1)：完美适配 Fragment-based 协议，思考过程与回答严格分离
🔄 智能会话复用：基于消息指纹自动接续 DeepSeek 会话，减少 Agent 全量历史重放
🎯 多 Token 支持：逗号分隔多 Token，自动负载均衡
🐳 Docker 部署：支持 x86_64 / ARM64，一行命令启动

免责声明

Caution

工具调用警告：本项目工具调用基于提示词模拟与正则解析，不稳定，不支持原生 OpenAI/Anthropic Tools 协议，仅供实验性测试。

Warning

逆向 API 不稳定，建议前往 DeepSeek 官方平台付费使用 API，避免封禁风险。

本组织和个人不接受任何资金捐助和交易，此项目是纯粹研究交流学习性质！

仅限自用，禁止对外提供服务或商用，避免对官方造成服务压力，否则风险自担！

支持详情

1. 模型列表

系统通过解析模型名称中的关键字自动注入官方对应的协议参数，各功能可自由排列组合：

模型名称 (Model ID)	后端版本	专家模式	深度思考	联网搜索	说明
`deepseek`	V4-Flash	❌	❌	❌	基础对话模式
`deepseek-expert`	V4-Pro	✅	❌	❌	推荐：专家增强模式
`deepseek-r1`	V4-Flash	❌	✅	❌	R1 深度思考模式
`deepseek-search`	V4-Flash	❌	❌	✅	联网搜索模式
`deepseek-expert-r1`	V4-Pro	✅	✅	❌	V4-Pro + 深度思考
`deepseek-expert-search`	V4-Pro	✅	❌	✅	V4-Pro + 联网搜索
`deepseek-r1-search`	V4-Flash	❌	✅	✅	深度思考 + 搜索
`deepseek-expert-r1-search`	V4-Pro	✅	✅	✅	最强形态：全功能

映射逻辑：包含 expert → V4-Pro，否则 V4-Flash；包含 think/r1 → 开启思考；包含 search → 开启搜索。

2. 会话复用

基于 SQLite 存储的智能会话复用机制，开启后即使客户端不传 conversation_id，系统也能自动接续上下文。

环境变量：

CHAT_SESSION_REUSE=true — OpenAI Chat 接口自动复用
ANTHROPIC_SESSION_REUSE=true — Anthropic 接口自动复用（默认开启）
RESPONSES_SESSION_REUSE=true — OpenAI Responses 接口自动复用（默认开启）

复用逻辑：

隐式复用：系统提取除最后一条消息外的所有历史消息生成「指纹」，匹配数据库中的旧会话自动接续
显式复用：请求体传入 conversation_id: "session_id@parent_id"，优先级最高

优势：模型继承之前的搜索/思考/专家状态；仅发送最新一轮消息到官网，避免会话分裂。

3. MCP 服务

升级至 2025 Streamable HTTP 标准，适配 Cursor / Claude Desktop。

配置示例 (claude_desktop_config.json)：

{
  "mcpServers": {
    "deepseek-search": {
      "url": "http://localhost:8000/mcp",
      "type": "http",
      "headers": {
        "Authorization": "Bearer YOUR_TOKEN"
      }
    }
  }
}

提供的工具：

search(query) — 调用 DeepSeek 联网搜索，返回带引用的结构化资讯

代码示例

OpenAI Chat Completions

curl -X POST http://127.0.0.1:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -d '{
    "model": "deepseek-expert",
    "messages": [{"role": "user", "content": "你是谁？"}],
    "stream": false
  }'

多轮对话 (利用 `conversation_id`)

# 第二轮
curl -X POST http://127.0.0.1:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -d '{
    "model": "deepseek-expert",
    "conversation_id": "第一轮返回的id",
    "messages": [{"role": "user", "content": "刚才说了什么？"}]
  }'

OpenAI Responses (Codex CLI)

curl -X POST http://127.0.0.1:8000/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -d '{
    "model": "deepseek-expert",
    "input": "查上海天气",
    "stream": false
  }'

Anthropic Messages (Claude Code)

curl -X POST http://127.0.0.1:8000/v1/messages \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "deepseek-expert",
    "max_tokens": 512,
    "messages": [{"role": "user", "content": "你是谁？"}],
    "stream": false
  }'

接入准备

请确保您在中国境内或拥有中国境内的个人计算设备，否则部署后可能因无法访问 DeepSeek 而无法使用。

从 DeepSeek 获取 userToken：

进入 DeepSeek 发起任意对话
F12 打开开发者工具 → Application → LocalStorage
找到 userToken 的 value 值
作为 Authorization: Bearer TOKEN 使用

多账号接入

同个账号同时只能有一路输出，可通过逗号拼接多个 Token：

Authorization: Bearer TOKEN1,TOKEN2,TOKEN3

每次请求服务会从中挑选一个。

Docker 部署

提供自动构建的 Docker 镜像，支持 x86_64 和 ARM64 架构。

👉 查看所有可用镜像版本

Docker Compose (推荐)

services:
  deepseek-free-api:
    container_name: deepseek-free-api
    image: ghcr.io/fu-jie/deepseek-free-api:latest
    restart: always
    ports:
      - "8000:8000"
    environment:
      - TZ=Asia/Shanghai

docker compose up -d

Docker Run

docker run -it -d --init --name deepseek-free-api \
  -p 8000:8000 \
  -e TZ=Asia/Shanghai \
  ghcr.io/fu-jie/deepseek-free-api:latest

接口列表

`POST /v1/chat/completions` — OpenAI Chat

与 OpenAI chat-completions-api 兼容。支持流式与非流式。

Authorization: Bearer [userToken]

参数	类型	说明
`model`	string	模型名称，见模型列表
`messages`	array	对话消息
`stream`	boolean	是否流式输出，默认 false
`conversation_id`	string	可选，接续指定会话

`POST /v1/responses` — OpenAI Responses (Codex CLI)

适配 OpenAI Responses API，支持 previous_response_id 接续会话。

`POST /v1/messages` — Anthropic Messages (Claude Code)

适配 Anthropic Messages API。需携带 anthropic-version: 2023-06-01 头。支持深度思考映射为 Anthropic thinking delta。另保留兼容别名 POST /anthropic/v1/messages。

`GET /mcp` / `POST /mcp` — MCP Streamable HTTP

MCP 服务端点，提供 search 工具。适配 Cursor / Claude Desktop；客户端会根据 Streamable HTTP 协议同时使用 GET 和 POST。

`POST /token/check` — Token 存活检测

{"token": "eyJhbGci..."}

返回 {"live": true/false}。请勿频繁调用（间隔 ≥ 10 分钟）。

`GET /v1/models` — 模型列表

返回可用模型 ID 列表。

环境变量

环境变量	默认值	说明
`DEEP_SEEK_CHAT_AUTHORIZATION`	(空)	DeepSeek userToken，多个用逗号分隔。配置后无需在请求头传 Authorization
`SERVER_PORT`	8000	服务端口
`CHAT_SESSION_REUSE`	true	是否启用 Chat 接口会话复用
`CHAT_SESSION_TTL`	604800000	Chat 会话缓存 TTL（毫秒），默认 7 天
`ANTHROPIC_SESSION_REUSE`	true	是否启用 Anthropic 接口会话复用
`ANTHROPIC_SESSION_TTL`	604800000	Anthropic 会话缓存 TTL（毫秒）
`RESPONSES_SESSION_REUSE`	true	是否启用 Responses 接口会话复用
`RESPONSES_SESSION_TTL`	604800000	Responses 会话缓存 TTL（毫秒）

参考 .env.example 文件进行配置。

注意事项

Nginx 反代优化

如果使用 Nginx 反代，建议添加以下配置优化流式输出：

proxy_buffering off;
proxy_cache off;
proxy_read_timeout 300s;
chunked_transfer_encoding on;

Token 统计

详见 Token 统计文档。

Name		Name	Last commit message	Last commit date
Latest commit History 135 Commits
.github/workflows		.github/workflows
.vscode		.vscode
configs/dev		configs/dev
doc		doc
docs		docs
public		public
src		src
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
README_EN.md		README_EN.md
REVERSE_ENGINEERING_EXPERT_MODE.md		REVERSE_ENGINEERING_EXPERT_MODE.md
docker-compose.yml		docker-compose.yml
libs.d.ts		libs.d.ts
package-lock.json		package-lock.json
package.json		package.json
sha3_wasm_bg.7b9ca65ddd.wasm		sha3_wasm_bg.7b9ca65ddd.wasm
test_multiturn_tools.py		test_multiturn_tools.py
tsconfig.json		tsconfig.json
vercel.json		vercel.json
yarn.lock		yarn.lock

Folders and files

Latest commit

History

Repository files navigation

DeepSeek Free API 服务 (持续维护版)

支持我 ❤️

特性概览

目录

最近更新

免责声明

支持详情

1. 模型列表

2. 会话复用

3. MCP 服务

代码示例

OpenAI Chat Completions

多轮对话 (利用 conversation_id)

OpenAI Responses (Codex CLI)

Anthropic Messages (Claude Code)

接入准备

多账号接入

Docker 部署

Docker Compose (推荐)

Docker Run

接口列表

POST /v1/chat/completions — OpenAI Chat

POST /v1/responses — OpenAI Responses (Codex CLI)

POST /v1/messages — Anthropic Messages (Claude Code)

GET /mcp / POST /mcp — MCP Streamable HTTP

POST /token/check — Token 存活检测

GET /v1/models — 模型列表

环境变量

注意事项

Nginx 反代优化

Token 统计

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 3

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

多轮对话 (利用 `conversation_id`)

`POST /v1/chat/completions` — OpenAI Chat

`POST /v1/responses` — OpenAI Responses (Codex CLI)

`POST /v1/messages` — Anthropic Messages (Claude Code)

`GET /mcp` / `POST /mcp` — MCP Streamable HTTP

`POST /token/check` — Token 存活检测

`GET /v1/models` — 模型列表

Packages