free-claude-code 是一个开源的本地代理服务,能让你免去高昂账单,用免费额度或本地大模型无缝替代官方付费 API 来运行 Claude Code 智能编程助手。
这个项目由开发者 Alishahryar1 团队打造。他们非常熟悉 Python 异步高并发和 FastAPI 框架,对各大主流大模型的 API 协议中转转换吃得很透。
简单来说,free-claude-code 就是一个在本地运行的“反向代理和协议转换器”。原本官方的 Claude Code 命令行工具必须绑定 Anthropic 官方的付费 API,写代码、扫描项目时 Token 消耗极快,账单很贵。而这个项目在本地架设了一个桥接服务器,拦截 Claude Code 发出的标准请求,把它动态重写并伪装,转发给其他免费、便宜或者用户自己本地部署的大模型后端。
它的目标市场是那些重度依赖 AI 辅助编程,想要享受 Claude Code 强大的多文件编辑和自动构建工作流,但又不想承担高昂 API 费用的小型极客团队、独立开发者和开源爱好者。核心能力和技术优势在于完美的“无缝替换”,你完全不需要修改 Claude Code 客户端的任何底层代码,只要改个环境变量,就能把底层换成 NVIDIA NIM 的免费额度、OpenRouter、DeepSeek 或者本地的 Ollama。而且它完美支持流式传输(Streaming)和复杂的工具调用(Tool Calls),让 AI 动起手来改代码的体验不打折扣。
目前这个项目在 Github 上非常火爆,由于切中了开发者省钱的刚需,它的 Star 数量和 Fork 数量都在快速飙升,属于近期 AI 编程圈子里的热门趋势项目。
它的目标群体主要有两类:一类是想省钱的个人开发者,不想为每天日常的写代码调试支付几十美金的官方账单;另一类是注重隐私和离线环境的团队,希望在完全不联网的情况下,让 AI 帮自己重构企业内部的私有代码。
使用环境非常广泛,无论是普通的 macOS、Linux 终端,还是 Windows 的 PowerShell,甚至在 VSCode 扩展里都能完美运行。它的特色场景在于“白嫖云端算力”或“纯本地离线开发”,比如你可以配置成白天用云端免费模型跑复杂任务,晚上断网了直接切换到本地模型继续干活。
不过,这个项目也是有一定门槛的。使用者必须具备基础的终端命令行操作常识,知道怎么配置系统环境变量(比如 ANTHROPIC_BASE_URL),并且最好对大模型的 API Key 获取(如 OpenRouter 或 NVIDIA NIM)或者本地大模型工具(如 Ollama、LM Studio)的运行有一定了解。如果你连什么是命令行都不清楚,那用起来可能会有点吃力。
这个项目库提供的产品本质上是一个“多后端 AI 路由网关”,其亮点特色功能主要体现在以下几个方面:
1. 零成本多后端支持(Multi-Backend Routing)
它可以无缝对接 NVIDIA NIM(提供稳定的免费层)、OpenRouter(聚合了上百种免费和付费模型)、DeepSeek 原生 API、以及本地的 LM Studio、Ollama 和 llama.cpp。使用效果就是你完全掌握了后端选择权,不再被一家厂商绑死,能直接用上性价比最高的算力。
2. 完美的协议与流式转换(Protocol Translation & Streaming)
这是技术上最有难度的地方。由于 Claude Code 内部有复杂的工具调用机制,这个代理层能够实时将其他模型的流式 Token 和中间的 Tool Call 格式,伪装并翻译成 Anthropic 标准格式。达成的效果就是 Claude Code 依然以为自己在使用官方的 Claude 3.5 Sonnet,在终端里依然可以流畅地看它边思考边敲代码,完全不会断联或报错。
3. 远程控制与机器人集成(Discord & Telegram Bot)
这个功能特别好玩。它内置了 Discord 和 Telegram 机器人的对接。你可以把任务丢给聊天软件里的机器人,它会在后台帮你操控 Claude Code 去改代码、跑测试,并把实时思考过程和工具调用结果推送到你的手机或聊天频道里,实现多并发任务的远程托管。
4. 智能上下文压缩(Auto Compaction)
在启动命令 fcc-claude 里,项目自动帮用户注入了高达 190k Token 的自动压缩窗口变量(CLAUDE_CODE_AUTO_COMPACT_WINDOW),大幅优化了长上下文时的处理效率,防止长对话导致内存崩溃或额度瞬间暴死。
第一步:打开你的终端(Mac/Linux)或者 PowerShell(Windows)。
第二步:使用一键安装脚本下载项目。
* 如果是 macOS 或 Linux,直接复制粘贴运行这行命令:
curl -fsSL “[https://github.com/Alishahryar1/free-claude-code/blob/main/scripts/install.sh?raw=1](https://www.google.com/search?q=https://github.com/Alishahryar1/free-claude-code/blob/main/scripts/install.sh%3Fraw%3D1)” | sh
* 如果是 Windows,在 PowerShell 里运行这行命令:
irm “[https://github.com/Alishahryar1/free-claude-code/blob/main/scripts/install.ps1?raw=1](https://www.google.com/search?q=https://github.com/Alishahryar1/free-claude-code/blob/main/scripts/install.ps1%3Fraw%3D1)” | iex
第三步:启动代理服务器。在终端输入:
fcc-server
这时候终端会打印出类似 INFO: Admin UI: [http://127.0.0.1:8082/admin](https://www.google.com/search?q=http://127.0.0.1:8082/admin) 的字样,说明本地服务器已经跑起来了。
第四步:配置模型。在浏览器里打开刚刚终端给你的 [http://127.0.0.1:8082/admin](https://www.google.com/search?q=http://127.0.0.1:8082/admin) 网址。去 NVIDIA NIM 官网申请一个免费的 API 密钥,把它粘贴到网页对应的输入框里,点击验证并应用。默认的模型已经帮你设好了。
第五步:快乐白嫖。重新开一个终端窗口,直接输入:
fcc-claude
这样就会自动帮你配置好环境变量并启动 Claude Code,你就可以开始免费和 AI 对话写代码了。
如果你只是在自己的个人电脑上日常开发使用,那你不需要任何外部付费资源,只需要你的电脑能联网(用于连接 NVIDIA 或是 OpenRouter 接口),或者本地开着 Ollama 即可。
但是,如果你想和团队一起用,或者想让你的 Discord/Telegram 机器人 24 小时在线,那你最好准备一台轻量级的云服务器(VPS)或者云主机。因为该项目是基于 FastAPI 开发的标准 HTTP 服务,你可以非常轻松地把它打包进 Docker 容器里进行私有化部署。
关于静态托管平台:由于它是一个需要持续运行、维护长连接、处理流式响应(Streaming)并暴露管理后台的动态 Python 后端服务,因此它无法直接部署到类似 Cloudflare Pages 或是 Vercel 这种纯粹的静态或 Serveless 边缘函数平台上。你必须使用支持运行持续性容器或 Python 服务的平台(如传统的 VPS、Render、Railway 或者飞书云等)。
网友在 Issues 里问的最多的几个基础问题和官方/社区给出的答案如下:
问题 1:为什么我运行 fcc-claude 的时候提示找不到 claude 命令?
答案:因为你本地没有安装官方的 Claude Code 客户端。你需要先运行 npm i -g @anthropic-ai/claude-code 安装好官方客户端,然后再用 fcc-claude。
问题 2:使用 NVIDIA NIM 提示超出频率限制(Rate Limit)怎么办?
答案:NVIDIA 的免费额度是有每分钟请求次数限制的。如果遇到了,可以在 Admin UI 里切换到 OpenRouter 并选择里面的免费大模型,或者换成自建的 DeepSeek 这种便宜又便宜的 API 渠道来作为备用。
问题 3:为什么 AI 在执行修改文件时报错,提示工具调用失败?
答案:这是因为你选择的后端大语言模型能力不足。有些轻量级或者未针对 Tool Call 深度优化的本地开源模型不具备极强的“Tool Calling(工具调用)”能力。建议切换到 DeepSeek-V3、DeepSeek-R1 或者参数量大一些的编程专用模型(如 Qwen-2.5-Coder-32B)。
问题 4:我怎么在 VSCode 插件里用这个代理?
答案:在 VSCode 的 settings.json 配置文件里,找到或者添加 claude-code.environmentVariables,把 ANTHROPIC_BASE_URL 的值改成你本地 fcc-server 的运行地址(比如 http://localhost:8082)就可以了。
问题 5:修改了 Admin UI 里的配置后,需要手动去重启 fcc-server 吗?
答案:不需要。现在的 Admin UI 非常智能,当你点击应用新配置时,它会在后台自动热重载并重启代理服务运行实例,你直接去用客户端就行。
整体来看,社区对这个项目的评价非常高,普遍觉得它解决了广大开发者的一大痛点。
正面评价 1:“这简直是开源社区的福音!Claude Code 的命令行工作流非常丝滑,但官方 API 真的烧钱。用这个项目接入了 DeepSeek 之后,成本直接暴降了 90% 以上,体验还几乎没变!”
正面评价 2:“强烈推荐它的网页管理后台(Admin UI),太傻瓜化了。以前用别的代理工具天天在黑框框里改配置,现在网页里贴个 Key 就能用,甚至还能直接用上 NVIDIA 的免费算力。”
正面评价 3:“把 Claude Code 做成了 Discord 机器人这一点太绝了。我现在出门在外面,手机上发条消息给机器人,家里的电脑就自动帮我把项目的 Bug 改了还跑完了测试,太硬核了。”
正面评价 4:“对于注重代码隐私的团队来说很有用。我们公司不希望代码上传到第三方大模型公司,用这个工具强行把 Claude Code 桥接到了我们内网自建的 Ollama 离线大模型上,完美解决了合规问题。”
负面评价 1:“虽然想法很好,但是实际用下来,如果后端不用最顶级的大模型(比如不用 DeepSeek 或 Sonnet 本身),换成一些小的本地开源模型时,Claude Code 经常会卡死或者胡言乱语,因为小模型根本听不懂官方客户端发出的那些复杂的 Agent 指令。这不能怪项目本身,但用起来确实挺折腾模型的选择。”
为了让你更清楚它的定位,我们把它和市面上另外 3 个同类型或相似定位的 AI 编程/代理应用做个横向对比:
1. 对比 Aider (著名的终端 AI 编程助手)
* 亮点/优于对方的地方:free-claude-code 能够完美保留官方 Claude Code 那套极其精致的原生用户界面、自动紧凑窗口管理以及 Anthropic 官方团队精心调优的智能体指令习惯。
* 不如对方的地方:Aider 原生就完美支持上百种异构大模型,不需要额外架设一层代理服务器;而且 Aider 自身的冲突解决和 Git 联动机制在面对弱模型时,比 Claude Code 表现得更稳定。
2. 对比 Cline / Roo Code (VSCode 热门 AI 编程插件)
* 亮点/优于对方的地方:由于它是服务于官方 Claude Code 体系,终端执行的速度极快,对多文件跨目录的架构理解和系统命令的直接执行权限比普通的 VSCode 插件更激进、更极客。
* 不如对方的地方:Cline 等插件在 VSCode 内部有极其直观的视觉侧边栏和多模态图片查看功能,UI 交互对不习惯终端的人更友好,且本身就内置了各种 Provider 的切换开关,不需要像这个项目一样在后台额外挂一个 Python 代理服务。
3. 对比 传统的 One-API / New-API (通用大模型中转管理系统)
* 亮点/优于对方的地方:free-claude-code 是专门为 Claude Code 这个特定工具量身定制的。它不仅仅做简单的 API 转发,还专门针对 Anthropic 的特有 Tool Call 进行了深度的逆向流式翻译和长文本自动压缩(Auto Compaction)。这些是通用中转系统做不到的。
* 不如对方的地方:如果作为通用的 API 中转站,它的功能显得有些单一,不支持复杂的商用多用户分发、多机负载均衡以及详细的额度计费展示面板。
