找回密码
 立即注册
搜索

我用本地Gemma 4替换了Codex

作者:admin | 时间:4 小时前 | 阅读:3| 显示全部楼层

马上注册,让你轻松玩转程序园

您需要 登录 才可以下载或查看,没有账号?立即注册

x
1、寻找替代方案几个月前,我开始尝试本地运行的人工智能编码模型。
我的目标很明确:
  • 保持代码私密
  • 减少延迟
  • 降低API成本
  • 获得完全控制
输入:Gemma 4 + Ollama。
Gemma 4是Google最新的开放模型。Ollama是在本地运行大型语言模型的工具。
它们的组合改变了我的开发流程。

2、为什么选择Gemma 4?

954530a3cd47a01c68fd7e35a1d8d958.jpg

Gemma 4有几个关键优势:

1.完全本地运行

你的代码永远不需要离开你的机器。隐私得到保证。

2.免费使用

没有API调用成本。一旦模型下载,你可以无限使用。

3.快速响应

本地模型意味着零网络延迟。

4.完全控制

你选择何时更新模型或更改配置。

3、入门设置步骤1:安装Ollama

首先,安装Ollama工具:

curl-fsSL https://ollama.com/install.sh|sh这将在你的机器上设置Ollama。

步骤2:下载Gemma 4

安装Ollama后,获取Gemma 4模型:

ollama pull gemma:2b或者对于更强大的版本:

ollama pull gemma:7b根据你的硬件选择。2b版本可以在大多数笔记本电脑上运行。7b版本需要更多资源。

步骤3:测试模型

运行一下命令确保它工作:

ollama run gemma:2b现在你可以和它聊天了。

4、构建你的编码代理现在有趣的部分开始了。

你需要的不只是一个聊天机器人。你需要一个可以帮你编码的代理。

这是我的设置:

工具1:代码编辑器

使用VS Code或你喜欢的编辑器。

工具2:Ollama后端

Gemma 4通过Ollama运行。

工具3:Claude Code(可选)

如果你想增强功能,Claude Code可以作为补充。

5、我的实际工作流程这是我的设置:

1.分析需求

我告诉Gemma我需要什么。例如:

"创建一个Express服务器,监听3000端口,返回Hello World"2.生成代码

Gemma生成代码。我检查并修改。

3.自动补全

对于简单任务,Copilot风格的补全仍然有效。

4.调试帮助

当事情不工作,我让Gemma分析错误。

6、性能对比让我比较一下我的设置:

a7c9d09d5a73e84fe44ba6788d47db08.jpg
方面
云端AI
本地Gemma
延迟
2-5秒
0.5-1秒
隐私


控制
有限
完全
成本
订阅/月
一次性


本地设置在我的日常任务上甚至更快。

7、处理复杂任务对于复杂任务,我使用分层方法:

简单任务:直接使用Gemma

函数创建

简单调试

代码补全

复杂任务:云端AI

架构决策

大规模重构

高级推理

这给了我两全其美。

8、实际示例让我展示一个真实的例子。

任务:创建一个Express服务器

我给Gemma的提示:

创建一个简单的Express服务器,监听3000端口。当访问根路径时,返回"Hello World from the Express Server!"Gemma的响应(经过本地运行后):

const express=require('express');const app=express();const port=3000;app.get('/',(req,res)=>{res.send('Hello World from the Express Server!');});app.listen(port,()=>{console.log(`Express server is running at http://localhost{port}`);});9、部署它代码很直接:

初始化项目:

npm init-ynpm install express保存文件:

将代码保存为server.js。

运行服务器:

node server.js测试服务器:

打开你的浏览器或使用curl访问服务器:

导航到:http://localhost:3000

你会看到响应:Hello World from the Express Server!

10、结束语完全替换Codex?还不是。

但替换工作流程的重要部分?绝对是。

这个实验显示的很简单:

你不再需要完全依赖云端人工智能来构建真正的软件。

使用Gemma 4和Ollama,你现在可以:

本地运行人工智能模型

构建和理解代码

创建真正的开发工作流程

保持对环境的完全控制

所有这一切都不需要向外部API发送一行代码。

您需要登录后才可以回帖 登录 | 立即注册
“PowerOFF 行动” 锁定 7.5 万名 DDoS 用户,关停 53 个域名
“PowerOFF 行动” 锁定 7.5 万名 DDoS 用户,关停 53 个域名
在 “PowerOFF 行动” 最新阶段的国际执法行动中,已通过电子邮件和信件对超过 7.5 万名使用分布式拒绝服务
ZionSiphon 恶意软件专盯水处理系统搞破坏
ZionSiphon 恶意软件专盯水处理系统搞破坏
一款名为ZionSiphon的新型恶意软件专为运营技术环境打造,将目标锁定在水处理和海水淡化设施,意图破坏其正
继 Anthropic 发布 Mythos 后,OpenAI 扩大其网络安全模型使用权限
继 Anthropic 发布 Mythos 后,OpenAI 扩大其网络安全模型使用权限
在Anthropic推出Claude Mythos人工智能模型几天后,OpenAI推出了GPT-5.4-Cyber。这是一款专注于网络安全领
Claude Code、Gemini CLI 和 GitHub Copilot Agents 因注释面临提示注入风险 ... ...
Claude Code、Gemini CLI 和 GitHub Copilot Agents 因注释面临提示注入风险 ... ...
一名研究人员披露了一种名为“注释与控制”的提示注入攻击方法细节,该方法已被证实可针对多款流行的人工智
人工智能平台 n8n 被滥用于隐秘网络钓鱼及恶意软件传播
人工智能平台 n8n 被滥用于隐秘网络钓鱼及恶意软件传播
攻击者利用人工智能自动化平台 n8n 开展网络钓鱼活动、传播恶意软件,并借助可信基础设施躲避安全检测。
我用本地Gemma 4替换了Codex
我用本地Gemma 4替换了Codex
1、寻找替代方案几个月前,我开始尝试本地运行的人工智能编码模型。 我的目标很明确: 保持代码私密减少延
OpenAI Codex 上线插件功能,剑指超级应用
OpenAI Codex 上线插件功能,剑指超级应用
OpenAI本周宣布,将为Codex新增插件支持。这些插件面向Box、Figma、Linear、Notion、Sentry、Slack、Gmail
用OpenClaw分析A股:免费数据源汇总与实战教程
用OpenClaw分析A股:免费数据源汇总与实战教程
很多散户投资者做股票研究时面临两大痛点:数据要钱和分析靠猜。 其实,有大量免费数据源可以用于A股研究
“PowerOFF 行动” 锁定 7.5 万名 DDoS 用
在 “PowerOFF 行动” 最新阶段的国际执法行动中,已通过电子邮件和信件对超过 7.5 万
ZionSiphon 恶意软件专盯水处理系统搞破坏
一款名为ZionSiphon的新型恶意软件专为运营技术环境打造,将目标锁定在水处理和海水淡
继 Anthropic 发布 Mythos 后,OpenAI 扩大
在Anthropic推出Claude Mythos人工智能模型几天后,OpenAI推出了GPT-5.4-Cyber。这是
Claude Code、Gemini CLI 和 GitHub Copilo
一名研究人员披露了一种名为“注释与控制”的提示注入攻击方法细节,该方法已被证实可
人工智能平台 n8n 被滥用于隐秘网络钓鱼及
攻击者利用人工智能自动化平台 n8n 开展网络钓鱼活动、传播恶意软件,并借助可信基础
我用本地Gemma 4替换了Codex
1、寻找替代方案几个月前,我开始尝试本地运行的人工智能编码模型。 我的目标很明确:
OpenAI Codex 上线插件功能,剑指超级应用
OpenAI本周宣布,将为Codex新增插件支持。这些插件面向Box、Figma、Linear、Notion
用OpenClaw分析A股:免费数据源汇总与实战
很多散户投资者做股票研究时面临两大痛点:数据要钱和分析靠猜。 其实,有大量免费数
美国一男子因策划2000万美元加密货币诈骗判
据美国司法部消息,美国德克萨斯州男子Robert Dunlap因策划加密货币诈骗、骗取近1000
特朗普:现在与伊朗的关系非常好,离与伊朗
美国总统特朗普表示,「我们现在与伊朗的关系非常好。」离与伊朗达成协议非常近。 如