AI Pulse

Google Gemma 4 能在 iPhone 上完全离线运行

Google Gemma 4 能在 iPhone 上完全离线运行

Gemma 4 现在能在 iPhone 上本地运行,全程无需网络连接。这意味着,AI 推理不再依赖后台服务器,而是由手机自己完成全部计算。

Gemma 4 的 31B 版本在早期测试中,性能接近通义千问 Qwen 3.5 的 27B 版本,参数量多出约 40 亿。这意味着两者能力边界相近,但各自有强项和短板,没有一方全面胜出。

更值得关注的是 E2B 和 E4B 这两个小尺寸变体。它们专为手机设计,把运行效率放在首位,而不是堆参数。Google 自家 App 默认推荐 E2B,因为它启动更快、占用内存更少,也更能适应手机有限的散热与内存条件。

用户只需从 App Store 下载 Google AI Edge Gallery,选好模型,就能立刻在设备上运行推理。这意味着,没有 API 请求,没有后台数据上传,也没有云服务绑定。

这个 App 不只是输入文字、输出答案的界面。它集成了图像识别、语音交互,还开放了可扩展的 Skills 框架。这意味着,它不是一次性的演示工具,而是供开发者和高级用户搭建本地 AI 功能的起点。

Gemma 4 在 iPhone 上调用的是设备 GPU 进行推理,响应延迟明显降低。这意味着,当前消费级手机硬件,已经能稳定承载这类 AI 工作负载,且不出现卡顿或过热降频。

离线能力对特定行业尤为关键:比如野外作业人员、医院临床场景,或任何受数据隐私法规严格限制、禁止数据出域的环境。这意味着,这些地方第一次拥有了真正合规、可用、不妥协的 AI 工具。

Gemma 4 登陆 iPhone 不是实验室里的展示。它标志着,本地 AI 不再是‘即将到来’的选项,而是一个已落地、可选择、正被使用的现实。

📎 阅读原文 · GizmoWeek