Gemma

找到 8 篇关于此标签的文章

手机本地跑 AI 不再需要联网—— 一个开源安卓应用正在把这件事变得可操作

Pocket LLM v1.4.0 本周更新：安装包从捆绑模型压缩到约 200MB，用户可在 App 内自行下载所需模型、离线运行 AI 对话。这不是大公司发布会，而是开源社区悄悄推进「手机本地 AI」可用性的一个缩影——值得关注的信号是，离线 AI 的门槛正在从「极客专属」向普通用户移动。

Alconost 基准测试显示，这款 12B 专用模型击败了 GPT-5.4 和 Claude Sonnet-4，但会悄无声息地输出错误的中文字体变体。

Gemma 4B、GPT-OSS-20B 和 Qwen3-80B 在语法无误的句子中「幻觉」出拼写错误，暴露了指令微调模型在语法检查场景下的系统性缺陷。

谷歌最新开源模型Gemma 4在实际业务流程中拒绝执行指令、忽视工具调用，暴露AI智能体商业化落地的核心风险，迫使企业重新评估AI自动化投入决策。

Qwen 32B、Gemma 9B 和 Command R 32B 在 8 次以上工具调用后均出现类似故障，原因是注意力稀释而非上下文限制。

在 RTX 4080 上对 OpenCode 与 6+ 款自托管 LLM 进行实战基准测试，涵盖真实编码任务。

开发者利用 Parlor 项目，在 Apple M3 Pro 上本地运行 Gemma 4 E2B，实现实时音视频输入与语音输出，无需云端依赖。

OpenClaw uses llama.cpp TurboQuant cache compression to run agentic AI models on 16GB MacBook Air at 10-15 tokens/sec.