返回首页

Gemma

找到 12 篇关于此标签的文章

GemmaGoogle

Gemma 4 逐层嵌入引讨论 — 把知识和推理拆开存储,小模型的机会还是幻觉

Gemma 4 的逐层嵌入设计引发社区讨论:模型的知识存储和推理能力能否分开扩展?如果可以,2B 小模型或许能装下 20B 的知识量。这直接关系到企业用小模型本地部署的可行性边界。

May 31 分钟
hfviewerHugging Face

开发者做出 Hugging Face 模型可视化工具 — 看懂大模型黑盒不再需要读代码

一位开发者推出 hfviewer.com,可将 Hugging Face 上的大模型架构转化为交互式图表。这值得关心,因为它把原本需要读代码才能理解的模型结构变成了直观视觉图,降低了非技术人员了解 AI 黑盒的门槛。

May 31 分钟
QwenGemma

Qwen 3.6 跑分赢实测输 — 刷榜正在扭曲大模型能力认知

开发者实测 Qwen 3.6 与 Gemma 4,发现跑分领先的 Qwen 因死循环烧掉 8000+ Token 在真实任务中落败。大模型刷榜正扭曲能力认知,企业选型需从看榜单转向做实测。

May 21 分钟
GemmaGoogle

Gemma 4 模型文件现身 HuggingFace — 开源社区跑在了官方工具链前面

有人将 gemma-4-31B-it-DFlash 上传至 HuggingFace,但 llama.cpp 尚不支持运行。开源模型迭代速度正把部署工具链甩在身后,拿到模型却用不起来,成了新尴尬。

May 21 分钟
NVIDIAGemma

NVIDIA 自研 4 位量化把 26B 模型塞进消费显卡 — 精度损失不到 1%

NVIDIA 发布 NVFP4 量化版 Gemma-4-26B,压缩至 18.8GB 可在消费显卡运行,6 项基准测试精度损失均不超过 0.7%。4 位量化正从妥协变成优选,但这也是 NVIDIA 生态锁定的一步棋。

May 11 分钟
QwenGemma

Gemma 4 仅用1/5 token跑赢Qwen 3.6 — 本地部署开始拼效率

Reddit 用户用同一吃豆人游戏 Prompt 测试两个开源模型,Gemma 4 以1/5的token和1/5的时间产出更可玩的结果。这提醒我们:本地部署时代,模型效率比生成量更值得关注。

May 11 分钟
Pocket LLM端侧AI

手机本地跑 AI 不再需要联网—— 一个开源安卓应用正在把这件事变得可操作

Pocket LLM v1.4.0 本周更新:安装包从捆绑模型压缩到约 200MB,用户可在 App 内自行下载所需模型、离线运行 AI 对话。这不是大公司发布会,而是开源社区悄悄推进「手机本地 AI」可用性的一个缩影——值得关注的信号是,离线 AI 的门槛正在从「极客专属」向普通用户移动。

Apr 191 分钟
TranslateGemmaGemma

我 们用 TranslateGemma-12B 对比了 5 款前沿大模型的 字幕翻译能力——它全面领先,但有一个严重 缺陷

Alconost 基准测试显示,这 款 12B 专用模型击败了 GPT-5.4 和 Claude Sonnet-4,但会悄无声息地输出错误的 中文字体变体。

Apr 141 分钟
GemmaQwen3

Why some small/medium models fail at grammar checking task?

Gemma 4B、GPT-OSS-20B 和 Qwen3-80B 在语法无误的句子中「幻觉」出拼写错误, 暴露了指令微调模型在语法检查场景下的系统性缺陷。

Apr 131 分钟
AI智能体开源模型

Gemma 4"听话"危机:AI智能体落地的致命陷阱

谷歌最新开源模型Gemma 4在实际业务流程中拒绝执行指令、忽视工具调用,暴露AI智能体商业化落地的核心风险,迫使企业重新评估AI自动化投入决策。

Apr 91 分钟
Qwen-32Bllama.cpp

本地 LLM 在 8-9 次链式调用后工具调用准确率下降

Qwen 32B、Gemma 9B 和 Command R 32B 在 8 次以上工具调用后均出现类似故障,原因是注意力稀释而非上下文限制。

Apr 81 分钟
OpenCodellama-server

OpenCode + 本地 LLM:哪些模型最适合独立开发者任务

在 RTX 4080 上对 OpenCode 与 6+ 款自托管 LLM 进行实战基准测试,涵盖真实编码任务。

Apr 61 分钟