RTX 5090

找到 2 篇关于此标签的文章

NVIDIA 自研 4 位量化把 26B 模型塞进消费显卡 — 精度损失不到 1%

NVIDIA 发布 NVFP4 量化版 Gemma-4-26B，压缩至 18.8GB 可在消费显卡运行，6 项基准测试精度损失均不超过 0.7%。4 位量化正从妥协变成优选，但这也是 NVIDIA 生态锁定的一步棋。

Qwen3.6-27B 经 Unsloth Q5 量化后部署在单张 RTX 5090 上实测，19 轮任务表现稳定。中等规模模型的本地部署可行性正在实质性提高，值得关心硬件成本与能力边界的交汇点。