返回首页
RTX 5090
找到 2 篇关于此标签的文章
NVIDIAGemma
NVIDIA 自研 4 位量化把 26B 模型塞进消费显卡 — 精度损失不到 1%
NVIDIA 发布 NVFP4 量化版 Gemma-4-26B,压缩至 18.8GB 可在消费显卡运行,6 项基准测试精度损失均不超过 0.7%。4 位量化正从妥协变成优选,但这也是 NVIDIA 生态锁定的一步棋。
3h ago1 分钟
QwenUnsloth
Qwen3.6-27B量化跑进单张消费显卡—本地部署甜蜜点正在出现
Qwen3.6-27B 经 Unsloth Q5 量化后部署在单张 RTX 5090 上实测,19 轮任务表现稳定。中等规模模型的本地部署可行性正在实质性提高,值得关心硬件成本与能力边界的交汇点。
3h ago1 分钟