DGX Spark

找到 2 篇关于此标签的文章

16台Nvidia超算拼成集群跑通大模型 — 企业自建算力的焦点正转向显存

Reddit用户用16台Nvidia DGX Spark搭成集群跑通434GB大模型，验证了统一内存的实用价值。大模型推理瓶颈正从算力转向显存，企业自建本地算力有了新思路。

开发者报告在 vLLM 上部署 Gemma 4 26B-A4B 结果不一，DGX Spark GB10 上的 INT4 量化版本速度过慢。