Bonsai

找到 1 篇关于此标签的文章

GGML 新增 Q1_0 1 比特量化：以 1.15GB 运行 8B 模型

GGML 现已支持 Q1_0 1 比特量化，将 Bonsai 8B 模型压缩至 1.15GB，实现纯 CPU 推理，大幅降低部署门槛。