OPC
News
OPCClub
ChatOPC
JoinOPC
OPCBot
OPCHome
OPCX
EN
返回首页
Bonsai
找到 1 篇关于此标签的文章
GGML
llama.cpp
GGML 新增 Q1_0 1 比特量化:以 1.15GB 运行 8B 模型
GGML 现已支持 Q1_0 1 比特量化,将 Bonsai 8B 模型压缩至 1.15GB,实现纯 CPU 推理,大幅降低部署门槛。
Apr 6
·
1 分钟