llama.cppQwen
37 个大语言模型在 MacBook Air M5 32GB 上完成基准测试:完整速度结果
社区使用 llama-bench 在 M5 Air 32GB 上对 37 个本地 LLM 进行基准测试,结果显示 MoE 模型在速度与质量比方面表现最佳。
Apr 6·1 分钟
Gemmallama.cpp
Gemma E2B 在 M3 Pro 上实现本地实时多模态 AI 运行
开发者利用 Parlor 项目,在 Apple M3 Pro 上本地运行 Gemma 4 E2B,实现实时音视频输入与语音输出,无需云端依赖。
Apr 5·1 分钟