开源模型排行榜收录 218 款模型、10 款 Apple 芯片 — 本地跑 AI 正在变成正经事

Anubis-OSS 排行榜本周更新数据：371 次提交跑分、218 个模型参赛、10 款 Apple 芯片位列其中 — 开源模型本地部署的生态，已经大到需要正经排行榜来丈量了。

这是什么

Anubis-OSS 是一个聚焦开源大模型本地运行能力的社区排行榜（类似手机跑分软件，但跑的是 AI 模型在本地硬件上的实际表现）。它关注的核心问题是：不靠云端算力，一台本地机器到底能跑什么模型、跑多快、跑多好。

这组数字值得拆开看：218 个模型，意味着开源社区两年前还在争论 LLaMA 能不能用，现在已经是一个需要横向对比的拥挤赛道；10 款 Apple 芯片，说明 M 系列芯片（苹果自研的 Mac 处理器，统一内存架构对跑大模型有天然优势）已经不是极客的实验品，而是被正式纳入评测体系的硬件选项；371 次提交，意味着社区不是挂个名就走，而是在反复调参、换硬件、刷成绩。

行业怎么看

乐观派认为，这类排行榜的出现是开源模型走向成熟的标志。当用户可以在一张表里比较「我的 M2 Max 跑 Qwen2-7B 能有多少 token/s」，本地部署的决策成本就大幅降低了。这对企业内网部署、数据不出云的场景尤其关键。

但我们也注意到两个风险。第一，排行榜天然鼓励「刷榜优化」，跑分好的模型未必是实际场景最顺手的；第二，目前本地部署的主流模型仍然集中在 7B-14B 参数量级，和 GPT-4 级能力的差距不是排行榜能弥合的。有社区成员直接指出：「跑分生态在膨胀，但大部分人的真实需求还是 API 调用，不是自己搭环境。」

对普通人的影响

对企业 IT：开源模型本地部署有了可量化的选型依据，数据敏感行业（金融、医疗）可以更安心地评估「不上云」方案。

对个人职场：Apple 芯片被正式纳入评测，意味着手里那台 MacBook Pro 正在从「办公工具」变成「AI 工作站」，懂本地部署的打工人会有更多工具选择。

对消费市场：排行榜越热闹，本地 AI 工具就越容易出圈。但消费者要警惕：跑分不等于体验，别被数字牵着走。

开源模型排行榜收录 218 款模型、10 款 Apple 芯片 — 本地跑 AI 正在变成正经事

这是什么

行业怎么看

对普通人的影响

相关推荐

Google 让 Gemma 4 生成速度翻倍 — 小模型带大模型跑的"投机解码"成主流

Heretic 1.3 让 AI 模型「去审核」可复现 — 开源社区用透明度反击黑盒化

定制大模型仅更新1%参数：微调量化让AI专才流水线化，落地门槛实质降低

匿名Peanut爬到文生图第8 — 开源图像生成赛道越来越挤

RTX 5000 48G 显卡让 Qwen3.6 满血跑——本地高精度 AI 有了甜点配置

客户一眼看出内容全是 AI 写的？三个反直觉定律帮你找回溢价