Article Not Found

信号

Apple Silicon Mac 内置了一项隐藏限制：macOS 通过 Virtualization framework 将同时运行的虚拟机数量上限设为两台。对大多数用户而言，这道限制几乎感知不到。但对于在本地运行 AI 技术栈的独立开发者——无论是 LLM、沙盒 Agent，还是多租户测试环境——一旦需要第三个环境，这道天花板就会把你硬推向昂贵的云端 VM。

2023 年，Khronokernel 发布了一篇深度分析文章（在 Hacker News 上获得 179 点赞、125 条评论），详细拆解了这一限制在 Hypervisor 层面的成因——更重要的是，如何绕过它。简而言之：该限制由 Apple 的 Virtualization framework 在策略层面强制执行，与底层硬件无关。使用替代 Hypervisor 可完全绕过这一限制。

开发者视角

先来算一笔账：一台搭载 96 GB 统一内存的 M2 MacBook Pro 售价约为 3,000 至 4,000 美元。而具备同等内存规格的 GPU 云实例，每小时费用高达 2 至 8 美元。按每天使用 8 小时计算，每月成本约为 480 至 1,920 美元—— 前提是你能充分发挥本地硬件的全部性能，Mac 可在 2 至 8 个月内回本。

2 台 VM 的限制正是这笔账的漏洞所在。如果你正在构建以下任何一类系统，都会很快触及这道墙：

多 Agent AI 系统，每个 Agent 运行在独立的沙盒环境中
本地 RAG 流水线，检索、 Embedding 与推理模块分容器部署
在同一台机器上实现开发/预发布/生产环境的一致性
按需启动的客户 Demo 环境

这一现象所形成（或打破）的竞争壁垒在于：率先掌握本地 VM 高密度部署的开发者，能够大幅压缩迭代成本。每次测试无需按 Token 计费，也不必等待云实例启动。这种反馈循环的压缩，才是真正的杠杆所在。

逆向思维（DHH 会赞同这一点）：云优先往往是昂贵的默认选择，而非务实的选择。对于早期阶段的独立 AI 项目而言，一台运行 8 至 12 台 VM 的 4 ,000 美元 Mac，其投资回报率远优于每月 1,000 美元的云服务账单。

工具与技术栈

问题所在：Apple Virtualization Framework

Apple 原生的 Virtualization.framework（被 UTM 的 Apple Virtualization 后端及 macOS 内置 VM 支持等工具所使用）强制执行 2 台 VM 并发限制。这是框架层面的策略约束，而非芯片层面的硬件限制。

方案一： QEMU（免费开源）

QEMU 在 Apple Silicon 上完全绕过 Virtualization framework，使用其自身的 TCG（Tiny Code Generator）或 HVF（Hypervisor.framework）后端，不受 2 台 VM 上限的约束。

#  通过 Homebrew 安装
brew install qemu

# 启动一 个 Linux ARM64 虚拟机
qemu-system-aarch64 \
  -machine  virt \
  -cpu host \
  -m 4096 \
  -accel hvf \
  -drive file=ubuntu-arm 64.img,format=qcow2

- accel hvf 参数直接调用 Apple 的 Hypervisor.framework—— 与 Virtualization.framework 不同，不受任何数量限制。你可以在 RAM 允许的范围内运行任意数量的虚拟机。

方案二：UTM（免费，图形界面友好）

UTM 以 macOS 原生 UI 封装了 QEMU。将其切换至 QEMU 模拟模式（而非 Apple Virtualization 模式），2 台 VM 的限制随即消失。可在 GitHub 上免费获取，或以 9.99 美元从 Mac App Store 购买（支持开发者）。

方案三：Multipass（免费，Canonical 出品）

Canonical 的 Multipass 专为快速启动 Ubuntu VM 而设计。在 Apple Silicon 上，它默认使用 Virtualization framework，因此同样受到上限限制。但你可以将其配置为使用 QEMU 作为后端：

sudo  multipass set local.driver=qemu
multipass launch --name agent-1 --cpus 2 --memory 4G
multipass launch --name  agent-2 --cpus 2 --memory 4G
multipass launch --name agent-3 --cpus 2 --memory 4G
# 无数量上 限，RAM 够用就能继续启动

方案四：OrbStack（每月 8 美元或免费版）

OrbStack 是 Apple Silicon 上最快的 Docker/Linux VM 运行时，其 Linux 机器明确不使用 Apple 的 Virtualization framework。轻量、高速，专为需要运行多个环境的开发者而设计。具体定价请参考其官网。

内存现实检验

真正的瓶颈是 RAM。在 Apple Silicon 上，内存是统一架构——VM 与宿主操作系统共享同一内存池。粗略规划如下：

16GB Mac：2 至 3 台轻量级 VM（每台 2GB）+ 宿主系统开销
32GB Mac：可轻松运行 4 至 6 台 VM
64GB Mac：支持 8 至 12 台 VM，适合多 Agent 工作负载
96GB Mac：相当于在运行一个小型集群

本周就能上手

在 Mac 上构建本地多 Agent 沙盒

以下是一个具体的项目方案：构建一套本地多 Agent AI 系统，每个 Agent 运行在独立的 VM 中，通过私有虚拟网络相互通信。零云端成本，无速率限制。

第 1 天（约 2 小时）：将 Multipass 切换至 QEMU 后端，启动 3 台 Ubuntu VM，验证它们之间可以互相 ping 通。

sudo multipass set local.driver=qemu
multipass launch --name orchestrator --cpus 2 --memory 4G -- disk 20G
multipass launch --name agent-researcher --cpus 2 --memory 4G --disk 20G
multipass launch --name agent-writer --cpus 2  --memory 4G --disk 20G

第 2 天（约 3 小时）：在 orchest rator VM 上安装 Ollama，拉取一个小型模型（Mistral 7B 或 Phi-3 Mini），并将其暴露在本地网络上。

multipass exec orchestrator -- bash -c "
curl -fsSL https://ollama.com/install. sh | sh
ollama pull mistral
OLLAMA_HOST=0.0.0.0 ollama serve
 "

第 3 天（约 3 小时）：在宿主机上编写一个简单的 Python 编排脚本，通过 SSH 将任务路由至各个 Agent VM。Agent 1 负责研究（网络抓取 + RAG），Agent 2 负责写作。每个 Agent 相互隔离，独立运行，互不影响。

总成本：硬件之外每月 0 元。从零到完整系统的搭建时间：不到一周。这套本地 AI 基础设施若部署在云端，每月费用约为 200 至 500 美元——而现在，它免费运行在你已经拥有的硬件上。

更深层的启示：你以为是硬件限制的，往往只是软件策略。在选择购买云服务之前，先质疑这个假设本身。

Run Unlimited VMs on Apple Silicon: Break the 2-VM Wall

信号

开发者视角

工具与技术栈

问题所在：Apple Virtualization Framework

方案一： QEMU（免费开源）

方案二：UTM（免费，图形界面友好）

方案三：Multipass（免费，Canonical 出品）

方案四：OrbStack（每月 8 美元或免费版）

内存现实检验

本周就能上手

在 Mac 上构建本地多 Agent 沙盒

Related Reading

Byt eDance Doubles Down on Infrastructure , Not Models

CoreWeave's Drop Isn't About Performance— It's About Capacity Discipline

Cerebras Price H ike: More Than Just IPO Momentum

CoreWeave Is No Longer Just a GPU Landlord

Sony and TSMC Bet on Sensors : Edge Perception Repr icing in the AI Era

Th inkFlow Is Not an Aggreg ator — It's a Token OS

Run Unlimited VMs on Apple Silicon: Break the 2-VM Wall

信号

开发者视角

工具与 技术栈

问题所在：Apple Virtualization Framework

方案一： QEMU（免费开源）

方案二：UTM（免费，图形界面友好）

方案三：Multipass（免费，Canonical 出品）

方 案四：OrbStack（每月 8 美元或免费版）

内存现实 检验

本周就能上 手

在 Mac 上构建本地多 Agent 沙盒

Related Reading

Byt eDance Doubles Down on Infrastructure , Not Models

CoreWeave's Drop Isn't About Performance— It's About Capacity Discipline

Cerebras Price H ike: More Than Just IPO Momentum

CoreWeave Is No Longer Just a GPU Landlord

Sony and TSMC Bet on Sensors : Edge Perception Repr icing in the AI Era

Th inkFlow Is Not an Aggreg ator — It's a Token OS

工具与技术栈

方案四：OrbStack（每月 8 美元或免费版）

内存现实检验

本周就能上手