返回首页

本地部署

找到 16 篇关于此标签的文章

Qwen阿里巴巴

本地运行的阿里 Qwen 模型,在普通电脑上实现了「浏览器当操作系统」— 开源模型的能力边界正在被重新丈量

一位开发者用阿里巴巴开源的 Qwen 3.6 35B 模型,在本地(无需云端服务器)实现了「Browser OS」——让 AI 像操作系统一样调度浏览器完成复杂任务。他称这是迄今为止本地模型跑出的最好结果。这件事值得关注,因为它说明开源模型的实际可用性,正在追上那些要收费的云端大模型。

Apr 191 分钟
LocalLLaMAQwen3

本地 AI 自己调工 具还在「鬼打墙」——开源社区的真实使 用体验比宣传落后整整一代

Reddit 上一 个获得 103 点赞、148 条回复的帖子,集中 暴露了本地运行 AI 模型时「工具调用」功能的真实状态: 模型声称完成了任务,文件根本不存在; 声称网站已就绪,打开是空文件。 这不是个案,而是当前开源小模型在执 行复杂指令时的普遍短板——值得所有正 在评估「私有化部署 AI」方

Apr 191 分钟
LocalLLaMARTX 3090

两张显卡能不能同时跑两个 AI 模 型?一个真实用户案例揭示本地 部署的核心取舍

一位 拥有 RTX 3090(24GB)和 RTX 3060(12GB)双显卡的用户,在 Reddit 上提出了一个典型问题:两张规格不同的显卡,到 底该跑一个大模型还是同时跑两个?这个问题背 后,是越来越多人尝试在自己电脑上运行 AI 模型时都 会遇到的硬件资源分配难题。

Apr 191 分钟
Qwen3Gemma4

Qwen 3 还是 Gemma 4?本地 部署玩家正在用实测替 代官方跑分——小模型选型 进入「场景优先」时代

Reddit 上一 个关于「聊天与问答场景下 Qwen 3 35B 和 Gemma 4 26B 哪个更好」的提问,引发大量本地部署用 户讨论。这件事本身不大,但背后的信号 值得关注:越来越多人开始绕开 官方基准测试,用自己的实际使用场景做 选型依据,小模型市场的竞争逻辑正在 悄悄换轨。

Apr 191 分钟
阿里巴巴Qwen

一台消费级显卡,AI 帮用 户重写了整个记账软件——阿里 Qwen 新模型让「本地运行」开 始变得真实

阿里巴巴最新发布的 Qwen3.6-35B-A3B 模型,在一 位普通用户的消费级显卡(RTX 5070 Ti,16GB 显 存)上,用不到一小时完成了代码审查、 安全漏洞排查和重构工作。这不是实 验室基准测试,是真实项目里上一代 模型卡死的问题被解决了。它值 得关注,因为「在自己电脑上跑大模型做

Apr 181 分钟
本地部署显存优化

KV缓存压缩技术突破:本地大模型部署成本的结构性重写

llama.cpp实现6.8倍KV缓存压缩,131K上下文显存从8.2GB降至1.2GB,直接重写本地部署AI的硬件采购逻辑。

Apr 111 分钟
本地部署提示词工程

764次实验揭秘:小模型部署的三大反常识陷阱

企业自建小型AI模型时,照搬GPT-4提示词规范反而让准确率暴跌64%,这迫使每个计划"私有化部署AI"的老板重新评估技术方案选型。

Apr 111 分钟
AI优化本地部署

斯坦福Meta-Harness:AI系统自我进化,本地部署成本再降四倍

AI运行框架首次实现自动优化纠错,同等任务消耗算力降至四分之一,本地AI部署成本结构正在重写。

Apr 101 分钟
本地部署模型微调

零GPU微调实验:企业私有化AI部署的成本底线正在崩塌

一位开发者用纯CPU完成AI模型全权重微调,揭示私有化部署门槛骤降——传统企业"没有算力就没有AI"的借口正在失效。

Apr 101 分钟
OCR本地部署

本地OCR模型崛起:票据识别外包的终结倒计时

llama.cpp现已支持本地运行OCR模型,企业文档识别可脱离云端API,倒逼每年千万级票据外包市场重新定价。

Apr 101 分钟
语音合成TTS

AI语音克隆军备赛:30语言本地部署时代,配音行业的终局推演

OpenBMB发布VoxCPM2,支持30语言、无需参考音频即可生成声音,配音公司、电话营销和有声内容行业面临低成本替代压力,老板必须决定:继续用人,还是现在切换?

Apr 101 分钟
本地部署推理加速

本地部署122B大模型跑出198字/秒:算力租赁商的末日倒计时

两张消费级GPU在本地跑出企业级推理速度,按字收费的云AI算力租赁模式正面临颠覆——老板该续约还是自建?

Apr 101 分钟
本地部署显存配置

96GB显存的算力焦虑:本地大模型军备赛的商业分水岭

当个人玩家开始用4块3090跑千亿参数模型,传统企业还在犹豫要不要买SaaS订阅——这个算力门槛正在重新定义谁能自主掌控AI成本。

Apr 101 分钟
本地部署数据安全

本地AI部署热潮:企业数据主权的生死抉择

越来越多企业主放弃追求"更聪明的AI",转而追问"数据存在哪里"——这个问题正在重塑AI采购逻辑,倒逼老板在云端便利与数据主权之间做出明确站队。

Apr 101 分钟
Gemma 4Google

Gemma 4 31B 在本地硬件基准测试中匹敌 Gemini 2.5 Pro

社区基准测试显示,通过 llama.cpp 框架本地运行,Gemma 4 31B 达到了与 Gemini 2.5 Pro 相当的性能分数。

Apr 61 分钟
PerplexityEmbedding Models

Perplexity 发布 MIT 许可的嵌入模型以支持本地部署

Perplexity AI 在 MIT 许可下发布多款嵌入模型,支持免费商用及本地部署,降低对付费 API 的依赖。

Apr 61 分钟