Content generation failed
本地运行的阿里 Qwen 模型,在普通电脑上实现了「浏览器当操作系统」— 开源模型的能力边界正在被重新丈量
相关推荐
基于 #Qwen 推荐
NVIDIARTX Pro 4500 Blackwell
32GB 显存把本地大模型速度拉高 2 到 6 倍,企业买卡逻辑开始变了
一位用户把 RTX 5060 Ti 16GB 升级到 RTX Pro 4500 Blackwell 32GB 后,部分本地大模型推理提速达到 2 到 6 倍。值得关心的不是一张卡快了多少,而是企业部署私有大模型时,“显存优先”正比“堆系统内存”更实际。
6月5日·www.reddit.com
华为openPangu 2.0
华为发布 openPangu 2.0 并宣布开源,国产大模型开始补生态短板
6 月 30 日起,华为将逐步开源 openPangu 2.0 的模型权重、训练与推理代码。比参数规模更值得关心的是,它同时押注昇腾算力与鸿蒙生态,说明国产大模型竞争正从“谁更大”转向“谁能把软硬件和开发者体系真正连起来”。
6月12日·www.reddit.com
EAGLE3llama.cpp
EAGLE3 并入 llama.cpp,开源大模型推理开始更务实地追求提速
EAGLE3 经过半年开发正式并入 llama.cpp,核心意义不是又多了一个术语,而是开源社区在大模型推理提速上走向更务实路线:不只靠更强硬件,而是靠更聪明的生成流程,把本地部署的可用性再往前推一步。
6月12日·www.reddit.com
AnthropicClaude Fable
Anthropic 推出 Claude Fable,但更强不等于更可用,安全阉割成了核心卖点
Anthropic 本周发布 Claude Fable,并被描述为面向公众开放的更强版本,但关键词不是性能,而是“经过安全限制后仍可用”。这值得关心,因为大模型竞争正从拼参数,转向拼“能放出来给谁用、怎么用”。
6月11日·www.youtube.com
OpenAICodex
OpenAI 拿黑洞模拟做案例,说明编程 Agent 正从写代码走向做科研助手
OpenAI 最新案例里,天体物理学家用 Codex 参与黑洞模拟。值得关心的不是“AI 能不能写代码”,而是编程 Agent(能分步骤执行开发任务的系统)开始进入科研、工程等高门槛场景,帮助人类加快试错,但距离独立产出结论还很远。
6月11日·openai.com
AWSTrainium
AWS 把芯片调优交给 AI 代理,Trainium 的门槛开始从专家能力变成工具能力
AWS 发布 Neuron Agentic Development,把原本依赖少数专家的芯片内核调优流程,交给 AI 代理辅助完成。值得关心的是,这不是单纯多一个开发工具,而是云厂商在争夺“谁能更快把模型跑便宜”的关键环节。
6月10日·aws.amazon.com