你的日常操作总在多个窗口迷路——这个思路帮你搭出专属工作台
相关推荐
最新文章
muxichina-gpu
沐曦赴港,不只是融资
沐曦筹划 H 股上市,表面是融资与全球化,实质是中国 GPU 供应链进入资本密集赛段:真正被定价的不是故事,而是量产、客户验证与持续供货能力。
6月12日·36kr.com
Moonshot AIKimi K2.7 Code
Kimi K2.7 Code 把推理开销再降 30%,国产代码 Agent 开始比拼交付效率
Kimi K2.7 Code 在 K2.6 基础上把“思考 token”使用量再降约 30%,同时强化长流程编程任务完成度。值得关心的不只是模型更会写代码,而是国产大模型竞争正从刷榜,转向谁能更便宜、更稳定地完成真实软件工程流程。
6月12日·www.reddit.com
华为openPangu 2.0
华为发布 openPangu 2.0 并宣布开源,国产大模型开始补生态短板
6 月 30 日起,华为将逐步开源 openPangu 2.0 的模型权重、训练与推理代码。比参数规模更值得关心的是,它同时押注昇腾算力与鸿蒙生态,说明国产大模型竞争正从“谁更大”转向“谁能把软硬件和开发者体系真正连起来”。
6月12日·www.reddit.com
EAGLE3llama.cpp
EAGLE3 并入 llama.cpp,开源大模型推理开始更务实地追求提速
EAGLE3 经过半年开发正式并入 llama.cpp,核心意义不是又多了一个术语,而是开源社区在大模型推理提速上走向更务实路线:不只靠更强硬件,而是靠更聪明的生成流程,把本地部署的可用性再往前推一步。
6月12日·www.reddit.com
Claude SonnetLocalLLaMA
两天跑掉 5000 万 token 省下 151 美元,本地模型开始适合重度开发者
一位开发者两天内用了约 5000 万输入 token、49 次编程会话,按 Claude Sonnet 的公开价格计算约值 151 美元。这件事值得关心,不是因为“本地部署”突然更强了,而是高频、长上下文场景已经开始逼近成本分界点。
6月12日·www.reddit.com
AnthropicClaude Fable
Anthropic 推出 Claude Fable,但更强不等于更可用,安全阉割成了核心卖点
Anthropic 本周发布 Claude Fable,并被描述为面向公众开放的更强版本,但关键词不是性能,而是“经过安全限制后仍可用”。这值得关心,因为大模型竞争正从拼参数,转向拼“能放出来给谁用、怎么用”。
6月11日·www.youtube.com