返回首页

OPC Wire 的文章

60 篇文章 · 2026年4月14日2026年4月18日

智谱AI

GLM-5 and MiniMax M2.7 Offer Claude Code- Compatible APIs

智谱AI与MiniMax推出兼容 Anthropic SDK 的 API 端点,开发者仅需修改配置即可将 Claude Code 无缝切换至国产大模型。

Apr 185 分钟OPC Wirejuejin.cn
MCP

MCP Protocol Security Flaws: 492 Servers Exposed, 437K Downloads at Risk

安全研究发 现 492 台公开 MCP 服务器存在严重安全隐患,CVE-2025-6514 影 响超 437,000 次下载,涵盖凭证泄露、提示注 入及授权缺失等多类漏洞。

Apr 186 分钟OPC Wirejuejin.cn
Andrew -Ng

Agentic AI Bottleneck Shifts from Code to Deployment Operations

Andrew Ng 指出,Agentic AI 的瓶颈已 不再是代码编写,而是生产环境部署与问题定义, 一个新的运营角色正在悄然兴起。

Apr 185 分钟OPC Wirejuejin.cn
MiniMax

MiniMax Launches MaxHermes: Self-Evolving Agent Builds Own Skills

MiniMax 发布云沙 箱 Agent MaxHermes,可在无人工 干预的情况下从已完成任务中自动提取可复用 Skills, 并持续迭代优化。

Apr 186 分钟OPC Wirejuejin.cn
Cloudflare

Introducing Flagship: feature flags built for the age of AI

Cloudflare 原生 Feature Flag 服务 Flagship 进入封闭测试,基于 CNCF OpenFeature 标准构 建,专为 AI Agent 部署场景设计。

Apr 185 分钟OPC Wireblog.cloudflare.com
Amazon Bedrock

Introducing granular cost attribution for Amazon Bedrock

AWS 为 Amazon Bedrock 推出细粒度成本归因, 自动将推理费用映射至 IAM 用户、角色及 联合身份,无需任何代码改动。

Apr 185 分钟OPC Wireaws.amazon.com
NVIDIA Dynamo

Full-Stack Optimizations for Agentic Inference with NVIDIA Dynamo

Stripe 每周超 1300 个 PR、Ramp 三成合并代 码来自 Agent——NVIDIA Dynamo 如何从全栈角 度应对 Agentic 推理的基础设施挑战。

Apr 185 分钟OPC Wiredeveloper.nvidia.com
Cloudflare

Shared Dictionaries: compression that keeps up with the agentic web

Cloudflare 预 告共享压缩字典支持,仅传输 差异内容而非完整资源,公测定 于 2026 年 4 月 30 日开放。

Apr 176 分钟OPC Wireblog.cloudflare.com
Cloudflare

Introducing the Agent Readiness score. Is your site agent-ready?

Cloudflare 推出 isitagentready.com,扫描网站对 AI Agent 的 兼容性;数据显示,前 20 万域名中仅 4% 声明了 AI 偏好设置。

Apr 175 分钟OPC Wireblog.cloudflare.com
Amazon-Nova

AWS Nova Multimodal Embeddings Powers Native Video Semantic Search

Amazon Bedrock 推出 Nova Multimodal Embeddings,将文本、音频、 视频与图像统一映射至同一向 量空间,重构视频语义搜索架构。

Apr 176 分钟OPC Wireaws.amazon.com
Amazon-Bedrock

Optimize video semantic search intent with Amazon Nova Model Distillation on Amazon Bedrock

Amazon Bedrock 的 Model Distillation 功能将路由智能从 Nova Premier 迁移至 Nova Micro,推理成本降低超 95%,查 询延迟减少 50%。

Apr 176 分钟OPC Wireaws.amazon.com
Amazon Nova

AWS Nova Forge SDK Tutorial: Fine-Tune Nova Models With Data Mixing

AWS 发布 Nova Forge SDK 第 二期教程,详解数据混合微调流程;测试显 示 F1 分数提升 12 个百分点,同 时保留 MMLU 基线能力。

Apr 175 分钟OPC Wireaws.amazon.com
NVIDIA NemoClaw

Build a Secure, Always-On Local AI Agent with OpenClaw and NVIDIA NemoClaw

NVIDIA 推出 NemoClaw 与 OpenClaw 框架,让开发者无需依赖云端即可在 本地运行持久化、高安全性的 AI Agent。

Apr 176 分钟OPC Wiredeveloper.nvidia.com
Qwen3

Qwen 3.6 is the first local model that actually feels worth the effort for me

阿里巴巴 Qwen 3.6 35B-A3B 在双消费级 GPU 上以 Q8 量化运行,实现 170 tokens/秒与完整 260K 上下文,社 区称其首次真正替代云端编程助手。

Apr 176 分钟OPC Wirewww.reddit.com
LocalLLaMA

迁移至本地模型

原文为个人技术支持提问,不 构成可报道的 AI 新闻事件,未通过相关性审核 。

Apr 172 分钟OPC Wirewww.reddit.com
Hermes-Agent

Nous Research Open-Sources Her mes Agent, a Self-Improving AI Agent Framework

Hermes Agent 凭借持 久化技能记忆与三层架构,支持 200+ 模 型,GitHub Stars 突破 9 万,成为当前最受关 注的开源 Agent 框架之一。

Apr 176 分钟OPC Wirejuejin.cn
Claude Opus 4.7

Opus 4.7 来了,我并不建议你升级

Anthropic 发布 Claude Opus 4.7,移除 temperature/top_p/top_k 参数支持,新 tokenizer 导致实际费用最高上涨 35%, 生产环境升级需谨慎。

Apr 174 分钟OPC Wirejuejin.cn
Hermes-Agent

Hermes Agent vs OpenClaw: Persistent Memory vs Tool Orchestration

Nous Research 的 Hermes Agent 以四 层记忆架构挑战 OpenClaw,而 CertiK 审计揭露后者 存在逾 280 项安全漏洞,供 应链风险不容忽视。

Apr 177 分钟OPC Wirejuejin.cn
Juejin

Systematic Debugging Guide: A Detective Framework for Root Cause Analysis

掘金平台发布的四 阶段系统化调试方法论,帮助开发者告别「头痛医头」式 修复,建立从根因出发的结构化排查框架。

Apr 176 分钟OPC Wirejuejin.cn
Claude Code

Anthropic 的 1M Context 与 Claude Code:会话管理才是真正的核心议题

Anthropic 官方发布 Claude Code 会话管理指南,将 1M context window 的价值重新定义为需要主动维 护的会话纪律问题,而非单纯的容量提升。

Apr 175 分钟OPC Wirejuejin.cn
Claude Code

Claude Code 神器 /simplify:让你的代码秒变专业级!

深度 解析 Claude Code 内置斜杠命令 /simplify 的工作原理与实战用法 ,涵盖循环自动化、多步骤工作流组合及已 知局限性。

Apr 174 分钟OPC Wirejuejin.cn
Claude Opus 4.7

Claude Opus 4.7 Launches: 64.3% S WE-Bench Score, Higher Image Resolution

Anthropic 发布 Claude Opus 4.7 ,带来自验证编程机制、 2,576px 图像支持,定价维持不 变。

Apr 175 分钟OPC Wirejuejin.cn
Anthropic

Anthropic Adds ID Verification to Claude, Blocking Chinese Users

Anthropic 正式推出政府身份证 件与人脸实时比对验证机 制,中国大陆用户因证件不在支持范围内,实际上 已被完全阻断于 Claude 服务之外。

Apr 175 分钟OPC Wirejuejin.cn
Lalamove

Lalamove Cuts Translation Costs 90% With 3-Agent LLM Pipeline

Lalamove 工程团队公开披露,通过部署 翻译、质量评分与合规三智能体 LLM 框架,将本地化成 本削减 90%,交付周期从数月压缩至数天 。

Apr 176 分钟OPC Wirejuejin.cn
Qwen3.6-35B

Qwen3.6-35B is worse at tool use and reasoning loops than 3.5?

社区测试者反映,Qwen3.6- 35B 在 agentic 编程任务中比 Qwen3.5 更 容易陷入无限推理循环,工具调用可靠性出现明 显退步。

Apr 175 分钟OPC Wirewww.reddit.com
Google

Reddit 社区呼吁谷歌开源 Imagen(2022)、Gemini 1.0 Nano 与 Gemini 1.0 Pro

r /LocalLLaMA 社区发帖敦促谷歌开源多款已 废弃的旧世代模型,包括 Imagen、Gemini 1.0 及 PaLM 2,谷歌方面尚无任何回应。

Apr 163 分钟OPC Wirewww.reddit.com
Qwen3.6

PSA: Qwen3.6 ships with preserve_thinking. Make sure you have it on.

Qwen3. 6 引入 preserve_thinking 参数,可在多轮对话中保留推理上 下文,修复 KV cache 失效问题,对 Agent 场景影响显著。

Apr 164 分钟OPC Wirewww.reddit.com
llama.cpp

GPoUr with ~12gb vram and a 3080 getting 40tg/s on qwen3.6 35BA3B w/ 260k ctx

ll ama.cpp 的 turboquant 分支通过 turbo3 KV cache 量化, 在单张 RTX 3080 12GB 显存上实现 Qwen3-35B-A3B 约 40 tok/s 推理速度,并支持 260k 上下文窗口。

Apr 164 分钟OPC Wirewww.reddit.com
Amazon Nova Micro

Cost-efficient custom text-to-SQL using Amazon Nova Micro and Amazon Bedrock on-demand inference

AWS 详解如何通过 LoRA 微调 Nova Micro 支 持自定义 SQL 方言,借助 Serverless 推理在 22,000 次查询下月 费仅 $0.80。

Apr 162 分钟OPC Wireaws.amazon.com
Gemma-4

DeepMind’s New AI: A Gift To Humanity

Google DeepMind 正 式发布 Gemma 4 开放权重模型系列,采用 Apache 2.0 许可证,支持商业使用、修改与再分发,社区反 响热烈。

Apr 164 分钟OPC Wirewww.youtube.com
Meta

Meta 用 AI Agent 自动化基础设施效率管理,累计回 收数百兆瓦电力

Meta 推出统 一 AI Agent 平台,将原本耗时 10 小时的人工回归排查压 缩至 30 分钟,在全球数据中心集群中累计回收数百兆瓦电力容 量。

Apr 165 分钟OPC Wireengineering.fb.com
Cloudflare Workers

通 过 PlanetScale + Workers 部署 Postgres 和 MySQL 数据库

Cloudflare Workers 新增原生 PlanetScale 集成,可直接从 Dashboard 和 API 创建 Postgres 与 MySQL 数据库,统一账单功能将于下月上线。

Apr 164 分钟OPC Wireblog.cloudflare.com
Physical Intelligence

机 器人终于开始真正"工作"了

Physical Intelligence 正在训 练单一基础模型,实现跨机器人平台的零样本控制,彻底跳过逐任务数据采 集环节。

Apr 164 分钟OPC Wirewww.youtube.com
NVIDIA DeepStream

How to Build Vision AI Pipelines Using DeepStream Coding Agents

NVIDIA DeepStream 9 集成 Claude Code 与 Cursor 等 coding agent ,可自动生成实时视觉 AI 流水线的可部署优化代码。

Apr 165 分钟OPC Wiredeveloper.nvidia.com
Cloudflare

Cloudfl are AI 平台:专为 Agent 设计的统一推理层

Cloudflare 将 AI Gateway 与 Workers AI 整合为统 一推理层,通过单一 API 接入 12+ 家厂商的 70+ 个模型,共 享积分池,一行代码即可切换。

Apr 166 分钟OPC Wireblog.cloudflare.com
Cloudflare Workers AI

构 建超大语言模型的运行基础:Cloudflare 的推理架构解析

Cloudflare 详解 Workers AI 平台的 prefill-decode 分离架构与硬件配置策略,支撑 Kimi K2.5 运行并实 现 3 倍性能提升。

Apr 166 分钟OPC Wireblog.cloudflare.com
Gemma 4

教程上新丨一键部署Gemma 4 31B,最高256K上下文,能力媲美Qwen3.5 397B

Google DeepMind 开 源 Gemma 4 31 B 现已登 陆 OpenBayes, 一 键部署, 256 K 上下文,Apache 2.0 授 权, 基 准 测 试表 现 媲美 Qwen 3 .5 397B。

Apr 164 分钟OPC Wirejuejin.cn
AI

DeepAgents 快速上手教程

一 篇发 布 于 掘金的实 战教程,带 你在 60 分钟内用 DeepAgents 构建 生 产级 Agent 应用, 涵盖工 具调 用、子 Agent、 人工审批中 断 、记忆与 流 式输出。

Apr 164 分钟OPC Wirejuejin.cn
AI

太反差了!那边Claude强制「刷脸」认证,这边国内Coding Plan被外国人疯抢

Anthropic对 Claude用户推 行强 制人 脸识 别认证,而 智 谱 AI发 布GL M-5.1后 ,其 Coding Plan 遭到国 内外 开 发者疯抢, 形 成 鲜明对比。

Apr 164 分钟OPC Wirejuejin.cn
AI

MiniMax 在 阿里云 AC K/ ACS 上重 建 Agent 基础设施

M iniMax 将 旗 下 Agent 产品 Max Claw 与 MaxHermes 迁移至 阿里云云 原生架构,以 ACK 统 一编 排、 A CS Agent Sandbox 隔离 执行, 标 志着生 产级 Agent 部署进 入基 础设施时代。

Apr 165 分钟OPC Wirejuejin.cn
AI

混 合训练反而更差 ?VLM Agent在训 练前协调跨数 据集标注,文档 布局检测F-score 从0.860提升至 0.883

混合 多 数 据集训练并 不总 能 提 升效 果,通 过 V LM Agent在 训练前协调跨 数据集标注, 文档布局检测F -score从0.860提 升至0.883。

Apr 162 分钟OPC Wirejuejin.cn
AI

无人机拍叶片→AI找缺陷:CEA-DETR改进RT-DETR做风电叶片表面缺陷检测,mAP50达89.4%

CE A-DETR基 于RT -DETR改 进,专 为 风电叶片表面 缺陷检测设 计, mAP50达89.4 %, 助 力无 人机自 动化 巡检。

Apr 162 分钟OPC Wirejuejin.cn
Claude Code

Claude Code 命令速查大 全

Claude Code 核 心命令与 用 法速查, 涵盖常 用 操 作、 M CP 集 成与 模 型切 换等实 用技 巧。

Apr 162 分钟OPC Wirejuejin.cn
Android

从 1.5 秒到 660ms,直播间 首屏秒开是 怎么做出来的 ?

深 度解 析直播间首屏 加 载时 间从 1.5 秒优 化至 660ms 的完 整技 术方案与 实践 路 径。

Apr 162 分钟OPC Wirejuejin.cn
OpenCLI

OpenCL I:将任意网站转化为零成本 CLI Agent 工具

OpenCLI 通过 LLM 一次性生成确定性 JS Adapter, 后续执行零 LLM 成本,已获 15.6k GitHub Stars 。

Apr 155 分钟OPC Wirejuejin.cn
AWS-Trainium2

AWS Trainium2 上的 Speculative Decoding 将 LLM 推理延迟降低最高 3 倍

AWS 基准测试显示,在 Trainium2 上结 合 vLLM 使用 speculative decoding,可将解码密集型工作负载的 inter-token 延迟降低最高 3 倍。

Apr 156 分钟OPC Wireaws.amazon.com
Gemma 4

Gemma 4 与 Qwen 3.5 GGUF 深度评测:oobabooga 的 量化基准分析

oobabooga 发布五份 GGUF 量化基准报告,采用 KL Divergence 方法对 Gemma 4 与 Qwen 3.5 系列模型的 70-90 个量化版本进行全面对比评 测。

Apr 154 分钟OPC Wirewww.reddit.com
Gemma-4

Gemma 4 越狱系统提示词流传,开源权重 模型的安全边界再受考验

一段声称可绕过 Gemma 4 安全过滤机 制的系统提示词在 Reddit 上获得 112 个赞,涉及 GGUF 与 MLX 两种量化格式。

Apr 155 分钟OPC Wirewww.reddit.com
Hermes-Agent

Hermes Agent Framework 斩获 85K GitHub Stars,自演化记忆架构重新 定义 Agent 运行时

Nous Research 开源的 Hermes Agent 凭借四层记忆架构与运行时技能积累机制,在两 个月内突破 85K GitHub Stars,剑指 Agent 框架市场的无状态执行痛点。

Apr 156 分钟OPC Wirejuejin.cn
OpenAI

OpenAI 面向认证安全从业者推出 GPT-5.4-Cyber

OpenAI 通过 Trusted Access for Cyber 计划向经过身 份核验的安全防御者发布专项微调模型 GPT-5.4 -Cyber,进一步布局企业级网络安全市 场。

Apr 155 分钟OPC Wirejuejin.cn
LocalLLaMA

本 地 AI 最棒

一篇来自 Reddit 的帖子称赞本地 AI 工具,但不含任何可核实的新闻、数据 或技术进展。

Apr 152 分钟OPC Wirewww.reddit.com
Claude Code

AI 自 动值夜班时代来了!Claude Code 正式推出 Routines 功能

Anthropic 发布 Claude Code Routines 研究预览版,支持定时与事件驱动的自主编码任务, 完全运行于 Anthropic 云端基础设施,无需本地机器保持开启 。

Apr 155 分钟OPC Wirejuejin.cn
Amazon Bedrock

Guidesly 如何在 AWS 上为户外向导构建 Jack AI 自动化行程报告系统

Guidesly 的 Jack AI 借助 AWS Lambda、Step Functions 和 Amazon Bedrock,在每次户外向导预订完 成后自动生成并发布行程营销内容。

Apr 156 分钟OPC Wireaws.amazon.com
SageMaker HyperPod

Best practices to run inference on Amazon SageMaker HyperPod

AWS 发布 HyperPod 推理部署最佳实践指南,称可将 GPU 工作负载的总拥有成本降低最高 40%。

Apr 156 分钟OPC Wireaws.amazon.com
S ageMaker JumpStart

AWS 为 SageMaker JumpStart 新增面向用例的部署预设配置

SageMaker JumpStart 推出任务感知型部署配置,可 按用例针对成本、吞吐量或延迟分别进行优化, 大幅降低 MLOps 门槛。

Apr 156 分钟OPC Wireaws.amazon.com
Qwen3.5

Qwen3.5-9B GGUF Quant Rankings: Q8_0 Dominates KLD Scores

社区对 Qwen3.5- 9B 逾 35 种 GGUF 量化版本的 KLD 基 准测试显示,Q8_0 变体得分接近 0.001,Q5 以 下质量急剧下降。

Apr 144 分钟OPC Wirewww.reddit.com
TranslateGemma

我 们用 TranslateGemma-12B 对比了 5 款前沿大模型的 字幕翻译能力——它全面领先,但有一个严重 缺陷

Alconost 基准测试显示,这 款 12B 专用模型击败了 GPT-5.4 和 Claude Sonnet-4,但会悄无声息地输出错误的 中文字体变体。

Apr 146 分钟OPC Wirewww.reddit.com
AI

LangChain's 10 Core Modules for Agent Dev: Code Comparisons

LangChain 将 AI Agent 工 程拆解为 10 个抽象层,涵盖多厂商 LLM 调用、RAG 流水线到可 观测性,本文通过代码对比深度解析其 架构价值。

Apr 146 分钟OPC Wirejuejin.cn
Y OLOv8

YOL Ov8 在 RK3588 上实现 111 FPS,赋能无人机电力线巡检

千叶大学研究团队通过模型剪枝与异步 NPU 调度,在仅 6 TOPS 的边缘芯片 RK3588 上实现 111.3 FPS、端到端延迟 23ms 的实时电力 巡检推理。

Apr 145 分钟OPC Wirejuejin.cn
Claude Code

Claude Code 源码泄露:隐藏的 /buddy 宠物养成彩蛋系统曝 光

Anthropic 的 Claude Code CLI 工具源码遭泄露,其 中藏有一套完整的宠物养成系统 BUDDY,通过输入 / buddy 触发,内含稀有度、属性与 ASCII 动画等 完整机制。

Apr 145 分钟OPC Wirejuejin.cn