OPC Wire 的文章

Apr 185 分钟OPC Wireblog.cloudflare.com

Introducing Flagship: feature flags built for the age of AI

Cloudflare 原生 Feature Flag 服务 Flagship 进入封闭测试，基于 CNCF OpenFeature 标准构建，专为 AI Agent 部署场景设计。

Amazon Bedrock

Introducing granular cost attribution for Amazon Bedrock

AWS 为 Amazon Bedrock 推出细粒度成本归因，自动将推理费用映射至 IAM 用户、角色及联合身份，无需任何代码改动。

Apr 185 分钟OPC Wireaws.amazon.com

NVIDIA Dynamo

Full-Stack Optimizations for Agentic Inference with NVIDIA Dynamo

Stripe 每周超 1300 个 PR、Ramp 三成合并代码来自 Agent——NVIDIA Dynamo 如何从全栈角度应对 Agentic 推理的基础设施挑战。

Apr 185 分钟OPC Wiredeveloper.nvidia.com

Apr 176 分钟OPC Wireblog.cloudflare.com

Shared Dictionaries: compression that keeps up with the agentic web

Cloudflare 预告共享压缩字典支持，仅传输差异内容而非完整资源，公测定于 2026 年 4 月 30 日开放。

Apr 175 分钟OPC Wireblog.cloudflare.com

Introducing the Agent Readiness score. Is your site agent-ready?

Cloudflare 推出 isitagentready.com，扫描网站对 AI Agent 的兼容性；数据显示，前 20 万域名中仅 4% 声明了 AI 偏好设置。

Amazon-Nova

AWS Nova Multimodal Embeddings Powers Native Video Semantic Search

Amazon Bedrock 推出 Nova Multimodal Embeddings，将文本、音频、视频与图像统一映射至同一向量空间，重构视频语义搜索架构。

Apr 176 分钟OPC Wireaws.amazon.com

Amazon-Bedrock

Optimize video semantic search intent with Amazon Nova Model Distillation on Amazon Bedrock

Amazon Bedrock 的 Model Distillation 功能将路由智能从 Nova Premier 迁移至 Nova Micro，推理成本降低超 95%，查询延迟减少 50%。

Apr 176 分钟OPC Wireaws.amazon.com

Amazon Nova

AWS Nova Forge SDK Tutorial: Fine-Tune Nova Models With Data Mixing

AWS 发布 Nova Forge SDK 第二期教程，详解数据混合微调流程；测试显示 F1 分数提升 12 个百分点，同时保留 MMLU 基线能力。

Apr 175 分钟OPC Wireaws.amazon.com

NVIDIA NemoClaw

Build a Secure, Always-On Local AI Agent with OpenClaw and NVIDIA NemoClaw

NVIDIA 推出 NemoClaw 与 OpenClaw 框架，让开发者无需依赖云端即可在本地运行持久化、高安全性的 AI Agent。

Apr 176 分钟OPC Wiredeveloper.nvidia.com

Qwen3

Qwen 3.6 is the first local model that actually feels worth the effort for me

阿里巴巴 Qwen 3.6 35B-A3B 在双消费级 GPU 上以 Q8 量化运行，实现 170 tokens/秒与完整 260K 上下文，社区称其首次真正替代云端编程助手。

Apr 176 分钟OPC Wirewww.reddit.com

LocalLLaMA

迁移至本地模型

原文为个人技术支持提问，不构成可报道的 AI 新闻事件，未通过相关性审核。

Apr 172 分钟OPC Wirewww.reddit.com

Hermes-Agent

Nous Research Open-Sources Her mes Agent, a Self-Improving AI Agent Framework

Hermes Agent 凭借持久化技能记忆与三层架构，支持 200+ 模型，GitHub Stars 突破 9 万，成为当前最受关注的开源 Agent 框架之一。

Apr 176 分钟OPC Wirejuejin.cn

Claude Opus 4.7

Opus 4.7 来了，我并不建议你升级

Anthropic 发布 Claude Opus 4.7，移除 temperature/top_p/top_k 参数支持，新 tokenizer 导致实际费用最高上涨 35%，生产环境升级需谨慎。

Apr 174 分钟OPC Wirejuejin.cn

Hermes-Agent

Hermes Agent vs OpenClaw: Persistent Memory vs Tool Orchestration

Nous Research 的 Hermes Agent 以四层记忆架构挑战 OpenClaw，而 CertiK 审计揭露后者存在逾 280 项安全漏洞，供应链风险不容忽视。

Apr 177 分钟OPC Wirejuejin.cn

Juejin

Systematic Debugging Guide: A Detective Framework for Root Cause Analysis

掘金平台发布的四阶段系统化调试方法论，帮助开发者告别「头痛医头」式修复，建立从根因出发的结构化排查框架。

Apr 176 分钟OPC Wirejuejin.cn

Apr 175 分钟OPC Wirejuejin.cn

Anthropic 的 1M Context 与 Claude Code：会话管理才是真正的核心议题

Anthropic 官方发布 Claude Code 会话管理指南，将 1M context window 的价值重新定义为需要主动维护的会话纪律问题，而非单纯的容量提升。

Apr 174 分钟OPC Wirejuejin.cn

Claude Code 神器 /simplify：让你的代码秒变专业级！

深度解析 Claude Code 内置斜杠命令 /simplify 的工作原理与实战用法，涵盖循环自动化、多步骤工作流组合及已知局限性。

Claude Opus 4.7

Claude Opus 4.7 Launches: 64.3% S WE-Bench Score, Higher Image Resolution

Anthropic 发布 Claude Opus 4.7 ，带来自验证编程机制、 2,576px 图像支持，定价维持不变。

Apr 175 分钟OPC Wirejuejin.cn

Anthropic

Anthropic Adds ID Verification to Claude, Blocking Chinese Users

Anthropic 正式推出政府身份证件与人脸实时比对验证机制，中国大陆用户因证件不在支持范围内，实际上已被完全阻断于 Claude 服务之外。

Apr 175 分钟OPC Wirejuejin.cn

Lalamove

Lalamove Cuts Translation Costs 90% With 3-Agent LLM Pipeline

Lalamove 工程团队公开披露，通过部署翻译、质量评分与合规三智能体 LLM 框架，将本地化成本削减 90%，交付周期从数月压缩至数天。

Apr 176 分钟OPC Wirejuejin.cn

Qwen3.6-35B

Qwen3.6-35B is worse at tool use and reasoning loops than 3.5?

社区测试者反映，Qwen3.6- 35B 在 agentic 编程任务中比 Qwen3.5 更容易陷入无限推理循环，工具调用可靠性出现明显退步。

Apr 175 分钟OPC Wirewww.reddit.com

Google

Reddit 社区呼吁谷歌开源 Imagen（2022）、Gemini 1.0 Nano 与 Gemini 1.0 Pro

r /LocalLLaMA 社区发帖敦促谷歌开源多款已废弃的旧世代模型，包括 Imagen、Gemini 1.0 及 PaLM 2，谷歌方面尚无任何回应。

Apr 163 分钟OPC Wirewww.reddit.com

Qwen3.6

PSA: Qwen3.6 ships with preserve_thinking. Make sure you have it on.

Qwen3. 6 引入 preserve_thinking 参数，可在多轮对话中保留推理上下文，修复 KV cache 失效问题，对 Agent 场景影响显著。

Apr 164 分钟OPC Wirewww.reddit.com

llama.cpp

GPoUr with ~12gb vram and a 3080 getting 40tg/s on qwen3.6 35BA3B w/ 260k ctx

ll ama.cpp 的 turboquant 分支通过 turbo3 KV cache 量化，在单张 RTX 3080 12GB 显存上实现 Qwen3-35B-A3B 约 40 tok/s 推理速度，并支持 260k 上下文窗口。

Apr 164 分钟OPC Wirewww.reddit.com

Amazon Nova Micro

Cost-efficient custom text-to-SQL using Amazon Nova Micro and Amazon Bedrock on-demand inference

AWS 详解如何通过 LoRA 微调 Nova Micro 支持自定义 SQL 方言，借助 Serverless 推理在 22,000 次查询下月费仅 $0.80。

Apr 162 分钟OPC Wireaws.amazon.com

Gemma-4

DeepMind’s New AI: A Gift To Humanity

Google DeepMind 正式发布 Gemma 4 开放权重模型系列，采用 Apache 2.0 许可证，支持商业使用、修改与再分发，社区反响热烈。

Apr 164 分钟OPC Wirewww.youtube.com

Meta 用 AI Agent 自动化基础设施效率管理，累计回收数百兆瓦电力

Meta 推出统一 AI Agent 平台，将原本耗时 10 小时的人工回归排查压缩至 30 分钟，在全球数据中心集群中累计回收数百兆瓦电力容量。

Apr 165 分钟OPC Wireengineering.fb.com

Cloudflare Workers

通过 PlanetScale + Workers 部署 Postgres 和 MySQL 数据库

Cloudflare Workers 新增原生 PlanetScale 集成，可直接从 Dashboard 和 API 创建 Postgres 与 MySQL 数据库，统一账单功能将于下月上线。

Apr 164 分钟OPC Wireblog.cloudflare.com

Physical Intelligence

机器人终于开始真正"工作"了

Physical Intelligence 正在训练单一基础模型，实现跨机器人平台的零样本控制，彻底跳过逐任务数据采集环节。

Apr 164 分钟OPC Wirewww.youtube.com

NVIDIA DeepStream

How to Build Vision AI Pipelines Using DeepStream Coding Agents

NVIDIA DeepStream 9 集成 Claude Code 与 Cursor 等 coding agent ，可自动生成实时视觉 AI 流水线的可部署优化代码。

Apr 165 分钟OPC Wiredeveloper.nvidia.com

Apr 166 分钟OPC Wireblog.cloudflare.com

Cloudfl are AI 平台：专为 Agent 设计的统一推理层

Cloudflare 将 AI Gateway 与 Workers AI 整合为统一推理层，通过单一 API 接入 12+ 家厂商的 70+ 个模型，共享积分池，一行代码即可切换。

Cloudflare Workers AI

构建超大语言模型的运行基础：Cloudflare 的推理架构解析

Cloudflare 详解 Workers AI 平台的 prefill-decode 分离架构与硬件配置策略，支撑 Kimi K2.5 运行并实现 3 倍性能提升。

Apr 166 分钟OPC Wireblog.cloudflare.com

Gemma 4

教程上新丨一键部署Gemma 4 31B，最高256K上下文，能力媲美Qwen3.5 397B

Google DeepMind 开源 Gemma 4 31 B 现已登陆 OpenBayes，一键部署， 256 K 上下文，Apache 2.0 授权，基准测试表现媲美 Qwen 3 .5 397B。

Apr 164 分钟OPC Wirejuejin.cn

DeepAgents 快速上手教程

一篇发布于掘金的实战教程，带你在 60 分钟内用 DeepAgents 构建生产级 Agent 应用，涵盖工具调用、子 Agent、人工审批中断、记忆与流式输出。

Apr 164 分钟OPC Wirejuejin.cn

太反差了！那边Claude强制「刷脸」认证，这边国内Coding Plan被外国人疯抢

Anthropic对 Claude用户推行强制人脸识别认证，而智谱 AI发布GL M-5.1后，其 Coding Plan 遭到国内外开发者疯抢，形成鲜明对比。

Apr 164 分钟OPC Wirejuejin.cn

MiniMax 在阿里云 AC K/ ACS 上重建 Agent 基础设施

M iniMax 将旗下 Agent 产品 Max Claw 与 MaxHermes 迁移至阿里云云原生架构，以 ACK 统一编排、 A CS Agent Sandbox 隔离执行，标志着生产级 Agent 部署进入基础设施时代。

Apr 165 分钟OPC Wirejuejin.cn

混合训练反而更差？VLM Agent在训练前协调跨数据集标注，文档布局检测F-score 从0.860提升至 0.883

混合多数据集训练并不总能提升效果，通过 V LM Agent在训练前协调跨数据集标注，文档布局检测F -score从0.860提升至0.883。

无人机拍叶片→AI找缺陷：CEA-DETR改进RT-DETR做风电叶片表面缺陷检测，mAP50达89.4%

CE A-DETR基于RT -DETR改进，专为风电叶片表面缺陷检测设计， mAP50达89.4 %，助力无人机自动化巡检。

Claude Code 命令速查大全

Claude Code 核心命令与用法速查，涵盖常用操作、 M CP 集成与模型切换等实用技巧。

Android

从 1.5 秒到 660ms，直播间首屏秒开是怎么做出来的？

深度解析直播间首屏加载时间从 1.5 秒优化至 660ms 的完整技术方案与实践路径。

Apr 155 分钟OPC Wirejuejin.cn

OpenCLI

OpenCL I：将任意网站转化为零成本 CLI Agent 工具

OpenCLI 通过 LLM 一次性生成确定性 JS Adapter，后续执行零 LLM 成本，已获 15.6k GitHub Stars 。

AWS-Trainium2

AWS Trainium2 上的 Speculative Decoding 将 LLM 推理延迟降低最高 3 倍

AWS 基准测试显示，在 Trainium2 上结合 vLLM 使用 speculative decoding，可将解码密集型工作负载的 inter-token 延迟降低最高 3 倍。

Apr 154 分钟OPC Wirewww.reddit.com

Gemma 4

Gemma 4 与 Qwen 3.5 GGUF 深度评测：oobabooga 的量化基准分析

oobabooga 发布五份 GGUF 量化基准报告，采用 KL Divergence 方法对 Gemma 4 与 Qwen 3.5 系列模型的 70-90 个量化版本进行全面对比评测。

Gemma-4

Gemma 4 越狱系统提示词流传，开源权重模型的安全边界再受考验

一段声称可绕过 Gemma 4 安全过滤机制的系统提示词在 Reddit 上获得 112 个赞，涉及 GGUF 与 MLX 两种量化格式。

Apr 155 分钟OPC Wirewww.reddit.com

Hermes-Agent

Hermes Agent Framework 斩获 85K GitHub Stars，自演化记忆架构重新定义 Agent 运行时

Nous Research 开源的 Hermes Agent 凭借四层记忆架构与运行时技能积累机制，在两个月内突破 85K GitHub Stars，剑指 Agent 框架市场的无状态执行痛点。

Apr 156 分钟OPC Wirejuejin.cn

OpenAI

OpenAI 面向认证安全从业者推出 GPT-5.4-Cyber

OpenAI 通过 Trusted Access for Cyber 计划向经过身份核验的安全防御者发布专项微调模型 GPT-5.4 -Cyber，进一步布局企业级网络安全市场。

Apr 155 分钟OPC Wirejuejin.cn

LocalLLaMA

本地 AI 最棒

一篇来自 Reddit 的帖子称赞本地 AI 工具，但不含任何可核实的新闻、数据或技术进展。

Apr 152 分钟OPC Wirewww.reddit.com

Apr 155 分钟OPC Wirejuejin.cn

AI 自动值夜班时代来了！Claude Code 正式推出 Routines 功能

Anthropic 发布 Claude Code Routines 研究预览版，支持定时与事件驱动的自主编码任务，完全运行于 Anthropic 云端基础设施，无需本地机器保持开启。

Amazon Bedrock

Guidesly 如何在 AWS 上为户外向导构建 Jack AI 自动化行程报告系统

Guidesly 的 Jack AI 借助 AWS Lambda、Step Functions 和 Amazon Bedrock，在每次户外向导预订完成后自动生成并发布行程营销内容。

SageMaker HyperPod

Best practices to run inference on Amazon SageMaker HyperPod

AWS 发布 HyperPod 推理部署最佳实践指南，称可将 GPU 工作负载的总拥有成本降低最高 40%。

S ageMaker JumpStart

AWS 为 SageMaker JumpStart 新增面向用例的部署预设配置

SageMaker JumpStart 推出任务感知型部署配置，可按用例针对成本、吞吐量或延迟分别进行优化，大幅降低 MLOps 门槛。

Apr 144 分钟OPC Wirewww.reddit.com

Qwen3.5

Qwen3.5-9B GGUF Quant Rankings: Q8_0 Dominates KLD Scores

社区对 Qwen3.5- 9B 逾 35 种 GGUF 量化版本的 KLD 基准测试显示，Q8_0 变体得分接近 0.001，Q5 以下质量急剧下降。

TranslateGemma

我们用 TranslateGemma-12B 对比了 5 款前沿大模型的字幕翻译能力——它全面领先，但有一个严重缺陷

Alconost 基准测试显示，这款 12B 专用模型击败了 GPT-5.4 和 Claude Sonnet-4，但会悄无声息地输出错误的中文字体变体。

Apr 146 分钟OPC Wirewww.reddit.com

LangChain's 10 Core Modules for Agent Dev: Code Comparisons

LangChain 将 AI Agent 工程拆解为 10 个抽象层，涵盖多厂商 LLM 调用、RAG 流水线到可观测性，本文通过代码对比深度解析其架构价值。

Apr 146 分钟OPC Wirejuejin.cn

Y OLOv8

YOL Ov8 在 RK3588 上实现 111 FPS，赋能无人机电力线巡检

千叶大学研究团队通过模型剪枝与异步 NPU 调度，在仅 6 TOPS 的边缘芯片 RK3588 上实现 111.3 FPS、端到端延迟 23ms 的实时电力巡检推理。

Apr 145 分钟OPC Wirejuejin.cn