AI
找到 16 篇关于此标签的文章
It 's a Big One
Content unav ailable — generation failed before translation could proceed .
Qwen 3.6 27B Makes Huge Gains in Agency on Artificial Analysis - Ties with Sonnet 4.6
阿里通义千问最新发布的 Qwen3.6 27B ,在第三方机构 Artificial Analysis的 Agent 能力评测中与 Anthrop ic 旗舰模型Claude Sonnet 4.6并列,同时超过谷歌Gemini和 OpenAI GP T-5系列。这件事值得关注,不是因为又一个跑分
Google 让 AI 替你重新构图 — 拍照技术的门槛又低了一截
Google Research 发布了一项新的 AI 照片重构图技术,可以在拍摄完成后自动调整画面角度与构图。这件事值得关注,不是因为技术多新奇,而是因为它把过去需要专业摄影师判断的「取景决策」交给了算法—— 这条线一旦被跨过,影响的不只是摄影爱好者。
Google Engineers Want One Ruleset for Production - Ready AI Code — Harder Than It Sounds
Google engineers are tac kling why AI- generated code rarely ships to production, and the fix is more complex than expected .
Your AI Isn 't D umb — It Just Needs Constraints
Har ness Engineering shows that adding behavioral rules to an unchanged AI model can lift benchmark scores from 13.5 to 85 .
A Low -Code Platform's Internal Doc Got Pushed as AI News — The Filter Is Broken
A low-code platform's internal doc was mist aken for AI news, expos ing a syst emic filtering failure in AI media.
DeepAgents 快速上手教程
一 篇发 布 于 掘金的实 战教程,带 你在 60 分钟内用 DeepAgents 构建 生 产级 Agent 应用, 涵盖工 具调 用、子 Agent、 人工审批中 断 、记忆与 流 式输出。
太反差了!那边Claude强制「刷脸」认证,这边国内Coding Plan被外国人疯抢
Anthropic对 Claude用户推 行强 制人 脸识 别认证,而 智 谱 AI发 布GL M-5.1后 ,其 Coding Plan 遭到国 内外 开 发者疯抢, 形 成 鲜明对比。
MiniMax 在 阿里云 AC K/ ACS 上重 建 Agent 基础设施
M iniMax 将 旗 下 Agent 产品 Max Claw 与 MaxHermes 迁移至 阿里云云 原生架构,以 ACK 统 一编 排、 A CS Agent Sandbox 隔离 执行, 标 志着生 产级 Agent 部署进 入基 础设施时代。
混 合训练反而更差 ?VLM Agent在训 练前协调跨数 据集标注,文档 布局检测F-score 从0.860提升至 0.883
混合 多 数 据集训练并 不总 能 提 升效 果,通 过 V LM Agent在 训练前协调跨 数据集标注, 文档布局检测F -score从0.860提 升至0.883。
无人机拍叶片→AI找缺陷:CEA-DETR改进RT-DETR做风电叶片表面缺陷检测,mAP50达89.4%
CE A-DETR基 于RT -DETR改 进,专 为 风电叶片表面 缺陷检测设 计, mAP50达89.4 %, 助 力无 人机自 动化 巡检。
LangChain's 10 Core Modules for Agent Dev: Code Comparisons
LangChain 将 AI Agent 工 程拆解为 10 个抽象层,涵盖多厂商 LLM 调用、RAG 流水线到可 观测性,本文通过代码对比深度解析其 架构价值。
放弃 Claude 订阅?我用 8 年前的服务器,强跑 Google 最强开源模型 Gemma 4 真实测评!
一位开发者在 2016 年老款 Xeon 服务器上本地运行 Google Gemma 4 26B,实测揭示内存带宽才 是 CPU 推理的核心瓶颈。
Gemma 4 Benchmarks Make Case for Local LLM Deployment
Gemma 4's 31B model scores 86.4% on τ²-Bench and 85.2% on MMMLU, running in 34-38GB VRAM on a 96GB card.
MCP协议加入Linux基金会与AI基础设施标准化
2025年12月Anthropic将MCP捐赠给Linux基金会,OpenAI、Google、Microsoft等主流厂商相继加入。本文分析这一治理转变对AI智能体集成方式、企业安全模型及产业生态的深远影响。
Anthropic Claude 4.6 发布:一人公司的 AI 利器
Anthropic 发布 Claude 4.6,性能大幅提升,一人公司创业者的效率工具再升级