一位拥有15年经验的政策研究员,在消费级硬件上用开源模型和Agent框架(让AI自主规划和执行多步骤任务的程序),花了5小时、自主迭代6轮,生成了一份21页的欧洲AI现状报告 — AI做深度研究,从'能不能'正式进入'能用但别急'的阶段。
这是什么
这位自称失业的公共部门研究员,用Hermes Agent(开源AI代理框架)配合Qwen 3.6-35b量化版(阿里的开源大模型,经压缩可本地运行),在自己的电脑上跑通了一套研究报告生成流程:从草稿开始,诊断问题、修正内容、生成图表、插入文档,六轮循环几乎自主完成。连代码仓库的README和文件夹结构都是AI自己生成的。作者将全部提示词、脚本和中间产物开源,明确表示这是给同行的'起步脚手架',不是成品方案。
行业怎么看
我们注意到这个案例的价值不在报告质量本身 — 作者自评'不算优秀,但足够好作为起点'。真正的信号是:非技术背景的传统知识工作者,已经在消费级硬件上跑通了Agent工作流的完整闭环,且认为未来可以实现全自动。这对Perplexity等商业深度研究产品是一个提醒 — 用户自建替代方案的门槛正在降低。
但风险同样明显。首先是速度:RTX 4060加32GB内存,每秒仅28 token,5小时出一份报告,生产力视角并不划算。其次是质量失控:6轮自主迭代意味着AI在'自我审视',但缺少领域专家的干预节点,专业报告的准确性和合规性无法保证。反对者会指出,政策简报的'格式像'和'内容对'是两回事 — 当前模型的幻觉问题在自主长文本生成中只会被放大,而非收敛。
对普通人的影响
对企业IT:开源Agent加本地部署的组合,让数据不出域的深度研究成为可能,但5小时算力成本和尚无质控流程,意味着短期仍是实验而非生产工具。
对个人职场:传统研究、咨询岗位的'初稿生成'环节正在被蚕食 — 不是AI替代你,是会用AI的人替代不会用的人,这个判断又多了一个实例。
对消费市场:消费级显卡跑Agent的体验仍偏极客玩具,但随着模型小型化和框架成熟,12-18个月后可能进入更广泛的知识工作者日常。