发生了什么

Spring AI 2.0 已正式发布(General Availability),根据掘金上发布的技术指南,该版本为 Spring 生态系统内的大语言模型集成提供了一套原生 Java 框架。此次发布主要面向 Java 开发者——此前他们若要集成 GPT、Claude 或 Qwen 等模型,既没有官方的生产级路径可走,只能依赖手写 HTTP 客户端代码或社区维护的 SDK。

该框架内置对 20 余家模型提供商的支持,涵盖 OpenAI、Anthropic、Google、阿里巴巴的 Qwen,以及通过 Ollama 进行的本地推理——所有配置均可通过 Spring Boot 标准的 application.properties 机制完成。切换模型只需修改一行配置,无需在各服务层之间大规模重构。

为何值得关注

Java 在企业级后端领域依然占据主导地位。在 Spring AI 出现之前,Java 技术栈长期处于结构性劣势:Python 的 LangChain 与 OpenAI SDK 生态比任何 JVM 原生方案都早熟了数年。工程团队要么接受在 Java 单体服务旁边另起 Python 微服务,要么针对各模型提供商 API 手写脆弱的 HTTP 客户端。

Spring AI 与 Spring Boot 的深度集成意味着:依赖注入、AOP 以及 Spring Security 无需任何适配层,即可直接作用于 AI 组件。对于已全面标准化在 Spring 技术栈上的工程团队而言,这消除了引入 Python 或 Node.js AI Sidecar 服务的主要理由,进而对大型工程组织的基础设施复杂度、可观测性工具链以及人员招聘需求产生直接影响。

与之竞争的框架 LangChain4j 保持框架无关性,可在 Quarkus 或原生 Java SE 上运行——对于未采用 Spring Boot 的团队而言,这是一项实质性优势。据原文介绍,LangChain4j 支持 15+ 家模型提供商(对比 Spring AI 的 20+),同样被定位为生产就绪。正在评估两者的团队应将框架锁定作为核心变量:Spring AI 在 Spring Boot 集成深度上占优;LangChain4j 在可移植性上更胜一筹。

技术细节

Spring AI 2.0 的核心能力主要体现在四个方面:

  • ChatClient API:一套流式构建器接口,封装了提示词构造、模型调度与响应处理。流式响应原生使用 Project Reactor 的 Flux,替代了手动解析 Server-Sent Events 的方式。
  • 结构化输出(Structured Output):ChatResponse 上的 .entity(Class) 方法可将模型输出直接反序列化为 Java Record 或 POJO,跳过手动 JSON 解析环节,类型安全在编译期即可得到保障。
  • RAG(检索增强生成):内置 VectorStore 抽象,提供基于 PostgreSQL pgvector 扩展的 PgVectorStore 实现。Advisors 可将检索步骤以声明式方式附加到 ChatClient 实例上。
  • Function Calling / Tool Use:@Tool 注解可将 Java 方法暴露为模型可调用的工具,由 ToolCallbackProvider 负责处理调度生命周期。这使模型能够在单次请求周期内调用业务逻辑——如库存查询、数据库检索等操作。

配置遵循 Spring Boot 标准的外部化机制。切换提供商只需更新 spring.ai.openai.base-url 及对应的 API Key 属性,据原文介绍,整个切换过程无需改动任何代码。

原文中的示例 Controller 骨架如下:

@GetMapping("/chat")
public String chat(@RequestParam String message) {
    return chatClient.prompt()
        .user(message)
        .call()
        .content();
}

ChatClient Bean 通过标准构造函数注入方式引入,这意味着它完整参与 Spring 的生命周期管理——包括作用域管理、基于代理的 AOP,以及测试上下文支持。

后续值得关注的动向

  • LangChain4j 的竞争回应:LangChain4j 的维护者历来比 Spring AI 的里程碑节奏迭代更快。需关注 LangChain4j 后续版本是否会缩小提供商数量差距,或通过新增 Spring Boot Starter 来降低集成门槛。
  • 企业采用信号:Spring AI 的公信力取决于大型 Spring Boot 用户——金融服务、企业 SaaS 等行业——是否会将 AI 工作负载迁移至现有 Java 服务,而非继续维护 Python Sidecar。未来 30 天内的公开案例研究将是衡量其推进速度的重要参考。
  • 模型提供商 API 变更:OpenAI GPT 与 Anthropic Claude 的版本迭代节奏正在加速。当提供商废弃端点或变更响应 Schema 时,Spring AI 的抽象层将迎来真正的压力测试——需持续关注针对提供商破坏性变更所发布的补丁版本。
  • 可观测性工具链:Spring Boot Actuator 与 Micrometer 在 AI 调用链路追踪、Token 用量指标及延迟直方图方面的集成仍存在缺口,这是竞争对手可能借力突破的方向。需关注社区或官方模块是否会在 2026 年第一季度填补这一空白。