上一篇介绍了项目基本内容和技术选型,这篇文章主要介绍大模型的集成。对于普通开发者来说,最快捷的方式就是直接用现有的大模型。初期不会花很多时间在模型的选择和集成上,主要是把链路跑通,后续再做微调。
模型选择
直接问 DeepSeek,
当前场景适合的大模型
DeepSeek 回复:
再接着问:
如何接入阿里云「通义千问」大模型?
DeepSeek 回复:
OK,接下去就是直接到阿里云通义大模型官网,看下模型如何集成。
Turbo 集成
Step1:
直接访问模型广场,找到 Turbo,查看 API 调用示例,
Step2:
选择 DashScope,再选择 Java,提供了完整的接入示例,直接 copy 到本地执行;
Step3:
执行前需要申请下 API Key
替换掉代码的 apiKey
参数,引入 maven 依赖,直接运行 Main 函数,
xml
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>dashscope-sdk-java</artifactId>
<!-- 请将 'the-latest-version' 替换为最新版本号:https://mvnrepository.com/artifact/com.alibaba/dashscope-sdk-java -->
<version>2.18.5</version>
</dependency>
输出:
这样一个简单的接口调用就搞定了~
代码
这里直接基于脚手架拉出来的工程开发,详细的步骤可以查看上一篇文章,后端代码已提交到 GitHub。
有了基础模板之后,开发就变得异常简单,基本上全是复制粘贴,基础能力脚手架都提供了🥳🥳🥳这里完整演示一下,因为实在过于简单,不感兴趣的直接跳过就行。
Step1: 在根目录pom.xml
中引入依赖包。
Step2: 在infra
模块,注入依赖包,定义接口和实现类。
Step3: manager
模块发起请求,调用 infra
模块新增的方法。
Step4: api
模块定义对外暴露的接口,service
模块负责实现。
Step5: web
模块对外暴露 http 请求接口
这里需要注意的是按照默认配置,所有接口都是需要登录认证的,但是我们目前并不需要做登录认证,所以需要在拦截器中过滤请求。
Step6: 测试请求调用,最终前端只要把 data 展示出来就好啦。
总结
模型的对接还是比较简单的,因为现在还属于功能模块开发阶段,所以没有花很多时间在模型的选择上,也没有集成现有的工具包,如 Spring AI、Spring AI Alibaba 等。思路是没问题的,有句话不是说:先去做,哪怕做成一堆狗屎,再慢慢去改,一个粗糙的开始,就是最好的开始。
我是欧达克,祝你幸福。