1.介绍
1.1 什么是华为云Flexus X实例
最近华为云828 B2B企业节正在举办,Flexus X实例的促销也非常给力,大家可以去看看。特别是对算力性能有要求,同时对自建MySQL、Redis、Nginx性能有要求的小伙伴,千万不要错过。
Flexus云服务器X实例是新一代面向中小企业和开发者打的柔性算力云服务器,可智能感知业务负载,适用于电商直播、企业建站、开发测试环境、游戏服务器、音视频服务等中低负载场景。
data:image/s3,"s3://crabby-images/2efdd/2efdd25a4d3851a3a6d7bcc001a19d4d496d90c6" alt=""
1.2什么是Ollama
Ollama是一个开源的 LLM(大型语言模型)服务工具,用于简化在本地运行大语言模型,降低使用大语言模型的门槛,使得大模型的开发者、研究人员和爱好者能够在本地环境快速实验、管理和部署最新大语言模型,包括如Llama 3、Phi 3、Mistral、Gemma,Qwen等开源的大型语言模型。
data:image/s3,"s3://crabby-images/4d9ac/4d9ac159ace0d443570304fbaa323acc2bed71a7" alt=""
2 准备华为云Flexus应用服务器L实例
注册并登录华为云找到华为云Flexus云服务
data:image/s3,"s3://crabby-images/16d85/16d85f91f472a3eb526ad05516955dbe39cf33be" alt=""
选择合适的服务器进行购买
选择相应的配置并购买
购买之后找到控制台进行密码修改和远程登陆
使用远程连接工具连接云服务器
data:image/s3,"s3://crabby-images/7fdf2/7fdf2cf2642ec89613b6d50be72d6ba972c24e14" alt=""
3 部署Ollama服务
data:image/s3,"s3://crabby-images/a0f73/a0f7311a38bbfa19072d8fafeebc077bd41485d2" alt=""
这里官网提供了三种系统的安装包这里下载安装即可使用。
这里我采用docker部署的方式
docker pull ollama/ollama
data:image/s3,"s3://crabby-images/c5cb1/c5cb1c49d03ee5a93653eaee75059e3ee43e780c" alt=""
查看镜像
docker image ls
data:image/s3,"s3://crabby-images/3b4a1/3b4a151df0b4878d82eb99fe5d5171af83adb4ae" alt=""
运行容器
bash
docker run -itd -p11434:11434 --name ollama ollama/ollama
data:image/s3,"s3://crabby-images/2e456/2e456e61917b47aac231d42894f1f91ffbb6fdcc" alt=""
进入容器中
data:image/s3,"s3://crabby-images/a7e71/a7e71b3bf9beddd9982c5fb7889ecdc85ec9127d" alt=""
拉取对应的大模型 (mistral,llama3,qwen2,...)这里以mistral为例
data:image/s3,"s3://crabby-images/e57b9/e57b9ff0b50fef63d076905fff7ec19bc08b30e6" alt=""
运行对应的大模型 ollama run mistral
data:image/s3,"s3://crabby-images/841bd/841bd3b0adbaa31e0cdc3243bb53d6c4786c8279" alt=""
4 实现问答对话
这里我们使用Spring AI 快速搭建一个问答服务其中集成了ollama 可以快速链接到ollama服务,记得开放11434的端口
XML
<properties>
<java.version>17</java.version>
<spring-ai.version>1.0.0-M1</spring-ai.version>
</properties>
<dependencies>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-ollama-spring-boot-starter</artifactId>
</dependency>
</dependencies>
java
@RestController
@RequestMapping("/chat")
public class ChatController {
@Resource
private OllamaChatModel ollamaChatModel;
@Resource
private InMemoryChatMemory inMemoryChatMemory;
@Operation(summary = "同步输出")
@GetMapping("/question")
public String question(@RequestParam String question) {
return ollamaChatModel.call(question);
}
@Operation(summary = "流式输出")
@GetMapping(value = "/stream", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public Flux<String> stream(@RequestParam String question) {
return ollamaChatModel.stream(question);
}
@Operation(summary = "连续对话")
@GetMapping(value = "/history", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public Flux<String> history(@RequestParam String conversationId, @RequestParam String question) {
List<Message> messages = new ArrayList<>();
List<Message> conversation = inMemoryChatMemory.get(conversationId, 10);
if (conversation != null) {
messages.addAll(conversation);
}
messages.add(new UserMessage(question));
Prompt prompt = new Prompt(messages);
UserMessage message = new UserMessage(question);
List<Message> userMessages = new ArrayList<>();
userMessages.add(message);
inMemoryChatMemory.add(conversationId, userMessages);
return ollamaChatModel.stream(prompt).map((result) -> result.getResult().getOutput().getContent());
}
}
data:image/s3,"s3://crabby-images/83521/8352101618e8c0bc97e89171d51fc2449b61c829" alt=""