Spring AI Alibaba入门学习(二)

一、Ollama私有化部署

1.1 Ollama是什么?

一句话定义:Ollama是一个开源的、轻量级的本地大语言模型运行和管理平台,让你能在自己的电脑上轻松运行各种开源模型(如Llama 3、DeepSeek、Qwen等),就像Docker管理容器一样方便。

下载地址:https://ollama.com/download

2.2 安装Ollama

  • 使用命令行安装,避免安装到c盘

进入安装包所在目录执行命令安装,点击install,这样安装路径就是我们的指定路径,大模型也会默认下载在我们指定的目录下。

  • 新建环境变量,存放大模型数据包的位置
  • 停止Ollama客户端,找到c盘下的models文件夹,剪切到新建环境变量的目录下
  • 删掉c盘下的models文件夹,重启客户端,命令行输入Ollama List,查看大模型资源包是否正常展示(这一步主要是将大模型数据目录转移到 自己的安装盘而非c盘)
  • 验证是否安装成功

2.3 安装大模型

  • ollama首页搜索要下载的大模型
  • 找到对应的模型,参数越高,占用的电脑磁盘内存越大,显卡要求也越高
  • 我这里下载一个比较小的,拷贝命令执行
  • 下载完成后执行命令ollama run qwen2.5:3b运行安装的大模型实例

2.4 调用本地大模型

  • 新建demo2

pom文件主要新增ollama的依赖

复制代码
<!--ollama-->
<dependency>
   <groupId>org.springframework.ai</groupId>
   <artifactId>spring-ai-starter-model-ollama</artifactId>
   <version>1.0.0</version>
</dependency>
  • 配置yml文件

    server:
    port: 8002
    servlet:
    encoding:
    enabled: true
    force: true
    charset: utf-8

    spring:
    application:
    name: demo2
    # ====ollama Config=============
    ai:
    dashscope:
    api-key: ${aliQwen-api}
    ollama:
    base-url: http://localhost:11434
    chat:
    model: qwen2.5:3b

  • 编写controller测试

    package com.wx.controller;

    import jakarta.annotation.Resource;
    import org.springframework.ai.chat.model.ChatModel;
    import org.springframework.ai.ollama.OllamaChatModel;
    import org.springframework.web.bind.annotation.GetMapping;
    import org.springframework.web.bind.annotation.RequestParam;
    import org.springframework.web.bind.annotation.RestController;
    import reactor.core.publisher.Flux;

    /**

    • @Description

    • @author: wangxin

    • @date: 2026/3/7 20:42
      */
      @RestController
      public class OllamaController {

      @Resource(name = "ollamaChatModel")
      private ChatModel chatModel;

      @GetMapping("/ollama/chat")
      public String testChat(@RequestParam(name = "msg", defaultValue = "你是谁") String msg) {

      复制代码
       String call = chatModel.call(msg);
       System.out.println("大模型返回:" + call);
       return call;

      }

      @GetMapping("/ollama/stream")
      public Flux<String> testStream(@RequestParam(name = "msg", defaultValue = "你是谁") String msg) {

      复制代码
       return chatModel.stream(msg);

      }

    }

相关推荐
灰灰勇闯IT3 分钟前
TorchAir:PyTorch 跑在昇腾NPU上的桥梁
学习·aigc
Lucky_ldy3 分钟前
C语言学习:编译和链接
学习
chimchim669 分钟前
Azure ADF(Azure Data Factory 数据工厂)学习
学习·microsoft·azure
小新同学^O^9 分钟前
简单学习 --> Transformer架构
学习·架构·transformer
他们叫我阿冠13 分钟前
Docker的基础学习
学习·docker·容器
辰海Coding9 小时前
MiniSpring框架学习笔记-解决循环依赖的简化IoC容器
笔记·学习
晓梦林9 小时前
cp520靶场学习笔记
android·笔记·学习
心中有国也有家11 小时前
cann-recipes-infer:昇腾 NPU 推理的“菜谱集合”
经验分享·笔记·学习·算法
Upsy-Daisy11 小时前
AI Agent 项目学习笔记(八):Tool Calling 工具调用机制总览
人工智能·笔记·学习
LuminousCPP12 小时前
数据结构 - 线性表第四篇:C 语言通讯录优化升级全记录(踩坑 + 思考)
c语言·开发语言·数据结构·经验分享·笔记·学习