先别急着喷,没好用的iOS-Ollama客户端那就自己写个然后开源吧

一、故事起因

因所在行业特殊,很多敏感数据需要使用大模型进行数据的处理和分析,无法使用公有云上的各种模型,于是在公司内部部署了 Ollama 来跑本地模型解决问题。

这会问题来了,手机端需要访问 Ollama API,可没个趁手的 App,那就花一个晚上写一个吧。

Swift + SwiftUI,问题不大。

二、功能设计

目前需要下面这几个功能:

2.1 Ollama 服务配置

需要支持 Ollama 服务的配置,包括:

  • 服务地址
  • 使用的模型
  • 系统 prompt
  • 模型参数(这个目前还没做)

2.2 Ollama API 流式调用

为了提升体验,调用的是 Ollama API 的流式调用,每次调用只返回一部分结果,然后客户端不断读取,直到全部返回。

2.3 重开会话和会话列表

支持重开会话,支持选择会话列表的历史记录接着对话。

三、实现思路

3.1 数据模型建模

为了方便调用,我们先进行数据建模

3.1.1 Ollama聊天请求对象

Swift 复制代码
struct OllamaChatRequest: Codable {
    /*
     模型名称
     */
    var model = ""
    
    /*
     消息列表
     */
    var messages: [OllamaMessage] = []
    
    /*
     流式输出
     */
    var stream = true
}

3.1.2 Ollama聊天响应对象

Swift 复制代码
struct OllamaChatResponse: Codable {
    /*
     消息对象
     */
    var message: OllamaMessage
}

3.1.3 Ollama消息流

Swift 复制代码
struct OllamaChatStream: Codable {
    /*
     是否已完成
     */
    var done: Bool
    
    /*
     响应的消息对象
     */
    var message: OllamaMessage
}

3.1.4 Ollama消息对象

Swift 复制代码
struct OllamaMessage: Codable, Identifiable {
    /*
     系统
     */
    public static let ROLE_SYSTEM = "system"
    
    /*
     AI
     */
    public static let ROLE_ASSISTANT = "assistant"
    
    /*
     用户
     */
    public static let ROLE_USER = "user"
    
    /*
     消息ID
     */
    let id = UUID()
    
    /*
     消息角色
     */
    var role:String
    
    /*
     消息内容
     */
    var content:String
}

3.1.5 Ollama 列出模型响应对象

Swift 复制代码
struct OllamaModelResponse: Codable {
    /*
     模型列表
     */
    var models:[OllamaModel]
}

3.1.6 Ollama 模型对象

Swift 复制代码
struct OllamaModel:Identifiable,Codable{
    /*
     ID
     */
    let id  = UUID()
    
    /*
     模型名称
     */
    var name:String
}

3.1.7 Ollama 服务配置对象

Swift 复制代码
struct OllamaConfig :Codable{
    public static let CONFIG_PATH = "config.json"
    
    /*
     Ollama服务地址
     */
    var url :String
    
    /*
     提示词
     */
    var prompt:String
    
    /*
     使用的模型
     */
    var model:String
    
    /*
     模型列表
     */
    var models: [OllamaModel]
}

3.2 功能展示

目前已完成的功能部分:

3.2.1 聊天页面

3.2.2 设置页面

3.2.3 重开会话

四、代码实现

代码篇幅较长,我们干脆直接开源了。

还在 Ollama 官方新闻页面偷了个图片抠出来当了 Icon

Github: github.com/HammCn/Olla...

五、自建 Ollama 服务

我们在 Cloudflare Worker 上自建了一个 Ollama 服务,每天 10w 次的免费请求量,白嫖的快乐。

当然,我们不会用这种公有云上的模型来处理敏感数据。

下一篇我们来讲讲如何白嫖一个吧。

六、最后

That's all.

因为要备案,懒得上架 AppStore 了,怪麻烦的。自己用的话,拉下去本地构建到 iPhone 上即可。

Bye.

相关推荐
白掰虾6 小时前
STM32N6&AI资料汇总
人工智能·stm32·嵌入式硬件·stm32n6·stm32ai
爱思德学术7 小时前
中国计算机学会(CCF)推荐学术会议-C(软件工程/系统软件/程序设计语言):MSR 2026
人工智能·机器学习·软件工程·数据科学
小李独爱秋7 小时前
特征值优化:机器学习中的数学基石
人工智能·python·线性代数·机器学习·数学建模
科兴第一吴彦祖7 小时前
在线会议系统是一个基于Vue3 + Spring Boot的现代化在线会议管理平台,集成了视频会议、实时聊天、AI智能助手等多项先进技术。
java·vue.js·人工智能·spring boot·推荐算法
RainbowSea7 小时前
10. LangChain4j + 持久化实操详细说明
langchain·llm·ai编程
Lululaurel8 小时前
机器学习系统框架:核心分类、算法与应用全景解析
人工智能·算法·机器学习·ai·分类
居7然8 小时前
解锁AI智能体:上下文工程如何成为架构落地的“魔法钥匙”
人工智能·架构·大模型·智能体·上下文工程
二向箔reverse8 小时前
opencv基于SIFT特征匹配的简单指纹识别系统实现
人工智能·opencv·计算机视觉
RainbowSea8 小时前
9. LangChain4j + 整合 Spring Boot
langchain·llm·ai编程
啵啵鱼爱吃小猫咪8 小时前
机器人路径规划算法大全RRT,APF,DS,RL
人工智能