先别急着喷,没好用的iOS-Ollama客户端那就自己写个然后开源吧

一、故事起因

因所在行业特殊,很多敏感数据需要使用大模型进行数据的处理和分析,无法使用公有云上的各种模型,于是在公司内部部署了 Ollama 来跑本地模型解决问题。

这会问题来了,手机端需要访问 Ollama API,可没个趁手的 App,那就花一个晚上写一个吧。

Swift + SwiftUI,问题不大。

二、功能设计

目前需要下面这几个功能:

2.1 Ollama 服务配置

需要支持 Ollama 服务的配置,包括:

  • 服务地址
  • 使用的模型
  • 系统 prompt
  • 模型参数(这个目前还没做)

2.2 Ollama API 流式调用

为了提升体验,调用的是 Ollama API 的流式调用,每次调用只返回一部分结果,然后客户端不断读取,直到全部返回。

2.3 重开会话和会话列表

支持重开会话,支持选择会话列表的历史记录接着对话。

三、实现思路

3.1 数据模型建模

为了方便调用,我们先进行数据建模

3.1.1 Ollama聊天请求对象

Swift 复制代码
struct OllamaChatRequest: Codable {
    /*
     模型名称
     */
    var model = ""
    
    /*
     消息列表
     */
    var messages: [OllamaMessage] = []
    
    /*
     流式输出
     */
    var stream = true
}

3.1.2 Ollama聊天响应对象

Swift 复制代码
struct OllamaChatResponse: Codable {
    /*
     消息对象
     */
    var message: OllamaMessage
}

3.1.3 Ollama消息流

Swift 复制代码
struct OllamaChatStream: Codable {
    /*
     是否已完成
     */
    var done: Bool
    
    /*
     响应的消息对象
     */
    var message: OllamaMessage
}

3.1.4 Ollama消息对象

Swift 复制代码
struct OllamaMessage: Codable, Identifiable {
    /*
     系统
     */
    public static let ROLE_SYSTEM = "system"
    
    /*
     AI
     */
    public static let ROLE_ASSISTANT = "assistant"
    
    /*
     用户
     */
    public static let ROLE_USER = "user"
    
    /*
     消息ID
     */
    let id = UUID()
    
    /*
     消息角色
     */
    var role:String
    
    /*
     消息内容
     */
    var content:String
}

3.1.5 Ollama 列出模型响应对象

Swift 复制代码
struct OllamaModelResponse: Codable {
    /*
     模型列表
     */
    var models:[OllamaModel]
}

3.1.6 Ollama 模型对象

Swift 复制代码
struct OllamaModel:Identifiable,Codable{
    /*
     ID
     */
    let id  = UUID()
    
    /*
     模型名称
     */
    var name:String
}

3.1.7 Ollama 服务配置对象

Swift 复制代码
struct OllamaConfig :Codable{
    public static let CONFIG_PATH = "config.json"
    
    /*
     Ollama服务地址
     */
    var url :String
    
    /*
     提示词
     */
    var prompt:String
    
    /*
     使用的模型
     */
    var model:String
    
    /*
     模型列表
     */
    var models: [OllamaModel]
}

3.2 功能展示

目前已完成的功能部分:

3.2.1 聊天页面

3.2.2 设置页面

3.2.3 重开会话

四、代码实现

代码篇幅较长,我们干脆直接开源了。

还在 Ollama 官方新闻页面偷了个图片抠出来当了 Icon

Github: github.com/HammCn/Olla...

五、自建 Ollama 服务

我们在 Cloudflare Worker 上自建了一个 Ollama 服务,每天 10w 次的免费请求量,白嫖的快乐。

当然,我们不会用这种公有云上的模型来处理敏感数据。

下一篇我们来讲讲如何白嫖一个吧。

六、最后

That's all.

因为要备案,懒得上架 AppStore 了,怪麻烦的。自己用的话,拉下去本地构建到 iPhone 上即可。

Bye.

相关推荐
耕烟煮云12 分钟前
本文深入解析AI Native产品设计的核心范式——Linear三层架构模型
人工智能·架构
Rewloc17 分钟前
人生计算器
人工智能
波动几何30 分钟前
内容执行创新正交组合闭集
人工智能
XD74297163631 分钟前
科技早报晚报|2026年5月13日:Agent 记忆、编程控制台与本地研究工作台,今天更值得动手的 3 个机会
人工智能·科技·开源项目·科技新闻·ai agent·开发者工具·科技早报
XD74297163635 分钟前
科技早报|2026年5月16日:AI 正往高门槛场景下沉
人工智能·科技·开发者工具·科技早报
X54先生(人文科技)38 分钟前
《元创力》纪实录·桥段古卷显影:当未来考古遇见元协议
人工智能·开源·零知识证明
小王毕业啦1 小时前
2009-2025年 华证ESG年度季度评级评分数据 xlsx
大数据·人工智能·数据挖掘·数据分析·社科数据·实证分析·经管数据
2601_957787581 小时前
数据驱动的多平台内容矩阵运营效果分析与闭环优化技术
大数据·人工智能·矩阵
小小工匠1 小时前
Spring AI RAG - 06 敏感词过滤与内容安全防护
人工智能·安全·spring
189228048611 小时前
NV265固态MT29F32T08GSLBHL8-24QMES:B
大数据·服务器·人工智能·科技·缓存