Go 语言数据库迁移工具:支持多种数据库 | 开源日报 No.268

golang-migrate/migrate

Stars: 14.2k License: NOASSERTION

migrate 是一个用 Go 语言编写的数据库迁移工具,可作为命令行工具或库导入使用。它从不同来源读取迁移,并按正确顺序应用到数据库中。 该项目的主要功能和优势包括:

  • 支持多种数据库驱动
  • 使用 URL 指定数据库连接字符串
  • 支持各种迁移源,如文件系统、GitHub 等
  • 提供简单易用的 CLI 接口和稳定的 API
  • 内部使用 io.Reader 流以降低内存开销
  • 线程安全且无 goroutine 泄漏

openai/tiktoken

Stars: 10.5k License: MIT

tiktoken 是一个用于 OpenAI 模型的快速 BPE(字节对编码)分词器。 BPE 是一种将文本转换为标记的方法,具有以下几个优点:

  • 可逆且无损,可以将标记重新转换回原始文本。
  • 适用于任意文本,即使不在分词器的训练数据中。
  • 压缩了文本:标记序列比原始文本对应的字节数更短。实际上,每个标记平均相当于约 4 个字节。
  • 尝试让模型看到常见子单词。例如,在英语中,"ing" 是一个常见子单词,因此 BPE 编码通常会将 "encoding" 拆分为 "encod" 和 "ing",而不是例如 "enc" 和 "oding"。因为模型会在不同上下文中反复看到 "ing" 标记, 这有助于模型泛化并更好地理解语法。

tiktoken 提供了快速、高效、可扩展的 BPE 分词功能,并且性能比其他类似开源工具提升 3 至 6 倍之间。

khoj-ai/khoj

Stars: 5.4k License: AGPL-3.0

khoj 是一个个人 AI 助手,可以帮助你获取问题的答案,无论是来自你自己的笔记还是互联网。它使用强大的在线(例如 gpt4)或私有的本地(例如 mistral)LLMs。

  • 创建个人 AI 代理
  • 可分享笔记和文件
  • 访问实时信息
  • 多种访问方式
  • 快速准确语义搜索功能
  • 可以在本地托管或使用 SaaS Web 应用程序
  • 可以从 Obsidian、Emacs、桌面应用程序、Web 或 Whatsapp 访问

myshell-ai/MeloTTS

Stars: 3.8k License: MIT

MeloTTS 是 MyShell.ai 开发的高质量多语言文本转语音库。

  • 支持英语、西班牙语、法语、中文、日本和韩国等多种语言。
  • 中文发音支持混合中英文。
  • 足够快速以进行 CPU 实时推断。

obsidianmd/jsoncanvas

Stars: 2.3k License: MIT

jsoncanvas 是一个用于无限画布数据的开放文件格式。

  • 提供长期性、可读性、互操作性和可扩展性。
  • 易于解析,让用户拥有对其数据的所有权。
  • 可作为任何应用程序或工具的导入、导出和存储格式自由实现。
相关推荐
luckdewei32 分钟前
那个用 passlib 做认证的新同事,上线第一天就把用户密码写进了日志
后端
ping某2 小时前
为什么 Nginx 明明监听了 80,转发后端时却用了 4xxxx 端口?
后端·nginx
JustHappy2 小时前
我汇总了身边朋友的经历才发现,其实第一份实习是最难找的......
前端·后端·面试
uhakadotcom2 小时前
在python 的 工程化架构中 ,什么是 薄包装器层?
后端·面试·github
uniquejing3 小时前
《每次 API 调用前扔掉 43% Token,我开源了一个 AI 提示词瘦身工具》
开源
倔强的石头_6 小时前
《Kingbase护城河》——数据库存储空间全景探测与精细化瘦身实战
数据库
用户1474853079746 小时前
CodeX使用Skill生成游戏美术和音乐资源,一分钟入门
后端
Melody1236 小时前
用 abort 中断 AI 流式请求,我之前做错了
后端
onething3657 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 5 —— SSE 流式输出 + 打字机效果
人工智能·后端·全栈
一个做软件开发的牛马7 小时前
MyBatis-Plus 从零实战:完整搭建可运行 Demo,BaseMapper 零 SQL、Wrapper 条件构造、分页插件与代码生成器详解
java·后端