Github 2024-02-20开源项目日报 Top10

根据Github Trendings的统计,今日(2024-02-20统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言 项目数量
Python项目 6
非开发语言项目 2
TypeScript项目 1
Rust项目 1

命令行的艺术

命令行的艺术是一本综合指南,提供了关于使用命令行的笔记和技巧,涵盖了基础知识、日常使用、处理文件和数据、系统调试、一行命令、晦涩但有用的命令以及特定平台的技巧。它强调工程师在命令行上的流利程度对灵活性和生产力的重要性,并欢迎社区的贡献和修订。

稳定扩散Web UI

  • 创建周期:526 天
  • 开发语言:Python
  • 协议类型:GNU Affero General Public License v3.0
  • Star数量:119358 个
  • Fork数量:23783 次
  • 关注人数:119358 人
  • 贡献人数:430 人
  • Open Issues数量:1833 个
  • Github地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

稳定扩散Web UI是基于Gradio库的浏览器界面,用于稳定扩散。

《Hello 算法》:动画图解、一键运行的数据结构与算法教程

《Hello 算法》是一本开源的数据结构与算法教程,采用动画图解和支持多种编程语言,旨在帮助新手轻松入门。读者可以通过一键运行的源代码进行练习,同时享受互助学习的机会。

跨平台ChatGPT/Gemini UI

一个跨平台的 ChatGPT/Gemini UI,允许用户轻松部署自己的聊天应用程序,具有紧凑的客户端、与自部署的LLMs兼容、注重隐私的数据存储、Markdown支持、响应式设计和国际化等功能。

少样本语音克隆的高质量TTS模型训练

  • 创建周期:5 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:1779 个
  • Fork数量:180 次
  • 关注人数:1779 人
  • 贡献人数:11 人
  • Open Issues数量:32 个
  • Github地址:https://github.com/RVC-Boss/GPT-SoVITS.git

该项目展示了如何使用仅1分钟的语音数据来训练高质量的文本到语音(TTS)模型,展示了少样本语音克隆。在提供的GitHub链接中有演示视频。

Magika: 深度学习文件类型检测工具

Magika是一种AI驱动的文件类型检测工具,利用深度学习准确检测文件类型。它采用自定义的、高度优化的Keras模型,可以在毫秒内精确识别文件。在超过100万个文件和100种内容类型的评估中,它实现了超过99%的精度和召回率,并且被Google大规模使用以提高用户安全性。

minbpe:LLM标记的字节对编码算法

  • 创建周期:4 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:4034 个
  • Fork数量:248 次
  • 关注人数:4034 人
  • 贡献人数:6 人
  • Open Issues数量:4 个
  • Github地址:https://github.com/karpathy/minbpe.git

项目'minbpe'提供了常用于LLM标记的字节对编码(BPE)算法的最小清晰代码。它包括两个标记器'BasicTokenizer'和'RegexTokenizer',以及一个'RegexTokenizer',它复制了GPT-4的标记化。该项目还包括一个脚本'train.py',用于在输入文本上训练标记器并将词汇保存到磁盘以进行可视化。

大世界模型(LWM)

  • 创建周期:10 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:1282 个
  • Fork数量:68 次
  • 关注人数:1282 人
  • 贡献人数:3 人
  • Open Issues数量:14 个
  • Github地址:https://github.com/LargeWorldModel/LWM.git

Large World Model (LWM) 是一个通用的大上下文多模态自回归模型。它是使用RingAttention在大量多样化的长视频和书籍数据集上训练的,可以进行语言、图像和视频的理解和生成。

具有Transformer的可扩展扩散模型(DiT)的官方PyTorch实现

  • 创建周期:431 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:2682 个
  • Fork数量:210 次
  • 关注人数:2682 人
  • 贡献人数:3 人
  • Open Issues数量:34 个
  • Github地址:https://github.com/facebookresearch/DiT.git

官方PyTorch实现的"具有Transformer的可扩展扩散模型"称为DiT。

zkSync Era: 以太坊的零知识证明扩展

  • 创建周期:367 天
  • 开发语言:Rust
  • 协议类型:Apache License 2.0
  • Star数量:1722 个
  • Fork数量:1347 次
  • 关注人数:1722 人
  • 贡献人数:100 人
  • Open Issues数量:75 个
  • Github地址:https://github.com/matter-labs/zksync-era.git

zkSync Era是一个使用零知识证明来扩展以太坊的Layer 2 Rollup,旨在在不损害安全性或去中心化的情况下扩展以太坊。它兼容EVM,允许99%的以太坊项目在不重构或重新审计的情况下进行重新部署。zkSync Era还使用基于LLVM的编译器,最终将允许开发人员使用C++、Rust等流行语言编写智能合约。

相关推荐
qq_5290252914 分钟前
Torch.gather
python·深度学习·机器学习
数据小爬虫@14 分钟前
如何高效利用Python爬虫按关键字搜索苏宁商品
开发语言·爬虫·python
Narutolxy21 分钟前
深入探讨 Go 中的高级表单验证与翻译:Gin 与 Validator 的实践之道20241223
开发语言·golang·gin
Hello.Reader29 分钟前
全面解析 Golang Gin 框架
开发语言·golang·gin
Cachel wood1 小时前
python round四舍五入和decimal库精确四舍五入
java·linux·前端·数据库·vue.js·python·前端框架
終不似少年遊*1 小时前
pyecharts
python·信息可视化·数据分析·学习笔记·pyecharts·使用技巧
Python之栈1 小时前
【无标题】
数据库·python·mysql
m0_748241701 小时前
DuetWebControl 开源项目常见问题解决方案
开源
袁袁袁袁满1 小时前
100天精通Python(爬虫篇)——第113天:‌爬虫基础模块之urllib详细教程大全
开发语言·爬虫·python·网络爬虫·爬虫实战·urllib·urllib模块教程
老大白菜2 小时前
Python 爬虫技术指南
python