Github 2024-02-20开源项目日报 Top10

根据Github Trendings的统计,今日(2024-02-20统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言 项目数量
Python项目 6
非开发语言项目 2
TypeScript项目 1
Rust项目 1

命令行的艺术

命令行的艺术是一本综合指南,提供了关于使用命令行的笔记和技巧,涵盖了基础知识、日常使用、处理文件和数据、系统调试、一行命令、晦涩但有用的命令以及特定平台的技巧。它强调工程师在命令行上的流利程度对灵活性和生产力的重要性,并欢迎社区的贡献和修订。

稳定扩散Web UI

  • 创建周期:526 天
  • 开发语言:Python
  • 协议类型:GNU Affero General Public License v3.0
  • Star数量:119358 个
  • Fork数量:23783 次
  • 关注人数:119358 人
  • 贡献人数:430 人
  • Open Issues数量:1833 个
  • Github地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

稳定扩散Web UI是基于Gradio库的浏览器界面,用于稳定扩散。

《Hello 算法》:动画图解、一键运行的数据结构与算法教程

《Hello 算法》是一本开源的数据结构与算法教程,采用动画图解和支持多种编程语言,旨在帮助新手轻松入门。读者可以通过一键运行的源代码进行练习,同时享受互助学习的机会。

跨平台ChatGPT/Gemini UI

一个跨平台的 ChatGPT/Gemini UI,允许用户轻松部署自己的聊天应用程序,具有紧凑的客户端、与自部署的LLMs兼容、注重隐私的数据存储、Markdown支持、响应式设计和国际化等功能。

少样本语音克隆的高质量TTS模型训练

  • 创建周期:5 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:1779 个
  • Fork数量:180 次
  • 关注人数:1779 人
  • 贡献人数:11 人
  • Open Issues数量:32 个
  • Github地址:https://github.com/RVC-Boss/GPT-SoVITS.git

该项目展示了如何使用仅1分钟的语音数据来训练高质量的文本到语音(TTS)模型,展示了少样本语音克隆。在提供的GitHub链接中有演示视频。

Magika: 深度学习文件类型检测工具

Magika是一种AI驱动的文件类型检测工具,利用深度学习准确检测文件类型。它采用自定义的、高度优化的Keras模型,可以在毫秒内精确识别文件。在超过100万个文件和100种内容类型的评估中,它实现了超过99%的精度和召回率,并且被Google大规模使用以提高用户安全性。

minbpe:LLM标记的字节对编码算法

  • 创建周期:4 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:4034 个
  • Fork数量:248 次
  • 关注人数:4034 人
  • 贡献人数:6 人
  • Open Issues数量:4 个
  • Github地址:https://github.com/karpathy/minbpe.git

项目'minbpe'提供了常用于LLM标记的字节对编码(BPE)算法的最小清晰代码。它包括两个标记器'BasicTokenizer'和'RegexTokenizer',以及一个'RegexTokenizer',它复制了GPT-4的标记化。该项目还包括一个脚本'train.py',用于在输入文本上训练标记器并将词汇保存到磁盘以进行可视化。

大世界模型(LWM)

  • 创建周期:10 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:1282 个
  • Fork数量:68 次
  • 关注人数:1282 人
  • 贡献人数:3 人
  • Open Issues数量:14 个
  • Github地址:https://github.com/LargeWorldModel/LWM.git

Large World Model (LWM) 是一个通用的大上下文多模态自回归模型。它是使用RingAttention在大量多样化的长视频和书籍数据集上训练的,可以进行语言、图像和视频的理解和生成。

具有Transformer的可扩展扩散模型(DiT)的官方PyTorch实现

  • 创建周期:431 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:2682 个
  • Fork数量:210 次
  • 关注人数:2682 人
  • 贡献人数:3 人
  • Open Issues数量:34 个
  • Github地址:https://github.com/facebookresearch/DiT.git

官方PyTorch实现的"具有Transformer的可扩展扩散模型"称为DiT。

zkSync Era: 以太坊的零知识证明扩展

  • 创建周期:367 天
  • 开发语言:Rust
  • 协议类型:Apache License 2.0
  • Star数量:1722 个
  • Fork数量:1347 次
  • 关注人数:1722 人
  • 贡献人数:100 人
  • Open Issues数量:75 个
  • Github地址:https://github.com/matter-labs/zksync-era.git

zkSync Era是一个使用零知识证明来扩展以太坊的Layer 2 Rollup,旨在在不损害安全性或去中心化的情况下扩展以太坊。它兼容EVM,允许99%的以太坊项目在不重构或重新审计的情况下进行重新部署。zkSync Era还使用基于LLVM的编译器,最终将允许开发人员使用C++、Rust等流行语言编写智能合约。

相关推荐
java1234_小锋3 分钟前
【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 热词数量分析日期统计功能实现
python·自然语言处理·flask
山烛19 分钟前
KNN 算法中的各种距离:从原理到应用
人工智能·python·算法·机器学习·knn·k近邻算法·距离公式
guozhetao32 分钟前
【ST表、倍增】P7167 [eJOI 2020] Fountain (Day1)
java·c++·python·算法·leetcode·深度优先·图论
墨染点香38 分钟前
第七章 Pytorch构建模型详解【构建CIFAR10模型结构】
人工智能·pytorch·python
阿什么名字不会重复呢1 小时前
在线工具+网页平台来学习和操作Python与Excel相关技能
python·数据分析
Vertira2 小时前
python 阿里云 安装 dashscope的简介、安装
开发语言·python
gc_22992 小时前
学习Python中Selenium模块的基本用法(1:简介)
python·selenium
先做个垃圾出来………3 小时前
2116. 判断一个括号字符串是否有效
python
兮℡檬,4 小时前
房价预测|Pytorch
人工智能·pytorch·python
im_AMBER7 小时前
学习日志19 python
python·学习