Github 2024-02-20开源项目日报 Top10

根据Github Trendings的统计,今日(2024-02-20统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言 项目数量
Python项目 6
非开发语言项目 2
TypeScript项目 1
Rust项目 1

命令行的艺术

命令行的艺术是一本综合指南,提供了关于使用命令行的笔记和技巧,涵盖了基础知识、日常使用、处理文件和数据、系统调试、一行命令、晦涩但有用的命令以及特定平台的技巧。它强调工程师在命令行上的流利程度对灵活性和生产力的重要性,并欢迎社区的贡献和修订。

稳定扩散Web UI

  • 创建周期:526 天
  • 开发语言:Python
  • 协议类型:GNU Affero General Public License v3.0
  • Star数量:119358 个
  • Fork数量:23783 次
  • 关注人数:119358 人
  • 贡献人数:430 人
  • Open Issues数量:1833 个
  • Github地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

稳定扩散Web UI是基于Gradio库的浏览器界面,用于稳定扩散。

《Hello 算法》:动画图解、一键运行的数据结构与算法教程

《Hello 算法》是一本开源的数据结构与算法教程,采用动画图解和支持多种编程语言,旨在帮助新手轻松入门。读者可以通过一键运行的源代码进行练习,同时享受互助学习的机会。

跨平台ChatGPT/Gemini UI

一个跨平台的 ChatGPT/Gemini UI,允许用户轻松部署自己的聊天应用程序,具有紧凑的客户端、与自部署的LLMs兼容、注重隐私的数据存储、Markdown支持、响应式设计和国际化等功能。

少样本语音克隆的高质量TTS模型训练

  • 创建周期:5 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:1779 个
  • Fork数量:180 次
  • 关注人数:1779 人
  • 贡献人数:11 人
  • Open Issues数量:32 个
  • Github地址:https://github.com/RVC-Boss/GPT-SoVITS.git

该项目展示了如何使用仅1分钟的语音数据来训练高质量的文本到语音(TTS)模型,展示了少样本语音克隆。在提供的GitHub链接中有演示视频。

Magika: 深度学习文件类型检测工具

Magika是一种AI驱动的文件类型检测工具,利用深度学习准确检测文件类型。它采用自定义的、高度优化的Keras模型,可以在毫秒内精确识别文件。在超过100万个文件和100种内容类型的评估中,它实现了超过99%的精度和召回率,并且被Google大规模使用以提高用户安全性。

minbpe:LLM标记的字节对编码算法

  • 创建周期:4 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:4034 个
  • Fork数量:248 次
  • 关注人数:4034 人
  • 贡献人数:6 人
  • Open Issues数量:4 个
  • Github地址:https://github.com/karpathy/minbpe.git

项目'minbpe'提供了常用于LLM标记的字节对编码(BPE)算法的最小清晰代码。它包括两个标记器'BasicTokenizer'和'RegexTokenizer',以及一个'RegexTokenizer',它复制了GPT-4的标记化。该项目还包括一个脚本'train.py',用于在输入文本上训练标记器并将词汇保存到磁盘以进行可视化。

大世界模型(LWM)

  • 创建周期:10 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:1282 个
  • Fork数量:68 次
  • 关注人数:1282 人
  • 贡献人数:3 人
  • Open Issues数量:14 个
  • Github地址:https://github.com/LargeWorldModel/LWM.git

Large World Model (LWM) 是一个通用的大上下文多模态自回归模型。它是使用RingAttention在大量多样化的长视频和书籍数据集上训练的,可以进行语言、图像和视频的理解和生成。

具有Transformer的可扩展扩散模型(DiT)的官方PyTorch实现

  • 创建周期:431 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:2682 个
  • Fork数量:210 次
  • 关注人数:2682 人
  • 贡献人数:3 人
  • Open Issues数量:34 个
  • Github地址:https://github.com/facebookresearch/DiT.git

官方PyTorch实现的"具有Transformer的可扩展扩散模型"称为DiT。

zkSync Era: 以太坊的零知识证明扩展

  • 创建周期:367 天
  • 开发语言:Rust
  • 协议类型:Apache License 2.0
  • Star数量:1722 个
  • Fork数量:1347 次
  • 关注人数:1722 人
  • 贡献人数:100 人
  • Open Issues数量:75 个
  • Github地址:https://github.com/matter-labs/zksync-era.git

zkSync Era是一个使用零知识证明来扩展以太坊的Layer 2 Rollup,旨在在不损害安全性或去中心化的情况下扩展以太坊。它兼容EVM,允许99%的以太坊项目在不重构或重新审计的情况下进行重新部署。zkSync Era还使用基于LLVM的编译器,最终将允许开发人员使用C++、Rust等流行语言编写智能合约。

相关推荐
Java小混子14 小时前
golang项目CRUD示例
开发语言·后端·golang
想搞艺术的程序员14 小时前
Go 优雅关闭实践指南:从原理到框架落地
开发语言·后端·golang
m5655bj14 小时前
Python 查找并高亮显示指定 Excel 数据
开发语言·python·excel
逛逛GitHub15 小时前
GitHub 开源 AI 好玩神器,自动记录你的一天。
前端·github
武子康15 小时前
Java-167 Neo4j CQL 实战:CREATE/MATCH 与关系建模速通 案例实测
java·开发语言·数据库·python·sql·nosql·neo4j
upward_tomato15 小时前
python中模拟浏览器操作之playwright使用说明以及打包浏览器驱动问题
开发语言·python
为你写首诗ge15 小时前
【python】python安装使用pytorch库环境配置
pytorch·python
散峰而望15 小时前
C++入门(算法) - 习题
开发语言·c++·算法·github
信创天地15 小时前
RISC-V 2025年在国内的发展趋势
python·网络安全·系统架构·系统安全·运维开发
Danceful_YJ15 小时前
30.注意力汇聚:Nadaraya-Watson 核回归
pytorch·python·深度学习