Github 2024-02-20开源项目日报 Top10

根据Github Trendings的统计,今日(2024-02-20统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言 项目数量
Python项目 6
非开发语言项目 2
TypeScript项目 1
Rust项目 1

命令行的艺术

命令行的艺术是一本综合指南,提供了关于使用命令行的笔记和技巧,涵盖了基础知识、日常使用、处理文件和数据、系统调试、一行命令、晦涩但有用的命令以及特定平台的技巧。它强调工程师在命令行上的流利程度对灵活性和生产力的重要性,并欢迎社区的贡献和修订。

稳定扩散Web UI

  • 创建周期:526 天
  • 开发语言:Python
  • 协议类型:GNU Affero General Public License v3.0
  • Star数量:119358 个
  • Fork数量:23783 次
  • 关注人数:119358 人
  • 贡献人数:430 人
  • Open Issues数量:1833 个
  • Github地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

稳定扩散Web UI是基于Gradio库的浏览器界面,用于稳定扩散。

《Hello 算法》:动画图解、一键运行的数据结构与算法教程

《Hello 算法》是一本开源的数据结构与算法教程,采用动画图解和支持多种编程语言,旨在帮助新手轻松入门。读者可以通过一键运行的源代码进行练习,同时享受互助学习的机会。

跨平台ChatGPT/Gemini UI

一个跨平台的 ChatGPT/Gemini UI,允许用户轻松部署自己的聊天应用程序,具有紧凑的客户端、与自部署的LLMs兼容、注重隐私的数据存储、Markdown支持、响应式设计和国际化等功能。

少样本语音克隆的高质量TTS模型训练

  • 创建周期:5 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:1779 个
  • Fork数量:180 次
  • 关注人数:1779 人
  • 贡献人数:11 人
  • Open Issues数量:32 个
  • Github地址:https://github.com/RVC-Boss/GPT-SoVITS.git

该项目展示了如何使用仅1分钟的语音数据来训练高质量的文本到语音(TTS)模型,展示了少样本语音克隆。在提供的GitHub链接中有演示视频。

Magika: 深度学习文件类型检测工具

Magika是一种AI驱动的文件类型检测工具,利用深度学习准确检测文件类型。它采用自定义的、高度优化的Keras模型,可以在毫秒内精确识别文件。在超过100万个文件和100种内容类型的评估中,它实现了超过99%的精度和召回率,并且被Google大规模使用以提高用户安全性。

minbpe:LLM标记的字节对编码算法

  • 创建周期:4 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:4034 个
  • Fork数量:248 次
  • 关注人数:4034 人
  • 贡献人数:6 人
  • Open Issues数量:4 个
  • Github地址:https://github.com/karpathy/minbpe.git

项目'minbpe'提供了常用于LLM标记的字节对编码(BPE)算法的最小清晰代码。它包括两个标记器'BasicTokenizer'和'RegexTokenizer',以及一个'RegexTokenizer',它复制了GPT-4的标记化。该项目还包括一个脚本'train.py',用于在输入文本上训练标记器并将词汇保存到磁盘以进行可视化。

大世界模型(LWM)

  • 创建周期:10 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:1282 个
  • Fork数量:68 次
  • 关注人数:1282 人
  • 贡献人数:3 人
  • Open Issues数量:14 个
  • Github地址:https://github.com/LargeWorldModel/LWM.git

Large World Model (LWM) 是一个通用的大上下文多模态自回归模型。它是使用RingAttention在大量多样化的长视频和书籍数据集上训练的,可以进行语言、图像和视频的理解和生成。

具有Transformer的可扩展扩散模型(DiT)的官方PyTorch实现

  • 创建周期:431 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:2682 个
  • Fork数量:210 次
  • 关注人数:2682 人
  • 贡献人数:3 人
  • Open Issues数量:34 个
  • Github地址:https://github.com/facebookresearch/DiT.git

官方PyTorch实现的"具有Transformer的可扩展扩散模型"称为DiT。

zkSync Era: 以太坊的零知识证明扩展

  • 创建周期:367 天
  • 开发语言:Rust
  • 协议类型:Apache License 2.0
  • Star数量:1722 个
  • Fork数量:1347 次
  • 关注人数:1722 人
  • 贡献人数:100 人
  • Open Issues数量:75 个
  • Github地址:https://github.com/matter-labs/zksync-era.git

zkSync Era是一个使用零知识证明来扩展以太坊的Layer 2 Rollup,旨在在不损害安全性或去中心化的情况下扩展以太坊。它兼容EVM,允许99%的以太坊项目在不重构或重新审计的情况下进行重新部署。zkSync Era还使用基于LLVM的编译器,最终将允许开发人员使用C++、Rust等流行语言编写智能合约。

相关推荐
叫我:松哥1 小时前
基于大数据和深度学习的智能空气质量监测与预测平台,采用Spark数据预处理,利用TensorFlow构建LSTM深度学习模型
大数据·python·深度学习·机器学习·spark·flask·lstm
极智-9968 小时前
GitHub 热榜项目 · 日榜精选(2026-01-06)
github·开源项目·技术趋势·开发者工具
吃茄子的猫8 小时前
quecpython中&的具体含义和使用场景
开发语言·python
じ☆冷颜〃8 小时前
黎曼几何驱动的算法与系统设计:理论、实践与跨领域应用
笔记·python·深度学习·网络协议·算法·机器学习
Codebee8 小时前
Ooder企业级 AI-Agent 平台 《SkillFlow 智流白皮书》
开源·全栈
数据大魔方8 小时前
【期货量化实战】日内动量策略:顺势而为的短线交易法(Python源码)
开发语言·数据库·python·mysql·算法·github·程序员创富
APIshop8 小时前
Python 爬虫获取 item_get_web —— 淘宝商品 SKU、详情图、券后价全流程解析
前端·爬虫·python
风送雨8 小时前
FastMCP 2.0 服务端开发教学文档(下)
服务器·前端·网络·人工智能·python·ai
效率客栈老秦9 小时前
Python Trae提示词开发实战(8):数据采集与清洗一体化方案让效率提升10倍
人工智能·python·ai·提示词·trae
哈里谢顿9 小时前
一条 Python 语句在 C 扩展里到底怎么跑
python