Github 2024-02-21 开源项目日报 Top10

根据Github Trendings的统计，今日(2024-02-21统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：

开发语言	项目数量
Python项目	8
非开发语言项目	1
TypeScript项目	1

gpt4free 语言模型集合改进计划

创建周期：300 天
开发语言：Python
协议类型：GNU General Public License v3.0
Star数量：51768 个
Fork数量：12716 次
关注人数：51768 人
贡献人数：168 人
Open Issues数量：107 个
Github地址：https://github.com/xtekky/gpt4free.git
项目首页: https://discord.gg/XfybzPXPH5

官方 gpt4free 仓库是由 @hlohaus 维护，@xtekky 编写的强大语言模型集合。该项目欢迎用户反馈以进行改进，并提供了一个表单供用户提交建议。该项目旨在进行各种改进，如增强文档、提供视频教程、更新提供者状态列表、改进 Bing 包装器，并增强错误处理和兼容性。

社交媒体账户搜索工具

创建周期：1885 天
开发语言：Python
协议类型：MIT License
Star数量：48048 个
Fork数量：6068 次
关注人数：48048 人
贡献人数：192 人
Open Issues数量：204 个
Github地址：https://github.com/sherlock-project/sherlock.git
项目首页: http://sherlock-project.github.io

这个开源项目允许用户在各种社交网络上使用特定的用户名搜索社交媒体账户。它提供了一种便捷的方式来追踪和定位与特定用户名相关的社交媒体资料。

Lobe Chat - 开源高性能AI聊天框架

创建周期：276 天
开发语言：TypeScript
协议类型：MIT License
Star数量：18033 个
Fork数量：3733 次
关注人数：18033 人
贡献人数：61 人
Open Issues数量：147 个
Github地址：https://github.com/lobehub/lobe-chat.git
项目首页: https://chat-preview.lobehub.com

Lobe Chat是一个开源的、高性能的AI聊天框架，支持一键免费部署私人ChatGPT/Gemini/Local LLM应用。

minbpe：LLM标记的字节对编码算法

创建周期：4 天
开发语言：Python
协议类型：MIT License
Star数量：4034 个
Fork数量：248 次
关注人数：4034 人
贡献人数：6 人
Open Issues数量：4 个
Github地址：https://github.com/karpathy/minbpe.git

项目'minbpe'提供了常用于LLM标记的字节对编码（BPE）算法的最小清晰代码。它包括两个标记器'BasicTokenizer'和'RegexTokenizer'，以及一个'RegexTokenizer'，它复制了GPT-4的标记化。该项目还包括一个脚本'train.py'，用于在输入文本上训练标记器并将词汇保存到磁盘以进行可视化。

Magika: 深度学习文件类型检测工具

创建周期：181 天
开发语言：Python
协议类型：Apache License 2.0
Star数量：2812 个
Fork数量：126 次
关注人数：2812 人
贡献人数：5 人
Open Issues数量：38 个
Github地址：https://github.com/google/magika.git
项目首页: https://google.github.io/magika/

Magika是一种AI驱动的文件类型检测工具，利用深度学习准确检测文件类型。它采用自定义的、高度优化的Keras模型，可以在毫秒内精确识别文件。在超过100万个文件和100种内容类型的评估中，它实现了超过99%的精度和召回率，并且被Google大规模使用以提高用户安全性。

大世界模型（LWM）

创建周期：10 天
开发语言：Python
协议类型：Apache License 2.0
Star数量：1282 个
Fork数量：68 次
关注人数：1282 人
贡献人数：3 人
Open Issues数量：14 个
Github地址：https://github.com/LargeWorldModel/LWM.git

Large World Model (LWM) 是一个通用的大上下文多模态自回归模型。它是使用RingAttention在大量多样化的长视频和书籍数据集上训练的，可以进行语言、图像和视频的理解和生成。

具有Transformer的可扩展扩散模型（DiT）的官方PyTorch实现

创建周期：431 天
开发语言：Python
协议类型：Other
Star数量：2682 个
Fork数量：210 次
关注人数：2682 人
贡献人数：3 人
Open Issues数量：34 个
Github地址：https://github.com/facebookresearch/DiT.git

官方PyTorch实现的"具有Transformer的可扩展扩散模型"称为DiT。

UFO：Windows OS交互的UI焦点代理

创建周期：42 天
开发语言：Python
协议类型：MIT License
Star数量：984 个
Fork数量：82 次
关注人数：984 人
贡献人数：4 人
Open Issues数量：2 个
Github地址：https://github.com/microsoft/UFO.git

UFO是一个UI焦点双代理框架，旨在通过无缝地在单个或跨多个应用程序中导航和操作来满足Windows OS上的用户请求。

V-JEPA: 视频联合嵌入预测架构

创建周期：9 天
开发语言：Python
协议类型：Other
Star数量：1162 个
Fork数量：85 次
关注人数：1162 人
贡献人数：4 人
Open Issues数量：7 个
Github地址：https://github.com/facebookresearch/jepa.git

V-JEPA是视频联合嵌入预测架构的官方PyTorch代码库，是一种从视频中进行自监督学习的视觉表示方法。这些模型通过 passively 观看 VideoMix2M 数据集中的视频像素进行训练，并产生多功能的视觉表示，在下游视频和图像任务中表现良好，而无需调整模型参数。