Github 2024-02-21 开源项目日报 Top10

根据Github Trendings的统计,今日(2024-02-21统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言 项目数量
Python项目 8
非开发语言项目 1
TypeScript项目 1

gpt4free 语言模型集合改进计划

官方 gpt4free 仓库是由 @hlohaus 维护,@xtekky 编写的强大语言模型集合。该项目欢迎用户反馈以进行改进,并提供了一个表单供用户提交建议。该项目旨在进行各种改进,如增强文档、提供视频教程、更新提供者状态列表、改进 Bing 包装器,并增强错误处理和兼容性。

社交媒体账户搜索工具

这个开源项目允许用户在各种社交网络上使用特定的用户名搜索社交媒体账户。它提供了一种便捷的方式来追踪和定位与特定用户名相关的社交媒体资料。

Lobe Chat - 开源高性能AI聊天框架

Lobe Chat是一个开源的、高性能的AI聊天框架,支持一键免费部署私人ChatGPT/Gemini/Local LLM应用。

minbpe:LLM标记的字节对编码算法

  • 创建周期:4 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:4034 个
  • Fork数量:248 次
  • 关注人数:4034 人
  • 贡献人数:6 人
  • Open Issues数量:4 个
  • Github地址:https://github.com/karpathy/minbpe.git

项目'minbpe'提供了常用于LLM标记的字节对编码(BPE)算法的最小清晰代码。它包括两个标记器'BasicTokenizer'和'RegexTokenizer',以及一个'RegexTokenizer',它复制了GPT-4的标记化。该项目还包括一个脚本'train.py',用于在输入文本上训练标记器并将词汇保存到磁盘以进行可视化。

Magika: 深度学习文件类型检测工具

Magika是一种AI驱动的文件类型检测工具,利用深度学习准确检测文件类型。它采用自定义的、高度优化的Keras模型,可以在毫秒内精确识别文件。在超过100万个文件和100种内容类型的评估中,它实现了超过99%的精度和召回率,并且被Google大规模使用以提高用户安全性。

大世界模型(LWM)

  • 创建周期:10 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:1282 个
  • Fork数量:68 次
  • 关注人数:1282 人
  • 贡献人数:3 人
  • Open Issues数量:14 个
  • Github地址:https://github.com/LargeWorldModel/LWM.git

Large World Model (LWM) 是一个通用的大上下文多模态自回归模型。它是使用RingAttention在大量多样化的长视频和书籍数据集上训练的,可以进行语言、图像和视频的理解和生成。

具有Transformer的可扩展扩散模型(DiT)的官方PyTorch实现

  • 创建周期:431 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:2682 个
  • Fork数量:210 次
  • 关注人数:2682 人
  • 贡献人数:3 人
  • Open Issues数量:34 个
  • Github地址:https://github.com/facebookresearch/DiT.git

官方PyTorch实现的"具有Transformer的可扩展扩散模型"称为DiT。

UFO:Windows OS交互的UI焦点代理

  • 创建周期:42 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:984 个
  • Fork数量:82 次
  • 关注人数:984 人
  • 贡献人数:4 人
  • Open Issues数量:2 个
  • Github地址:https://github.com/microsoft/UFO.git

UFO是一个UI焦点双代理框架,旨在通过无缝地在单个或跨多个应用程序中导航和操作来满足Windows OS上的用户请求。

V-JEPA: 视频联合嵌入预测架构

  • 创建周期:9 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:1162 个
  • Fork数量:85 次
  • 关注人数:1162 人
  • 贡献人数:4 人
  • Open Issues数量:7 个
  • Github地址:https://github.com/facebookresearch/jepa.git

V-JEPA是视频联合嵌入预测架构的官方PyTorch代码库,是一种从视频中进行自监督学习的视觉表示方法。这些模型通过 passively 观看 VideoMix2M 数据集中的视频像素进行训练,并产生多功能的视觉表示,在下游视频和图像任务中表现良好,而无需调整模型参数。

相关推荐
SsummerC7 分钟前
【leetcode100】组合总和Ⅳ
数据结构·python·算法·leetcode·动态规划
Tandy12356_14 分钟前
Godot开发2D冒险游戏——第一节:主角登场!
python·游戏引擎·godot
西柚小萌新1 小时前
【Python爬虫基础篇】--4.Selenium入门详细教程
爬虫·python·selenium
Gladiator5751 小时前
博客记录-day151-面试+力扣
github
FIT2CLOUD飞致云1 小时前
问答页面支持拖拽和复制粘贴文件,MaxKB企业级AI助手v1.10.6 LTS版本发布
人工智能·开源
爱喝奶茶的企鹅2 小时前
Ethan独立开发产品日报 | 2025-04-24
人工智能·程序员·开源
橘猫云计算机设计2 小时前
springboot基于hadoop的酷狗音乐爬虫大数据分析可视化系统(源码+lw+部署文档+讲解),源码可白嫖!
数据库·hadoop·spring boot·爬虫·python·数据分析·毕业设计
YOULANSHENGMENG2 小时前
linux 下python 调用c++的动态库的方法
c++·python
SsummerC2 小时前
【leetcode100】零钱兑换Ⅱ
数据结构·python·算法·leetcode·动态规划
一眼青苔3 小时前
切割PDF使用python,库PyPDF2
服务器·python·pdf