Github 2024-02-21 开源项目日报 Top10

根据Github Trendings的统计,今日(2024-02-21统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言 项目数量
Python项目 8
非开发语言项目 1
TypeScript项目 1

gpt4free 语言模型集合改进计划

官方 gpt4free 仓库是由 @hlohaus 维护,@xtekky 编写的强大语言模型集合。该项目欢迎用户反馈以进行改进,并提供了一个表单供用户提交建议。该项目旨在进行各种改进,如增强文档、提供视频教程、更新提供者状态列表、改进 Bing 包装器,并增强错误处理和兼容性。

社交媒体账户搜索工具

这个开源项目允许用户在各种社交网络上使用特定的用户名搜索社交媒体账户。它提供了一种便捷的方式来追踪和定位与特定用户名相关的社交媒体资料。

Lobe Chat - 开源高性能AI聊天框架

Lobe Chat是一个开源的、高性能的AI聊天框架,支持一键免费部署私人ChatGPT/Gemini/Local LLM应用。

minbpe:LLM标记的字节对编码算法

  • 创建周期:4 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:4034 个
  • Fork数量:248 次
  • 关注人数:4034 人
  • 贡献人数:6 人
  • Open Issues数量:4 个
  • Github地址:https://github.com/karpathy/minbpe.git

项目'minbpe'提供了常用于LLM标记的字节对编码(BPE)算法的最小清晰代码。它包括两个标记器'BasicTokenizer'和'RegexTokenizer',以及一个'RegexTokenizer',它复制了GPT-4的标记化。该项目还包括一个脚本'train.py',用于在输入文本上训练标记器并将词汇保存到磁盘以进行可视化。

Magika: 深度学习文件类型检测工具

Magika是一种AI驱动的文件类型检测工具,利用深度学习准确检测文件类型。它采用自定义的、高度优化的Keras模型,可以在毫秒内精确识别文件。在超过100万个文件和100种内容类型的评估中,它实现了超过99%的精度和召回率,并且被Google大规模使用以提高用户安全性。

大世界模型(LWM)

  • 创建周期:10 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:1282 个
  • Fork数量:68 次
  • 关注人数:1282 人
  • 贡献人数:3 人
  • Open Issues数量:14 个
  • Github地址:https://github.com/LargeWorldModel/LWM.git

Large World Model (LWM) 是一个通用的大上下文多模态自回归模型。它是使用RingAttention在大量多样化的长视频和书籍数据集上训练的,可以进行语言、图像和视频的理解和生成。

具有Transformer的可扩展扩散模型(DiT)的官方PyTorch实现

  • 创建周期:431 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:2682 个
  • Fork数量:210 次
  • 关注人数:2682 人
  • 贡献人数:3 人
  • Open Issues数量:34 个
  • Github地址:https://github.com/facebookresearch/DiT.git

官方PyTorch实现的"具有Transformer的可扩展扩散模型"称为DiT。

UFO:Windows OS交互的UI焦点代理

  • 创建周期:42 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:984 个
  • Fork数量:82 次
  • 关注人数:984 人
  • 贡献人数:4 人
  • Open Issues数量:2 个
  • Github地址:https://github.com/microsoft/UFO.git

UFO是一个UI焦点双代理框架,旨在通过无缝地在单个或跨多个应用程序中导航和操作来满足Windows OS上的用户请求。

V-JEPA: 视频联合嵌入预测架构

  • 创建周期:9 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:1162 个
  • Fork数量:85 次
  • 关注人数:1162 人
  • 贡献人数:4 人
  • Open Issues数量:7 个
  • Github地址:https://github.com/facebookresearch/jepa.git

V-JEPA是视频联合嵌入预测架构的官方PyTorch代码库,是一种从视频中进行自监督学习的视觉表示方法。这些模型通过 passively 观看 VideoMix2M 数据集中的视频像素进行训练,并产生多功能的视觉表示,在下游视频和图像任务中表现良好,而无需调整模型参数。

相关推荐
悟空聊架构6 分钟前
从 0 到 1:Jenkins 对接企微机器人避坑指南(附可下载 Pipeline 模板)
后端·架构·github
CF14年老兵9 分钟前
Python万物皆对象:从懵懂到顿悟的奇妙之旅
后端·python·trae
这里有鱼汤12 分钟前
发现个用《道德经》+价值投资大咖的智慧,做A股的AI诊股神器,居然还开源了
python
陈天伟教授40 分钟前
(二)Python + 地球信息科学与技术 (GeoICT)=?
开发语言·python
HelloGitHub1 小时前
直击痛点的开源项目「GitHub 热点速览」
开源·github
之歆1 小时前
大模型微调分布式训练-大模型压缩训练(知识蒸馏)-大模型推理部署(分布式推理与量化部署)-大模型评估测试(OpenCompass)
人工智能·笔记·python
人工干智能1 小时前
pygame的帧处理中,涉及键盘的有`pg.event.get()`与`pg.key.get_pressed()` ,二者有什么区别与联系?
python·游戏·计算机外设·pygame
R-G-B1 小时前
【P18 3-10】OpenCV Python—— 鼠标控制,鼠标回调函数(鼠标移动、按下、。。。),鼠标绘制基本图形(直线、圆、矩形)
python·opencv·计算机外设·鼠标回调函数·鼠标控制·鼠标移动·鼠标绘制图形
IT古董4 小时前
第四章:大模型(LLM)】06.langchain原理-(3)LangChain Prompt 用法
java·人工智能·python
时序数据说7 小时前
时序数据库市场前景分析
大数据·数据库·物联网·开源·时序数据库