Github 2024-02-21 开源项目日报 Top10

根据Github Trendings的统计,今日(2024-02-21统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言 项目数量
Python项目 8
非开发语言项目 1
TypeScript项目 1

gpt4free 语言模型集合改进计划

官方 gpt4free 仓库是由 @hlohaus 维护,@xtekky 编写的强大语言模型集合。该项目欢迎用户反馈以进行改进,并提供了一个表单供用户提交建议。该项目旨在进行各种改进,如增强文档、提供视频教程、更新提供者状态列表、改进 Bing 包装器,并增强错误处理和兼容性。

社交媒体账户搜索工具

这个开源项目允许用户在各种社交网络上使用特定的用户名搜索社交媒体账户。它提供了一种便捷的方式来追踪和定位与特定用户名相关的社交媒体资料。

Lobe Chat - 开源高性能AI聊天框架

Lobe Chat是一个开源的、高性能的AI聊天框架,支持一键免费部署私人ChatGPT/Gemini/Local LLM应用。

minbpe:LLM标记的字节对编码算法

  • 创建周期:4 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:4034 个
  • Fork数量:248 次
  • 关注人数:4034 人
  • 贡献人数:6 人
  • Open Issues数量:4 个
  • Github地址:https://github.com/karpathy/minbpe.git

项目'minbpe'提供了常用于LLM标记的字节对编码(BPE)算法的最小清晰代码。它包括两个标记器'BasicTokenizer'和'RegexTokenizer',以及一个'RegexTokenizer',它复制了GPT-4的标记化。该项目还包括一个脚本'train.py',用于在输入文本上训练标记器并将词汇保存到磁盘以进行可视化。

Magika: 深度学习文件类型检测工具

Magika是一种AI驱动的文件类型检测工具,利用深度学习准确检测文件类型。它采用自定义的、高度优化的Keras模型,可以在毫秒内精确识别文件。在超过100万个文件和100种内容类型的评估中,它实现了超过99%的精度和召回率,并且被Google大规模使用以提高用户安全性。

大世界模型(LWM)

  • 创建周期:10 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:1282 个
  • Fork数量:68 次
  • 关注人数:1282 人
  • 贡献人数:3 人
  • Open Issues数量:14 个
  • Github地址:https://github.com/LargeWorldModel/LWM.git

Large World Model (LWM) 是一个通用的大上下文多模态自回归模型。它是使用RingAttention在大量多样化的长视频和书籍数据集上训练的,可以进行语言、图像和视频的理解和生成。

具有Transformer的可扩展扩散模型(DiT)的官方PyTorch实现

  • 创建周期:431 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:2682 个
  • Fork数量:210 次
  • 关注人数:2682 人
  • 贡献人数:3 人
  • Open Issues数量:34 个
  • Github地址:https://github.com/facebookresearch/DiT.git

官方PyTorch实现的"具有Transformer的可扩展扩散模型"称为DiT。

UFO:Windows OS交互的UI焦点代理

  • 创建周期:42 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:984 个
  • Fork数量:82 次
  • 关注人数:984 人
  • 贡献人数:4 人
  • Open Issues数量:2 个
  • Github地址:https://github.com/microsoft/UFO.git

UFO是一个UI焦点双代理框架,旨在通过无缝地在单个或跨多个应用程序中导航和操作来满足Windows OS上的用户请求。

V-JEPA: 视频联合嵌入预测架构

  • 创建周期:9 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:1162 个
  • Fork数量:85 次
  • 关注人数:1162 人
  • 贡献人数:4 人
  • Open Issues数量:7 个
  • Github地址:https://github.com/facebookresearch/jepa.git

V-JEPA是视频联合嵌入预测架构的官方PyTorch代码库,是一种从视频中进行自监督学习的视觉表示方法。这些模型通过 passively 观看 VideoMix2M 数据集中的视频像素进行训练,并产生多功能的视觉表示,在下游视频和图像任务中表现良好,而无需调整模型参数。

相关推荐
孑渡27 分钟前
【LeetCode】每日一题:跳跃游戏 II
python·算法·leetcode·游戏·职场和发展
dandanforgetlove30 分钟前
python pdfplumber优化表格提取
开发语言·windows·python
ka2x32 分钟前
订单折扣金额分摊算法|代金券分摊|收银系统|积分分摊|分摊|精度问题|按比例分配|钱分摊|钱分配
java·c语言·c++·python·算法·spring·spring cloud
2401_858120265 小时前
探索sklearn文本向量化:从词袋到深度学习的转变
开发语言·python·机器学习
bigbearxyz7 小时前
Java实现图片的垂直方向拼接
java·windows·python
立秋67897 小时前
使用Python绘制堆积柱形图
开发语言·python
jOkerSdl7 小时前
第三十章 方法大全(Python)
python
小白学大数据7 小时前
HTML内容爬取:使用Objective-C进行网页数据提取
大数据·爬虫·python·html·objective-c·cocoa
逆境清醒8 小时前
开源数据科学平台Anaconda简介
人工智能·python·深度学习·机器学习·anaconda
SleepingBug8 小时前
[python][Anaconda]使用jupyter打开F盘或其他盘文件
开发语言·python·jupyter