GitHub 一周热点汇总第15期(2024/03/17-03/23) ,这一周的项目中有一个超级热点,把其人远远甩在身后,一起看看都有哪些热门项目吧。
#1 grok-1
- 项目名称:grok-1 - 马斯克的大模型
- GitHub 链接:github.com/xai-org/gro...
- 上周 Star 数:42600+
本周最火热的项目毫无疑问就是马斯克开源的大语言模型:grok-1,在一周的时间里获得了超过42600个star,是的你没看错,是4万多个star。
马斯克先前在网上针对OpenAI进行了一番控诉,认为他们违背了最初利用AI造福人类的初衷,而他决定自己开源一款大模型。3月17日凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。Grok-1也是目前规模最大的大模型。
更具之前发出的测评数据,Grok-1有这着非常好的表现,超过了绝大部分同类的模型。
下面是目前能够知道的 Grok-1 的一些情况:
- 基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调;
- 3140 亿参数的 MoE 模型,在给定 token 上的激活权重为 25%;
- 2023 年 10 月,xAI 使用 JAX 库和 Rust 语言组成的自定义训练堆栈从头开始训练。
但是Grok-1的规模也成为了一种限制,它的大小就已经达到了296G,想要运行它也需要非常多的资源,如果没有足够的"钞能力",也就只能看看热闹、围观一下了。
下面是它在github上的star历史,这是我目前见过的,最快增长的项目,没有之一。
#2 Open-Sora
- 项目名称:Open-Sora - Sora开源实现
- GitHub 链接:github.com/hpcaitech/O...
- 上周 Star 数:9200+
前段时间OpenAI推出了Sora,可谓一时风光无限,不过在我们还没有等来Sora的正式可用前,我们先等来了它的开源实现版。
Open-Sora 项目是一项致力于高效 制作高质量视频,并使所有人都能使用其模型、工具和内容的计划。 通过采用开源 原则,Open-Sora 不仅实现了先进视频生成技术的低成本普及,还提供了一个精简且用户友好的方案,简化了视频制作的复杂性。 下面是Open-Sora的最新效果:
Open-Sora 的复现方案参考了 Stable Video Diffusion (SVD)[3] 工作,共包括三个阶段,分别是:
- 大规模图像预训练;
- 大规模视频预训练;
- 高质量视频数据微调。
每个阶段都会基于前一个阶段的权重继续训练。相比于从零开始单阶段训练,多阶段训练通过逐步扩展数据,更高效地达成高质量视频生成的目标。
目前,基于项目提供的模型权重只需 3 天的训练就能生成 2 秒的 512x512 视频,当然同样支持训练加速。更多的细节可以查看他们的项目,尤其是项目中的报告,里面介绍了很多详细内容。
#3 MediaCrawler
- 项目名称:MediaCrawler - 爬虫
- GitHub 链接:github.com/NanmiCoder/...
- 上周 Star 数:8500 +
这是一个爬虫的项目,爬取各个媒体平台上的信息和评论。这个项目最初我是在B站上看到了作者的视频,然后到GitHub上发现项目越来越火,不过现在项目内容已经被作者清空了。
只能说很遗憾吧,其实从视频中就能看出来,作者一开始并没有太多的想法,但是随着热度的上升,给作者带来了越来越多的问题。于是乎,就变成了现在的样子。
所以啊,国内做开源真的是不容易,本来大家分享一下想法和思路,但总有太多乱七八糟的事情,我只能在这里默默地支持一下作者,希望下个项目再见。
#4 full-stack-fastapi-template
- 项目名称:full-stack-fastapi-template - 全栈web模板
- GitHub 链接:github.com/tiangolo/fu...
- 上周 Star 数:5300+
本项目是一个现代的全栈web应用模板,就项目名字所说的,本项目的后台使用FastApi,另外还使用了React、SQLModel、PostgreSQL、Docker等技术,作为一个模板项目里面包含了开发一个web项目所需的几乎所有元素,可以帮助使用者快速开发web项目。
下面是项目使用到的一些技术栈和一些特点:
- ⚡用于 Python 后端 API 的 FastAPI 。
-
- 用于 Python SQL 数据库交互 (ORM) 的SQLModel 。
- Pydantic
- ,由 FastAPI 使用,用于数据验证和设置管理。
- PostgreSQL
- 作为 SQL 数据库。
- React前端。
-
- 使用 TypeScript、hooks、Vite 和现代前端堆栈的其他部分。
- 前端组件的Chakra UI 。
- 自动生成的前端客户端。
- 深色模式支持。
- 用于开发和生产的Docker Compose
- 默认情况下安全密码哈希。
- JWT 令牌身份验证。
- 基于电子邮件的密码恢复。
- ✅ 使用Pytest进行测试。
- Traefik作为反向代理/负载均衡器。
- 使用 Docker Compose 的部署说明,包括如何设置前端 Traefik 代理来处理自动 HTTPS 书。
- 基于 GitHub Actions 的 CI(持续集成)和 CD(持续部署)。
登录页面
黑暗模式
项目前后端分离,并自带了Swagger等,本地部署后会有以下几个访问端口:
java
Frontend: <http://localhost>
Backend: <http://localhost/api/>
Automatic Interactive Docs (Swagger UI): <http://localhost/docs>
Automatic Alternative Docs (ReDoc): <http://localhost/redoc>
Adminer: <http://localhost:8080>
Traefik UI: <http://localhost:8090>
#5 gpt-pilot
- 项目名称:gpt-pilot - AI开发者
- GitHub 链接:github.com/Pythagora-i...
- 上周 Star 数:2800+
GPT Pilot 旨在提供第一个真正的 AI 开发伙伴。不仅仅是一个自动完成功能或 PR 消息的助手,而是一个真正的 AI 开发人员,可以编写完整的功能、调试它们、与您讨论问题、请求审核等。
如果您使用 VS Code 作为 IDE,最简单使用GPT Pilot 的方法是下载它的VSCode 插件。在vscode中它的名字叫Pythagora。
在项目执行过程中,它能够自动提出问题,并根据我们的答案,模拟与复现开发一个项目时的完整流程。整个执行的流程是如下这样的。
GPT Pilot 会先询问我们一系列问题,来确定应用类型,产品需求和技术要求,然后基于这些问答内容,自动完成环境配置,编写代码。 我们在这整个过程中,只需扮演好项目管理者的角色,检查 AI 完成的代码是否符合标准,并在适当的时候给予其指引,让 AI 能在正确的方向上持续编写与迭代项目。
相对来说,GPT Pilot 是一种监督性的AI编程,并没有完全把人排除在外,这样实际上也是目前更好的模式。
项目里还提供了多个使用GPT Pilot开发的程序实例,可以直接查看