GitHub 一周热点汇总第15期(2024/03/17-03/23)

GitHub 一周热点汇总第15期(2024/03/17-03/23) ,这一周的项目中有一个超级热点,把其人远远甩在身后,一起看看都有哪些热门项目吧。

#1 grok-1

本周最火热的项目毫无疑问就是马斯克开源的大语言模型:grok-1,在一周的时间里获得了超过42600个star,是的你没看错,是4万多个star。

马斯克先前在网上针对OpenAI进行了一番控诉,认为他们违背了最初利用AI造福人类的初衷,而他决定自己开源一款大模型。3月17日凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。Grok-1也是目前规模最大的大模型。

更具之前发出的测评数据,Grok-1有这着非常好的表现,超过了绝大部分同类的模型。

下面是目前能够知道的 Grok-1 的一些情况:

  • 基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调;
  • 3140 亿参数的 MoE 模型,在给定 token 上的激活权重为 25%;
  • 2023 年 10 月,xAI 使用 JAX 库和 Rust 语言组成的自定义训练堆栈从头开始训练。

但是Grok-1的规模也成为了一种限制,它的大小就已经达到了296G,想要运行它也需要非常多的资源,如果没有足够的"钞能力",也就只能看看热闹、围观一下了。

下面是它在github上的star历史,这是我目前见过的,最快增长的项目,没有之一。

#2 Open-Sora

前段时间OpenAI推出了Sora,可谓一时风光无限,不过在我们还没有等来Sora的正式可用前,我们先等来了它的开源实现版。

Open-Sora 项目是一项致力于高效 制作高质量视频,并使所有人都能使用其模型、工具和内容的计划。 通过采用开源 原则,Open-Sora 不仅实现了先进视频生成技术的低成本普及,还提供了一个精简且用户友好的方案,简化了视频制作的复杂性。 下面是Open-Sora的最新效果:

Open-Sora 的复现方案参考了 Stable Video Diffusion (SVD)[3] 工作,共包括三个阶段,分别是:

  1. 大规模图像预训练;
  2. 大规模视频预训练;
  3. 高质量视频数据微调。

每个阶段都会基于前一个阶段的权重继续训练。相比于从零开始单阶段训练,多阶段训练通过逐步扩展数据,更高效地达成高质量视频生成的目标。

目前,基于项目提供的模型权重只需 3 天的训练就能生成 2 秒的 512x512 视频,当然同样支持训练加速。更多的细节可以查看他们的项目,尤其是项目中的报告,里面介绍了很多详细内容。

#3 MediaCrawler

这是一个爬虫的项目,爬取各个媒体平台上的信息和评论。这个项目最初我是在B站上看到了作者的视频,然后到GitHub上发现项目越来越火,不过现在项目内容已经被作者清空了。

只能说很遗憾吧,其实从视频中就能看出来,作者一开始并没有太多的想法,但是随着热度的上升,给作者带来了越来越多的问题。于是乎,就变成了现在的样子。

所以啊,国内做开源真的是不容易,本来大家分享一下想法和思路,但总有太多乱七八糟的事情,我只能在这里默默地支持一下作者,希望下个项目再见。

#4 full-stack-fastapi-template

  • 项目名称:full-stack-fastapi-template - 全栈web模板
  • GitHub 链接:github.com/tiangolo/fu...
  • 上周 Star 数:5300+

本项目是一个现代的全栈web应用模板,就项目名字所说的,本项目的后台使用FastApi,另外还使用了React、SQLModel、PostgreSQL、Docker等技术,作为一个模板项目里面包含了开发一个web项目所需的几乎所有元素,可以帮助使用者快速开发web项目。

下面是项目使用到的一些技术栈和一些特点:

  • ⚡用于 Python 后端 API 的 FastAPI 。
    • 用于 Python SQL 数据库交互 (ORM) 的SQLModel 。
    • Pydantic
    • ,由 FastAPI 使用,用于数据验证和设置管理。
    • PostgreSQL
    • 作为 SQL 数据库。
  • React前端。
    • 使用 TypeScript、hooks、Vite 和现代前端堆栈的其他部分。
    • 前端组件的Chakra UI 。
    • 自动生成的前端客户端。
    • 深色模式支持。
  • 用于开发和生产的Docker Compose
  • 默认情况下安全密码哈希。
  • JWT 令牌身份验证。
  • 基于电子邮件的密码恢复。
  • ✅ 使用Pytest进行测试。
  • Traefik作为反向代理/负载均衡器。
  • 使用 Docker Compose 的部署说明,包括如何设置前端 Traefik 代理来处理自动 HTTPS 书。
  • 基于 GitHub Actions 的 CI(持续集成)和 CD(持续部署)。

登录页面

黑暗模式

项目前后端分离,并自带了Swagger等,本地部署后会有以下几个访问端口:

java 复制代码
Frontend: <http://localhost>

Backend: <http://localhost/api/>

Automatic Interactive Docs (Swagger UI): <http://localhost/docs>

Automatic Alternative Docs (ReDoc): <http://localhost/redoc>

Adminer: <http://localhost:8080>

Traefik UI: <http://localhost:8090>

#5 gpt-pilot

GPT Pilot 旨在提供第一个真正的 AI 开发伙伴。不仅仅是一个自动完成功能或 PR 消息的助手,而是一个真正的 AI 开发人员,可以编写完整的功能、调试它们、与您讨论问题、请求审核等。

如果您使用 VS Code 作为 IDE,最简单使用GPT Pilot 的方法是下载它的VSCode 插件。在vscode中它的名字叫Pythagora。

在项目执行过程中,它能够自动提出问题,并根据我们的答案,模拟与复现开发一个项目时的完整流程。整个执行的流程是如下这样的。

GPT Pilot 会先询问我们一系列问题,来确定应用类型,产品需求和技术要求,然后基于这些问答内容,自动完成环境配置,编写代码。 我们在这整个过程中,只需扮演好项目管理者的角色,检查 AI 完成的代码是否符合标准,并在适当的时候给予其指引,让 AI 能在正确的方向上持续编写与迭代项目。

相对来说,GPT Pilot 是一种监督性的AI编程,并没有完全把人排除在外,这样实际上也是目前更好的模式。

项目里还提供了多个使用GPT Pilot开发的程序实例,可以直接查看

相关推荐
DeepSeek-大模型系统教程7 分钟前
推荐 7 个本周 yyds 的 GitHub 项目。
人工智能·ai·语言模型·大模型·github·ai大模型·大模型学习
ai小鬼头3 小时前
AIStarter最新版怎么卸载AI项目?一键删除操作指南(附路径设置技巧)
前端·后端·github
青阳流月5 小时前
1.vue权衡的艺术
前端·vue.js·开源
小小鱼儿小小林6 小时前
免费一键自动化申请、续期、部署、监控所有 SSL/TLS 证书,ALLinSSL开源免费的 SSL 证书自动化管理平台
开源·自动化·ssl
CoderLiu7 小时前
用这个MCP,只给大模型一个figma链接就能直接导出图片,还能自动压缩上传?
前端·llm·mcp
三花AI7 小时前
阿里开源 OmniAvatar:音频驱动数字人模型
开源·资讯
说私域7 小时前
基于开源AI智能客服、AI智能名片与S2B2C商城小程序的微商服务质量提升路径研究
人工智能·小程序·开源
蚂蚁数据AntData7 小时前
从性能优化赛到社区Committer,走进赵宇捷在Apache Fory的成长之路
大数据·开源·apache·数据库架构
阿里云云原生8 小时前
Spring AI Alibaba 游乐场开放!一站式体验AI 应用开发全流程
开源
NocoBase9 小时前
为什么越来越多 Airtable 用户开始尝试 NocoBase?
低代码·开源·资讯