GitHub 一周热点汇总第15期(2024/03/17-03/23)

GitHub 一周热点汇总第15期(2024/03/17-03/23) ,这一周的项目中有一个超级热点,把其人远远甩在身后,一起看看都有哪些热门项目吧。

#1 grok-1

本周最火热的项目毫无疑问就是马斯克开源的大语言模型:grok-1,在一周的时间里获得了超过42600个star,是的你没看错,是4万多个star。

马斯克先前在网上针对OpenAI进行了一番控诉,认为他们违背了最初利用AI造福人类的初衷,而他决定自己开源一款大模型。3月17日凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。Grok-1也是目前规模最大的大模型。

更具之前发出的测评数据,Grok-1有这着非常好的表现,超过了绝大部分同类的模型。

下面是目前能够知道的 Grok-1 的一些情况:

  • 基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调;
  • 3140 亿参数的 MoE 模型,在给定 token 上的激活权重为 25%;
  • 2023 年 10 月,xAI 使用 JAX 库和 Rust 语言组成的自定义训练堆栈从头开始训练。

但是Grok-1的规模也成为了一种限制,它的大小就已经达到了296G,想要运行它也需要非常多的资源,如果没有足够的"钞能力",也就只能看看热闹、围观一下了。

下面是它在github上的star历史,这是我目前见过的,最快增长的项目,没有之一。

#2 Open-Sora

前段时间OpenAI推出了Sora,可谓一时风光无限,不过在我们还没有等来Sora的正式可用前,我们先等来了它的开源实现版。

Open-Sora 项目是一项致力于高效 制作高质量视频,并使所有人都能使用其模型、工具和内容的计划。 通过采用开源 原则,Open-Sora 不仅实现了先进视频生成技术的低成本普及,还提供了一个精简且用户友好的方案,简化了视频制作的复杂性。 下面是Open-Sora的最新效果:

Open-Sora 的复现方案参考了 Stable Video Diffusion (SVD)[3] 工作,共包括三个阶段,分别是:

  1. 大规模图像预训练;
  2. 大规模视频预训练;
  3. 高质量视频数据微调。

每个阶段都会基于前一个阶段的权重继续训练。相比于从零开始单阶段训练,多阶段训练通过逐步扩展数据,更高效地达成高质量视频生成的目标。

目前,基于项目提供的模型权重只需 3 天的训练就能生成 2 秒的 512x512 视频,当然同样支持训练加速。更多的细节可以查看他们的项目,尤其是项目中的报告,里面介绍了很多详细内容。

#3 MediaCrawler

这是一个爬虫的项目,爬取各个媒体平台上的信息和评论。这个项目最初我是在B站上看到了作者的视频,然后到GitHub上发现项目越来越火,不过现在项目内容已经被作者清空了。

只能说很遗憾吧,其实从视频中就能看出来,作者一开始并没有太多的想法,但是随着热度的上升,给作者带来了越来越多的问题。于是乎,就变成了现在的样子。

所以啊,国内做开源真的是不容易,本来大家分享一下想法和思路,但总有太多乱七八糟的事情,我只能在这里默默地支持一下作者,希望下个项目再见。

#4 full-stack-fastapi-template

  • 项目名称:full-stack-fastapi-template - 全栈web模板
  • GitHub 链接:github.com/tiangolo/fu...
  • 上周 Star 数:5300+

本项目是一个现代的全栈web应用模板,就项目名字所说的,本项目的后台使用FastApi,另外还使用了React、SQLModel、PostgreSQL、Docker等技术,作为一个模板项目里面包含了开发一个web项目所需的几乎所有元素,可以帮助使用者快速开发web项目。

下面是项目使用到的一些技术栈和一些特点:

  • ⚡用于 Python 后端 API 的 FastAPI 。
    • 用于 Python SQL 数据库交互 (ORM) 的SQLModel 。
    • Pydantic
    • ,由 FastAPI 使用,用于数据验证和设置管理。
    • PostgreSQL
    • 作为 SQL 数据库。
  • React前端。
    • 使用 TypeScript、hooks、Vite 和现代前端堆栈的其他部分。
    • 前端组件的Chakra UI 。
    • 自动生成的前端客户端。
    • 深色模式支持。
  • 用于开发和生产的Docker Compose
  • 默认情况下安全密码哈希。
  • JWT 令牌身份验证。
  • 基于电子邮件的密码恢复。
  • ✅ 使用Pytest进行测试。
  • Traefik作为反向代理/负载均衡器。
  • 使用 Docker Compose 的部署说明,包括如何设置前端 Traefik 代理来处理自动 HTTPS 书。
  • 基于 GitHub Actions 的 CI(持续集成)和 CD(持续部署)。

登录页面

黑暗模式

项目前后端分离,并自带了Swagger等,本地部署后会有以下几个访问端口:

java 复制代码
Frontend: <http://localhost>

Backend: <http://localhost/api/>

Automatic Interactive Docs (Swagger UI): <http://localhost/docs>

Automatic Alternative Docs (ReDoc): <http://localhost/redoc>

Adminer: <http://localhost:8080>

Traefik UI: <http://localhost:8090>

#5 gpt-pilot

GPT Pilot 旨在提供第一个真正的 AI 开发伙伴。不仅仅是一个自动完成功能或 PR 消息的助手,而是一个真正的 AI 开发人员,可以编写完整的功能、调试它们、与您讨论问题、请求审核等。

如果您使用 VS Code 作为 IDE,最简单使用GPT Pilot 的方法是下载它的VSCode 插件。在vscode中它的名字叫Pythagora。

在项目执行过程中,它能够自动提出问题,并根据我们的答案,模拟与复现开发一个项目时的完整流程。整个执行的流程是如下这样的。

GPT Pilot 会先询问我们一系列问题,来确定应用类型,产品需求和技术要求,然后基于这些问答内容,自动完成环境配置,编写代码。 我们在这整个过程中,只需扮演好项目管理者的角色,检查 AI 完成的代码是否符合标准,并在适当的时候给予其指引,让 AI 能在正确的方向上持续编写与迭代项目。

相对来说,GPT Pilot 是一种监督性的AI编程,并没有完全把人排除在外,这样实际上也是目前更好的模式。

项目里还提供了多个使用GPT Pilot开发的程序实例,可以直接查看

相关推荐
AI自动化工坊14 小时前
GitHub CLI统一AI编码技能管理:技术规范与工程实践指南
人工智能·github·agent·cli
angushine15 小时前
gitlab跨服务器备份
服务器·gitlab·github
文慧的科技江湖15 小时前
光伏管理系统产品需求文档(PRD) -【详细功能需求及研发核心字段清单】
运维·开源·慧知重卡开源充电桩平台·慧知开源充电桩平台·开源充电桩平台·光伏开源管理系统
鹓于15 小时前
Android APK开发到发布全流程指南
git·github
思想者00115 小时前
开源 OKR 目标管理系统
开源
Source.Liu15 小时前
【Matrix】Matrix 开源 Rust 项目全景
rust·开源
有梦想的牛牛15 小时前
Cursor vs Claude Code vs GitHub Copilot
github·copilot
MicrosoftReactor16 小时前
技术速递|GitHub Copilot CLI 结合多模型能力提供“第二视角”
ai·github·copilot
研究点啥好呢16 小时前
Github热榜项目推荐 | React生态系统的成熟演进
前端·react.js·github
林会16 小时前
DeerFlow本地部署!调用本地大模型
python·开源