GitHub 一周热点汇总第15期(2024/03/17-03/23)

GitHub 一周热点汇总第15期(2024/03/17-03/23) ,这一周的项目中有一个超级热点,把其人远远甩在身后,一起看看都有哪些热门项目吧。

#1 grok-1

本周最火热的项目毫无疑问就是马斯克开源的大语言模型:grok-1,在一周的时间里获得了超过42600个star,是的你没看错,是4万多个star。

马斯克先前在网上针对OpenAI进行了一番控诉,认为他们违背了最初利用AI造福人类的初衷,而他决定自己开源一款大模型。3月17日凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。Grok-1也是目前规模最大的大模型。

更具之前发出的测评数据,Grok-1有这着非常好的表现,超过了绝大部分同类的模型。

下面是目前能够知道的 Grok-1 的一些情况:

  • 基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调;
  • 3140 亿参数的 MoE 模型,在给定 token 上的激活权重为 25%;
  • 2023 年 10 月,xAI 使用 JAX 库和 Rust 语言组成的自定义训练堆栈从头开始训练。

但是Grok-1的规模也成为了一种限制,它的大小就已经达到了296G,想要运行它也需要非常多的资源,如果没有足够的"钞能力",也就只能看看热闹、围观一下了。

下面是它在github上的star历史,这是我目前见过的,最快增长的项目,没有之一。

#2 Open-Sora

前段时间OpenAI推出了Sora,可谓一时风光无限,不过在我们还没有等来Sora的正式可用前,我们先等来了它的开源实现版。

Open-Sora 项目是一项致力于高效 制作高质量视频,并使所有人都能使用其模型、工具和内容的计划。 通过采用开源 原则,Open-Sora 不仅实现了先进视频生成技术的低成本普及,还提供了一个精简且用户友好的方案,简化了视频制作的复杂性。 下面是Open-Sora的最新效果:

Open-Sora 的复现方案参考了 Stable Video Diffusion (SVD)[3] 工作,共包括三个阶段,分别是:

  1. 大规模图像预训练;
  2. 大规模视频预训练;
  3. 高质量视频数据微调。

每个阶段都会基于前一个阶段的权重继续训练。相比于从零开始单阶段训练,多阶段训练通过逐步扩展数据,更高效地达成高质量视频生成的目标。

目前,基于项目提供的模型权重只需 3 天的训练就能生成 2 秒的 512x512 视频,当然同样支持训练加速。更多的细节可以查看他们的项目,尤其是项目中的报告,里面介绍了很多详细内容。

#3 MediaCrawler

这是一个爬虫的项目,爬取各个媒体平台上的信息和评论。这个项目最初我是在B站上看到了作者的视频,然后到GitHub上发现项目越来越火,不过现在项目内容已经被作者清空了。

只能说很遗憾吧,其实从视频中就能看出来,作者一开始并没有太多的想法,但是随着热度的上升,给作者带来了越来越多的问题。于是乎,就变成了现在的样子。

所以啊,国内做开源真的是不容易,本来大家分享一下想法和思路,但总有太多乱七八糟的事情,我只能在这里默默地支持一下作者,希望下个项目再见。

#4 full-stack-fastapi-template

  • 项目名称:full-stack-fastapi-template - 全栈web模板
  • GitHub 链接:github.com/tiangolo/fu...
  • 上周 Star 数:5300+

本项目是一个现代的全栈web应用模板,就项目名字所说的,本项目的后台使用FastApi,另外还使用了React、SQLModel、PostgreSQL、Docker等技术,作为一个模板项目里面包含了开发一个web项目所需的几乎所有元素,可以帮助使用者快速开发web项目。

下面是项目使用到的一些技术栈和一些特点:

  • ⚡用于 Python 后端 API 的 FastAPI 。
    • 用于 Python SQL 数据库交互 (ORM) 的SQLModel 。
    • Pydantic
    • ,由 FastAPI 使用,用于数据验证和设置管理。
    • PostgreSQL
    • 作为 SQL 数据库。
  • React前端。
    • 使用 TypeScript、hooks、Vite 和现代前端堆栈的其他部分。
    • 前端组件的Chakra UI 。
    • 自动生成的前端客户端。
    • 深色模式支持。
  • 用于开发和生产的Docker Compose
  • 默认情况下安全密码哈希。
  • JWT 令牌身份验证。
  • 基于电子邮件的密码恢复。
  • ✅ 使用Pytest进行测试。
  • Traefik作为反向代理/负载均衡器。
  • 使用 Docker Compose 的部署说明,包括如何设置前端 Traefik 代理来处理自动 HTTPS 书。
  • 基于 GitHub Actions 的 CI(持续集成)和 CD(持续部署)。

登录页面

黑暗模式

项目前后端分离,并自带了Swagger等,本地部署后会有以下几个访问端口:

java 复制代码
Frontend: <http://localhost>

Backend: <http://localhost/api/>

Automatic Interactive Docs (Swagger UI): <http://localhost/docs>

Automatic Alternative Docs (ReDoc): <http://localhost/redoc>

Adminer: <http://localhost:8080>

Traefik UI: <http://localhost:8090>

#5 gpt-pilot

GPT Pilot 旨在提供第一个真正的 AI 开发伙伴。不仅仅是一个自动完成功能或 PR 消息的助手,而是一个真正的 AI 开发人员,可以编写完整的功能、调试它们、与您讨论问题、请求审核等。

如果您使用 VS Code 作为 IDE,最简单使用GPT Pilot 的方法是下载它的VSCode 插件。在vscode中它的名字叫Pythagora。

在项目执行过程中,它能够自动提出问题,并根据我们的答案,模拟与复现开发一个项目时的完整流程。整个执行的流程是如下这样的。

GPT Pilot 会先询问我们一系列问题,来确定应用类型,产品需求和技术要求,然后基于这些问答内容,自动完成环境配置,编写代码。 我们在这整个过程中,只需扮演好项目管理者的角色,检查 AI 完成的代码是否符合标准,并在适当的时候给予其指引,让 AI 能在正确的方向上持续编写与迭代项目。

相对来说,GPT Pilot 是一种监督性的AI编程,并没有完全把人排除在外,这样实际上也是目前更好的模式。

项目里还提供了多个使用GPT Pilot开发的程序实例,可以直接查看

相关推荐
爱喝白开水a13 小时前
关于大模型在企业生产环境中的独立部署问题
人工智能·深度学习·llm·大语言模型·ai大模型·计算机技术·本地部署大模型
Langchain14 小时前
不可错过!CMU最新《生成式人工智能大模型》课程:从文本、图像到多模态大模型
人工智能·自然语言处理·langchain·大模型·llm·大语言模型·多模态大模型
幽影相随15 小时前
构建llama.cpp并在linux上使用gpu
llm·llama.cpp
AAI机器之心16 小时前
LLM大模型:开源RAG框架汇总
人工智能·chatgpt·开源·大模型·llm·大语言模型·rag
杨荧17 小时前
【JAVA开源】基于Vue和SpringBoot的洗衣店订单管理系统
java·开发语言·vue.js·spring boot·spring cloud·开源
网安-搬运工1 天前
RAG再总结之如何使大模型更好使用外部数据:四个不同层级及查询-文档对齐策略
人工智能·自然语言处理·大模型·llm·大语言模型·ai大模型·rag
大模型八哥1 天前
大模型扫盲系列——大模型实用技术介绍(上)
人工智能·程序人生·ai·大模型·llm·llama·ai大模型
FIT2CLOUD飞致云1 天前
测试管理新增视图与高级搜索功能,测试计划支持一键生成缺陷详情,MeterSphere开源持续测试工具v3.3版本发布
开源·接口测试·metersphere·团队协作·持续测试·测试管理
杨荧1 天前
【JAVA开源】基于Vue和SpringBoot的旅游管理系统
java·vue.js·spring boot·spring cloud·开源·旅游