近日,Meta(原 Facebook)开源了他们公司的新一代大模型 Llama 3,虽然目前只放出了 8B 和 70B 两个版本,但是在评估结果上已经优于 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5 等大模型。Meta 官方还表示,这些只是开胃菜,更强的 400B 参数的模型已经在训练中了,预计几个月后将和大家见面(开源与否尚不明确)。
说回上周的热门开源项目,最近基于 LLM 构建知识库的开源项目很火,但我一个都没收录。因为如果是本地起大模型效果不好,请求大模型的 API 又不免费,所以我找到了一个 OpenAI API 反向代理开源项目,可用来实现免费白嫖 OpenAI API。内容也是知识库的关键,Reader 能够将网页内容转化成 LLM 友好的文本。对于没有编程基础的小伙伴,这有一个 30-Days-Of-Python 的开源教程,学它!当然,学习之余也可以娱乐一下,比如试试'无名杀',这是一款类似于三国杀的开源卡牌游戏。
- 本文目录
-
- 开源新闻
- 1.1 Meta 开源 Llama 3 大模型
-
- 开源热搜项目
- 2.1 OpenAI API 免费反向代理:ChatGPT
- 2.2 一门新兴的系统级编程语言:Zig
- 2.3 将网页内容转化成 LLM 友好的文本:Reader
- 2.4 三国杀类型的卡牌游戏:noname
- 2.5 为期 30 天的 Python 编程挑战:30-Days-Of-Python
-
- HelloGitHub 热评
- 3.1 自定义 Windows 任务栏透明度的小工具:TranslucentTB
- 3.2 跨平台的手写笔记和绘图应用:Rnote
-
- 结尾
-
1. 开源新闻
1.1 Meta 开源 Llama 3 大模型
今年初,扎克伯格就曾公开解释过:Meta 为什么开源 Llama 模型?
- 改进模型:开源可以借助社区的力量持续提升模型的质量,因为社区的反馈和审查有助于安全性和运行效率的提升,而这对每个人都有益。
- 产品发展:虽然开源并不排除将模型转化为商业产品的可能性,开源模型的领导者可以将社区创新整合进自家产品中,提高产品竞争力。
- 行业标准:开源软件有潜力成为行业标准,从而促进技术发展和统一性。
- 吸引人才:由于开发者和研究人员更倾向于参与开源项目,开源策略可以帮助公司吸引和招聘到行业内的优秀人才。
最新发布的 Llama 3 相较于 Llama 2 在参数规模、训练数据集、模型架构(GQA)、性能、多语言支持、推理和代码生成方面都有所提升,但现在对中文支持的不是很好,而且 meta.ai 上用的还是 Llama 2。
GitHub 地址:github.com/meta-llama/...
2. 开源热搜项目
2.1 OpenAI API 免费反向代理:ChatGPT
主语言:TypeScript ,Star:3.7k ,周增长:1k
虽然现在无需登陆就可以免费使用 ChatGPT(gpt-3.5-turbo 模型),但如果是想用接口的话还要收费的。该项目就是基于免费的 ChatGPT 网站服务,将其转化成免费的 ChatGPT API,接口返回和官方一致,支持 Docker 部署。需要注意的是部署的服务器,要在 OpenAI 服务支持的国家和地区。
GitHub 地址→github.com/PawanOsman/...
2.2 一门新兴的系统级编程语言:Zig
主语言:Zig ,Star:30k ,周增长:300
这是一种命令式、通用、静态类型、编译的系统编程语言,注重性能、安全和可读性。它支持编译时泛型与反射、交叉编译以及手动存储器管理,目标为改进 C 语言,可以轻松地和 C 语言的代码库配合工作。Zig 简洁且直接,没有隐式控制流、没有隐式内存分配、没有预处理器、没有宏,特别适合用于开发编译器、操作系统内核、桌面应用、性能敏感的应用、嵌入式系统等。
zig
const std = @import("std");
const parseInt = std.fmt.parseInt;
test "parse integers" {
const input = "123 67 89,99";
const ally = std.testing.allocator;
var list = std.ArrayList(u32).init(ally);
// Ensure the list is freed at scope exit.
// Try commenting out this line!
defer list.deinit();
var it = std.mem.tokenizeAny(u8, input, " ,");
while (it.next()) |num| {
const n = try parseInt(u32, num, 10);
try list.append(n);
}
const expected = [_]u32{ 123, 67, 89, 99 };
for (expected, list.items) |exp, actual| {
try std.testing.expectEqual(exp, actual);
}
}
GitHub 地址→github.com/ziglang/zig
2.3 将网页内容转化成 LLM 友好的文本:Reader
主语言:TypeScript ,Star:3k ,周增长:2.5k
该项目可以将指定的 URL 内容转化为干净、LLM 友好的文本,从而提高 Agent 和 RAG 系统的输入质量,可作为构建知识库的一环。我试用了一下,内容提取效果不错,但是对于需要登陆才能访问的 URL 就不行了。
GitHub 地址→github.com/jina-ai/rea...
2.4 三国杀类型的卡牌游戏:noname
主语言:JavaScript ,Star:1.9k ,周增长:100
「无名杀」是一款以三国为背景的卡牌策略游戏,它完全免费、无广告,玩法和三国杀一样,但自由度高很多,有海量武将可供玩家选择,还支持自制武将和技能,提供了身份、国战、斗地主、塔防、单挑、联机等游戏模式。
GitHub 地址→github.com/libccy/nona...
2.5 为期 30 天的 Python 编程挑战:30-Days-Of-Python
主语言:Python ,Star:31k ,周增长:600
该项目是帮助人们在 30 天内学会 Python 编程语言,通过每天的练习和学习,逐渐掌握 Python 的基础和进阶知识,全部完成可能需要超过 100 天。该教程适合想要快速入门 Python 的初学者,或者对 Python 有一定了解,想通过实践深入理解 Python 的开发者。
GitHub 地址→github.com/Asabeneh/30...
3. HelloGitHub 热评
在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。
3.1 自定义 Windows 任务栏透明度的小工具:TranslucentTB
主语言:C++
该项目是采用 C++ 开发的用于调整 Windows 任务栏透明度的工具,它体积小、免费、简单易用,支持 5 种任务栏状态、6 种动态模式、Windows 10/11 操作系统。
3.2 跨平台的手写笔记和绘图应用:Rnote
主语言:Rust
这是一款用 Rust 和 GTK4 编写的绘图应用,可用于绘制草图、手写笔记和注释文档等。它支持导入/导出 PDF 和图片文件,以及无限画布、拖放、自动保存等功能。适用于 Windows、Linux 和 macOS 系统,需要搭配手写板使用。
4. 结尾
在结束本周「GitHub 热点速递」的精彩内容后,希望这些开源项目能够对大家有所启发,帮助你们找到新的工具、学习资源或是娱乐项目。如果看完这些还不过瘾,可以通过阅读「往期回顾」的内容,找到更多热门开源项目。
往期回顾
以上为本周的「GitHub 热点速递」全部内容,如果你发现其他好玩、有趣的 GitHub 项目,就来 HelloGitHub 和大家一起分享吧。