GitHub 一周热点汇总第5期(2024/01/07-01/13)

GitHub一周热点汇总第5期 (2024/01/07-01/13),梳理每周热门的GitHub项目,这一周的热门项目都普遍比较年轻,有几个更是刚刚发布就火热起来了,一起来看看都有哪些项目吧。

#1 llm-course

本项目的内容从名字就能大概猜到了,没错,就是一个针对大语言模型的课程。本项目中包含了学习大语言模型的roadmap和colab notebook,很适合从头来学习入门一下LLM。学习党们可以出手了,赶快学起来吧。

项目分成3个部分,分别是:

  • LLM 基础知识:基础知识包括了数学、Python、神经网络等。
  • LLM 科学家:主要针对使用最新技术去构建更好的LLM
  • LLM 工程师:主要针对如何去开发和部署基于大模型的应用

下面是基础知识部分和LLM科学家部分的roadmap,LLM工程师的部分还暂时没有更新,大家要稍微等等。

这是项目的GitHub star历史,上周突然一下子就火爆起来了。

#2 Jan

又是一款ChatGPT的替代品,但是与一般的OpenAI套壳产品不太一样的地方在于,它希望把AI能力放到你本地的环境中。Jan支持从 PC 到多 GPU 集群的各种类型环境,帮助你在100%离线的在本地构建一个ChatGPT。

以下是Jan支持运行环境类型:

  • Nvidia GPU(快速)
  • Apple M 系列(快速)
  • 苹果英特尔
  • Linux Debian
  • Windows x64

由于是在本地部署和运行的LLM,因此使用Jan理论上可以获得一些优势:

隐私:全本地化的数据,避免了泄露的可能

可定制:可以微调模型或者是定制自己的产品页面。

另外就是如果本地的性能足够强大,是可以获得更好的使用速度和稳定性的。

#3 crewAI

crewAI 是一个针对AI agent的编排框架,它希望可以让ai agent之间更加智能的协同工作,进而让整个AI 体系可以独立完成复杂的任务。

CrewAI 旨在使人工智能代理能够承担角色、分享目标并在一个有凝聚力的单元中运作------就像一个运转良好的团队。无论您是要构建智能助理平台、自动化客户服务整体还是多代理研究团队,CrewAI 都可以为复杂的多代理交互提供支撑。

CrewAI的主要特性:

  • 基于角色的agent设计:定制具有特定角色、目标和工具的代理。
  • agent间自主委派:agent可以自主委派任务并相互查询,提高解决问题的效率。
  • 灵活的任务管理:使用可定制的工具定义任务并将其动态分配给agent。
  • 流程驱动:目前仅支持sequential。任务执行,处理更复杂的流程,例如共识和分层。

#4 1brc

1brc就是 One Billion Row Challenge ,项目实际上是一个关于JAVA的挑战,使用JAVA处理一个10亿行的文件,怎么样Java大神的竞赛的基因动了吗,有兴趣的话,也可以去提交一下。

发起者希望探讨现代 Java 在聚合文本文件中的 10 亿行方面能走多远,挑战要求从处理一个文本文件,它包含一系列气象站的温度值,一共有10亿行。各路大神请使用各种可能的技术,比如虚拟线程、SIMD、优化GC,最终获取最好的运行速度。

目前已经有一些开始提交了,有兴趣的快动手吧,挑战一直持续到1月底。

#5 Umi-OCR

这是个国人项目,打开项目的所有介绍都是中文优先的,对国内是非常友好。

Umi-OCR是开源、免费的离线OCR软件。支持截屏/粘贴/批量导入图片,段落排版/排除水印,扫描/生成二维码。内置多国语言库。

下面是它的主要特点:

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。
  • 灵活:支持命令行、HTTP接口等多种调用方式。
  • 功能:截图OCR / 批量OCR / 二维码 / 数学公式识别

本应用适用于 Windows7 x64 及以上,这点对于平时使用Mac的我有点可惜,如果你是Windows用户,就去试试吧。

相关推荐
大大大反派2 小时前
CANN 生态未来展望:统一框架 `CANN Unified` 与开源协同演进
开源
酷酷的崽7982 小时前
CANN 开源生态实战:端到端构建高效文本分类服务
分类·数据挖掘·开源
晚霞的不甘2 小时前
CANN 在工业质检中的亚像素级视觉检测系统设计
人工智能·计算机视觉·架构·开源·视觉检测
爱吃烤鸡翅的酸菜鱼4 小时前
CANN ops-nn激活函数与池化算子深度解析
网络·开源·aigc
ujainu4 小时前
CANN仓库中的AIGC可持续演进工程:昇腾AI软件栈如何构建“活”的开源生态
人工智能·开源·aigc
酷酷的崽7984 小时前
深度解析 CANN 开源项目:以 `ops-transformer` 为例探索 AI 模型加速实践
开源
ujainu4 小时前
CANN仓库中的AIGC性能极限挑战:昇腾软件栈如何榨干每一瓦算力
人工智能·开源
wenzhangli74 小时前
ooderA2UI BridgeCode 深度解析:从设计原理到 Trae Solo Skill 实践
java·开发语言·人工智能·开源
skywalk81635 小时前
快速安装一个本地开源邮件系统postfix+dovecot @Ubuntu22.40
开源·邮箱·postfix·dovecot
猫头虎5 小时前
2026年AI产业13大趋势预测:Vibe Coding创作者经济元年到来,占冰强专家解读AIGC未来图景
人工智能·开源·prompt·aigc·ai编程·远程工作·agi