GitHub 一周热点汇总第5期(2024/01/07-01/13)

GitHub一周热点汇总第5期 (2024/01/07-01/13),梳理每周热门的GitHub项目,这一周的热门项目都普遍比较年轻,有几个更是刚刚发布就火热起来了,一起来看看都有哪些项目吧。

#1 llm-course

本项目的内容从名字就能大概猜到了,没错,就是一个针对大语言模型的课程。本项目中包含了学习大语言模型的roadmap和colab notebook,很适合从头来学习入门一下LLM。学习党们可以出手了,赶快学起来吧。

项目分成3个部分,分别是:

  • LLM 基础知识:基础知识包括了数学、Python、神经网络等。
  • LLM 科学家:主要针对使用最新技术去构建更好的LLM
  • LLM 工程师:主要针对如何去开发和部署基于大模型的应用

下面是基础知识部分和LLM科学家部分的roadmap,LLM工程师的部分还暂时没有更新,大家要稍微等等。

这是项目的GitHub star历史,上周突然一下子就火爆起来了。

#2 Jan

又是一款ChatGPT的替代品,但是与一般的OpenAI套壳产品不太一样的地方在于,它希望把AI能力放到你本地的环境中。Jan支持从 PC 到多 GPU 集群的各种类型环境,帮助你在100%离线的在本地构建一个ChatGPT。

以下是Jan支持运行环境类型:

  • Nvidia GPU(快速)
  • Apple M 系列(快速)
  • 苹果英特尔
  • Linux Debian
  • Windows x64

由于是在本地部署和运行的LLM,因此使用Jan理论上可以获得一些优势:

隐私:全本地化的数据,避免了泄露的可能

可定制:可以微调模型或者是定制自己的产品页面。

另外就是如果本地的性能足够强大,是可以获得更好的使用速度和稳定性的。

#3 crewAI

crewAI 是一个针对AI agent的编排框架,它希望可以让ai agent之间更加智能的协同工作,进而让整个AI 体系可以独立完成复杂的任务。

CrewAI 旨在使人工智能代理能够承担角色、分享目标并在一个有凝聚力的单元中运作------就像一个运转良好的团队。无论您是要构建智能助理平台、自动化客户服务整体还是多代理研究团队,CrewAI 都可以为复杂的多代理交互提供支撑。

CrewAI的主要特性:

  • 基于角色的agent设计:定制具有特定角色、目标和工具的代理。
  • agent间自主委派:agent可以自主委派任务并相互查询,提高解决问题的效率。
  • 灵活的任务管理:使用可定制的工具定义任务并将其动态分配给agent。
  • 流程驱动:目前仅支持sequential。任务执行,处理更复杂的流程,例如共识和分层。

#4 1brc

1brc就是 One Billion Row Challenge ,项目实际上是一个关于JAVA的挑战,使用JAVA处理一个10亿行的文件,怎么样Java大神的竞赛的基因动了吗,有兴趣的话,也可以去提交一下。

发起者希望探讨现代 Java 在聚合文本文件中的 10 亿行方面能走多远,挑战要求从处理一个文本文件,它包含一系列气象站的温度值,一共有10亿行。各路大神请使用各种可能的技术,比如虚拟线程、SIMD、优化GC,最终获取最好的运行速度。

目前已经有一些开始提交了,有兴趣的快动手吧,挑战一直持续到1月底。

#5 Umi-OCR

这是个国人项目,打开项目的所有介绍都是中文优先的,对国内是非常友好。

Umi-OCR是开源、免费的离线OCR软件。支持截屏/粘贴/批量导入图片,段落排版/排除水印,扫描/生成二维码。内置多国语言库。

下面是它的主要特点:

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。
  • 灵活:支持命令行、HTTP接口等多种调用方式。
  • 功能:截图OCR / 批量OCR / 二维码 / 数学公式识别

本应用适用于 Windows7 x64 及以上,这点对于平时使用Mac的我有点可惜,如果你是Windows用户,就去试试吧。

相关推荐
小强在此2 小时前
基于开源鸿蒙(OpenHarmony)的【智能家居综合应用】系统
华为·开源·智能家居·团队开发·harmonyos
Rense111 小时前
开源RK3588 AI Module7,并与Jetson Nano生态兼容的低功耗AI模块
人工智能·开源
程序员皮皮林15 小时前
开源PDF工具 Apache PDFBox 认识及使用(知识点+案例)
java·pdf·开源·apache
MinIO官方账号20 小时前
从 HDFS 迁移到 MinIO 企业对象存储
人工智能·分布式·postgresql·架构·开源
giszz1 天前
【开源大模型生态9】百度的文心大模型
人工智能·开源
棱镜七彩1 天前
供方软件供应链安全保障要求及开源场景对照自评表(下)
安全·开源
华为云开源1 天前
openGemini 社区人才培养计划:助力成长,培养新一代云原生数据库人才
数据库·云原生·开源
GoppViper1 天前
golang学习笔记29——golang 中如何将 GitHub 最新提交的版本设置为 v1.0.0
笔记·git·后端·学习·golang·github·源代码管理
铁匠匠匠1 天前
从零开始学数据结构系列之第六章《排序简介》
c语言·数据结构·经验分享·笔记·学习·开源·课程设计
贩卖纯净水.1 天前
白月光git
git·github