LLaMA 2:开源的预训练和微调语言模型推理引擎 | 开源日报 No.86

facebookresearch/llama

Stars: 36.0k License: NOASSERTION

LLaMA 2 是一个开源项目,用于加载 LLaMA 模型并进行推理。

该项目的主要功能是提供预训练和微调后的 LLaMA 语言模型的权重和起始代码。这些模型参数范围从 7B 到 70B 不等。

以下是该项目的关键特性和核心优势:

  • 支持多种规模 (7B、13B 和 70B) 的语言模型。
  • 所有模型都支持最长 4096 个标记长度,并根据硬件配置预分配缓存空间。
  • 预训练版本适用于文本补全任务,需要按照指定格式输入提示以获得期望答案作为自然延伸。
  • 微调聊天版可以应用在对话场景中,在输入输出上遵循特定格式定义来获取所需功能与性能。

apexcharts/apexcharts.js

Stars: 13.1k License: MIT

ApexCharts 是一个现代的 JavaScript 图表库,它允许您使用简单的 API 和 100 多个预先准备好的示例构建交互式数据可视化。ApexCharts 包含超过十种图表类型,可以在应用程序和仪表板中提供美观、响应式的可视化效果。

  • 支持各大主流浏览器
  • 提供 npm 安装方式
  • 可以直接引入 js 文件进行使用

termux/termux-packages

Stars: 11.3k License: NOASSERTION

这个项目是一个包含脚本和补丁的仓库,用于构建适用于 Termux Android 应用程序的软件包。该项目提供了有关 Termux 软件包管理的快速指南,并解释了在运行 aptpkg 命令时如何修复 "存储库正在维护中或已关闭" 的错误信息。

hiroi-sora/Umi-OCR

Stars: 11.1k License: MIT

Umi-OCR 是一个免费、开源的离线 OCR 软件,适用于 Windows7 x64 及以上系统。它具有以下核心优势和功能:

  • 全部代码开源,完全免费。
  • 解压即可使用,无需网络连接。
  • 可以批量导入处理图片,并将结果保存到本地 txt/md/jsonl 等多种格式文件中。也可以进行实时截屏识别。
  • 使用高效的 PaddleOCR-json C++ 识别引擎,在电脑性能足够的情况下通常比在线 OCR 服务更快速。
  • 默认采用精准度较高的 PPOCR-v3 模型库,并且对手写、方向不正、杂乱背景等情景也有良好的识别率。还支持设置忽略区域排除水印等。

espnet/espnet

Stars: 7.2k License: Apache-2.0

ESPnet 是一个端到端的语音处理工具包,涵盖了端到端语音识别、文本转语音、语音翻译、语音增强、说话人分离等功能。该工具使用 pytorch 作为深度学习引擎,并遵循 Kaldi 风格的数据处理和特征提取/格式以及配方来提供各种不同的实验设置。

  • 支持多个 ASR (自动演讲识别) 配方
  • 支持类似于 ASR 配方一样的 TTS (文本转声)
  • 支持 ST (Speech Translation) 配方
  • 提供完整且易用的命令行界面和脚本接口

thuml/Time-Series-Library

Stars: 1.8k License: MIT

TSlib 是一个开源库,用于深度学习研究,特别是深度时间序列分析。该库提供了一个整洁的代码基础来评估先进的深度时间序列模型或开发自己的模型,并涵盖五个主流任务:长期和短期预测、插补、异常检测和分类。

  • 提供了一套完善的代码库
  • 支持多种任务 (长期/短期预测、插补、异常检测和分类)
  • 包含各类领先模型实现
相关推荐
GIOTTO情13 分钟前
媒介宣发的技术革命:Infoseek如何用AI重构企业传播全链路
大数据·人工智能·重构
阿里云大数据AI技术22 分钟前
云栖实录 | 从多模态数据到 Physical AI,PAI 助力客户快速启动 Physical AI 实践
人工智能
小关会打代码29 分钟前
计算机视觉进阶教学之颜色识别
人工智能·计算机视觉
IT小哥哥呀35 分钟前
基于深度学习的数字图像分类实验与分析
人工智能·深度学习·分类
机器之心1 小时前
VAE时代终结?谢赛宁团队「RAE」登场,表征自编码器或成DiT训练新基石
人工智能·openai
机器之心1 小时前
Sutton判定「LLM是死胡同」后,新访谈揭示AI困境
人工智能·openai
大模型真好玩1 小时前
低代码Agent开发框架使用指南(四)—Coze大模型和插件参数配置最佳实践
人工智能·agent·coze
jerryinwuhan1 小时前
基于大语言模型(LLM)的城市时间、空间与情感交织分析:面向智能城市的情感动态预测与空间优化
人工智能·语言模型·自然语言处理
落雪财神意1 小时前
股指10月想法
大数据·人工智能·金融·区块链·期股
中杯可乐多加冰1 小时前
无代码开发实践|基于业务流能力快速开发市场监管系统,实现投诉处理快速响应
人工智能·低代码