开源日报 0822 | 语音识别与推理

这些项目包括 JavaScript 算法示例、系统编程语言 Rust、高性能的自动语音识别推理项目 Whisper.cpp 以及键盘工作者的单词记忆与英语肌肉记忆锻炼软件 Qwerty Learner。

trekhleb/javascript-algorithms

Stars: 174.1k License: MIT

这个项目是一个包含许多流行算法和数据结构的 JavaScript 示例。该项目提供了各种不同类型的数据结构,如链表、队列、栈等,并且还提供了各种常见的算法实现,如排序算法、搜索算法等。该项目具有以下核心优势:

  • 提供大量常用数据结构和算法的示例代码
  • 每个部分都有详细说明和进一步阅读链接
  • 适合学习和研究目的

rust-lang/rust

Stars: 84.5k License: NOASSERTION

Rust 是一种系统编程语言,它包含了编译器、标准库和文档。

  • Rust 具有内存安全性和并发性。
  • 它提供高级抽象的同时保持低级控制。
  • 支持模式匹配、所有权系统和生命周期检查等功能。

ggerganov/whisper.cpp

Stars: 22.2k License: MIT

whisper.cpp 是一个高性能的 OpenAI Whisper 自动语音识别 (ASR) 模型推理项目。它具有以下主要功能和核心优势:

  • 无依赖的纯 C/C++实现
  • 针对 Apple Silicon 进行了 ARM NEON、Accelerate 框架和 Core ML 的优化,成为首选平台
  • 支持 x86 体系结构上的 AVX 指令集以及 POWER 体系结构上的 VSX 指令集
  • 混合 F16/F32 精度支持
  • 支持 4 位和 5 位整数量化
  • 低内存使用 (Flash Attention)
  • 运行在 CPU 上,并部分支持 NVIDIA GPU;通过 cuBLAS 以及部分支持 OpenCL GPU; 通过 CLBlast 加速计算。

该项目还提供了丰富而全面的平台支持,包括 Mac OS、iOS、Android、Java 等多个操作系统/环境。

此外,whisper.cpp 还具有以下特点:

  • 轻量级模型实现:将整个模型实现压缩到 2 个源文件中,方便在不同平台和应用程序中轻松集成。
  • 提供示例代码:演示如何使用库进行样本音频转录以及从麦克风获取实时音频并进行转录。
  • 各种绑定可用:提供各种编程语言 (如 Rust、Javascript、Go 等) 下与 Whisper 交互的绑定。
  • 提供多个示例项目:包括命令行工具、语音助手应用程序以及在浏览器中运行 Whisper 等。

Kaiyiwing/qwerty-learner

Stars: 11.1k License: GPL-3.0

Qwerty Learner 是一个为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件。

  • 内置了常用的 CET-4、CET-6、GMAT、GRE 等多个词库,满足用户对单词记忆的需求。
  • 提供音标显示和发音功能,方便用户在背诵单词时同时学习读音和音标。
  • 支持默写模式,在完成练习后可以选择进行本章默写来巩固学习成果。
  • 显示输入速度和正确率,让用户感知自己技能提升情况。
相关推荐
GISer_Jing3 分钟前
神经网络初学总结(一)
人工智能·深度学习·神经网络
szxinmai主板定制专家11 分钟前
【国产NI替代】基于A7 FPGA+AI的16振动(16bits)终端PCIE数据采集板卡
人工智能·fpga开发
数据分析能量站1 小时前
神经网络-AlexNet
人工智能·深度学习·神经网络
Ven%1 小时前
如何修改pip全局缓存位置和全局安装包存放路径
人工智能·python·深度学习·缓存·自然语言处理·pip
szxinmai主板定制专家1 小时前
【NI国产替代】基于国产FPGA+全志T3的全国产16振动+2转速(24bits)高精度终端采集板卡
人工智能·fpga开发
YangJZ_ByteMaster1 小时前
EndtoEnd Object Detection with Transformers
人工智能·深度学习·目标检测·计算机视觉
Anlici1 小时前
模型训练与数据分析
人工智能·机器学习
余~~185381628002 小时前
NFC 碰一碰发视频源码搭建技术详解,支持OEM
开发语言·人工智能·python·音视频
唔皇万睡万万睡2 小时前
五子棋小游戏设计(Matlab)
人工智能·matlab·游戏程序
视觉语言导航2 小时前
AAAI-2024 | 大语言模型赋能导航决策!NavGPT:基于大模型显式推理的视觉语言导航
人工智能·具身智能