无损剪切音视频文件的跨平台工具: LosslessCut | 开源日报 0908

mifi/lossless-cut

Stars: 17.3k License: GPL-2.0

LosslessCut是一款跨平台的FFmpeg GUI工具,它可以对视频、音频和字幕等相关媒体文件进行快速无损操作。

该软件最主要的功能是无损剪切和裁剪音视频文件,可以使用它快速提取出好的部分并丢弃其余片段而不会损失质量,这非常适合用于处理从摄像机、GoPro或者无人机中获取到的大型视频文件以节省存储空间。此外它还能在不需要重新编码的情况下添加音乐或字幕轨道到视频中,所以速度非常快。

特点:

  • 支持多数格式的无损剪切
  • 实验性质功能:自动检测静默段(例如电视广告)
  • 重排任意顺序下的音视频段落
  • 流编辑处理
  • 将多个源组合到一个输出里 (比如给一个视频加上背景音乐)
  • 提取、编辑和移除各种类型轨道 (包括但不限于视频/音频/字幕/附件)
  • 快速批次流程 (注意:尚未有批量输出)
  • 无损重编码视频/音频到不同格式的文件中
  • 可以从视频中提取全分辨率快照,保存为JPEG/PNG格式(低或高质量)
  • 将一段时间范围内的帧导出为图像 (每n个帧、秒数、场景变化等)

bigcode-project/starcoder

Stars: 5.8k License: Apache-2.0

StarCoder 是一个基于源代码和自然语言文本训练的语言模型 (LM)。它的训练数据包括 80 多种不同编程语言以及从 GitHub 问题、提交记录和笔记中提取出来的文本。这个项目展示了该 LM 的能力概览。

以下是 StarCoder 项目的关键特性和核心优势:

  • 可用于完成函数实现或推断一行代码中后续字符
  • 基于 🤗's transformers 库,可以进行代码生成
  • 支持快速启动,并列举了安装步骤、使用方法等详细说明
  • 提供精调功能,可在具体下游任务上应用
  • 通过 PEFT 和 bitsandbytes 简化并高效地进行精调操作
  • 支持 Stack Exchange 数据集 fine-tuning,在指令方面表现良好
  • 评估工具 BigCode-Evaluation-Harness 对其衍生产品也有很好支持

请注意:在使用之前需要接受协议,并确保已登录 Hugging Face hub。此外,请参考 Readme 中给出的硬件要求信息。

bentoml/OpenLLM

Stars: 5.1k License: Apache-2.0

OpenLLM 是一个用于在生产环境中操作大型语言模型 (LLMs) 的开放平台。

主要功能:

  • 支持各种最先进的开源 LLMs,包括 StableLM、Falcon、Dolly 等。
  • 提供灵活的 API,可以通过 RESTful API 或 gRPC 进行服务,并支持 WebUI、CLI 和 Python/Javascript 客户端查询。
  • 可以自由构建 AI 应用程序,与 LangChain、BentoML 和 Hugging Face 无缝集成。
  • 简化部署流程,可自动生成 LLM 服务器 Docker 镜像或作为 Serverless 端点部署。

baichuan-inc/Baichuan-7B

Stars: 4.7k License: Apache-2.0

Baichuan-7B 是一个由百川智能开发的大规模预训练语言模型。该项目基于 Transformer 结构,使用了 70 亿参数,在约 1.2 万亿个 tokens 上进行了训练。这个开源项目支持中英双语,并且具有 4096 长度的上下文窗口。

以下是 Baichuan-7B 的关键特性和核心优势:

  • 在标准的中文和英文 benchmark (C-Eval/MMLU) 上取得同尺寸更好效果
  • 支持多领域学科评测数据集 C-Eval 和 Gaokao
  • 具备认知与问题解决相关任务能力评估 AGIEval 数据集

mosaicml/llm-foundry

Stars: 2.9k License: Apache-2.0

LLM Foundry 是一个用于训练 MosaicML 基础模型的代码库。它旨在提供易于使用、高效和灵活的功能,以便快速尝试最新技术。

以下是该项目的核心优势和关键特性:

  • 提供了各种模型、数据集、回调函数和实用工具等源代码。
  • 包含运行 LLM 工作负载所需的脚本。
  • 可将原始文本数据转换为 StreamingDataset 格式,并存储在 data_prep/ 目录下。
  • 支持从 125M 到 70B 参数范围内对 HuggingFace 和 MPT 模型进行训练或微调。
  • 可通过 benchmarking 文件夹中提供的工具评估培训吞吐量、MFU (Most Frequently Used) 等指标。
  • 能够将模型转换为 HuggingFace 或 ONNX 格式,并生成响应结果,位于 inference/ 目录下。

liou666/polyglot

Stars: 1.4k License: MIT

Polyglot是一款多平台的桌面端应用程序,旨在提供一个易于使用的语言练习平台,方便进行多语种的口语练习。它基于ChatGPT和Azure人工智能语言模型作为底层服务,并使用Vue3+TS技术栈构建。该项目具有以下特点:

  • 多国语言口语练习:内置了英文AI角色,其他非英文支持自定义。
  • 智能对话功能:基于chatGPT服务实现。
  • 支持暗黑模式、文字翻译等功能。
  • 用户可自定义配置Azure key、头像以及对话场景。

如果您想要提高外语水平或者掌握一门新的外语,那么这个开源项目将是一个不错的选择。

相关推荐
LCG元10 小时前
Vue.js组件开发-实现对视频预览
前端·vue.js·音视频
boonya12 小时前
Yearning开源MySQL SQL审核平台
数据库·mysql·开源
customer0813 小时前
【开源免费】基于SpringBoot+Vue.JS贸易行业crm系统(JAVA毕业设计)
java·vue.js·spring boot·后端·spring cloud·开源
DogDaoDao16 小时前
H266/VVC 量化编码中量化矩阵 QM 技术
音视频·视频编解码·h266·vvc·量化编码·vvenc·量化矩阵 qm
说私域17 小时前
私域流量池构建与转化策略:以开源链动2+1模式AI智能名片S2B2C商城小程序为例
大数据·人工智能·小程序·开源
有Li1 天前
2D 超声心动图视频到 3D 心脏形状重建的临床应用| 文献速递-医学影像人工智能进展
人工智能·3d·音视频
XuanRanDev1 天前
【音视频处理】FFmpeg for Windows 安装教程
windows·ffmpeg·音视频
亿坊电商1 天前
可以称之为“yyds”的物联网开源框架有哪几个?
物联网·开源
程序猿玖月柒1 天前
常见的多媒体框架(FFmpeg GStreamer DirectShow AVFoundation OpenMax)
ffmpeg·音视频·gstreamer·openmax·directshow·avfoundation
源代码杀手1 天前
【以音频软件FFmpeg为例】通过Python脚本将软件路径添加到Windows系统环境变量中的实现与原理分析
windows·python·音视频