音视频

jbk331111 小时前
音视频
开发了一个免费的批量视频语音字幕识别工具,核心点是可批量自动处理识别任务这个批量识别功能是免费的、无限制的、可批量使用的功能,可实现音频、视频文件语音识别转txt文本、srt字幕,主要是能批量执行识别任务,不用手动一个个去识别,这是与其他语音识别软件的最大的区别,而且可同时处理视频和音频文件,非常适合批量创作的公司和工作室。
Coovally AI模型快速验证14 小时前
人工智能·算法·yolo·计算机视觉·音视频·无人机
超越Sora的开源思路:如何用预训练组件高效训练你的视频扩散模型?(附训练代码)当我们开始思考3D数据或视频时,一个很自然的想法就是把它们视为一系列2D帧,然后通过简单地把时间作为额外维度来应用同样的模型。
weixin_4368040714 小时前
音视频
音频在线预览工具 - 输入URL即刻播放远程音频输入音频URL即可在线预览,无需下载。支持MP3、WAV、OGG等主流格式,快速验证音频链接有效性,适用于开发者、内容创作者及测试人员。
kaizq15 小时前
音视频·cherrystudio·fastmcp·streamablehttp·本地mcp流媒服务器
AI-MCP本地流媒音频服务器设计与CherryStudio部署应用咨询:用一个文件基于FastMcp库本地编码搭建简单MCP服务,实现选择并上传一个音频文件然后自动运行streamableHTTP流式播放,所有功能可以在浏览器窗口测试[可上传URL或本地实际音频文件,列出所有上传音频文件,可选择播放]。在Cherry Studio可视环境做MCP treamableHTTP部署与运行[举例说明如何上传文件并进行指定文件的播放]。
thinkMoreAndDoMore16 小时前
音视频
audioserviceandroid音频系统,分为两个部分:数据和控制(策略);这种划分方式可以扩展到任意软件系统。 数据:数据流从源(source)到目的(sink)的过程以及数据节点。audiotrack和audioflinger的主要职责就是与数据相关,当然也涉及一些音频控制。 控制:管理和修改数据链路/数据节点。audioservice和audiopolicy的主要职责与此相关。
TEL1892462247716 小时前
音视频·实时音视频·视频编解码
IT6517BFN:单芯片DisplayPort转VGA转换器,集成MCU该IT6517BFN是一款高性能单芯片DisplayPort转VGA转换器。结合DisplayPort接收器和三重DAC,IT6517BFN支持DisplayPort输入和VGA输出,通过转换功能实现。内置的 DisplayPort 接收器完全符合 DisplayPort 1.1a 规范。配备双通道HBR(高比特率)DisplayPort接收机,IT6517BFN支持最高至WUXGA和UXGA的VESA分辨率。此外,内置的三重DAC支持最多8位深色。
TEL1892462247717 小时前
音视频·实时音视频·视频编解码
IT6516BFN:单芯片DisplayPort转VGA转换器,集成MCU该IT6516BFN是一款高性能单芯片DisplayPort转VGA转换器。结合 DisplayPort 接收器和三重 DAC,IT6516BFN 支持通过转换功能实现 DisplayPort 输入和 VGA 输出。内置的 DisplayPort 接收器完全符合 DisplayPort 1.1a 规范。配备双通道HBR(高比特率)DisplayPort接收机,IT6516BFN支持最高至WUXGA和UXGA的VESA分辨率。此外,内置的三重DAC支持最多8位深度色彩。
Facechat17 小时前
音视频
视频混剪-WebCodecs导出视频BaseCut 技术博客第五篇。这篇是干货最多的一篇——怎么把编辑好的内容导出成 MP4 文件。先把导出流程画出来:
Facechat18 小时前
音视频
视频混剪-转场效果是怎么实现的BaseCut 技术博客第四篇。这篇聊转场——两个画面之间的淡入淡出、滑动、擦除是怎么做的。最简单的解释:让画面 A 逐渐变成画面 B。
weixin_436804071 天前
音视频
视频在线预览工具 - 输入URL即刻播放远程视频输入视频URL即可在线预览,无需下载。支持MP4、WebM等主流格式,快速验证视频链接有效性,适用于开发者、内容创作者及测试人员。
18538162800云罗20 小时前
线性代数·矩阵·音视频
2026 最新矩阵剪辑系统搭建教程(附完整可运行源码在自媒体、短视频运营场景中,批量处理多账号视频(矩阵剪辑)是提升效率的核心需求。本文将手把手教你搭建一套轻量级矩阵剪辑系统,基于 Python+FFmpeg 实现多视频批量剪辑、拼接、转码、加水印等核心功能,提供完整可运行源码,零基础也能快速部署。
Black蜡笔小新20 小时前
音视频
视频融合平台EasyCVR打造化工园区智能化监控管理系统应用方案化工园区作为危险化学品生产、储存、运输的核心载体,存在工艺复杂、易燃易爆有毒有害介质多、重大危险源集中等特点,安全防控压力巨大。传统的人工监控方式效率低下且容易出现疏漏,已经难以满足日益增长的安全管理需求。
二等饼干~za89866820 小时前
服务器·开发语言·php·音视频·ai-native
碰一碰发视频系统源码搭建部署技术分享碰一碰发视频系统通常指通过NFC(近场通信)或蓝牙等短距离通信技术触发视频传输的功能。系统需包含前端交互、通信协议、后端存储及视频分发模块。以下是关键技术与部署步骤。
geffen168820 小时前
线性代数·矩阵·音视频
GF-AUDIO9696音频矩阵核心特性AUDIO9696音频矩阵是一款支持 96进96出的大型音频矩阵切换器,具备高通道数、灵活路由、增益调节、静音功能及多种控制方式等特点,适用于大型音频系统、演出场所、会议中心等需要复杂音频信号管理的场景。格芬科技是音频矩阵源头厂家,支持OEMODM,以下是其核心特性与功能分析:
Facechat21 小时前
音视频
视频混剪-LeaferJS 贴纸系统的实现BaseCut 技术博客第六篇,也是最后一篇。这篇讲贴纸系统——怎么实现可拖拽、可缩放、可旋转的图片叠加。
REDcker21 小时前
前端·音视频·播放器·h265·解码·软解码
web 端 H265 软解码实现原理与使用说明处理过程:输出信息示例:处理过程:播放过程:状态回调:FFmpeg 在浏览器中运行时,使用 Emscripten 的 MEMFS(内存文件系统):
APIshop1 天前
爬虫·python·音视频
Python 爬虫获取「item_video」——淘宝商品主图视频全流程拆解下面把两条路线都给出「最小可运行」代码,并逐行拆解,方便你按业务场景二选一。登入开放平台→ 创建「网站应用」→ 审核通过拿到 AppKey / AppSecret
深耕AI1 天前
音视频
【给ESP32-S3配上好声音】音频“放大镜”MAX98357A大家好!作为电子爱好者或初入嵌入式音频领域的开发者,你是否遇到过这样的困扰:ESP32-S3、树莓派Pico等微控制器(MCU)明明能播放MP3、WAV音频,但直接接上耳机或扬声器,声音却像蚊子叫一样微弱?这时,你就需要一个关键的“放大镜”组件——音频功率放大器。
阿酷tony1 天前
音视频
企业视频私域做企业内训、企业课程平台企业视频私域平台主要分为两类:一类是私有视频托管平台,用于安全存储、管理和分发视频内容;另一类是私域直播平台,专注于为企业提供专属的直播服务。以下是常见平台示例:
TEL189246224771 天前
音视频·实时音视频·视频编解码
IT6569:单芯片四通道DisplayPort 1.4转HDMI 2.1转换器,带嵌入式MCU该IT6569FN是一款高性能单芯片DisplayPort转HDMI转换器。结合DisplayPort接收器和HDMI发射器,IT6569FN支持DisplayPort输入和HDMI输出的转换功能。