音视频

kaixin_啊啊3 天前
音视频
突破限制:Melody远程音频管理新体验Melody以创新方式重塑音频资源管理——这款开源平台打破音乐平台壁垒,聚合多来源音源,实现从搜索到存储的全流程管理。支持Docker一键部署,兼容各种硬件设备,无论是低功耗开发板还是高性能服务器都能稳定运行。智能检测算法确保可用资源,为音乐爱好者打造专属的个人音频中心,让每首珍藏曲目都触手可及。多平台整合与本地存储结合,重新定义音频管理体验。
ai产品老杨3 天前
javascript·人工智能·开源·音视频·能源
解锁仓储智能调度、运输路径优化、数据实时追踪,全功能降本提效的智慧物流开源了AI 视频监控平台是一款融合高性能功能与轻量化操作的实时算法驱动型视频监控系统,其核心愿景在于深度破除不同芯片厂商间的技术壁垒,省去冗余重复的适配环节,最终达成芯片、算法与应用的全链路协同适配。这一创新性设计可直接将企业级应用的开发成本降低约 95%,为企业数字化监控转型提供高性价比选择。
MThinker3 天前
音视频·智能硬件·micropython·canmv·k230
02-Media-8-uvc_with_csc.py 使用硬件解码的USB摄像头(UVC)捕获视频并显示的程序uvc_with_csc.py 程序为前篇文章《02-Media-7-uvc.py 使用软件解码的USB摄像头(UVC)捕获视频并显示的程序》的姊妹篇,区别在于:uvc_with_csc.py使用了硬件解码。
向阳花开_miemie3 天前
学习·音视频
Android音频学习(十八)——混音流程在上一节有提到,音频数据会通过共享内存传到播放线程播放,如果是混音,则音频数据传入到MixerThread进行处理。当调用output打开输出流后会根据output_flag创建对应的播放线程。
清风6666663 天前
stm32·单片机·mongodb·毕业设计·音视频·课程设计
基于STM32的APP遥控视频水泵小车设计本设计题目为基于STM32的APP遥控视频水泵小车设计,系统以STM32单片机为核心,结合无线通信、视频采集及水泵控制技术,实现通过手机APP对小车进行远程遥控、视频监控及外设控制。该系统不仅可以实现小车的运动控制,还可以远程查看车载摄像头拍摄的视频,并控制水泵与LED灯的开关,适用于农业灌溉、实验教学及远程监控场景。
Cary丿Xin3 天前
音视频
Luma 视频生成 API 对接说明随着 AI 的应用变广,各类 AI 程序已逐渐普及。AI 已逐渐深入到人们的工作生活方方面面。而 AI 涉及的行业也越来越多,从最初的写作,到医疗教育,再到现在的视频。
奔跑吧 android4 天前
音视频·channel·audio·aosp·frame·period_size
【车载audio开发】【基础概念1】【音频基础概念通俗讲解】在 Android 的音频系统(AOSP 15 中)里,开发者经常会遇到一些“硬核”术语,比如 channel、sample rate、format、frame、period_size 等。刚接触时,这些名词很容易混淆。下面我们通过生活中的例子,把这些概念讲清楚。
小狮子安度因4 天前
ffmpeg·音视频
ffplay音频重采样⾳频重采样在 audio_decode_frame() 中实现, audio_decode_frame() 就是从⾳频frame队列中取出⼀个frame,按指定格式经过重采样后输出(解码不是在该函数进⾏)。
张晓~183399481214 天前
c语言·c++·人工智能·矩阵·c#·php·音视频
短视频矩阵源码-视频剪辑+AI智能体开发接入技术分享短视频矩阵源码通常包含视频批量剪辑、多平台分发、数据统计等功能模块。开发此类系统需要掌握视频处理框架如FFmpeg、OpenCV等核心技术。
GilgameshJSS4 天前
python·学习·音视频
【学习K230-例程23】GT6700-音频FFT柱状图B站视频在前面例程我们介绍了FFT(傅里叶变换)和音频的录制与播放实验,本次实验结合二者,通过将时域采集到的音频数据通过 FFT 为频域。   例程功能:获取耳机麦克风的音频数据作为时域数据输入 FFT 模块进行 FFT 得到频域数据后,计算频域数据各个频率点的幅值并在 LCD 上进行直观的图像显示。
Zero_to_zero12345 天前
人工智能·音视频
NVSpeech_170k 数据集音频提取处理先从 hugging face 上进行下载:https://huggingface.co/datasets/Hannie0813/NVSpeech170k,然后通过一下脚本提取音频和文本,方便后续处理。
东方佑5 天前
人工智能·音视频·语音识别
从音频到Token:构建原神角色语音识别模型的完整实践本文将带你从零实现一个基于音频Token化的角色语音识别系统,完整复现原神角色语音分类任务,包含数据处理、模型训练和推理全流程。
猫林老师5 天前
华为·音视频·harmonyos
HarmonyOS多媒体开发:音视频播放与录制全解析本文将全面介绍HarmonyOS 5(API 12)中的多媒体开发能力,重点讲解音视频播放与录制的实现原理、最佳实践和性能优化技巧。
max5006005 天前
图像处理·人工智能·深度学习·算法·音视频
使用OmniAvatar-14B模型实现照片和文字生成视频的完整指南随着人工智能技术的快速发展,文本到视频生成模型正成为多媒体创作领域的重要工具。OmniAvatar-14B作为一个先进的生成式AI模型,能够根据输入的照片和文字描述生成高质量的视频内容。本文将详细介绍如何在配备16G显存的Mini4设备上,使用Python语言本地部署和运行OmniAvatar-14B模型,实现从照片和文字生成视频的功能。
Antonio9155 天前
android·音视频
【音视频】Android NDK 与.so库适配32位和64位的本质是CPU通用寄存器(GPRs)的数据宽度,直接决定了CPU一次能处理的数据量、操作系统能力及软件兼容性,具体区别如下:
嘀咕博客5 天前
人工智能·3d·音视频·ai工具
Stable Virtual Camera:Stability AI等推出的AI模型 ,2D图像轻松转3D视频本文转载自:https://www.hello123.com/stable-virtual-camera
勘察加熊人5 天前
ffmpeg·音视频
ffmpeg切割音频ffmpeg切割音频我希望对指定音频切割,按照开始时间,结束时间,切割成新文件,自动保存,非常好用step1:
一条数据库5 天前
人工智能·音视频·语音识别
南京方言数据集|300小时高质量自然对话音频|专业录音棚采集|方言语音识别模型训练|情感计算研究|方言保护文化遗产数字化|语音情感识别|方言对话系统开发随着人工智能技术的快速发展,语音识别和自然语言处理领域对高质量方言数据的需求日益增长。南京方言作为江淮官话的重要分支,承载着丰富的地域文化和语言特色,在语言学研究和方言保护方面具有重要价值。本数据集精心采集了300小时的南京方言自然对话音频,不仅填补了当前南京话高质量语音数据的空白,更为方言研究、语音识别模型训练、情感计算等前沿领域提供了宝贵资源。这些数据通过专业录音棚采集,严格控制质量,确保方言纯正度和情感表达的自然性,能够有效支持各类语言技术研发和文化传承项目。
therese_100865 天前
音视频
音视频demo测试av_packet相关apihttps://gitee.com/flying-guy/c--practice/blob/master/ffmpeg/01-buffer/avpacket.c