音视频

AI+程序员在路上21 分钟前
c语言·c++·音视频
C及C++的音频库与视频库介绍在 C/C++ 开发中,处理音频和视频需要依赖专业的库来实现编解码、播放、录制、处理等功能。一.音频库(C/C++)
西西弗Sisyphus22 分钟前
音视频·wan·anytext2
Wan2.1 图生视频 支持批量生成flyfish综合效果实现基于 Wan2.1 模型的配置化批量生成功能,支持从prompt.json读取多个 “图像 - 文本提示” 组合(每个任务可关联多图像),通过config.json集中管理模型路径、分辨率、帧数、引导强度等参数,自动根据图像高宽比调整尺寸并适配模型输入要求,利用负向提示词优化生成质量,可批量输出独立视频文件,并提供模型加载时间、单任务耗时等性能统计,具备模块化架构、错误容错和多设备支持能力,适合高效生成多样化视频素材。
哔哩哔哩技术23 分钟前
人工智能·音视频
Index-AniSora技术升级开源:动漫视频生成强化学习B站升级动画视频生成模型Index-AniSora技术并开源,支持番剧、国创、漫改动画、VTuber、动画PV、鬼畜动画等多种二次元风格视频镜头一键生成!
白熊18823 分钟前
人工智能·chrome·计算机视觉·音视频
【图像大模型】Stable Video Diffusion:基于时空扩散模型的视频生成技术深度解析Stable Video Diffusion (SVD) 采用三层级联扩散架构实现图像到视频的生成,其数学表达为:
沉迷单车的追风少年26 分钟前
音视频
畅游Diffusion数字人(30):情绪化数字人视频生成畅游Diffusion数字人(0):专栏文章导航前言:仅从音频生成此类运动极具挑战性,因为它在音频和运动之间存在一对多的相关性。运动视频的情绪是多元化的选择,之前的工作很少考虑情绪化的数字人生成。今天解读一个最新的工作FLOAT,可以生成制定情绪化的数字人视频。
Everbrilliant8928 分钟前
音视频·h.265·视频编码速率控制·缓冲机制·速率控制技术·h.265/hevc速率控制·目标比特分配
音视频之H.265/HEVC速率控制H.265/HEVC系列文章:1、音视频之H.265/HEVC编码框架及编码视频格式2、音视频之H.265码流分析及解析
feiyangqingyun40 分钟前
c++·qt·音视频
Qt/C++编写音视频实时通话程序/画中画/设备热插拔/支持本地摄像头和桌面近期有客户提需求,需要在嵌入式板子上和电脑之间音视频通话,要求用Qt开发,可以用第三方的编解码组件,能少用就尽量少用,以便后期移植起来方便。如果换成5年前的知识储备,估计会采用纯网络通信收发图片和声音数据方式实现,比如用qcamera打开摄像头,转成图片,base64编码发送,接收到收到后base64解码成图片绘制,声音用qaudioinput采集后pcm数据直接tcp发送,收到后直接发给qaudiooutput设备播放即可。这种能不能实现效果呢,也是可以的,就是体验不大好友好,比如画面的流畅度要低不少,
EasyDSS1 小时前
人工智能·音视频
WebRTC技术EasyRTC音视频实时通话驱动智能摄像头迈向多场景应用在物联网蓬勃发展的当下,智能摄像头广泛应用于安防、家居、工业等领域。但传统智能摄像头存在视频传输延迟高、设备兼容性差、网络波动时传输不稳定等问题,难以满足用户对实时流畅交互视频的需求。EasyRTC凭借低延迟、高可靠、跨平台特性,为智能摄像头性能升级带来突破,助力打造优质高效的视频通信方案,拓展应用场景边界。
开开心心就好2 小时前
前端·python·pdf·ocr·音视频·tornado·dash
全能视频处理工具介绍说明软件介绍本文介绍的软件是FFmpeg小白助手,它是一款视频处理工具。使用便捷性这款FFmpeg小白助手无需安装,解压出来就能够直接投入使用。
穿山甲yyds3 小时前
ffmpeg·音视频
【windows】音视频处理工具-FFmpeg(合并/分离)FFmpeg是一个‌开源的跨平台音视频处理框架。法国计算机程序员 Fabrice Bellard 于 2000 年创建。
开开心心就好5 小时前
前端·python·pdf·ocr·硬件架构·音视频·材料工程
便捷的Office批量转PDF工具软件介绍本文介绍的软件是一款能实现Office批量转换的工具,名为五五Excel word批量转PDF。
爱吃涮毛肚的肥肥(暂时吃不了版)16 小时前
c++·qt·面试·职场和发展·音视频·腾讯会议
仿腾讯会议——音频服务器部分
Java搬砖组长19 小时前
音视频
小红书的视频怎么保存没有水印(方法分享)你是不是也经常在小红书上刷到超赞的旅行vlog、美妆教程或美食探店视频,想保存下来慢慢看,却发现下载后总有烦人的水印?别急!今天教你一招,3秒轻松保存无水印高清视频,简单又实用!
智联视频超融合平台20 小时前
运维·人工智能·网络协议·信息可视化·音视频·无人机
智慧赋能光伏运维——无人机巡检+地面监控双链路覆盖,打造光伏电站管理新标杆在全球能源转型浪潮下,光伏电站作为清洁能源的重要载体,其高效运维管理成为行业核心命题。然而,传统光伏电站运维存在覆盖范围广、设备分散、人工巡检效率低、故障响应慢等痛点。为破解这一难题,我们的「无人机巡检+地面监控双链路覆盖」解决方案,依托智能视频监控管理平台,实现全天候、无死角、高精度的电站管理,为光伏产业注入智慧化动能。
zanglengyu21 小时前
linux·音视频·rockchip
RK3568解码1080P视频时遇到系统崩溃内核挂掉的解决方案接上篇rk3568。实际使用 rock_mpp库硬解码时,会遇到解码1080P视频整个系统卡死,内核崩溃的问题。
非凡ghost1 天前
ffmpeg·音视频
Icecream Video Editor:简单易用的视频编辑软件,轻松打造专业视频Icecream Video Editor 是一款简单易用的视频编辑软件,专为希望快速、高效编辑视频的用户设计。它提供了丰富的功能,包括视频剪辑、效果应用、音频处理和视频导出,满足用户在不同场景下的需求。无论是视频新手还是有一定基础的创作者,Icecream Video Editor 都能帮助你轻松打造专业级的视频作品。
爱吃涮毛肚的肥肥(暂时吃不了版)1 天前
c++·算法·面试·职场和发展·音视频·腾讯会议
仿腾讯会议——添加音频使用的是对象ba,这样跨线程不会立刻回收,如果使用引用,跨线程会被直接回收掉,可能出现问题
phper81 天前
whisper·音视频·语音识别
开源音视频转文字工具:基于 Vosk 和 Whisper 的多语言语音识别项目随着短视频、播客等音视频内容的爆发式增长,快速将音视频内容转换为文字的需求也越来越大。无论是内容创作者需要的字幕,还是企业需要的会议记录,都需要一个可靠的语音转文字解决方案。
WSSWWWSSW1 天前
ffmpeg·音视频
ffmpeg转码后的视频有横条纹和彩虹横条等乱彩问题原因:ffmpeg安装的时,./configure 添加了–disable-asm参数,导致色彩异常。 **解决方法:**移除该参数–disable-asm。 注意:不加该参数可能提示no yasm或nasm等问题,解决该问题即可。大多是环境变量没有配置好。
AI360labs_atyun1 天前
人工智能·科技·ai·whisper·音视频·教育
使用 Whisper 生成视频字幕:从提取音频到批量处理生成视频字幕是许多视频处理任务的核心需求。本文将指导你使用 OpenAI 的 Whisper 模型为视频文件(如电视剧《Normal People》或电影《花样年华》)生成字幕(SRT 格式)。我们将从提取音频开始,逐步实现字幕生成,并提供一个 Python 脚本实现批量处理。此外,我们还将探讨如何处理非英语音频(如中文)并优化字幕质量。