音视频

月起星九7 小时前
ffmpeg·音视频
为什么ffmpeg进行视频合成有时长误差简单的图片拼接问题,规定了持续时长和转场,但会有零点几秒的误差。有个解释是:由于视频编码和帧率导致的误差:
湖南人爱科技有限公司21 小时前
android·python·php·音视频·爬山算法·raphp
RaPhp和Python某音最新bd-ticket-guard-client-data加密算法解析(视频评论)这是RaPHP代码是这python代码提示:只提供交流和学习,请无他使用!
却道天凉_好个秋1 天前
人工智能·opencv·音视频
OpenCV(四):视频采集与保存cv2.VideoCapture 是 OpenCV 中用于视频采集的核心对象。它抽象了视频输入源,无论是来自硬件摄像头、视频文件,还是网络流(如 IP 摄像机)。
苏打水com1 天前
前端·音视频
字节跳动前端业务:从「短视频交互」到「全球化适配」的技术挑战字节跳动的前端朋友聊起工作日常,他说最直观的感受是 “永远在解决新问题”—— 上午可能还在优化抖音的短视频加载速度,下午就要对接海外团队,处理 TikTok 在东南亚地区的多语言适配。这种 “业务多样性 + 技术高要求” 的组合,正是字节前端业务的核心特点,也让它成为很多前端开发者向往的技术阵地。
人工智能技术派1 天前
人工智能·语言模型·音视频
Qwen-Audio:一种新的大规模音频-语言模型现有的多任务语言模型主要关注特定类型的音频(如人类语音)或特定任务(如语音识别和字幕生成),限制了模型的通用性和交互能力。于是提出了一个新颖的音频-语言模型,该模型拥有通用音频理解模型的能力,结构图如下。
音视频牛哥2 天前
人工智能·音视频·大牛直播sdk·rtsp播放器·rtmp播放器·rtsp服务器·rtmp同屏推流
系统级超低延迟音视频直播模块时代:如何构建可控、可扩展的实时媒体底座在过去十余年里,实时音视频(Real-Time A/V)领域的SDK经历了从**“底层工具库时代”到“系统引擎时代”的演化。 最初的主流方案以 FFmpeg、WebRTC 等为代表,它们奠定了音视频编解码与网络传输的基础,但也让开发者不得不面对繁复的协议细节、内存管理、线程调度、跨平台适配等问题。这类通用型框架**功能强大,却更像“半成品”工具,需要高门槛的工程整合能力。
aqi002 天前
ffmpeg·音视频·直播·流媒体
FFmpeg开发笔记(八十一)FFmpeg代码对RTSP和RTMP的推流区别首先注意RTSP推流地址以“rtsp://”开头,且RTSP地址的默认端口号为8554。而RTMP推流地址以“rtmp://”开头,且RTMP地址的默认端口号为1935。 其次注意FFmpeg从6.1开始对RTMP协议做了增强支持,主要是支持HEVC、VP9和AV1等编码格式通过RTMP协议进行推流,所以建议将编译环境的FFmpeg版本升级到6.1或者更高版本。
却道天凉_好个秋2 天前
音视频·视频采集
音视频学习(六十八):视频采集原理视频采集(Video Capture) 是指从摄像头、采集卡、屏幕或其他视频信号源中获取原始视频数据帧(Raw Frame)的过程。
Gigavision2 天前
音视频
SCAMPS视频生理信号测量数据集官方链接:https://github.com/danmcduff/scampsdataset论文:https://arxiv.org/pdf/2206.04197
EasyDSS3 天前
音视频·无人机
互联网视频云平台EasyDSS无人机技术在烟火巡检场景中的的应用随着科技的飞速发展,无人机技术作为现代科技的杰出代表,已经渗透到社会生活的方方面面,新型技术的应用为提高消防安全管理水平、预防火灾事故以及提升应急救援效率提供了新的思路和工具。
千里马学框架3 天前
android·面试·智能手机·车载系统·音视频·安卓framework开发·audio
音频焦点学习之AudioFocusRequest.Builder类剖析什么是音频焦点 两个或两个以上的 Android 应用可同时向同一输出流播放音频,并且系统会将所有音频混合在一起。虽然这是一项出色的技术,但却会给用户带来很大的困扰。为了避免所有音乐应用同时播放,Android 引入了“音频焦点”的概念。一次只能有一个应用获得音频焦点。
奔跑吧邓邓子3 天前
c++·ffmpeg·实战·音视频
【C++实战(71)】解锁C++音视频开发:FFmpeg从入门到实战FFmpeg 是一个广泛使用的开源多媒体框架,它包含多个组件库,这些组件库各自承担着不同的功能,共同协作完成复杂的音视频处理任务。
骄傲的心别枯萎3 天前
linux·ffmpeg·音视频·视频编解码·rv1126
项目1:FFMPEG推流器讲解(一):FFMPEG重要结构体讲解本章节主要介绍FFMPEG的结构体,FFMPEG是音视频的瑞士军刀,它提供了一系列丰富的音视频处理接口。如:编码、解码、推流、滤镜等等。在我们这个项目里面,FFMPEG主要的作用是进行视频推流的功能,就是把RV1126编码的视频码流利用FFMPEG框架推送到流媒体服务器。
fl1768313 天前
qt·目标检测·音视频
基于pyqt5实现的视频抽帧工具源码+项目说明用于目标检测图片采集这是一个专为视频优化和剪辑设计的高级抽帧工具。本工具结合多种图像处理与分析算法,能够智能地识别并去除冗余或相似的视频帧,显著优化动画的动态效果,或为动漫 AMV/MAD 创作者提供更高效的补帧与素材处理方案。
MongoVIP4 天前
人工智能·音视频·ai工具使用
音频类AI工具扩展进入千音漫语操作界面,点击 “智能配音” 板块。将提前准备好的儿童故事文本,比如《小兔子找朋友》的内容粘贴到文本输入框中。文本内容如下:
IvanCodes4 天前
人工智能·开源·aigc·音视频
RTX 4090 加速国产 AIGC 视频生成:腾讯混元与阿里千问开源模型国产AIGC视频大模型正加速落地,RTX 4090凭借强大算力与大显存,成为本地部署腾讯混元、阿里通义万相等前沿视频生成模型的最佳选择,开启桌面级AI创作新时代。
骄傲的心别枯萎4 天前
linux·ffmpeg·音视频·视频编解码·rv1126
项目1:FFMPEG推流器讲解(二):FFMPEG输出模块初始化FFMPEG输出模块主要用于初始化音视频推流功能,确保RV1126的码流能够通过FFMPEG正常推送。该模块的初始化流程包含以下步骤:
reasonsummer6 天前
人工智能·音视频·通义万相
【办公类-117-01】20250924通义万相视频2.5——三个小人(幼儿作品动态化)
摸鱼仙人~6 天前
音视频
如何高效下载 YouTube 视频?实用工具推荐版权: 仅下载 Creative Commons 或 UP 主明示授权 内容。 商用前请双重确认 YouTube License。