音视频

Ghost Face...1 小时前
linux·chrome·音视频
Linux音频控制神器:amixer完全指南amixer 是 ALSA (Advanced Linux Sound Architecture) 的工具,用于控制音频设备的混音器设置。
八月的雨季 最後的冰吻1 小时前
ffmpeg·音视频
FFmepg--28- 滤镜处理 YUV 视频帧:实现上下镜像效果输入:768x320.yuv(YUV420P 格式,planar,无压缩) 输出:out_crop_vfilter.yuv(处理后的 YUV420P 帧) 处理逻辑: 将原始帧复制为两路; 第一路保持不变,作为主画面; 第二路裁剪出上半部分(高度 = 原高 / 2); 对裁剪结果进行垂直翻转(vflip); 将翻转后的图像叠加到主画面的下半区域(y = H/2); 输出合成帧。 最终效果:画面下半部分是上半部分的镜像(类似水面倒影)。
aqi003 小时前
android·ffmpeg·kotlin·音视频·直播·流媒体
FFmpeg开发笔记(九十二)基于Kotlin的开源Android推流器StreamPack《FFmpeg开发实战:从零基础到短视频上线》一书的“10.2 FFmpeg推流和拉流”提到直播行业存在RTSP和RTMP两种常见的流媒体协议。除此以外,还有于2017年推出的SRT协议,相比常见的RTMP协议,SRT协议具有更低的延迟,并且消除了卡帧、抖动等花屏现象。 因为SRT是个较新的直播协议,所以手机端支持SRT的开源框架比较稀有,比如本文介绍的StreamPack就是屈指可数的SRT开源推流APP。
Together_CZ4 小时前
人工智能·机器学习·音视频·spatial·cambrian-s·迈向视频中的空间超感知·supersensing
Cambrian-S: Towards Spatial Supersensing in Video——迈向视频中的空间超感知这篇文章的核心研究内容是探索如何推动多模态大语言模型(MLLM)在视频理解中的空间超感知能力(Spatial Supersensing),并提出了一个新的基准测试和模型框架来实现这一目标。以下是文章的主要研究内容和贡献的总结:
Android系统攻城狮4 小时前
音视频·android16·音频进阶
Android16音频之设置音频属性AudioTrack.Builder().setAudioAttributes:用法实例(一百一十九)简介: CSDN博客专家、《Android系统多媒体进阶实战》作者博主新书推荐:《Android系统多媒体进阶实战》🚀 Android Audio工程师专栏地址: Audio工程师进阶系列【原创干货持续更新中……】🚀 Android多媒体专栏地址: 多媒体系统工程师系列【原创干货持续更新中……】🚀 推荐1:AAOS车载系统+AOSP14系统攻城狮入门视频实战课 🚀 推荐2:Android14 Binder之HIDL与AIDL通信实战课 🚀 推荐3:Android15快速自定义与集成音效实战课 ?
空影星5 小时前
python·数据挖掘·数据分析·音视频
轻量日记神器RedNotebook,高效记录每一天** 功能: ** 一款轻量级的桌面日记/日志软件,支持日历视图写日记,可以插入标签、图片、链接和文件,支持文字加粗、斜体等格式,还能导出为 PDF、HTML、纯文本等格式,适合记录生活、工作笔记或灵感片段。
Black蜡笔小新5 小时前
安全·音视频
视频汇聚平台EasyCVR赋能石油管道计量站精准监控与安全管理在石油石化行业,管道输送是保障能源供给的生命线。而管道计量站作为这条生命线上的“贸易结算关口”与“安全监控节点”,其计量的准确性、数据的安全性与现场的可视化管控至关重要。本文将深入探讨视频汇聚平台EasyCVR如何通过其强大的多协议接入与融合能力,为石油管道计量站构建一个统一、智能、可信赖的视觉感知中枢。
马剑威(威哥爱编程)14 小时前
java·音视频·harmonyos
鸿蒙6开发视频播放器的屏幕方向适配问题大家好,我是 V 哥, 在鸿蒙6开发中,屏幕方向适配是提升用户体验的重要环节。下面我将通过一个完整的视频播放器示例,详细讲解ArkTS中横竖屏切换的实现方案。
万能的小裴同学19 小时前
android·音视频
Android M3U8视频播放器build.gradle(app)AndroidManifest.xmlListShow.javaMainActivity.java
音视频牛哥19 小时前
人工智能·计算机视觉·音视频·音视频开发·rtsp播放器·安卓rtsp服务器·安卓实现ipc功能
轻量级RTSP服务的工程化设计与应用:从移动端到边缘设备的实时媒体架构在实际的音视频系统中,RTSP 依然是设备端、行业端、AIoT 端最稳定、最普遍的实时视频协议之一。 与 WebRTC、RTMP、HTTP-FLV 这些偏“互联网直播分发”的协议不同,RTSP 更强调:
❀͜͡傀儡师19 小时前
docker·容器·音视频
Docker部署视频下载器1、yt-dlp简介 yt-dlp是一款免费开源的视频下载工具,支持从YouTube及其他数百个视频网站下载视频、音频和字幕。
EasyDSS1 天前
音视频·无人机
视频推流平台EasyDSS无人机推流技术打造大型安保巡逻监控新模式在大型体育赛事、重要峰会、公共庆典等大型活动的安保工作中,传统的地面固定监控与人力巡逻模式正面临巨大挑战:视野盲区多、机动性差、响应滞后、全局态势感知不足。如何实现“看得全、看得远、反应快”,成为安保指挥体系现代化的核心诉求。
2501_907136821 天前
ffmpeg·音视频·软件需求
开源视频批量处理工具FFmpeg Batch AV Converter核心功能与优势: 1. 全格式支持: 解码上百种音视频格式(含H.266/VVC等最新编码),支持4K超高清处理。 2. 批量处理: 多线程引擎可同时处理数千个文件,显著提升工作效率。 3. 进阶功能: 精准到帧的视频剪辑与多文件拼接。 字幕时间轴匹配(支持软/硬字幕)。 M3U8流媒体抓取与YouTube视频下载。 4. 跨平台运行: Windows原生支持,需.NET Framework 4.7.2及以上版本; Linux需配置Wine-Mono环境。 GitHub源代码:https://github
EasyCVR1 天前
音视频
从“看不见”到“看得清”:视频融合平台EasyCVR远程监控技术在沙尘暴交通监控中的应用沙尘暴天气不仅给民众日常生活带来诸多不便,更因其排放粉尘的不确定性与不连续性,给环保部门的环境监测工作以及交通管理部门的交通管控带来严峻挑战。极低的能见度,严重影响人们的安全出行,极大地增加了交通的管理难度。
七牛云行业应用1 天前
人工智能·音视频·ai视频
解决 AI 视频角色闪烁与时长限制:基于即梦/可灵的多模型 Pipeline 实战在 AIGC 领域,Text-to-Video(文生视频)一直被视为“抽卡游戏”。对于开发者和创作者而言,最大的痛点并非画质,而是“不可控”——角色闪烁、物理规律崩坏、时长受限。 近期,随着 B 站 UP 主 @黄浦江三文鱼 等人发布了长达 23 分钟的 AI 剧情长片,我们看到了解决这一问题的曙光。通过拆解这些工程级项目,我发现核心秘密不在于某个单一的“神级模型”,而在于一套模块化、分层治理的多模型协作 Workflow。 作为一名长期关注 AI 工程化的架构师,本文将跳出单纯的 Prompt 技巧,从
Tiger Shi1 天前
ffmpeg·音视频·obs
使用LIBOBS: 采集桌面,保存图片OBS Studio是个很全面的采集和直播开源软件,并且通过Libobs支持二次开发。不过缺点是文档太少,代码的例子也少,只有一个test。而项目本身功能很全,但代码量比较大,想全面了解需要花费不少时间。最近花了点时间编译出来,通过debug OBS Studio,大致掌握了一些开发要点,写了一个小demo。
别动哪条鱼1 天前
数据结构·ffmpeg·音视频
AVAudioFifoAVAudioFifo 是 FFmpeg 中专门为音频处理设计的先进先出(FIFO)缓冲区。它主要用于解决音频处理中常见的生产者-消费者速度不匹配问题。
八月的雨季 最後的冰吻1 天前
ffmpeg·音视频
FFmepg--27-两路音频混合这是一个使用FFmpeg库实现的音频混合器程序,它将两个输入音频文件混合成一个输出音频文件。混合使用了FFmpeg的filter功能,具体使用了amix滤镜,并设置了两个输入的权重。
CV实验室2 天前
人工智能·计算机视觉·3d·论文·音视频·视频生成
CV论文速递:覆盖视频生成与理解、3D视觉与运动迁移、多模态与跨模态智能、专用场景视觉技术等方向 (11.17-11.21)本周精选10篇CV领域前沿论文,覆盖视频生成与理解、3D视觉与运动迁移、多模态与跨模态智能、专用场景视觉技术等方向。全部300多篇论文已经整理好,感兴趣的自取!
FinelyYang2 天前
uni-app·音视频·webrtc
uniapp+unipush2.0+WebRTC实现h5一对一视频通话sendvideocall.vue,发起视频通话邀请。videocallrev.vue,接听通话页面。