音视频

u0100681606 小时前
音视频
音频 ACC 的ADTS格式分析AAC(高级音频解码)音频格式: 是一种由mpeg-4标准定义的有损音频压缩格式。AAC格式分为2 种: ADIF(音频数据交换格式)和 ADTS (音频的传输流格式),ADIF只有一个统一的头,可以确定的找到这个音频数据的开始,必须得到所有的数据后才能解码,常用在磁盘文件中。ADTS则是每一帧都有头信息,可以在任意帧解码,它是一个有同步字的比特流,解码可以在这个流中任何位置开始。
xwz小王子9 小时前
人工智能·音视频
多视角视频扩散策略:一种三维时空-觉察视频动作模型26年4月来自中科院自动化所、中科院大学、中科第五纪公司(FiveAges)、清华、西交大、武汉大学和南京大学的论文“Multi-View Video Diffusion Policy: A 3D Spatio-Temporal-Aware Video Action Model”。
今夕资源网10 小时前
音视频·wallpaper·视频桌面·动态桌面·免费动态桌面·免费视频桌面·动态桌面软件
Lively Wallpaper动态壁纸软件 能将任何视频 网页或动画转换为动态桌面背景 github开源 免费Wallpaper Engine平替Lively Wallpaper动态壁纸软件 能将任何视频 网页或动画转换为动态桌面背景 github开源 免费Wallpaper Engine平替
Hommy8811 小时前
开源·github·音视频·剪映小助手
【开源剪映小助手】视频生成流程本项目提供了一个完整的云端视频生成解决方案,基于剪映专业版的自动化控制实现。系统支持草稿创建、素材添加、视频生成、状态查询和结果下载等全流程功能。通过异步任务队列管理和剪映自动化控制,实现了稳定的云端渲染服务。
Olivia0514051411 小时前
音视频
Voohu:音频变压器在广播级信号传输中的阻抗匹配与失真控制广播级音频设备(调音台、话筒前置放大器、功放)要求极低的失真、平坦的频率响应和高共模抑制。音频变压器用于平衡/非平衡转换、地环路隔离以及阻抗匹配。本文分析音频变压器的关键性能指标及其对音频质量的影响,并提供选型建议。
QQ154018285613 小时前
音视频·sss1700·对录线·音频对录方案·usb音频
USB音频对录方案,SSS1700对录线,鑫创3S1700芯片代理在直播、录音、双设备音频互传等场景中,稳定且高保真的USB音频对录方案至关重要,台湾鑫创(3S)SSS1700芯片凭借出色性能,成为该领域的主流核心方案。
lingx_gps14 小时前
开源·音视频·jt808·车载监控·车辆监控·jt1078·车辆定位
2026版:深度解析领新北斗(TracSeek)—— 基于JT808与JT1078协议的开源车载视频位置监控系统在智能交通与车联网技术飞速发展的 2026 年,如何构建一个高性能、高扩展性且符合行业标准的车载监控平台,依然是开发者关注的焦点。领新北斗(TracSeek) 作为一个深度集成国家部标协议的开源项目,为企业和开发者提供了一套成熟的闭环解决方案。
新缸中之脑15 小时前
音视频
用 Gemini TTS 生成音频故事我目前正在做一个关于语言学习的副项目。主要功能包括使用 AI 生成内容以及将文本转换为音频文件。为了存储音频文件,我还需要云存储。
重生之我在安卓搞音频16 小时前
android·音视频
二、Android 音频框架在该章节,主要解释 Android 官方提供的的音频框架图,以及针对 APPLICATION 的应用逻辑进行讲解— 以 AudioTrack 为例。
潜创微科技19 小时前
嵌入式硬件·音视频
IT6625 HDMI2.0 转双端口 MIPI CSI/DSI 高清转换芯片方案一、前言商业显示、AR/VR 设备、车载中控、嵌入式开发、教育互动、医疗影像等场景对 HDMI 转 MIPI 接口、4K@60Hz 高清无损转换、双路独立输出、低功耗稳定运行、HDCP 内容加密、长距离信号兼容的需求持续提升。部分传统多芯片方案存在架构复杂、画质损耗、兼容性差、开发周期长、BOM 成本较高等挑战。
珊瑚怪人20 小时前
音视频·视频·js·zlmediakit·视频流处理
分享一个Edge浏览器播放H265 RTSP流的问题,涉及到ZLMediaKit、WebRTC公司测试环境摄像头有五个,四个大华的,一个海康的,那一个海康的在edge浏览器上播放不了,在chrome浏览器上可以播放, 业务代码逻辑是这样的,这些摄像头都连接了一个硬盘录像机,然后一个后端服务会记录下有哪些流,然后前端可以调用接口查询,查询到在通过ZLMediaKit过滤拉取过来。
qcx2320 小时前
人工智能·ffmpeg·音视频
【AI Agent实战】 0 成本视频处理全流程:ffmpeg + whisper 实现去水印、双语字幕、品牌片尾 | 实战SOP不用 Sora,不用剪映会员,不用任何视频生成大模型。一个 7 分 40 秒的英文教程视频,15 分钟完成:去水印 → 英文识别 → 中文翻译 → 双语字幕 → 品牌片尾替换 → 叮声音效合成。全程命令行。
huxiao_060120 小时前
ffmpeg·音视频
Windosw下VS 2022编译FFmpeg(支持x264、x265、fdk-acc)FFmpeg7.0 版本移除了 6.0 之前已弃用的 API,无法向下兼容。所以编译的版本选择FFmpeg 6.1.1。
F_D_Z21 小时前
数据挖掘·回归·音视频
Causal Forcing:自回归扩散蒸馏与高质量实时交互视频生成关键词:自回归扩散、因果注意力、ODE蒸馏、分布匹配蒸馏、流映射学习当前视频扩散模型面临的根本性矛盾在于生成质量与实时性之间的权衡:
骨子里的偏爱21 小时前
音视频
.raw后缀的文件转为jpg(压缩视频流转图片)1.单.raw后缀文件转为jpg2.批量.raw后缀文件转jpg
码云数智-园园21 小时前
前端·音视频·html5
告别Flash:HTML5音视频播放器实战指南随着Adobe Flash Player在2020年底正式停止支持,Web音视频播放领域迎来了根本性变革。HTML5的<video>和<audio>标签凭借其原生支持、跨平台兼容性和出色性能,已成为现代Web开发的标配。本文将通过实战案例,手把手教你如何利用HTML5打造功能完善的自定义播放器,并攻克常见的兼容性难题。
热爱专研AI的学妹1 天前
大数据·人工智能·阿里云·音视频
Seedance 2.0(即梦 2.0)深度解析:AI 视频正式迈入导演级精准可控时代2026 年 2 月 12 日,字节跳动 Seed 实验室正式推出 **Seedance 2.0(即梦 2.0)** 多模态音视频生成大模型。这款模型以统一多模态联合架构为基础,在运动稳定性、角色一致性、多镜头叙事能力与音画同步效果上实现全面升级,是当前国内接近工业级视频生产标准的 AI 视频模型之一。
byte轻骑兵1 天前
人工智能·音视频·语音识别·le audio·低功耗音频
从收音机到蓝牙:LE Audio核心BASS服务解析与实战在嵌入式蓝牙开发的赛道上,我们习惯了点对点的音频传输模式。从经典蓝牙的A2DP到BLE早期的音频尝试,设备之间始终绕不开配对、连接、主从角色这些固有流程。这种模式在个人聆听场景下运转良好,但当我们走进机场、博物馆,或是想和朋友共享同一首歌时,传统蓝牙的局限性便暴露无遗——一对多传输困难、多设备同步延迟高、低功耗设备持续扫描功耗过大。
大猫会长2 天前
前端·javascript·音视频
AudioContext给音频提高音量b站有些视频音量设为100%时,不够响,可以用AudioContext API进行突破限制/** * 带平滑过渡的增益控制 * @param {HTMLMediaElement} mediaElement - video/audio 元素 * @param {number} gainValue - 目标增益值 * @param {number} duration - 过渡时间(秒),默认 0.1秒 */ async function adjustMediaGainSmooth(mediaElement,