音视频

Prannt8 小时前
ai·音视频·语音识别
星朗智能语音——语音合成——上传文件配音作为一个重度小说迷加考研党,我平时手里攒了大量几十万字的TXT小说、专业课复习资料和长篇会议纪要。一直想把它们转成语音,在通勤或者闭目养神的时候听。
byte轻骑兵8 小时前
人工智能·音视频·avrcp·音视频控制
【AVRCP】规范精讲[7]: 打通AVCTP互操作底层,吃透事务标签与分片规则在蓝牙音频/视频控制的整套链路里,AVRCP负责定义我们能用到的播放、暂停、切歌、媒体浏览等控制逻辑,而这些指令真正能在设备之间稳定跑通,全靠下层的AVCTP(Audio/Video Control Transport Protocol)托底。可以说,AVCTP就是AVRCP的传令通道,通道的指令匹配、传输分片、身份标识规则,直接决定两台蓝牙设备能不能正常互通、指令会不会乱序丢包。
EasyGBS9 小时前
音视频
国标GB28181视频平台EasyGBS即将重磅新增WHIP推流功能!低延迟直播体验再升级在视频监控与互联网直播加速融合的今天,用户对实时性、交互性和设备兼容性的要求正在快速攀升。为进一步提升平台在安防监控、应急指挥、直播分发等场景下的适配能力,国标GB28181算法算力平台EasyGBS即将迎来重磅功能升级——新增WHIP推流功能!
jiejiejiejie_11 小时前
flutter·音视频
Flutter for OpenHarmony 萌系实战合集:地图功能 + 音频播放一站式指南Flutter for OpenHarmony 萌系实战合集:地图功能 + 音频播放一站式指南 欢迎加入开源鸿蒙跨平台社区: https://openharmonycrossplatform.csdn.net 前言 在开源鸿蒙生态快速发展的当下,Flutter for OpenHarmony 作为高效的跨平台开发框架,打破了鸿蒙设备与其他平台的开发壁垒,让开发者仅用一套 Dart 代码,就能实现鸿蒙手机、平板等多设备的应用部署。对于新手开发者而言,地图展示、音频播放是移动端最常用的基础功能,也是入门跨平台
jbk331111 小时前
人工智能·音视频·剪辑软件·剪映自动化软件
10分钟翻译一条视频,实现语音、字幕翻译后与画面同步对齐,视频翻译助手使用教程做视频翻译时,需要把视频中的声音、字幕进行翻译,但翻译后,由于不同语言的朗读速度不一样,导致翻译后的声音与原来的视频画面存在时间差,直接等比修改视频或者声音的速度,并不能把对应的画面与声音在时间结上同步对齐,如果人工一个个去调整,则非常费时间,也非常繁琐,还容易出错。
带娃的IT创业者11 小时前
图像处理·音视频·工作流·davinci resolve·后期制作·视频调色·色彩管理
DaVinci Resolve – Photo:当视频调色之王,跨界“修图”,意味着什么?2025年6月,一条来自Blackmagic Design的消息在Hacker News上炸开了锅——748票的热度,让“DaVinci Resolve – Photo”瞬间成为技术圈、影视圈乃至独立开发者的焦点。对于很多初级开发者来说,DaVinci Resolve可能是个既熟悉又陌生的名字。熟悉,是因为它在影视后期领域几乎是“调色”的代名词;陌生,是因为它的核心工作流(节点式调色、非线性剪辑、Fusion特效合成)与传统的图片处理软件(如Photoshop、Lightroom)完全不同。
nashane19 小时前
华为·音视频·harmonyos·harmonyos 5
HarmonyOS Video组件预览图片优化实践:告别黑屏,提升视频播放体验在HarmonyOS应用开发中,Video组件作为多媒体播放的核心控件,其用户体验直接影响着应用的整体质量。一个常见的痛点问题是:视频在开始播放前显示为黑色屏幕,直到用户点击播放并再次暂停后,才能看到视频内容。这种"黑屏等待"不仅影响视觉体验,还可能让用户误以为视频加载失败或内容不可用。
科研前沿20 小时前
大数据·人工智能·科技·算法·音视频·空间计算
2026 数字孪生前沿科技:全景迭代报告 —— 镜像视界生成式孪生(Generative DT)技术白皮书数字孪生正经历第三代范式跃迁:从 1.0 “静态镜像复刻”、2.0 “数据驱动仿真”,迈入 3.0 “生成式可执行元神” 时代。镜像视界开创性融合3D Gaussian Splatting(3DGS) 与世界模型(World Model),推出生成式孪生(Generative DT),彻底重构数字孪生数据供给逻辑:单张照片 / 短视频→小时级自动生成高保真可编辑三维场景。
EasyDSS1 天前
音视频
私有化视频会议系统/视频高清直播点播EasyDSS一体化视频平台赋能各行业数字化高效协同远程协作、线上指挥、远程培训、跨地联动已成为各行业运营刚需,传统线下会面模式成本高、效率低,通用公有云会议又受限于安全与定制化不足,难以适配垂直行业的个性化业务场景。EasyDSS私有化视频会议系统聚焦行业实际应用痛点,集视频会议、直播、点播、可视化联动于一体,为政务、教育、集团企业等场景,提供量身定制的私有化视频通信解决方案。
科研前沿1 天前
大数据·人工智能·科技·算法·音视频·空间计算
镜像视界浙江科技有限公司的关键技术突破有哪些?镜像视界(浙江)科技有限公司作为国内数字孪生和视频孪生第一梯队核心技术拥有单位、国内数字孪生和视频孪生解决方案第一梯队企业及政企首选供应商,关键技术突破集中在底层底座、核心引擎两大维度,覆盖空间计算、实景映射、跨镜感知等核心领域,具体如下:
东方佑1 天前
音视频
VideoBlockTokenizer:视频色块语义token化器的设计与实现在数字视频处理领域,压缩技术一直是核心研究方向之一。传统视频编码标准(如H.264、HEVC)通过复杂的算法实现高压缩比,但其复杂度也相应较高。本文将介绍一种基于色块语义token化的轻量级视频压缩方案——VideoBlockTokenizer,它在图像色块token化的基础上增加了时间维度的压缩,实现了简洁而有效的视频表示。
Black蜡笔小新1 天前
音视频
国标GB28181之后,视频监控EasyCVR的下一个“统一战场”在哪里?2011年,GB28181的发布,结束了中国视频监控"七国八制"的混乱局面。历经2016版、2022版两次重大迭代,这一国标已成长为安防行业不可或缺的技术基石。但对于专业集成商而言,一个更深层的问题浮出水面:国标之后,下一个战场在哪里?
沃虎Chinty-031 天前
音视频
音频变压器选型与应用:三大核心功能深度解析本文围绕音频变压器的噪声隔离、阻抗匹配、信号平衡转换三大核心功能,结合工程实践,给出清晰的选型逻辑与避坑指南。
互联科技报1 天前
人工智能·矩阵·音视频
2026年第一季度短视频矩阵视频混剪头部工具市场动态深度解析2026年第一季度,中国短视频矩阵视频混剪工具市场迎来了前所未有的变革期。随着企业数字化转型加速,短视频矩阵运营从“可选配菜”升级为“必备主食”,市场对AI剪辑工具的需求呈现爆发式增长。在这个关键时间节点,三大头部工具——超级智剪、筷子混剪系统、超级编导,正通过不同的战略布局争夺市场份额。
Digitally1 天前
macos·音视频·ipad
如何将 iPad 上的视频无损传输到 Mac当您打算将 iPad 上的视频传输到 Mac 进行备份、编辑或在大屏幕上欣赏内容时,本指南将为您提供 6 种实用解决方案。即使您要传输的是一部较长的电影,也能轻松完成。更重要的是,某些方法还能在传输过程中保持视频分辨率。
AI2512241 天前
人工智能·音视频
AI视频生成技术解析:主流软件原理与选型指南AI视频生成技术在2026年已从实验室走向大规模商用。本文从技术原理出发,解析当前主流AI视频生成软件背后的架构设计,并基于技术特性给出选型分析。
ting94520001 天前
人工智能·架构·音视频
微软 VibeVoice 万字深度解析:从原理、架构、部署到行业落地,重新定义长音频 AI在大语言模型(LLM)席卷全球的今天,语音作为人类最自然的交互方式,却长期面临一个核心瓶颈:长音频处理能力不足。
山楂树の1 天前
学习·音视频·h.265
H.265 (HEVC) 视频解码转逐帧图像 完整实现方案目录一、需求背景二、核心技术解析2.1 H.265/HEVC 编码标准2.2 WebCodecs API(核心高性能解码)
大强同学1 天前
音视频
用Claude Code把一篇文章自动做成视频,全程不用碰剪辑软件做短视频最烦的是什么?写文案、找素材、调时间轴、配音乐、导出……每一步都是手动操作。今天分享一个骚操作:直接丢一篇 Markdown 文章给 Claude Code,它自动帮你生成一个带动画、配乐的视频 MP4 文件。
郭源潮11 天前
c++·音视频·实时音视频
从8k嘈杂到16k清晰,我是如何使用RNNoise+libresample构建音频降噪管道的?最近要实现一个需求:需要对输入的8k可能嘈杂的音频(输入为裸的PCM流),做降噪处理,输出16k。网上查了一些资料,完成该模块后,经过测试,降噪效果明显,但是在设计的时候也踩了很多坑,在这里进行一个总结。