音视频

时空自由民.9 小时前
音视频
音视频图片压缩不一定“必须压缩”,但实际项目里,视频/图片经常需要压缩;音频看场景,很多时候可以不压缩。核心判断标准只有一个:
日取其半万世不竭10 小时前
云原生·eureka·音视频
PeerTube 部署指南:自建视频托管平台PeerTube 是一个去中心化的视频托管平台,基于 ActivityPub 协议,可以和 Mastodon 等 Fediverse 应用互联。你可以用它搭建自己的视频平台:存放课程视频、技术分享、私人录像,也可以开放给社区使用。视频托管在你自己的服务器,不受平台审查,没有广告算法推荐,播放体验完全自控。
luoqice10 小时前
音视频
FLV文件解析FLV(Flash Video)文件格式本质上是一个包含 Header(文件头) 和 Body(文件体) 的二进制文件。
byte轻骑兵12 小时前
人工智能·音视频·蓝牙·avrcp·音视频控制
【AVRCP】规范精讲[10]:链路管理器LM互操作规则与场景落地在蓝牙音视频远程控制的完整协议栈里,链路管理器LM是衔接底层基带与上层L2CAP的核心枢纽,负责物理链路的创建、资源调度、功耗管理与链路类型管控。很多开发者会把重心放在L2CAP通道、AVCTP指令这些上层逻辑,却很少关注LM层的互操作约束——而AVRCP对LM的要求看似极简,却是保证控制链路稳定、避免协议冲突的关键前提。
JK Chen13 小时前
python·whisper·音视频
faster_whisper,视频转文字,并生成字幕文件faster_whisper,视频转文字,并生成字幕文件(附带exe)使用说明:–model:选 tiny/base/small/medium/large(越大越准、越耗资源)。
Prannt1 天前
ai·音视频·语音识别
星朗智能语音——语音合成——上传文件配音作为一个重度小说迷加考研党,我平时手里攒了大量几十万字的TXT小说、专业课复习资料和长篇会议纪要。一直想把它们转成语音,在通勤或者闭目养神的时候听。
byte轻骑兵1 天前
人工智能·音视频·avrcp·音视频控制
【AVRCP】规范精讲[7]: 打通AVCTP互操作底层,吃透事务标签与分片规则在蓝牙音频/视频控制的整套链路里,AVRCP负责定义我们能用到的播放、暂停、切歌、媒体浏览等控制逻辑,而这些指令真正能在设备之间稳定跑通,全靠下层的AVCTP(Audio/Video Control Transport Protocol)托底。可以说,AVCTP就是AVRCP的传令通道,通道的指令匹配、传输分片、身份标识规则,直接决定两台蓝牙设备能不能正常互通、指令会不会乱序丢包。
EasyGBS1 天前
音视频
国标GB28181视频平台EasyGBS即将重磅新增WHIP推流功能!低延迟直播体验再升级在视频监控与互联网直播加速融合的今天,用户对实时性、交互性和设备兼容性的要求正在快速攀升。为进一步提升平台在安防监控、应急指挥、直播分发等场景下的适配能力,国标GB28181算法算力平台EasyGBS即将迎来重磅功能升级——新增WHIP推流功能!
jiejiejiejie_2 天前
flutter·音视频
Flutter for OpenHarmony 萌系实战合集:地图功能 + 音频播放一站式指南Flutter for OpenHarmony 萌系实战合集:地图功能 + 音频播放一站式指南 欢迎加入开源鸿蒙跨平台社区: https://openharmonycrossplatform.csdn.net 前言 在开源鸿蒙生态快速发展的当下,Flutter for OpenHarmony 作为高效的跨平台开发框架,打破了鸿蒙设备与其他平台的开发壁垒,让开发者仅用一套 Dart 代码,就能实现鸿蒙手机、平板等多设备的应用部署。对于新手开发者而言,地图展示、音频播放是移动端最常用的基础功能,也是入门跨平台
jbk33112 天前
人工智能·音视频·剪辑软件·剪映自动化软件
10分钟翻译一条视频,实现语音、字幕翻译后与画面同步对齐,视频翻译助手使用教程做视频翻译时,需要把视频中的声音、字幕进行翻译,但翻译后,由于不同语言的朗读速度不一样,导致翻译后的声音与原来的视频画面存在时间差,直接等比修改视频或者声音的速度,并不能把对应的画面与声音在时间结上同步对齐,如果人工一个个去调整,则非常费时间,也非常繁琐,还容易出错。
带娃的IT创业者2 天前
图像处理·音视频·工作流·davinci resolve·后期制作·视频调色·色彩管理
DaVinci Resolve – Photo:当视频调色之王,跨界“修图”,意味着什么?2025年6月,一条来自Blackmagic Design的消息在Hacker News上炸开了锅——748票的热度,让“DaVinci Resolve – Photo”瞬间成为技术圈、影视圈乃至独立开发者的焦点。对于很多初级开发者来说,DaVinci Resolve可能是个既熟悉又陌生的名字。熟悉,是因为它在影视后期领域几乎是“调色”的代名词;陌生,是因为它的核心工作流(节点式调色、非线性剪辑、Fusion特效合成)与传统的图片处理软件(如Photoshop、Lightroom)完全不同。
nashane2 天前
华为·音视频·harmonyos·harmonyos 5
HarmonyOS Video组件预览图片优化实践:告别黑屏,提升视频播放体验在HarmonyOS应用开发中,Video组件作为多媒体播放的核心控件,其用户体验直接影响着应用的整体质量。一个常见的痛点问题是:视频在开始播放前显示为黑色屏幕,直到用户点击播放并再次暂停后,才能看到视频内容。这种"黑屏等待"不仅影响视觉体验,还可能让用户误以为视频加载失败或内容不可用。
科研前沿2 天前
大数据·人工智能·科技·算法·音视频·空间计算
2026 数字孪生前沿科技:全景迭代报告 —— 镜像视界生成式孪生(Generative DT)技术白皮书数字孪生正经历第三代范式跃迁:从 1.0 “静态镜像复刻”、2.0 “数据驱动仿真”,迈入 3.0 “生成式可执行元神” 时代。镜像视界开创性融合3D Gaussian Splatting(3DGS) 与世界模型(World Model),推出生成式孪生(Generative DT),彻底重构数字孪生数据供给逻辑:单张照片 / 短视频→小时级自动生成高保真可编辑三维场景。
EasyDSS2 天前
音视频
私有化视频会议系统/视频高清直播点播EasyDSS一体化视频平台赋能各行业数字化高效协同远程协作、线上指挥、远程培训、跨地联动已成为各行业运营刚需,传统线下会面模式成本高、效率低,通用公有云会议又受限于安全与定制化不足,难以适配垂直行业的个性化业务场景。EasyDSS私有化视频会议系统聚焦行业实际应用痛点,集视频会议、直播、点播、可视化联动于一体,为政务、教育、集团企业等场景,提供量身定制的私有化视频通信解决方案。
科研前沿2 天前
大数据·人工智能·科技·算法·音视频·空间计算
镜像视界浙江科技有限公司的关键技术突破有哪些?镜像视界(浙江)科技有限公司作为国内数字孪生和视频孪生第一梯队核心技术拥有单位、国内数字孪生和视频孪生解决方案第一梯队企业及政企首选供应商,关键技术突破集中在底层底座、核心引擎两大维度,覆盖空间计算、实景映射、跨镜感知等核心领域,具体如下:
东方佑2 天前
音视频
VideoBlockTokenizer:视频色块语义token化器的设计与实现在数字视频处理领域,压缩技术一直是核心研究方向之一。传统视频编码标准(如H.264、HEVC)通过复杂的算法实现高压缩比,但其复杂度也相应较高。本文将介绍一种基于色块语义token化的轻量级视频压缩方案——VideoBlockTokenizer,它在图像色块token化的基础上增加了时间维度的压缩,实现了简洁而有效的视频表示。
Black蜡笔小新2 天前
音视频
国标GB28181之后,视频监控EasyCVR的下一个“统一战场”在哪里?2011年,GB28181的发布,结束了中国视频监控"七国八制"的混乱局面。历经2016版、2022版两次重大迭代,这一国标已成长为安防行业不可或缺的技术基石。但对于专业集成商而言,一个更深层的问题浮出水面:国标之后,下一个战场在哪里?
沃虎Chinty-032 天前
音视频
音频变压器选型与应用:三大核心功能深度解析本文围绕音频变压器的噪声隔离、阻抗匹配、信号平衡转换三大核心功能,结合工程实践,给出清晰的选型逻辑与避坑指南。
互联科技报2 天前
人工智能·矩阵·音视频
2026年第一季度短视频矩阵视频混剪头部工具市场动态深度解析2026年第一季度,中国短视频矩阵视频混剪工具市场迎来了前所未有的变革期。随着企业数字化转型加速,短视频矩阵运营从“可选配菜”升级为“必备主食”,市场对AI剪辑工具的需求呈现爆发式增长。在这个关键时间节点,三大头部工具——超级智剪、筷子混剪系统、超级编导,正通过不同的战略布局争夺市场份额。
Digitally2 天前
macos·音视频·ipad
如何将 iPad 上的视频无损传输到 Mac当您打算将 iPad 上的视频传输到 Mac 进行备份、编辑或在大屏幕上欣赏内容时,本指南将为您提供 6 种实用解决方案。即使您要传输的是一部较长的电影,也能轻松完成。更重要的是,某些方法还能在传输过程中保持视频分辨率。