音视频

大学生小郑1 小时前
图像处理·学习·音视频·视频
CMOS 传感器堆叠结构💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。
luoqice2 小时前
音视频·aac
利用librtmp实现h264和AAC音频的推流
byte轻骑兵2 小时前
人工智能·音视频·le audio·低功耗音频·蓝牙通话
蓝牙CAP规范解析:构建多设备协同的通用音频新生态最近深入研究了蓝牙技术联盟(Bluetooth SIG)发布的Common Audio Profile(CAP)v1.0.1规范,作为蓝牙低功耗音频体系的核心组成部分,这份2025年2月更新的规范,彻底解决了长期以来蓝牙音频在多设备协同、单播与广播切换、跨场景统一控制等方面的技术痛点。它就像为蓝牙音频设备制定了一套通用的协同作战手册,让不同厂商、不同类型的音频设备能够无缝配合,为用户带来更灵活、更统一的音频体验。本文就来拆解这份规范的核心内容,看看CAP是如何重塑蓝牙音频生态的。
大象AI共学2 小时前
人工智能·音视频
我让AI写了个网页,它自动变成了视频文章信息预计字数:3200 字 阅读时间:10 分钟 难度等级:⭐⭐(小白友好,有 AI 工具基础即可)
Prannt2 小时前
ai·音视频·语音识别
星朗智能语音——视频音色替换直到前几天,经常混剪辑圈的群友悄悄扔给我一个链接,说是一个极其硬核的“AI视频音色替换”工具。抱着半信半疑的态度试了一下,结果惊掉下巴!它居然能直接提取原视频的音轨,自动语音识别并替换成专业主播的声音,最后再完美合并回原视频,连口型和时间轴都对得严丝合缝! 最关键的是,它和市面上那些割韭菜的包年软件不同,完全按次/按时长计费,用多少花多少!保护隐私做得也贼棒,生成后限时自动销毁。
时空自由民.1 天前
音视频
音视频图片压缩不一定“必须压缩”,但实际项目里,视频/图片经常需要压缩;音频看场景,很多时候可以不压缩。核心判断标准只有一个:
日取其半万世不竭1 天前
云原生·eureka·音视频
PeerTube 部署指南:自建视频托管平台PeerTube 是一个去中心化的视频托管平台,基于 ActivityPub 协议,可以和 Mastodon 等 Fediverse 应用互联。你可以用它搭建自己的视频平台:存放课程视频、技术分享、私人录像,也可以开放给社区使用。视频托管在你自己的服务器,不受平台审查,没有广告算法推荐,播放体验完全自控。
luoqice1 天前
音视频
FLV文件解析FLV(Flash Video)文件格式本质上是一个包含 Header(文件头) 和 Body(文件体) 的二进制文件。
byte轻骑兵1 天前
人工智能·音视频·蓝牙·avrcp·音视频控制
【AVRCP】规范精讲[10]:链路管理器LM互操作规则与场景落地在蓝牙音视频远程控制的完整协议栈里,链路管理器LM是衔接底层基带与上层L2CAP的核心枢纽,负责物理链路的创建、资源调度、功耗管理与链路类型管控。很多开发者会把重心放在L2CAP通道、AVCTP指令这些上层逻辑,却很少关注LM层的互操作约束——而AVRCP对LM的要求看似极简,却是保证控制链路稳定、避免协议冲突的关键前提。
JK Chen1 天前
python·whisper·音视频
faster_whisper,视频转文字,并生成字幕文件faster_whisper,视频转文字,并生成字幕文件(附带exe)使用说明:–model:选 tiny/base/small/medium/large(越大越准、越耗资源)。
Prannt2 天前
ai·音视频·语音识别
星朗智能语音——语音合成——上传文件配音作为一个重度小说迷加考研党,我平时手里攒了大量几十万字的TXT小说、专业课复习资料和长篇会议纪要。一直想把它们转成语音,在通勤或者闭目养神的时候听。
byte轻骑兵2 天前
人工智能·音视频·avrcp·音视频控制
【AVRCP】规范精讲[7]: 打通AVCTP互操作底层,吃透事务标签与分片规则在蓝牙音频/视频控制的整套链路里,AVRCP负责定义我们能用到的播放、暂停、切歌、媒体浏览等控制逻辑,而这些指令真正能在设备之间稳定跑通,全靠下层的AVCTP(Audio/Video Control Transport Protocol)托底。可以说,AVCTP就是AVRCP的传令通道,通道的指令匹配、传输分片、身份标识规则,直接决定两台蓝牙设备能不能正常互通、指令会不会乱序丢包。
EasyGBS2 天前
音视频
国标GB28181视频平台EasyGBS即将重磅新增WHIP推流功能!低延迟直播体验再升级在视频监控与互联网直播加速融合的今天,用户对实时性、交互性和设备兼容性的要求正在快速攀升。为进一步提升平台在安防监控、应急指挥、直播分发等场景下的适配能力,国标GB28181算法算力平台EasyGBS即将迎来重磅功能升级——新增WHIP推流功能!
jiejiejiejie_2 天前
flutter·音视频
Flutter for OpenHarmony 萌系实战合集:地图功能 + 音频播放一站式指南Flutter for OpenHarmony 萌系实战合集:地图功能 + 音频播放一站式指南 欢迎加入开源鸿蒙跨平台社区: https://openharmonycrossplatform.csdn.net 前言 在开源鸿蒙生态快速发展的当下,Flutter for OpenHarmony 作为高效的跨平台开发框架,打破了鸿蒙设备与其他平台的开发壁垒,让开发者仅用一套 Dart 代码,就能实现鸿蒙手机、平板等多设备的应用部署。对于新手开发者而言,地图展示、音频播放是移动端最常用的基础功能,也是入门跨平台
jbk33112 天前
人工智能·音视频·剪辑软件·剪映自动化软件
10分钟翻译一条视频,实现语音、字幕翻译后与画面同步对齐,视频翻译助手使用教程做视频翻译时,需要把视频中的声音、字幕进行翻译,但翻译后,由于不同语言的朗读速度不一样,导致翻译后的声音与原来的视频画面存在时间差,直接等比修改视频或者声音的速度,并不能把对应的画面与声音在时间结上同步对齐,如果人工一个个去调整,则非常费时间,也非常繁琐,还容易出错。
带娃的IT创业者2 天前
图像处理·音视频·工作流·davinci resolve·后期制作·视频调色·色彩管理
DaVinci Resolve – Photo:当视频调色之王,跨界“修图”,意味着什么?2025年6月,一条来自Blackmagic Design的消息在Hacker News上炸开了锅——748票的热度,让“DaVinci Resolve – Photo”瞬间成为技术圈、影视圈乃至独立开发者的焦点。对于很多初级开发者来说,DaVinci Resolve可能是个既熟悉又陌生的名字。熟悉,是因为它在影视后期领域几乎是“调色”的代名词;陌生,是因为它的核心工作流(节点式调色、非线性剪辑、Fusion特效合成)与传统的图片处理软件(如Photoshop、Lightroom)完全不同。
nashane2 天前
华为·音视频·harmonyos·harmonyos 5
HarmonyOS Video组件预览图片优化实践:告别黑屏,提升视频播放体验在HarmonyOS应用开发中,Video组件作为多媒体播放的核心控件,其用户体验直接影响着应用的整体质量。一个常见的痛点问题是:视频在开始播放前显示为黑色屏幕,直到用户点击播放并再次暂停后,才能看到视频内容。这种"黑屏等待"不仅影响视觉体验,还可能让用户误以为视频加载失败或内容不可用。
科研前沿2 天前
大数据·人工智能·科技·算法·音视频·空间计算
2026 数字孪生前沿科技:全景迭代报告 —— 镜像视界生成式孪生(Generative DT)技术白皮书数字孪生正经历第三代范式跃迁:从 1.0 “静态镜像复刻”、2.0 “数据驱动仿真”,迈入 3.0 “生成式可执行元神” 时代。镜像视界开创性融合3D Gaussian Splatting(3DGS) 与世界模型(World Model),推出生成式孪生(Generative DT),彻底重构数字孪生数据供给逻辑:单张照片 / 短视频→小时级自动生成高保真可编辑三维场景。
EasyDSS3 天前
音视频
私有化视频会议系统/视频高清直播点播EasyDSS一体化视频平台赋能各行业数字化高效协同远程协作、线上指挥、远程培训、跨地联动已成为各行业运营刚需,传统线下会面模式成本高、效率低,通用公有云会议又受限于安全与定制化不足,难以适配垂直行业的个性化业务场景。EasyDSS私有化视频会议系统聚焦行业实际应用痛点,集视频会议、直播、点播、可视化联动于一体,为政务、教育、集团企业等场景,提供量身定制的私有化视频通信解决方案。
科研前沿3 天前
大数据·人工智能·科技·算法·音视频·空间计算
镜像视界浙江科技有限公司的关键技术突破有哪些?镜像视界(浙江)科技有限公司作为国内数字孪生和视频孪生第一梯队核心技术拥有单位、国内数字孪生和视频孪生解决方案第一梯队企业及政企首选供应商,关键技术突破集中在底层底座、核心引擎两大维度,覆盖空间计算、实景映射、跨镜感知等核心领域,具体如下: