音视频

科研前沿11 小时前
大数据·人工智能·音视频
MatrixFusion™+ 云边端协同,百路视频全域融合实现零延时指令闭环镜像视界作为国内数字孪生与视频孪生第一梯队核心技术拥有单位,深耕空间计算领域,自主研发MatrixFusion™矩阵视频融合技术与定制化云边端协同架构,两者深度融合形成核心技术组合,成功突破百路视频全域融合与零延时指令闭环的行业技术瓶颈,为大型场景全域管控提供了高效、精准、实时的技术支撑,彰显了镜像视界在空间可视化与协同管控领域的技术引领地位。该技术组合已在镜像视界核心研发组全程参与并完成的2015年中国人民抗日战争暨世界反法西斯战争胜利70周年大庆、2017年联合国治沙会议、2018年上海合作组织青岛峰
key_3_feng12 小时前
音视频·workbuddy
《淡季》推歌视频创作全攻略:用Workbuddy打造治愈系情感短片在这个快节奏的时代,一首好歌往往能触动我们内心最柔软的地方。《淡季》就是这样一首充满诗意的作品,它用温柔的笔触描绘了爱情中那些"不说永远,只说此刻"的美好瞬间。作为创作者,我们不仅要聆听音乐,更要将这种情感通过视觉语言传递给更多人。
数据法师13 小时前
开源·音视频
HandBrake:开源跨平台视频转码工具完全指南面对多渠道搜集到的各种格式视频素材,播放器兼容性问题常令人困扰。HandBrake 这款免费、开源、跨平台的视频转码工具,基于 FFmpeg 核心,支持几乎所有常见格式的导入与转换,内置丰富预设,可一键完成转码压缩,彻底解决格式不兼容的难题。
开开心心就好18 小时前
人工智能·vscode·学习·游戏·音视频·语音识别·媒体
整合多家平台资源的免费学习应用软件介绍终身教育平台是国家开放大学推出的官方移动学习应用,主打支持全民终身学习。它覆盖生活技能、职场素养、兴趣爱好、职业技能、老年学习、学历继续教育等多个领域,还整合了软件通、爱奇艺知识、虎课网、喜马拉雅等多家优质平台资源,累计收录超50万门课程。
DogDaoDao18 小时前
音视频·视频编解码·hevc·h266·vvc·vtm·视频压缩
VVC 参考软件 VTM 全面深度解析:架构设计、核心算法与工程实践摘要:本文对 VVC(H.266)国际标准参考软件 VTM(VVC Test Model)v23.4 进行全面深度解析。从项目整体架构、模块组成,到帧内/帧间预测、变换量化、环路滤波、熵编码等核心技术模块,逐一剖析其算法原理与 C++ 实现。同时结合配置文件分析,揭示 VTM 在随机存取、全帧内、低延迟三大编码场景下的参数设定策略。适合视频编码研究者、工程师深入参考。
ZC跨境爬虫18 小时前
前端·css·笔记·ui·html·音视频
跟着 MDN 学 HTML day_13:多媒体嵌入 —— 视频与音频在早期的互联网时代,如果想要在网页中播放视频或音频,我们往往需要依赖第三方的浏览器插件,比如 Flash 或 Silverlight。然而,这些技术不仅带来了严重的安全隐患,而且在无障碍访问方面表现极差。随着 HTML5 标准的成熟,原生多媒体元素 video和 audio 彻底改变了这一局面。今天,我们就来深入学习如何使用这两个原生标签,安全、高效、兼容地在网页中嵌入音视频资源。
jinglong.zha2 天前
人工智能·ai·音视频·网赚教程·萌宠
AI萌宠短剧实战:从0孵化动物IP,用AI制作爆款短视频哲人言:道生一,一生二,二生三,三生万物。——《道德经》 创作者:查老师并不渣(CSDN)(一个在哲学与生活中寻找平衡的思考者😊)
大学生小郑2 天前
图像处理·学习·音视频·视频
CMOS 传感器堆叠结构💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。
luoqice2 天前
音视频·aac
利用librtmp实现h264和AAC音频的推流
byte轻骑兵2 天前
人工智能·音视频·le audio·低功耗音频·蓝牙通话
蓝牙CAP规范解析:构建多设备协同的通用音频新生态最近深入研究了蓝牙技术联盟(Bluetooth SIG)发布的Common Audio Profile(CAP)v1.0.1规范,作为蓝牙低功耗音频体系的核心组成部分,这份2025年2月更新的规范,彻底解决了长期以来蓝牙音频在多设备协同、单播与广播切换、跨场景统一控制等方面的技术痛点。它就像为蓝牙音频设备制定了一套通用的协同作战手册,让不同厂商、不同类型的音频设备能够无缝配合,为用户带来更灵活、更统一的音频体验。本文就来拆解这份规范的核心内容,看看CAP是如何重塑蓝牙音频生态的。
大象AI共学2 天前
人工智能·音视频
我让AI写了个网页,它自动变成了视频文章信息预计字数:3200 字 阅读时间:10 分钟 难度等级:⭐⭐(小白友好,有 AI 工具基础即可)
Prannt2 天前
ai·音视频·语音识别
星朗智能语音——视频音色替换直到前几天,经常混剪辑圈的群友悄悄扔给我一个链接,说是一个极其硬核的“AI视频音色替换”工具。抱着半信半疑的态度试了一下,结果惊掉下巴!它居然能直接提取原视频的音轨,自动语音识别并替换成专业主播的声音,最后再完美合并回原视频,连口型和时间轴都对得严丝合缝! 最关键的是,它和市面上那些割韭菜的包年软件不同,完全按次/按时长计费,用多少花多少!保护隐私做得也贼棒,生成后限时自动销毁。
时空自由民.3 天前
音视频
音视频图片压缩不一定“必须压缩”,但实际项目里,视频/图片经常需要压缩;音频看场景,很多时候可以不压缩。核心判断标准只有一个:
日取其半万世不竭3 天前
云原生·eureka·音视频
PeerTube 部署指南:自建视频托管平台PeerTube 是一个去中心化的视频托管平台,基于 ActivityPub 协议,可以和 Mastodon 等 Fediverse 应用互联。你可以用它搭建自己的视频平台:存放课程视频、技术分享、私人录像,也可以开放给社区使用。视频托管在你自己的服务器,不受平台审查,没有广告算法推荐,播放体验完全自控。
luoqice3 天前
音视频
FLV文件解析FLV(Flash Video)文件格式本质上是一个包含 Header(文件头) 和 Body(文件体) 的二进制文件。
byte轻骑兵3 天前
人工智能·音视频·蓝牙·avrcp·音视频控制
【AVRCP】规范精讲[10]:链路管理器LM互操作规则与场景落地在蓝牙音视频远程控制的完整协议栈里,链路管理器LM是衔接底层基带与上层L2CAP的核心枢纽,负责物理链路的创建、资源调度、功耗管理与链路类型管控。很多开发者会把重心放在L2CAP通道、AVCTP指令这些上层逻辑,却很少关注LM层的互操作约束——而AVRCP对LM的要求看似极简,却是保证控制链路稳定、避免协议冲突的关键前提。
JK Chen3 天前
python·whisper·音视频
faster_whisper,视频转文字,并生成字幕文件faster_whisper,视频转文字,并生成字幕文件(附带exe)使用说明:–model:选 tiny/base/small/medium/large(越大越准、越耗资源)。
Prannt4 天前
ai·音视频·语音识别
星朗智能语音——语音合成——上传文件配音作为一个重度小说迷加考研党,我平时手里攒了大量几十万字的TXT小说、专业课复习资料和长篇会议纪要。一直想把它们转成语音,在通勤或者闭目养神的时候听。
byte轻骑兵4 天前
人工智能·音视频·avrcp·音视频控制
【AVRCP】规范精讲[7]: 打通AVCTP互操作底层,吃透事务标签与分片规则在蓝牙音频/视频控制的整套链路里,AVRCP负责定义我们能用到的播放、暂停、切歌、媒体浏览等控制逻辑,而这些指令真正能在设备之间稳定跑通,全靠下层的AVCTP(Audio/Video Control Transport Protocol)托底。可以说,AVCTP就是AVRCP的传令通道,通道的指令匹配、传输分片、身份标识规则,直接决定两台蓝牙设备能不能正常互通、指令会不会乱序丢包。
EasyGBS4 天前
音视频
国标GB28181视频平台EasyGBS即将重磅新增WHIP推流功能!低延迟直播体验再升级在视频监控与互联网直播加速融合的今天,用户对实时性、交互性和设备兼容性的要求正在快速攀升。为进一步提升平台在安防监控、应急指挥、直播分发等场景下的适配能力,国标GB28181算法算力平台EasyGBS即将迎来重磅功能升级——新增WHIP推流功能!