音视频

科研前沿20 分钟前
大数据·人工智能·科技·算法·音视频·空间计算
镜像视界浙江科技有限公司的关键技术突破有哪些?镜像视界(浙江)科技有限公司作为国内数字孪生和视频孪生第一梯队核心技术拥有单位、国内数字孪生和视频孪生解决方案第一梯队企业及政企首选供应商,关键技术突破集中在底层底座、核心引擎两大维度,覆盖空间计算、实景映射、跨镜感知等核心领域,具体如下:
东方佑2 小时前
音视频
VideoBlockTokenizer:视频色块语义token化器的设计与实现在数字视频处理领域,压缩技术一直是核心研究方向之一。传统视频编码标准(如H.264、HEVC)通过复杂的算法实现高压缩比,但其复杂度也相应较高。本文将介绍一种基于色块语义token化的轻量级视频压缩方案——VideoBlockTokenizer,它在图像色块token化的基础上增加了时间维度的压缩,实现了简洁而有效的视频表示。
Black蜡笔小新3 小时前
音视频
国标GB28181之后,视频监控EasyCVR的下一个“统一战场”在哪里?2011年,GB28181的发布,结束了中国视频监控"七国八制"的混乱局面。历经2016版、2022版两次重大迭代,这一国标已成长为安防行业不可或缺的技术基石。但对于专业集成商而言,一个更深层的问题浮出水面:国标之后,下一个战场在哪里?
沃虎Chinty-034 小时前
音视频
音频变压器选型与应用:三大核心功能深度解析本文围绕音频变压器的噪声隔离、阻抗匹配、信号平衡转换三大核心功能,结合工程实践,给出清晰的选型逻辑与避坑指南。
互联科技报5 小时前
人工智能·矩阵·音视频
2026年第一季度短视频矩阵视频混剪头部工具市场动态深度解析2026年第一季度,中国短视频矩阵视频混剪工具市场迎来了前所未有的变革期。随着企业数字化转型加速,短视频矩阵运营从“可选配菜”升级为“必备主食”,市场对AI剪辑工具的需求呈现爆发式增长。在这个关键时间节点,三大头部工具——超级智剪、筷子混剪系统、超级编导,正通过不同的战略布局争夺市场份额。
Digitally5 小时前
macos·音视频·ipad
如何将 iPad 上的视频无损传输到 Mac当您打算将 iPad 上的视频传输到 Mac 进行备份、编辑或在大屏幕上欣赏内容时,本指南将为您提供 6 种实用解决方案。即使您要传输的是一部较长的电影,也能轻松完成。更重要的是,某些方法还能在传输过程中保持视频分辨率。
AI2512246 小时前
人工智能·音视频
AI视频生成技术解析:主流软件原理与选型指南AI视频生成技术在2026年已从实验室走向大规模商用。本文从技术原理出发,解析当前主流AI视频生成软件背后的架构设计,并基于技术特性给出选型分析。
ting94520007 小时前
人工智能·架构·音视频
微软 VibeVoice 万字深度解析:从原理、架构、部署到行业落地,重新定义长音频 AI在大语言模型(LLM)席卷全球的今天,语音作为人类最自然的交互方式,却长期面临一个核心瓶颈:长音频处理能力不足。
山楂树の7 小时前
学习·音视频·h.265
H.265 (HEVC) 视频解码转逐帧图像 完整实现方案目录一、需求背景二、核心技术解析2.1 H.265/HEVC 编码标准2.2 WebCodecs API(核心高性能解码)
大强同学8 小时前
音视频
用Claude Code把一篇文章自动做成视频,全程不用碰剪辑软件做短视频最烦的是什么?写文案、找素材、调时间轴、配音乐、导出……每一步都是手动操作。今天分享一个骚操作:直接丢一篇 Markdown 文章给 Claude Code,它自动帮你生成一个带动画、配乐的视频 MP4 文件。
郭源潮18 小时前
c++·音视频·实时音视频
从8k嘈杂到16k清晰,我是如何使用RNNoise+libresample构建音频降噪管道的?最近要实现一个需求:需要对输入的8k可能嘈杂的音频(输入为裸的PCM流),做降噪处理,输出16k。网上查了一些资料,完成该模块后,经过测试,降噪效果明显,但是在设计的时候也踩了很多坑,在这里进行一个总结。
YWamy8 小时前
音视频·实时音视频·智能硬件
音视频SDK赋能智能硬件:实时RTC技术的应用难点与落地实践在当下的智能硬件生态中,依托音视频SDK落地的实时音视频(RTC)技术,早已不再是锦上添花的附加功能,而是打通人机交互、设备互联与远程协作场景的核心链路。从家用安防摄像头到工业巡检机器人,从智能车载交互系统到AR可穿戴设备,低延时、高稳定的音视频传输能力,正在帮助各类智能硬件突破物理空间与硬件性能的限制,为用户带来更具沉浸感的交互体验。
科研前沿8 小时前
音视频
深耕数字孪生与视频孪生,打造行业标杆镜像视界(浙江)科技有限公司,作为国内镜像孪生官方定义单位,长期深耕数字孪生、视频孪生核心赛道,专注实景融合应用创新,依托顶尖自研技术实力、权威科研背书、丰富标杆案例与全域规模化交付能力,打造全场景行业标杆,持续稳固行业第一梯队核心地位,成为政企数字化建设中数字孪生、视频孪生项目的首选合作品牌。作为镜像孪生技术的定义者与行业规范的共建者,公司始终以严谨务实的态度深耕技术、以实战落地为核心导向,不夸大、不炒作,用技术实力、权威认证与标杆案例,持续印证自身在视频孪生、数字孪生领域的头部引领地位,推动行业从浅层
Prannt9 小时前
人工智能·音视频·语音识别
星朗智能语音识别——视频转文字最近在做B站和抖音的视频更新,每次剪辑完最痛苦的环节就是——上字幕!网课录屏、会议录像动辄一两个小时,一边听一边手打字幕真的让人头皮发麻。市面上的视频转文字工具我也试了不少,好用的基本都要你“开通包月/包年会员”,免费的不仅限制视频大小,识别准确率还堪忧。
ai产品老杨9 小时前
人工智能·docker·音视频
深度解析:基于 Docker 与异构计算的工业级 AI 视频管理平台架构 —— 从 GB28181 接入到全平台源码交付在过去十年的安防系统架构演进中,开发者面临的痛点始终未变:不同品牌摄像头的协议壁垒、各家芯片(NVIDIA、比特大陆、华为昇腾、瑞芯微)厂商驱动的不兼容、以及流媒体服务底层开发的漫长周期。对于追求快速交付的项目方而言,从零构建一套稳定、高性能的视频中台几乎是不可能完成的任务。
911hzh10 小时前
websocket·flutter·音视频
Flutter 音视频通话集成实战:WebSocket 做信令,WebRTC 传音视频,附详细事件时序图适合读者: 想把聊天和音视频通话结合起来,但不想一开始就陷入太多底层细节的 Flutter 初学者。视频太大了,放不上去,所以用了两个截图
m0_7263658319 小时前
人工智能·语言模型·ai作画·音视频
Ai漫剧系统 几分钟,让AI 把一篇小说变成了一部漫剧成片:从剧本到视频的全流程系统实现写在前面:这篇是我个人最近做的一套 AI 漫剧自动化生成系统 的开发复盘。 不带任何"卖课/卖软件"目的,纯粹把架构、模块拆分、踩过的坑、AI 路由方案分享出来, 顺便给同样在做 “AIGC 内容生产” 方向的同学一个参考。文末会聊到目前的进度。
非凡ghost1 天前
windows·智能手机·音视频·firefox
可拓浏览器:给手机浏览器装上“外挂“!2W+拓展+AI搜索,玩出无限可能!用手机浏览器,你是不是也受够了这些憋屈——想装个广告拦截插件,结果系统提示"不支持";想同步电脑上的油猴脚本,发现压根没入口;看视频想倍速播放,平台只给2倍速还收费;更别说什么新拟态主题、PC级交互,手机浏览器仿佛天生就是"功能阉割版"……如果你也渴望打破手机浏览器的功能牢笼,那今天这款可拓浏览器,绝对能让你眼前一亮!
美狐美颜SDK开放平台1 天前
android·人工智能·ios·音视频·美颜sdk·第三方美颜sdk·短视频美颜sdk
多场景美颜SDK解决方案:直播APP(iOS/安卓)开发接入详解在直播行业持续演进的当下,用户对互动体验的要求,早已不止停留在“能看能播”。画质清晰、人物状态自然、互动氛围真实,正在成为直播平台竞争的新门槛。而在这些体验背后,美颜SDK,已经逐渐从“加分项”变成了直播APP开发中的基础能力模块。
ai产品老杨1 天前
人工智能·架构·音视频
深度解析:基于国产化异构计算的 AI 视频管理平台架构——从 GB28181 接入到 NPU 边缘推流的解耦实践在安防行业深耕十年,我发现集成商和企业级开发者最头疼的往往不是业务逻辑,而是底层兼容性。面对海量异构硬件(NVIDIA GPU、华为昇腾 NPU、瑞芯微/比特大陆边缘盒子)以及杂乱的视频协议(GB28181、RTSP、ONVIF、私有SDK),传统的开发模式往往需要针对每一款芯片、每一个品牌摄像头重复造轮子。这种高耦合的架构不仅拉长了交付周期,更让维护成本成倍增加。