音视频

500848 分钟前
flutter·架构·开源·wpf·音视频
Conv + BN + ReLU 融合:省掉两次显存读写卷积后面跟 BN,再跟 ReLU,这是 CNN 里最常见的三层组合。标准做法,这三个算子各跑各的:卷积算完把结果写回显存,BN 再把数据读出来做归一化,算完又写回去,ReLU 再读再写。
爱睡懒觉的焦糖玛奇朵2 小时前
人工智能·python·学习·yolo·音视频
【从视频到数据集:焦糖玛奇朵的魔法工具Video To YOLO Dataset】这个工具用于把视频文件夹转换成 YOLO 检测数据集,可作为 dataset_clean_tool.py 的前置工具。
神秘的摄影师4 小时前
音视频·媒体
2026年AE音乐素材下载网站TOP5评测——短视频与自媒体创作者专属指南2026年,短视频持续领跑互联网内容生态。《中国网络视听发展研究报告(2026)》显示,短视频是网民使用率超80%的主流应用中唯一保持用户规模和使用率双增长的品类,用户规模增至10.74亿,使用率达95.4%。网络视听用户人均单日使用时长达到201分钟,微短剧人均单日使用时长为129分钟,已超过长视频。
2601_957786775 小时前
矩阵·音视频·信号处理
短视频矩阵系统的信号处理密码:用奈奎斯特采样定理破解“限流“黑箱你有没有想过一个问题:同样一条视频,A账号发了500万播放,B账号发了500播放。内容一样、画质一样、甚至发布时间都一样——区别到底在哪?
若兰幽竹6 小时前
人工智能·python·音视频·抖音爆款分析
【大模型应用】抖音爆款视频深度分析系统:流水线式AI逆向拆解流量密码,精准预测播放量!你是否遇到这些问题?选题靠玄学,爆款靠运气;熬夜剪辑的视频只有500播放;不知道为什么爆,更不知道怎么复制……本系统通过AI大模型+算法逆向推演,8分钟解析任意抖音视频,输出S级/A级/B级/C级评级,预测播放量与卡点,提供可直接复制的SOP流程!
网管NO.17 小时前
音视频
视频核心技术 08:播放器原理与秒开优化 —— 首帧链路、缓冲策略与卡顿根治摘要:从点击播放到画面出现的几百毫秒里,播放器内部究竟干了什么?本文拆解播放器的三层流水线(解封装、解码、渲染),详解缓冲区的设计权衡,并聚焦“秒开”这个核心体验指标,从服务端、CDN、客户端三侧给出可直接落地的优化方案。读完你将能系统性地诊断卡顿与起播慢的问题。
searchforAI7 小时前
人工智能·学习·ai·aigc·powerpoint·音视频·贴图
视频画面里的PPT怎么提取?视频转图文讲义的实操教程技术大会的录播、公司内部培训的录像、B站上的干货教程……这些视频内容里,演讲者通常会配合PPT演示。但你作为观众,面临几个很现实的问题:
视频号下载助手8 小时前
音视频
2026实测可用!全网视频无水印保存完整操作方法日常浏览各大内容平台,总会遇到值得收藏、学习参考、用作剪辑素材的优质视频。受平台权限限制,很多视频无法直接本地保存,原生保存的素材也常会带有水印、画质压缩等问题。
广州灵眸科技有限公司9 小时前
开发语言·人工智能·深度学习·算法·yolo·音视频
瑞芯微(EASY EAI)RV1126B 音频电路主板引出了一组DSM音频接口和一组MIC差分输入接口。DSM 音频(Digital Signal Modulator)指的是将音频 PCM 数据进行直接比特流数字编码(Direct StreamDigital)转换输出的 1bit 信号流数据,在需要音频输出的设计中,接口输出的数字信号,经过一阶 RC 低通滤波处理后得到模拟音频信号输出。
孤舟簔笠翁9 小时前
音视频
音频均衡器(EQ)详解一,EQ的简介Audio equalizer filter (音频均衡器)常用的音效调节的一种滤波器。EQ是均衡器的缩写。它的基本作用是通过对声音某一个或多个频段进行增益或衰减,达到调整音色的目的。当然,EQ还有一个显著的功能,降噪。EQ通常包括如下参数:F(requency),频率――这是用于设定你要进行调整的频率点用的参数;G(ain),增益――用于调整在你设定好的F值上进行增益或衰减的参数;Q(uantize)――用于设定你要进行增益或衰减的频段 “宽度”。
jushi899910 小时前
音视频
网易爆米花 网盘视频聚合播放器 支持各大网盘、NAS挂载网易爆米花 网盘视频聚合播放器 支持各大网盘、NAS挂载 附600T光鸭网盘资源 “网易爆米花”是一款由网易推出的全能型智能媒体库播放器。它本身不提供视频,核心用途是帮你聚合网盘、NAS和本地硬盘中散落的影视资源,并通过强大的刮削功能,自动整理成带海报墙的精美私人影院。
MicroTech202510 小时前
科技·算法·音视频
微算法科技(NASDAQ :MLGO)发布基于NEQR技术的新型量子视频处理算法,重构智能视觉底层逻辑在经典计算领域,视频处理依赖庞大的数据运算与存储资源,尤其在高清视频、实时流媒体等场景中,传统算法面临算力瓶颈与能效限制。随着量子计算技术的突破,量子视频处理成为探索下一代计算范式的重要方向。量子态的叠加与纠缠特性为视频数据的并行处理提供了理论支持,而量子表示模型作为连接经典与量子计算的桥梁,直接影响算法的效率与可行性。微算法科技(NASDAQ :MLGO)提出的基于新型增强量子表示(NEQR)的量子视频处理算法,旨在通过量子化改造传统视频处理流程,突破经典计算在速度、精度与能效上的限制,为实时视频分析、
REDcker11 小时前
音视频·webrtc·实时音视频·webtransport
QUIC协议详解1本篇:QUIC 系列 ②/④ · QUIC协议详解1 · 系列总览见 QUIC协议系列导读QUIC 跑在 UDP 上,但逻辑单元是 Packet(包) 与 Frame(帧):一个 UDP datagram 可含一个或多个 QUIC 包,每个包内可叠多个帧。可靠传输靠 Packet Number(PN) 与 ACK Range 确认,丢包后 帧内容重封装进新 PN,而非 TCP 式原包重发。
K姐研究社20 小时前
人工智能·音视频
怎么用AI制作电商口播视频,开拍APP一键生成大家好,这里是K姐。一个帮助你把AI真正用起来的女子。最近有几位读者老师问我:想做自媒体,但是本职工作太忙,没时间剪辑怎么办?
txp玩Linux1 天前
人工智能·音视频
音频 AI 模型开源方案与音频 3A / ASR / TTS 全链路解析本文从工程师视角,对“音频 AI 模型开源方案与音频 3A / ASR / TTS 知识图谱”进行系统拆解。内容覆盖音频 AI 的核心版图、开源方案选型、音频 3A 原理、ASR 语音识别、TTS 语音合成、训练与部署流程、工程落地要点、应用产品形态与学习路线。
EasyDSS1 天前
音视频
私有化视频会议平台/视频高清直播点播EasyDSS构建智慧校园音视频协作新生态在教育数字化转型的关键阶段,智慧校园对音视频协作系统的需求,已从基础的远程沟通,升级为安全可控、体验流畅、管理智能的一体化解决方案。视频直播点播平台EasyDSS凭借技术创新与场景深耕,成为智慧校园建设的核心支撑,更通过功能迭代,全面适配教学、教研、管理全场景需求,筑牢校园数字化安全与体验双防线。
runafterhit1 天前
音视频
显示调研专题-OLED行业技术趋势分析报告个人针对显示领域进行专题调研,后续会展开一系列专题,用于锻炼信息收集分析逻辑,提升产品规划能力。系列分析:显示领域进行专题调研-总入口
灰灰勇闯IT1 天前
yolo·音视频
DVPP 视频预处理:YOLO 视频检测的瓶颈与解法图像推理预处理用 ops-cv + DVPP,延迟从 2.5ms 降到 0.55ms。换成视频流后情况变了——视频推理的预处理比单张图片复杂得多:解码 H.264 流、按帧解码、每帧做 Resize 和 Normalize。CPU 处理一帧视频解码 + 预处理可能花 5-10ms,推理本身才 2.8ms。
Luna-player1 天前
音视频
音频服务未运行,未安装音频设备,Windows 无法启动 Windows Audio 服务,错误 0x80070005:拒绝访问,本计算机无法播放音频适用于 Windows 11 系统:powershell这两条命令的作用是把 networkservice 和 localservice 这两个系统账户加入管理员组,修复你之前遇到的 “拒绝访问” 权限问题,从而解决 Windows Audio 服务无法启动的问题。
中小企业实战军师刘孙亮1 天前
架构·产品运营·音视频·制造·业界资讯
小微企业生存发展指南:从求稳到扩张的实战策略-佛山鼎策创局破局增长咨询于中国经济转型升级这般宏大的时代背景之下,小微企业恰似市场经济里极为细微但不可缺少的毛细血管,其生存及发展的问题受到了社会各界的高度留意,众多小微企业主在创业的初始进程中,往往会将全部的精力都投入至“求生存”里,比如不遗余力地维持企业的现金流,想方设法地获取基本客户群体,全力以赴地应对日常运营所带来的层层压力。