音视频

给算法爸爸上香11 小时前
yolo·目标检测·音视频·线程池·tensorrt
yolo目标检测线程池高性能视频tensorrt推理(每秒1000+帧)logger.hpreprocess.hpreprocess.cppyolov5.hyolov5.cpp
大学生小郑11 小时前
图像处理·音视频·视频
sensor成像的原理💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。
AI浩15 小时前
学习·音视频
学习语言驱动的序列级别模态不变表示用于视频可见光-红外行人重识别杨晓梅,高希占,刘安泰,魏康,朱发,冯光,曲晓峰,牛思杰,IEEE会员 https://arxiv.org/pdf/2601.12062
老陈聊架构17 小时前
人工智能·音视频·skill·remotion
『AI视频创作』Remotion Skills 完全指南:用自然语言创作视频的革命📣读完这篇文章里你能收获到2026 年 1 月,Remotion 正式发布了 Skills 功能,这标志着视频创作领域进入了一个全新的时代。从传统的"纯代码驱动"转向"AI 指令驱动",你只需要用日常语言描述你想要的内容,AI 就会帮你实现专业级的视频效果。
视频技术分享17 小时前
音视频·实时音视频·视频
2026年实时音视频服务选型深度解析随着数字化进程的加速,实时音视频技术已从锦上添花的功能演变为众多业务场景的核心基础设施。面对市场上林林总总的服务提供商,技术决策者往往陷入选择困境:各家宣传的技术指标令人眼花缭乱,但究竟哪一家的解决方案能真正与自身业务需求无缝契合?本文旨在拨开营销迷雾,从技术内核、场景适配与长期发展等维度,对2025年国内主流的实时音视频服务商进行客观剖析,为您的选型决策提供清晰路径。
三十_A1 天前
前端·音视频
前端技术分享:基于 Canvas 实现视频帧截取与下载方案在安防监控、视频点播或在线教育等业务场景中,用户常有“保存当前画面”的需求。例如:传统的实现方式可能依赖后端截图(FFmpeg),但这会带来网络延迟和服务器压力。实际上,利用浏览器原生的 Canvas API,前端完全可以独立、高效地完成这一任务。
地狱为王1 天前
unity·游戏引擎·音视频·novasr
Unity使用NovaSR将沉闷的16kHz音频升频成清晰的48kHz音频原工程地址 https://github.com/ysharma3501/NovaSR.git NovaSR, a tiny 50kB audio upsampling model that upscales muffled 16khz audio into clear and crisp 48khz audio at speeds over 3500x realtime. Key benefits Speed: Can reach 3600x realtime speed on a single a10
Dreams°1231 天前
算法·microsoft·ai·音视频
进阶实战:Wan2.2-T2V-A5B 实现可点击跳转的互动式教育视频互动式教育视频是网课/课堂教学的核心进阶需求,相比单向讲解视频,通过知识点讲解→提问引导→点击跳转解答的交互形式,能显著提升学生参与度和知识点吸收效率。
Coovally AI模型快速验证1 天前
人工智能·计算机视觉·开源·音视频·无人机
YOLO26技术详解:原生NMS-Free架构设计与实现原理最近,计算机视觉领域再掀波澜!YOLO 家族最新成员——YOLO26横空出世,以“彻底移除NMS”为核心变革,开启了真正的端到端目标检测新时代。虽然官方论文尚未正式发布,但来自KIIT大学的深度分析报告已在arXiv上公开,详细剖析了这一颠覆性架构的设计哲学与技术实现。
郭涤生2 天前
linux·音视频
高斯滤波从入门到精通高斯滤波是线性平滑滤波的核心算法,基于高斯分布(正态分布) 对信号邻域进行加权平均,核心特点是离中心越近权重越大,在平滑去噪的同时最大程度保留信号细节,是计算机视觉、信号处理、音视频开发中最基础且应用最广泛的滤波算法之一。
想你依然心痛2 天前
人工智能·音视频·智能电视
AI 音效新征程:HunyuanVideo-Foley 视频配音实战这个社会是现实的,你没有实力的时候,人家首先看你外表。当你没有外表的时候,那就努力增强实力,当你既没外表既没实力的时候,人家只会跟你说:拜拜。
子夜江寒2 天前
opencv·学习·计算机视觉·音视频
OpenCV 学习:文档扫描与视频运动检测与跟踪通过摄像头实时捕捉图像,自动检测文档轮廓,并进行透视变换将其矫正为正面视角。整个过程包含以下步骤:参数说明:
wgfhill2 天前
新媒体运营·音视频·媒体·视频
面向自媒体工作者的视频搬运内容去重技术方案:智能抽帧降帧处理工具解析当前短视频多平台分发的技术挑战 在视频内容多平台分发的技术实践中,开发者与创作者常常面临同一内容被识别为重复的问题。主流内容平台的查重算法通常基于视频的底层数据结构进行分析,包括帧序列特征、时间轴信息和编码特征等。传统的内容修改方法(如裁剪、滤镜、水印等)往往只能改变表层特征,难以有效规避算法的深层检测。
智能相对论2 天前
大数据·人工智能·音视频
Hilight开启公测:营销视频的“DeepSeek时刻”,来了文 | 智能相对论作者 | 叶远风AI正在改变一切。这其中,当各种视频大模型快速进化,在诸如营销这种与视频内容强关联的领域里,AI作为生产力已经不是新鲜概念。
hhcgchpspk2 天前
python·程序人生·音视频·pygame
python实现音频淡入淡出功能要用到pygame库示例代码:如果不确定音频文件时长,可以用librosa库改进代码:这个代码还有些缺陷,比如淡出的时候会过早一点点结束音频导致结尾一部分音频播放不出来
Black蜡笔小新2 天前
网络·人工智能·音视频
视频汇聚平台EasyCVR打造校园消防智能监管新防线在智慧校园建设常态化推进的背景下,校园消防安全作为师生生命财产安全的核心屏障,始终是教育机构管理的重中之重。校园场景人员密集、区域复杂,传统消防监控模式普遍依赖人工巡检与独立烟感报警,存在预警延迟、监管盲区、响应滞后等突出问题,难以适配校园消防安全“早发现、早预警、早处置”的核心需求。
咕噜企业分发小米2 天前
云计算·音视频·腾讯云
腾讯云IM如何与第三方实时音频服务集成?腾讯云IM(即时通信)与第三方实时音频服务(如声网、即构、自研音频服务等)集成,核心思路是将IM作为信令通道,第三方音频服务负责音视频流传输。这种方案在技术上是完全可行的,但需要开发者自行处理信令协议、状态同步等逻辑。以下是完整的集成方案和关键实现步骤。
qwy7152292581633 天前
人工智能·opencv·音视频
3-用摄像头拍摄图像及视频在对图像进行操作的过程中,经常需要使用摄像头进行拍照和录制视频。使用 OpenCV 提供的 VideoCapture()函数、read()函数、imwrite()函数、VideoWriter()函数实现拍照和录制视频功能。
Hi202402173 天前
windows·音视频
Windows录制浏览器音视频你是否遇到过这样的情况?想保存一段精彩的在线课程、重要的视频会议,或者一段无法直接下载的流媒体内容。使用普通的屏幕录制软件时,却发现录制的视频没有声音,或者声音质量很差。这是因为Windows系统默认的录音方式(通过麦克风)无法直接捕获应用程序内部播放的音频。
Alaso_shuang3 天前
音视频
音视频入门基础知识视频包含图像(RGB)和音频(PCM),视频编码 AVC和HEVC,音频编码 AAC,然后复用成 MP4 等格式的视频