音视频

三十_A10 小时前
前端·音视频
前端技术分享:基于 Canvas 实现视频帧截取与下载方案在安防监控、视频点播或在线教育等业务场景中,用户常有“保存当前画面”的需求。例如:传统的实现方式可能依赖后端截图(FFmpeg),但这会带来网络延迟和服务器压力。实际上,利用浏览器原生的 Canvas API,前端完全可以独立、高效地完成这一任务。
地狱为王10 小时前
unity·游戏引擎·音视频·novasr
Unity使用NovaSR将沉闷的16kHz音频升频成清晰的48kHz音频原工程地址 https://github.com/ysharma3501/NovaSR.git NovaSR, a tiny 50kB audio upsampling model that upscales muffled 16khz audio into clear and crisp 48khz audio at speeds over 3500x realtime. Key benefits Speed: Can reach 3600x realtime speed on a single a10
Dreams°12310 小时前
算法·microsoft·ai·音视频
进阶实战:Wan2.2-T2V-A5B 实现可点击跳转的互动式教育视频互动式教育视频是网课/课堂教学的核心进阶需求,相比单向讲解视频,通过知识点讲解→提问引导→点击跳转解答的交互形式,能显著提升学生参与度和知识点吸收效率。
Coovally AI模型快速验证12 小时前
人工智能·计算机视觉·开源·音视频·无人机
YOLO26技术详解:原生NMS-Free架构设计与实现原理最近,计算机视觉领域再掀波澜!YOLO 家族最新成员——YOLO26横空出世,以“彻底移除NMS”为核心变革,开启了真正的端到端目标检测新时代。虽然官方论文尚未正式发布,但来自KIIT大学的深度分析报告已在arXiv上公开,详细剖析了这一颠覆性架构的设计哲学与技术实现。
郭涤生12 小时前
linux·音视频
高斯滤波从入门到精通高斯滤波是线性平滑滤波的核心算法,基于高斯分布(正态分布) 对信号邻域进行加权平均,核心特点是离中心越近权重越大,在平滑去噪的同时最大程度保留信号细节,是计算机视觉、信号处理、音视频开发中最基础且应用最广泛的滤波算法之一。
想你依然心痛16 小时前
人工智能·音视频·智能电视
AI 音效新征程:HunyuanVideo-Foley 视频配音实战这个社会是现实的,你没有实力的时候,人家首先看你外表。当你没有外表的时候,那就努力增强实力,当你既没外表既没实力的时候,人家只会跟你说:拜拜。
子夜江寒16 小时前
opencv·学习·计算机视觉·音视频
OpenCV 学习:文档扫描与视频运动检测与跟踪通过摄像头实时捕捉图像,自动检测文档轮廓,并进行透视变换将其矫正为正面视角。整个过程包含以下步骤:参数说明:
wgfhill16 小时前
新媒体运营·音视频·媒体·视频
面向自媒体工作者的视频搬运内容去重技术方案:智能抽帧降帧处理工具解析当前短视频多平台分发的技术挑战 在视频内容多平台分发的技术实践中,开发者与创作者常常面临同一内容被识别为重复的问题。主流内容平台的查重算法通常基于视频的底层数据结构进行分析,包括帧序列特征、时间轴信息和编码特征等。传统的内容修改方法(如裁剪、滤镜、水印等)往往只能改变表层特征,难以有效规避算法的深层检测。
智能相对论16 小时前
大数据·人工智能·音视频
Hilight开启公测:营销视频的“DeepSeek时刻”,来了文 | 智能相对论作者 | 叶远风AI正在改变一切。这其中,当各种视频大模型快速进化,在诸如营销这种与视频内容强关联的领域里,AI作为生产力已经不是新鲜概念。
hhcgchpspk17 小时前
python·程序人生·音视频·pygame
python实现音频淡入淡出功能要用到pygame库示例代码:如果不确定音频文件时长,可以用librosa库改进代码:这个代码还有些缺陷,比如淡出的时候会过早一点点结束音频导致结尾一部分音频播放不出来
Black蜡笔小新1 天前
网络·人工智能·音视频
视频汇聚平台EasyCVR打造校园消防智能监管新防线在智慧校园建设常态化推进的背景下,校园消防安全作为师生生命财产安全的核心屏障,始终是教育机构管理的重中之重。校园场景人员密集、区域复杂,传统消防监控模式普遍依赖人工巡检与独立烟感报警,存在预警延迟、监管盲区、响应滞后等突出问题,难以适配校园消防安全“早发现、早预警、早处置”的核心需求。
咕噜企业分发小米1 天前
云计算·音视频·腾讯云
腾讯云IM如何与第三方实时音频服务集成?腾讯云IM(即时通信)与第三方实时音频服务(如声网、即构、自研音频服务等)集成,核心思路是将IM作为信令通道,第三方音频服务负责音视频流传输。这种方案在技术上是完全可行的,但需要开发者自行处理信令协议、状态同步等逻辑。以下是完整的集成方案和关键实现步骤。
qwy7152292581632 天前
人工智能·opencv·音视频
3-用摄像头拍摄图像及视频在对图像进行操作的过程中,经常需要使用摄像头进行拍照和录制视频。使用 OpenCV 提供的 VideoCapture()函数、read()函数、imwrite()函数、VideoWriter()函数实现拍照和录制视频功能。
Hi202402172 天前
windows·音视频
Windows录制浏览器音视频你是否遇到过这样的情况?想保存一段精彩的在线课程、重要的视频会议,或者一段无法直接下载的流媒体内容。使用普通的屏幕录制软件时,却发现录制的视频没有声音,或者声音质量很差。这是因为Windows系统默认的录音方式(通过麦克风)无法直接捕获应用程序内部播放的音频。
Alaso_shuang2 天前
音视频
音视频入门基础知识视频包含图像(RGB)和音频(PCM),视频编码 AVC和HEVC,音频编码 AAC,然后复用成 MP4 等格式的视频
Knight_AL2 天前
java·ffmpeg·音视频
Java + FFmpeg 实现视频分片合并(生成 list.txt 自动合并)Java 调用 FFmpeg 生成用于合并的视频列表文件 list.txt,并执行合并命令生成最终视频。
纳祥科技2 天前
单片机·音视频
NX6802,4路音频DAC芯片,具备90dB 动态范围 -90 dB THD+NNX6802是一款立体声数模转换芯片,内含插值滤波器、multi-bit数模转换器、差分输出模拟滤波。NX6802支持大部分的音频数据格式。
恒星科通2 天前
运维·服务器·安全·音视频·广播·应急广播
校园广播系统:全场景校园音频解决方案校园广播系统是学校教学、管理、校园文化建设及应急保障的核心基础设施,覆盖教学授课、校园通知、上下课打铃、德育宣传、应急疏散、校园活动等全场景,按功能适配性可分为传统定压广播、智能数控广播、IP 网络广播三大类,目前IP 网络广播系统因灵活拓展、智能管控的特性,成为中小学、高校的主流选择。
深蕾半导体2 天前
人工智能·音视频·边缘计算
SL1680端侧多路推理解决方案:一颗芯片,驱动8路视频实时AI分析在视频智能化的浪潮中,多路并发、实时推理、低成本部署已成为行业核心需求。深蕾半导体推出的基于SL1680 AI SoC的端侧多路推理解决方案,为安防、零售、工业、家居等场景提供高性价比的智能视频分析能力。
咕噜企业分发小米2 天前
云计算·音视频·腾讯云
腾讯云im实时音频腾讯云IM(即时通信)本身不直接提供实时音频通话能力,但可以通过集成腾讯云实时音视频(TRTC)服务来实现实时音频功能。两者属于不同的产品体系,需要配合使用。以下是核心实现方案: