技术栈
音视频
智算菩萨
1 小时前
架构
·
音视频
2025年Sora类视频生成模型架构剖析:时空编码与扩散机制
目录1 引言2 综述相关工作3 基础知识与原理3.1 扩散模型的基本数学框架3.2 潜空间扩散与 3D VAE
Hello.Reader
2 小时前
golang
·
ffmpeg
·
音视频
·
m3u8
用纯 Go 实现一个 AES-128 加密 m3u8 视频下载器(不依赖 ffmpeg)
HLS 的核心思想很简单:典型的 m3u8 大概长这样:对于加密的流,关键就是这行:它说明了:只要我们能拿到:
EasyCVR
3 小时前
音视频
安防监控EasyCVR视频汇聚平台RTSP流播放异常的原因排查
近期,我们接到用户反馈,某个通过EasyCVR平台接入的RTSP流在之前一直能够正常播放,但近期突然出现无法播放的问题。虽然平台界面显示该通道为在线或可接入状态,但实际无法获取视频数据进行播放。针对这一情况,我们立即展开排查,并定位到问题的关键所在。
DisonTangor
3 小时前
人工智能
·
语言模型
·
开源
·
aigc
·
音视频
Step-Audio-R1 首个成功实现测试时计算扩展的音频语言模型
Step-Audio-R1 是首个成功实现测试时计算扩展的音频语言模型。它彻底解决了困扰现有模型的"逆向扩展"异常现象——即性能会随着推理链延长而反常下降的问题。
音视频牛哥
5 小时前
人工智能
·
音视频
·
音视频开发
·
http-flv播放器
·
https-flv播放器
·
ws-flv播放器
·
wss-flv播放器
从低延迟到高可用:RTMP与 HTTP/HTTPS-FLV在App播放体系中的角色重构
在大牛直播SDK(SmartMediakit)的播放器体系中,RTMP 一直是“低延迟播放”的代名词:毫秒级首屏、百毫秒级端到端时延,让它在实时互动、工业视觉、无人机回传等场景中长期占据主导位置。
Hommy88
5 小时前
aigc
·
音视频
·
批量剪辑
·
剪映
如何利用剪映小助手实现视频批量剪辑?
剪映小助手(CapCut Mate)是一个帮助您批量处理视频剪辑的工具,通过简单的接口调用,您可以快速创建多个视频草稿、添加各类素材并批量生成视频,大大提高视频制作效率。
EasyGBS
5 小时前
音视频
EasyGBS新版本(v3.7.168)发布!视频能力再度升级!
EasyGBS平台近日迎来版本大更新(v3.7.168)。本次迭代聚焦功能拓展与体验优化,新增音频转码、推流插件及RTC设备接入能力,同时优化核心交互逻辑,移除冗余功能,进一步提升平台在安防监控、直播分发等场景的适配性与稳定性。以下为详细更新解读:
私人珍藏库
6 小时前
音视频
[Android] 迅捷音频(2.9.00)
[Android] 迅捷音频(2.9.00) 链接:https://pan.xunlei.com/s/VOfTfwWg7tQXw3AlHpH9ZPQuA1?pwd=tvxs#
你好音视频
6 小时前
ffmpeg
·
音视频
RTSP推流:RTP包组装逻辑详解
本文档结合FFmpeg源代码,详细解释RTSP推流时如何将媒体数据组装成RTP包的完整流程。位置: libavformat/rtspenc.c:182
Likeadust
7 小时前
安全
·
音视频
视频直播点播平台EasyDSS构建安全高效的医疗培训直播新体系
随着医学技术的快速发展和医疗资源的分布不均,传统医疗培训模式面临着时间、空间和经济成本的多重挑战。本文将深入探讨视频直播点播平台EasyDSS在医疗培训场景中的创新应用,展示如何通过该技术解决方案构建安全、高效、可溯源的远程医学教育体系,推动优质医疗教育资源的下沉和共享。
CV炼丹术
7 小时前
音视频
告别注意力机制?MamEVSR:基于状态空间模型的事件视频超分新范式
点击原文链接,查看更多图像超分辨率顶会顶刊论文视频超分辨率(Video Super-Resolution, VSR)的目标是从低分辨率视频中恢复出高分辨率画面,广泛应用于监控、高清电视等领域。
酷柚易汛智推官
7 小时前
aigc
·
音视频
·
酷柚易汛
从清影2.0看AIGC视频未来:技术、生态与可持续产业价值的竞争逻辑
当“一句话生成高清视频”从科幻场景走进日常创作,AIGC视频工具的发展已跨过技术炫技的初级阶段,迈入“全民可用、产业适配”的关键转折期。智谱AI推出的清影2.0,以1080P高清输出、中文语义精准理解、视听一体生成等核心优势,不仅刷新了大众对AI创作工具的认知,更凭借灵活的商业化模式,为AIGC技术从实验室走向产业场景提供了清晰范本。在内容生产效率革命与行业降本增效需求的双重驱动下,清影2.0的发布,恰似一面镜子,照见了AIGC视频工具的当下价值与未来方向。
pu_taoc
8 小时前
c语言
·
c++
·
ffmpeg
·
音视频
ffmpeg实战2-从MP4文件提取 音频和视频
通过的mp4文件一般都是由 音频:AAC 视频:H264 组成可以通过mediainfo这款软件进行查看
python百炼成钢
8 小时前
android
·
linux
·
音视频
49.Linux音频驱动
一款音频芯片都具有ADC和DAC的功能,也就是专用的音频编解码芯片衡量指标:采样率 采样位数扬声器采样率:
OpenCSG
8 小时前
人工智能
·
音视频
13.6B参数铸就“世界模型”,美团LongCat-Video实现5分钟原生视频生成,定义AI视频新标杆
近日,美团发布了一款名为LongCat-Video的AI视频生成模型,以其原生支持5分钟720p长视频生成的能力,迅速在行业内引起广泛关注。
Blossom.118
8 小时前
人工智能
·
深度学习
·
学习
·
决策树
·
搜索引擎
·
stable diffusion
·
音视频
基于扩散模型的视频生成优化:从Stable Diffusion到AnimateDiff的显存革命
摘要:在24GB显存上跑Stable Diffusion Video直接OOM?我花了三周时间,通过分离时空注意力、切片VAE解码和量化感知LoRA,在单张4090上实现了2048帧长视频生成,显存占用从37GB降至14GB,推理速度提升4.8倍。核心创新是将时间模块和空间模块解耦训练,配合梯度检查点的"时间换空间"策略。附完整可运行代码和ComfyUI插件,直接复用至生产级视频生成平台。
summerkissyou1987
8 小时前
android
·
音视频
audio-audioflinger-应用音量到活跃流
好的,这是一个非常深入的问题。我们来详细分析 AudioFlinger 如何将应用设置的音量应用到活跃的音频流上。
赖small强
8 小时前
图像处理
·
音视频
·
色度
·
对比度
·
饱和度
【音视频开发】深度解析图像处理核心概念:饱和度、色度与对比度
饱和度(Saturation)描述的是色彩的纯度或鲜艳程度。在 HSV (Hue, Saturation, Value) 色彩空间中,饱和度 S S S 的计算依赖于RGB通道中的最大值和最小值。
爱宇阳
9 小时前
ffmpeg
·
音视频
使用 PowerShell + ffmpeg 自动压缩视频(支持 CRF、无损、目标大小模式)
视频文件往往体积庞大,尤其是高分辨率或高码率的视频。如果你经常需要压缩视频以便存储、传输或分享,那么手动输入 ffmpeg 命令会很繁琐。本文将教你如何编写一个 PowerShell 自动化脚本,智能选择压缩参数,支持以下模式:
赖small强
1 天前
linux
·
音视频
·
v4l2
·
uvc
【音视频开发】Linux UVC (USB Video Class) 驱动框架深度解析
UVC (USB Video Class) 协议定义了视频流设备在 USB 总线上的标准行为,使得操作系统无需安装特定驱动即可支持摄像头等设备。