音视频

REDcker14 小时前
服务器·后端·音视频·实时音视频·srs·流媒体·oryx
Oryx开发者快速入门精简版快速入门,只保留核心概念与上手步骤。Docker 进阶、端口与数据卷、架构与协议、AI 功能、API 等详见 Oryx完整文档.md。
REDcker15 小时前
服务器·后端·音视频·实时音视频·srs·流媒体·oryx
Oryx完整文档本文档整理自 Oryx(ossrs/oryx)官方文档与社区资料,便于本地查阅与二次整理。Oryx(原 SRS Stack)是一款一体化、开箱即用的开源视频解决方案,专为构建具备直播和 WebRTC 功能的在线视频服务而设计。Oryx 专为云部署或自托管环境构建,将多种强大技术整合到统一平台中,简化了视频流基础设施的搭建与管理。
美狐美颜SDK开放平台16 小时前
人工智能·音视频·美颜sdk·直播美颜sdk·视频美颜sdk
美颜sdk哈哈镜功能开发指南:从人脸识别到动态变形在短视频与直播盛行的今天,用户对“好看”和“好玩”的追求从未停止。从基础磨皮美白到实时贴纸、滤镜特效,再到近年来重新走红的“哈哈镜变形效果”,美颜技术正在从“美化”走向“趣味互动”。
小鹿软件办公17 小时前
音视频·音频比特率如何设置
音频比特率设置多少最好?320kbps 真的比 128kbps 好很多吗无论是听音乐、看视频、播客,还是进行语音通话、内容创作,我们几乎每天都在和音频打交道。而提到音频质量,比特率往往是绕不开的核心参数。那么,MP3 或其他常见音频格式的比特率到底设置为多少最合适?128kbps 够用吗?320kbps 真的无损吗?
大模型实验室Lab4AI17 小时前
人工智能·深度学习·算法·机器学习·音视频
山大提出攻克视频大模型时间理解短板新方案论文名称:TIME: Temporal-Sensitive Multi-Dimensional Instruction Tuning and Robust Benchmarking for Video-LLMs
lusasky18 小时前
音视频
公安交通领域多模态视频分析+Video-Chat/Video-RAG产品案例与技术原理业界已有多款面向公安、交通场景的产品,将多模态大模型视频分析与Video-Chat(视频对话) 或Video-RAG(视频检索增强生成) 深度融合,覆盖视频侦查、事故快处、智能监管等核心场景。以下按功能类型分类,结合典型产品与技术原理展开说明。
查无此人byebye18 小时前
人工智能·pytorch·深度学习·架构·cnn·音视频·transformer
从DDPM到DiT:扩散模型3大核心架构演进|CNN到Transformer的AIGC生成革命(附实操要点)🔥 前言:在AIGC生成领域,扩散模型早已成为绝对主流——从 Stable Diffusion 到 Sora,从图像生成到视频合成,背后都离不开三大核心技术的迭代支撑。DDPM 奠定理论基石,ContextUNet 实现可控生成,DiT 用Transformer掀起架构革命,三者串联起扩散模型从实验室走向工业化应用的完整路径。
SJjiemo19 小时前
音视频
闪豆多平台视频批量下载器闪豆多平台视频批量下载器是一款面向PC端的全能型视频下载工具,核心价值是解决多平台视频无法直接下载、批量操作繁琐、画质/水印/字幕缺失、跨平台管理混乱等用户痛点,主打60+平台覆盖、批量无水印下载、高清/4K解析、自动合并转码,适配自媒体、学生、内容创作者等高频下载场景。以下从背景、作用、同类差异、总结展开专业分析。
小鹿软件办公20 小时前
ffmpeg·音视频
一行命令搞定!用 FFmpeg 按指定码率压缩视频动辄数GB甚至数十GB的视频文件给存储、传输和分享带来了不小压力。许多用户尝试用各类“视频压缩软件”,却常常遭遇画质严重下降、水印干扰或功能限制等问题。
Zeku1 天前
stm32·音视频·freertos·linux驱动开发·linux应用开发
RTSP音视频传输软件流程文档本系统采用客户端-服务器架构,实现执法记录仪的音视频实时传输功能:函数: int main(int argc, char* argv[])
池央1 天前
人工智能·开源·音视频
CANN ATVOSS:赋能 Ascend AI 处理器视频开源智能生态CANN 组织链接: https://atomgit.com/cann ATVOSS 仓库链接: https://atomgit.com/cann/atvoss
霖雨2 天前
音视频·sharepoint
SharePoint Online 为文档创建音频前言最近,在浏览SharePoint Online新功能的时候,有个为文件生成音频的功能,让人眼前一亮
青芒.2 天前
macos·ffmpeg·音视频
10个20GB大视频如何高效处理?M3 Mac + FFmpeg 最佳实践全解析摘要:面对10个20GB级别的视频文件,直接并发处理往往导致系统卡死、效率低下。本文基于 Apple M3 芯片特性,深入分析 I/O、CPU、GPU 资源瓶颈,提出“下载 → 本地硬编 → 上传”黄金工作流,并对比 NAS、外置 SSD、HLS 分片等常见误区,最终给出可落地的自动化脚本与工业级架构建议。
雾江流2 天前
音视频·软件工程
小喵播放器 1.1.8 | 视频超分提升画质 支持网页视频与B站番剧播放小喵播放器是一款基于mpv播放器内核的本地视频播放器,专为动漫观看场景进行优化。它集成了Anime4K实时超分辨率算法,在播放过程中对低分辨率动画进行画质增强。支持常见视频格式、字幕与音轨切换、播放记录、截图等基础播放器功能,并通过GLSL着色器实现实时画质提升。
REDcker2 天前
运维·服务器·音视频·实时音视频·srs
SRS完整文档:(Simple Realtime Server)流媒体服务器本文档来自 zread.ai 对 ossrs/srs 仓库的解析,合并该站所有子页面内容。来源:https://zread.ai/ossrs/srs
❀͜͡傀儡师3 天前
spring boot·ffmpeg·音视频
SpringBoot + FFmpeg + ZLMediaKit 实现本地视频推流完整的前端播放器代码已提供,包含以下功能:
大黄说说3 天前
ffmpeg·音视频
基于 fluent-ffmpeg 实现 HLS 视频切片:从完整视频到 .ts + .m3u8 流媒体传输随着在线视频需求的激增,HTTP Live Streaming(HLS)因其广泛的设备兼容性(尤其在 iOS 和现代浏览器中)和自适应码率能力,已成为主流的流媒体传输协议。HLS 的核心在于将一个完整的视频文件切分为一系列小的 .ts(MPEG-TS)片段,并生成对应的 .m3u8 播放列表文件。
5Gcamera3 天前
人工智能·5g·音视频·智能安全帽·执法记录仪
smarteye WEB客户端基本的用户权限管理操作必须是具有用户管理权限的用户帐号才能进入后台管理,进行用户管理的操作。危险气体检测仪,通过4G/5G执法记录仪或者4G/5G智能安全帽上报到平台
nov4th3 天前
java·spring boot·音视频·webrtc·实时音视频·html5·视频
WebRTC实现无插件多端视频通话WebRTC负责浏览器间直接的音视频数据传输,HTML负责前端音视频的采集和展示,信令服务器则是 “牵线搭桥” 的角色,解决WebRTC无法直接交换连接信息的问题。本文以实现网页端之间的视频通话为主,安卓端需要自行开发测试,原理是相通的。
❀͜͡傀儡师3 天前
spring boot·ffmpeg·音视频
把AI塞进工作流编辑器:FlowMix工作流正式开源演示地址:http://flowmix.turntip.cn/flow 体验地址:https://jitword.com 开源地址:https://github.com/MrXujiang/flowmix-flow 文档地址:https://ai.flowmix.cn/ 下面和大家简单介绍一下这款工作流引擎。 flowmix/flow 致力于提供一套开箱即用的流程可视化搭建底座, 来支撑各种复杂工作流场景的设计. 同时汲取了市面上主流工作流引擎的设计经验, 并对性能做了极致的优化, 目前 flowmix/