音视频

上海合宙LuatOS4 小时前
单片机·嵌入式硬件·物联网·算法·音视频·硬件工程·哈希算法
LuatOS核心库API——【hmeta 】硬件元数据在复杂异构的计算环境中,如何高效管理海量硬件设备?hmeta——硬件元数据系统,提供了一种标准化的解决方案。通过采集、组织和暴露硬件的描述性信息,hmeta使设备“可描述、可发现、可管理”。本文将深入探讨hmeta的构建逻辑、数据模型设计及其在数据中心自动化中的关键作用。
一个人旅程~6 小时前
windows·经验分享·电脑·音视频
QQ音乐、potplayer、VLC等对音乐格式的支持和加密文件格式的转换有哪些方法?potplayer的音质相对于VLC有哪些特点?QQ音乐、potplayer、VLC等对音乐格式的支持和加密文件格式的转换有哪些方法?potplayer的音质相对于VLC有哪些特点?
音视频牛哥7 小时前
音视频·rtsp播放器·rtmp播放器·安卓rtsp服务器·安卓轻量级rtsp服务·安卓rtsp摄像头推流·安卓摄像头rtmp推流
从协议栈到工程落地:SmartMediaKit全链路模块化架构深度解析在音视频SDK的选型中,"能跑Demo"和"能上线系统"之间,隔着的不是一行代码,而是一整套工程化的架构决策。本文以大牛直播SDK(SmartMediaKit)为蓝本,从协议栈原理出发,逐模块拆解其技术设计,探讨一套全自研流媒体内核如何在超低延迟、跨平台、模块化三个维度上同时做到极致。
奔跑吧 android8 小时前
音视频·audiohal·车载audio·高通音频架构·ahal·audiofinger
【车载Audio】【AudioHal 04】【高通音频架构】【从 AHAL adev_open 到 PAL XML 解析:30微秒内的调用链深度追踪】有兴趣可以先看 深入解析 Android 音频策略:onNewAudioModulesAvailableInt 的全链路探索
REDcker9 小时前
linux·服务器·c++·ffmpeg·音视频·c·后端开发
FFmpeg完整文档本文档整理自 FFmpeg/FFmpeg 官方文档与社区资料,便于本地查阅与二次整理。FFmpeg 是世界上最全面的多媒体处理框架,提供了一套完整的库和工具生态系统,用于处理音频、视频、字幕及相关元数据。该开源项目为桌面、移动和服务器环境中的无数应用提供支持,既为最终用户提供命令行工具,也为开发者提供用于将多媒体功能集成到应用中的 API。
linux_cfan10 小时前
php·音视频·webrtc
WordPress 视频播放痛点解决方案:支持 RTSP/WebRTC 与字幕检索的 ZWPlayer 插件实测在 WordPress 建站过程中,视频播放功能往往是开发者绕不开的一环。虽然 WordPress 自带的 Video 区块可以处理基础的 MP4 播放,但在面对现代流媒体需求时,其原生能力显得捉襟见肘:
AI周红伟1 天前
音视频
周红伟:字节官方发布Seedance 2.0 视频模型,技术实现过程和 技术分解今天,我们正式发布新一代视频创作模型 Seedance 2.0。Seedance 2.0 采用统一的多模态音视频联合生成架构,支持文字、图片、音频、视频四种模态输入,集成了目前业界最全面的多模态内容参考和编辑能力。
查无此人byebye1 天前
人工智能·pytorch·python·深度学习·音视频
实战DDPM扩散模型:MNIST手写数字生成+FID分数计算(完整可运行版)扩散模型(Diffusion Model)作为当下生成式AI的核心技术,在图像生成领域展现出了惊人的效果。本文将从代码层面逐行拆解一个完整可运行的DDPM(Denoising Diffusion Probabilistic Models)实现,基于MNIST数据集完成手写数字生成,并集成FID(Fréchet Inception Distance)指标量化生成效果。
九丝城主1 天前
前端·音视频
1V1音视频对话2--Web 双浏览器完整通话测试(强制 relay)这一步很重要,目标是两个浏览器窗口,通过你的 TURN 服务器,100% relay 建立视频通话,主要是测试跨网段的WebRTC实现。
哈__1 天前
flutter·音视频
基础入门 Flutter for OpenHarmony:video_player 视频播放组件详解欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net
小陈Coding1 天前
aigc·音视频·java面试·电商·技术面试·互联网大厂·内容社区
互联网大厂Java面试实录:电商音视频内容社区场景深度解析面试官:张工,10年互联网大厂经验,阿里P8级别,专注于电商、音视频、内容社区领域 候选人:谢飞机,Java开发工程师,3年工作经验 面试场景:某互联网大厂电商音视频内容社区后端技术面试
TEC_INO1 天前
音视频·aac
Linux_22:音频AAC编码音频为什么要进行编码压缩?我们就以PCM原始数据为例,假设这个PCM数据采样率为:48000、采样深度:16bit、声道数:2。对应的码率是:48000 * 16bit * 2 = 1536000bps ~=1.46M,若传输一分钟那就是1.46M * 60S~ = 87.6M。这个数据量是非常大,若在网络传输上这个音频的数据量很容易造成网络的负载压力。所以此时我们就需要对音频进行编码压缩,音频编码压缩格式分很多种,比方说:MP3、AAC、OGG格式。我们的课程重点来说AAC编码格式,因为AAC编码在网络
HAPPY酷1 天前
c++·ue5·音视频
C++ 音视频项目与 UE5 渲染与电影制作的关系✅ UE5 已成为现代电影前期预演(Previs)、技术预演(Techvis)和最终拍摄(Final Pixel)的核心工具。
听麟1 天前
分布式·华为·音视频·harmonyos·政务
HarmonyOS 6.0+ PC端分布式并行计算引擎开发实战:边缘协同场景下的异构资源调度与任务优化随着HarmonyOS 6.0及以上版本对PC端异构计算能力的深度强化,以及边缘计算场景的普及,基于鸿蒙设备群的分布式并行计算成为突破单设备算力瓶颈的关键技术方向。HarmonyOS Next的分布式架构天然支持多设备资源聚合,而PC端作为边缘节点的核心控制单元,具备强大的CPU/GPU/NPU算力储备和存储能力,能够承担分布式计算集群的调度中枢角色。通过开发分布式并行计算引擎,可实现PC与周边智能设备(摄像头、传感器、边缘网关)的算力协同,大幅提升视频分析、AI推理、数据处理等重型任务的执行效率。
人机与认知实验室1 天前
人工智能·音视频
Seedance:字节跳动的AI视频生成技术突破与行业变革
爱打代码的小林1 天前
opencv·计算机视觉·音视频
基于 Lucas-Kanade 光流法实现视频特征点追踪光流法是计算机视觉领域中用于分析物体运动的经典算法,而 Lucas-Kanade(LK)光流法作为稀疏光流的代表,因其计算高效、易于实现的特点,被广泛应用于视频目标追踪、运动分析等场景。
Knight_AL1 天前
ffmpeg·音视频·pcm
如何用 FFmpeg 处理 PCM 音频 & 判断 PCM 文件到底是什么格式“这个 PCM 究竟是什么采样率?是单声道还是双声道?位深是多少?”PCM(Pulse Code Modulation) 就是未经压缩的原始音频采样数据,它不带头信息,因此文件本身不包含任何格式说明。
集成显卡2 天前
前端·vue·音视频
前端视频播放方案选型:主流 Web 播放器对比 + Vue3 实战基于 Spring Boot3、Vue3、Naive UI 构建,助力应用快速开发、发布、运维的低代码平台,旨在帮助使用者(包含但不限于开发人员、业务人员)快速响应业务需求
爱吃番茄鼠骗2 天前
音视频
回顾ESP32S3系列---音频开发你可以把 I2S 想象成一个立体声广播系统,它有三根关键的 “线” 负责把声音从 ESP32S3 传到喇叭 / 耳机,或者从麦克风传到 ESP32S3: