音视频

查无此人byebye2 小时前
人工智能·pytorch·python·深度学习·音视频
实战DDPM扩散模型:MNIST手写数字生成+FID分数计算(完整可运行版)扩散模型(Diffusion Model)作为当下生成式AI的核心技术,在图像生成领域展现出了惊人的效果。本文将从代码层面逐行拆解一个完整可运行的DDPM(Denoising Diffusion Probabilistic Models)实现,基于MNIST数据集完成手写数字生成,并集成FID(Fréchet Inception Distance)指标量化生成效果。
九丝城主8 小时前
前端·音视频
1V1音视频对话2--Web 双浏览器完整通话测试(强制 relay)这一步很重要,目标是两个浏览器窗口,通过你的 TURN 服务器,100% relay 建立视频通话,主要是测试跨网段的WebRTC实现。
哈__9 小时前
flutter·音视频
基础入门 Flutter for OpenHarmony:video_player 视频播放组件详解欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net
小陈Coding9 小时前
aigc·音视频·java面试·电商·技术面试·互联网大厂·内容社区
互联网大厂Java面试实录:电商音视频内容社区场景深度解析面试官:张工,10年互联网大厂经验,阿里P8级别,专注于电商、音视频、内容社区领域 候选人:谢飞机,Java开发工程师,3年工作经验 面试场景:某互联网大厂电商音视频内容社区后端技术面试
TEC_INO9 小时前
音视频·aac
Linux_22:音频AAC编码音频为什么要进行编码压缩?我们就以PCM原始数据为例,假设这个PCM数据采样率为:48000、采样深度:16bit、声道数:2。对应的码率是:48000 * 16bit * 2 = 1536000bps ~=1.46M,若传输一分钟那就是1.46M * 60S~ = 87.6M。这个数据量是非常大,若在网络传输上这个音频的数据量很容易造成网络的负载压力。所以此时我们就需要对音频进行编码压缩,音频编码压缩格式分很多种,比方说:MP3、AAC、OGG格式。我们的课程重点来说AAC编码格式,因为AAC编码在网络
HAPPY酷9 小时前
c++·ue5·音视频
C++ 音视频项目与 UE5 渲染与电影制作的关系✅ UE5 已成为现代电影前期预演(Previs)、技术预演(Techvis)和最终拍摄(Final Pixel)的核心工具。
听麟9 小时前
分布式·华为·音视频·harmonyos·政务
HarmonyOS 6.0+ PC端分布式并行计算引擎开发实战:边缘协同场景下的异构资源调度与任务优化随着HarmonyOS 6.0及以上版本对PC端异构计算能力的深度强化,以及边缘计算场景的普及,基于鸿蒙设备群的分布式并行计算成为突破单设备算力瓶颈的关键技术方向。HarmonyOS Next的分布式架构天然支持多设备资源聚合,而PC端作为边缘节点的核心控制单元,具备强大的CPU/GPU/NPU算力储备和存储能力,能够承担分布式计算集群的调度中枢角色。通过开发分布式并行计算引擎,可实现PC与周边智能设备(摄像头、传感器、边缘网关)的算力协同,大幅提升视频分析、AI推理、数据处理等重型任务的执行效率。
人机与认知实验室10 小时前
人工智能·音视频
Seedance:字节跳动的AI视频生成技术突破与行业变革
爱打代码的小林10 小时前
opencv·计算机视觉·音视频
基于 Lucas-Kanade 光流法实现视频特征点追踪光流法是计算机视觉领域中用于分析物体运动的经典算法,而 Lucas-Kanade(LK)光流法作为稀疏光流的代表,因其计算高效、易于实现的特点,被广泛应用于视频目标追踪、运动分析等场景。
Knight_AL10 小时前
ffmpeg·音视频·pcm
如何用 FFmpeg 处理 PCM 音频 & 判断 PCM 文件到底是什么格式“这个 PCM 究竟是什么采样率?是单声道还是双声道?位深是多少?”PCM(Pulse Code Modulation) 就是未经压缩的原始音频采样数据,它不带头信息,因此文件本身不包含任何格式说明。
集成显卡1 天前
前端·vue·音视频
前端视频播放方案选型:主流 Web 播放器对比 + Vue3 实战基于 Spring Boot3、Vue3、Naive UI 构建,助力应用快速开发、发布、运维的低代码平台,旨在帮助使用者(包含但不限于开发人员、业务人员)快速响应业务需求
爱吃番茄鼠骗1 天前
音视频
回顾ESP32S3系列---音频开发你可以把 I2S 想象成一个立体声广播系统,它有三根关键的 “线” 负责把声音从 ESP32S3 传到喇叭 / 耳机,或者从麦克风传到 ESP32S3:
ViiTor_AI1 天前
人工智能·音视频
AI 在线字幕去除工具:一键无损删除视频硬字幕与软字幕在视频创作与内容再利用过程中,字幕有时是加分项,但也可能成为干扰。尤其是硬字幕(嵌入画面)或不需要的软字幕,往往影响画面美感、品牌呈现或多语言本地化制作。
愚公搬代码1 天前
人工智能·音视频
【愚公系列】《AI短视频创作一本通》027-AI 短视频创作的注意事项及未来展望(AI短视频的技术展望)💎【行业认证·权威头衔】 ✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家 ✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主 ✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者
binderIPC1 天前
macos·ffmpeg·音视频
macos环境下FFmpeg打包成.so文件FFmpeg 编译并打包成 Android 可直接使用的 .so 动态库,这是Android音视频开发的核心步骤。我们现在通过在macos环境下编译一个.so文件,以下是完整的流程。
binderIPC1 天前
macos·ffmpeg·音视频
macos的FFmpeg环境搭建是一套跨平台的开源音视频处理工具库,能完成音视频领域的所有核心操作,覆盖 “编解码→格式转换→剪辑→滤镜→封装 / 解封装” 全流程
ViiTor_AI1 天前
人工智能·计算机视觉·音视频
视频字幕怎么去除?5 种方法删除硬编码字幕与软字幕(CapCut 实操)硬编码字幕(Hardcoded Subtitles) 硬编码字幕是直接“写死”在视频画面中的字幕,它们已经成为视频图像的一部分,无法通过简单的开关关闭或移除。想要删除这类字幕,通常需要进行较复杂的视频编辑。硬编码字幕常用于必须让所有观众都看到字幕的场景,例如外语电影。
西***63471 天前
矩阵·音视频·会议系统
深耕政务数字化,矩阵会议系统多点落地,解锁政务会商新范式近日,一套专业矩阵会议系统成功落地四川省成都市武侯区政务服务中心,专业技术团队全程进驻现场,有序开展设备安装、调试及系统联调工作,严格按照政务服务场所相关标准完成全流程验收,凭借稳定的运行表现、便捷的操作体验,获得了武侯区政务服务中心相关领导的高度认可与肯定,为政务会议高效开展筑牢了技术支撑。
奔跑吧 android2 天前
android·音视频·audio·audioflinger·aosp15·车载音频·audiohal
【车载audio】【audio hal 01】【Android 音频子系统:Audio HAL Server 启动全流程深度解析】在 Android Treble 架构中,音频系统的核心逻辑被拆分为 Framework 层(AudioFlinger) 与 Vendor 层(Audio HAL)。android.hardware.audio.service 进程是 Vendor 层的守护进程,它的主要职责是: