技术栈
音视频
集成显卡
19 小时前
前端
·
vue
·
音视频
前端视频播放方案选型:主流 Web 播放器对比 + Vue3 实战
基于 Spring Boot3、Vue3、Naive UI 构建,助力应用快速开发、发布、运维的低代码平台,旨在帮助使用者(包含但不限于开发人员、业务人员)快速响应业务需求
爱吃番茄鼠骗
19 小时前
音视频
回顾ESP32S3系列---音频开发
你可以把 I2S 想象成一个立体声广播系统,它有三根关键的 “线” 负责把声音从 ESP32S3 传到喇叭 / 耳机,或者从麦克风传到 ESP32S3:
ViiTor_AI
20 小时前
人工智能
·
音视频
AI 在线字幕去除工具:一键无损删除视频硬字幕与软字幕
在视频创作与内容再利用过程中,字幕有时是加分项,但也可能成为干扰。尤其是硬字幕(嵌入画面)或不需要的软字幕,往往影响画面美感、品牌呈现或多语言本地化制作。
愚公搬代码
20 小时前
人工智能
·
音视频
【愚公系列】《AI短视频创作一本通》027-AI 短视频创作的注意事项及未来展望(AI短视频的技术展望)
💎【行业认证·权威头衔】 ✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家 ✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主 ✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者
binderIPC
20 小时前
macos
·
ffmpeg
·
音视频
macos环境下FFmpeg打包成.so文件
FFmpeg 编译并打包成 Android 可直接使用的 .so 动态库,这是Android音视频开发的核心步骤。我们现在通过在macos环境下编译一个.so文件,以下是完整的流程。
binderIPC
20 小时前
macos
·
ffmpeg
·
音视频
macos的FFmpeg环境搭建
是一套跨平台的开源音视频处理工具库,能完成音视频领域的所有核心操作,覆盖 “编解码→格式转换→剪辑→滤镜→封装 / 解封装” 全流程
ViiTor_AI
21 小时前
人工智能
·
计算机视觉
·
音视频
视频字幕怎么去除?5 种方法删除硬编码字幕与软字幕(CapCut 实操)
硬编码字幕(Hardcoded Subtitles) 硬编码字幕是直接“写死”在视频画面中的字幕,它们已经成为视频图像的一部分,无法通过简单的开关关闭或移除。想要删除这类字幕,通常需要进行较复杂的视频编辑。硬编码字幕常用于必须让所有观众都看到字幕的场景,例如外语电影。
西***6347
1 天前
矩阵
·
音视频
·
会议系统
深耕政务数字化,矩阵会议系统多点落地,解锁政务会商新范式
近日,一套专业矩阵会议系统成功落地四川省成都市武侯区政务服务中心,专业技术团队全程进驻现场,有序开展设备安装、调试及系统联调工作,严格按照政务服务场所相关标准完成全流程验收,凭借稳定的运行表现、便捷的操作体验,获得了武侯区政务服务中心相关领导的高度认可与肯定,为政务会议高效开展筑牢了技术支撑。
奔跑吧 android
1 天前
android
·
音视频
·
audio
·
audioflinger
·
aosp15
·
车载音频
·
audiohal
【车载audio】【audio hal 01】【Android 音频子系统:Audio HAL Server 启动全流程深度解析】
在 Android Treble 架构中,音频系统的核心逻辑被拆分为 Framework 层(AudioFlinger) 与 Vendor 层(Audio HAL)。android.hardware.audio.service 进程是 Vendor 层的守护进程,它的主要职责是:
REDcker
2 天前
服务器
·
后端
·
音视频
·
实时音视频
·
srs
·
流媒体
·
oryx
Oryx开发者快速入门
精简版快速入门,只保留核心概念与上手步骤。Docker 进阶、端口与数据卷、架构与协议、AI 功能、API 等详见 Oryx完整文档.md。
REDcker
2 天前
服务器
·
后端
·
音视频
·
实时音视频
·
srs
·
流媒体
·
oryx
Oryx完整文档
本文档整理自 Oryx(ossrs/oryx)官方文档与社区资料,便于本地查阅与二次整理。Oryx(原 SRS Stack)是一款一体化、开箱即用的开源视频解决方案,专为构建具备直播和 WebRTC 功能的在线视频服务而设计。Oryx 专为云部署或自托管环境构建,将多种强大技术整合到统一平台中,简化了视频流基础设施的搭建与管理。
美狐美颜SDK开放平台
2 天前
人工智能
·
音视频
·
美颜sdk
·
直播美颜sdk
·
视频美颜sdk
美颜sdk哈哈镜功能开发指南:从人脸识别到动态变形
在短视频与直播盛行的今天,用户对“好看”和“好玩”的追求从未停止。从基础磨皮美白到实时贴纸、滤镜特效,再到近年来重新走红的“哈哈镜变形效果”,美颜技术正在从“美化”走向“趣味互动”。
小鹿软件办公
2 天前
音视频
·
音频比特率如何设置
音频比特率设置多少最好?320kbps 真的比 128kbps 好很多吗
无论是听音乐、看视频、播客,还是进行语音通话、内容创作,我们几乎每天都在和音频打交道。而提到音频质量,比特率往往是绕不开的核心参数。那么,MP3 或其他常见音频格式的比特率到底设置为多少最合适?128kbps 够用吗?320kbps 真的无损吗?
大模型实验室Lab4AI
2 天前
人工智能
·
深度学习
·
算法
·
机器学习
·
音视频
山大提出攻克视频大模型时间理解短板新方案
论文名称:TIME: Temporal-Sensitive Multi-Dimensional Instruction Tuning and Robust Benchmarking for Video-LLMs
lusasky
2 天前
音视频
公安交通领域多模态视频分析+Video-Chat/Video-RAG产品案例与技术原理
业界已有多款面向公安、交通场景的产品,将多模态大模型视频分析与Video-Chat(视频对话) 或Video-RAG(视频检索增强生成) 深度融合,覆盖视频侦查、事故快处、智能监管等核心场景。以下按功能类型分类,结合典型产品与技术原理展开说明。
查无此人byebye
2 天前
人工智能
·
pytorch
·
深度学习
·
架构
·
cnn
·
音视频
·
transformer
从DDPM到DiT:扩散模型3大核心架构演进|CNN到Transformer的AIGC生成革命(附实操要点)
🔥 前言:在AIGC生成领域,扩散模型早已成为绝对主流——从 Stable Diffusion 到 Sora,从图像生成到视频合成,背后都离不开三大核心技术的迭代支撑。DDPM 奠定理论基石,ContextUNet 实现可控生成,DiT 用Transformer掀起架构革命,三者串联起扩散模型从实验室走向工业化应用的完整路径。
SJjiemo
2 天前
音视频
闪豆多平台视频批量下载器
闪豆多平台视频批量下载器是一款面向PC端的全能型视频下载工具,核心价值是解决多平台视频无法直接下载、批量操作繁琐、画质/水印/字幕缺失、跨平台管理混乱等用户痛点,主打60+平台覆盖、批量无水印下载、高清/4K解析、自动合并转码,适配自媒体、学生、内容创作者等高频下载场景。以下从背景、作用、同类差异、总结展开专业分析。
小鹿软件办公
2 天前
ffmpeg
·
音视频
一行命令搞定!用 FFmpeg 按指定码率压缩视频
动辄数GB甚至数十GB的视频文件给存储、传输和分享带来了不小压力。许多用户尝试用各类“视频压缩软件”,却常常遭遇画质严重下降、水印干扰或功能限制等问题。
Zeku
2 天前
stm32
·
音视频
·
freertos
·
linux驱动开发
·
linux应用开发
RTSP音视频传输软件流程文档
本系统采用客户端-服务器架构,实现执法记录仪的音视频实时传输功能:函数: int main(int argc, char* argv[])
池央
2 天前
人工智能
·
开源
·
音视频
CANN ATVOSS:赋能 Ascend AI 处理器视频开源智能生态
CANN 组织链接: https://atomgit.com/cann ATVOSS 仓库链接: https://atomgit.com/cann/atvoss