音视频

DogDaoDao12 分钟前
音视频·实时音视频·视频编解码·av1·vp9·libaom·环路滤波
AV1 环路滤波器深度解析:av1_loopfilter.c 源码原理详解在视频编解码领域,环路滤波器(Loop Filter) 是提升压缩质量和视觉体验的关键技术之一。作为 AV1 视频编码器的核心模块,环路滤波器位于解码环路内,通过平滑块边界处的像素突变来消除压缩伪影(Blocking Artifacts),从而在相同码率下获得更好的主观质量。
ZC跨境爬虫1 小时前
前端·javascript·ui·html·ecmascript·音视频
跟着MDN学HTML_day_47:(Document接口)在日常开发中,我们经常需要获取当前文档的基本信息,例如文档的标题、URL、字符集等。Document 接口提供了丰富的只读属性来满足这些需求。
YuxuanSys-Regen1 小时前
音视频·腾讯会议·teams·dante·无线手持·音频设备
WMMAV&YUXUANSYS/育轩:Dante主机接入手持发射器:让会议音频进入“无线高保真”时代WMMAV&YUXUANSYS/育轩: WMMAV 官网YuxuanSys官网某企业的中型会议室,用了三年某品牌的无线手持麦克风。平时开会没问题,直到有一次需要将发言声音同时传输到:
kcuwu.1 小时前
人工智能·音视频·coze
博客转抖音视频(文件上传版)Coze工作流实现文档(第一版)用户上传博客文件(TXT) → AI 提取核心知识(适配抖音短平快) → 自动生成结构化视频脚本(含分镜 + 配图描述) → 循环生成配图(AI 生图) → 合成抖音视频(自动配乐、字幕、剪辑),全程借助 Coze 插件 + Code 节点,完全适配 Coze 智能体开发技能。
沙振宇2 小时前
python·yolo·音视频·状态模式·识别
【Python】使用YOLO8识别视频中的车与人物与我之前写的这篇文章呼应:【Web】使用Vue3开发3D游戏(九)纹理视觉效果路况路况识别效果在行车记录仪路况分析、道路障碍物检测、智能驾驶仿真场景中,行人、车辆识别是最基础也是最核心的能力。本文基于 YOLOv8 实现本地 MP4 视频实时检测,精准区分行人、轿车、摩托车、货车、巴士等交通参与者,同时适配 Vue3 + PlayCanvas 3D 前端 数据协议,输出标准化障碍物类型,可直接对接 3D 场景做障碍物映射,非常适合做仿真项目、机器狗路况感知、Web3D 可视化开发。
开开心心就好3 小时前
人工智能·学习·游戏·音视频·hbase·语音识别·storm
支持添加网址的资源快速打开工具软件介绍多个应用和电影文件快速收藏打开器是一款高效的批量资源启动工具,专门解决每天打开固定应用、文件或文件夹的需求,让日常操作更省心。
AI搅拌机16 小时前
人工智能·音视频
LTX2.3 IC-LORA动作迁移,通过depth、POSE、Canny精准控制生成的视频!核心功能:通过深度图和姿势(Pose)精确控制视频生成控制方式:可提取参考视频的深度图和姿势信息通过调整参数控制生成视频的动作迁移效果
蒋胜山16 小时前
windows·经验分享·音视频
PowerPoint插入音频报错windows系统中遇到一个PowerPoint插入本地音频时候报错,如下图。显示错误是“无法执行此操作,因为音频设备不可用。请检查扬声器是否已插入和音频设备是否正常工作,然后重试。”
byte轻骑兵17 小时前
人工智能·音视频·低功耗·le audio
【LE Audio】CAP精讲[5]: 导演上线!Initiator音频协同全流程合规指南在LE Audio的CAP生态中,Initiator就像音频协同大戏的总导演——它负责发起音频流、统筹多设备配合、把控场景切换节奏,所有Acceptor的音频呈现和Commander的控制指令,最终都要围绕Initiator的流程展开。而Initiator角色要求,就是给这位导演制定的工作手册,明确了它必须掌握的核心流程、可灵活调整的操作、以及与其他角色配合的规则。本文拆解这份手册,看看Initiator要想导好一场协同大戏,到底需要满足哪些合规要求。
知识领航员20 小时前
adobe·音视频
2026年精选4款音频处理软件:Adobe Audition领衔,蘑兔AI音乐紧随其后音频处理是音乐制作、播客录制、视频配音等工作中不可或缺的一环。本文精选4款表现优秀的音频处理软件,按照专业程度和功能特色排序,Adobe Audition位居首位,蘑兔AI音乐位列第二。这些工具各具特色,适合不同场景的音频需求。
云天AI实战派20 小时前
人工智能·chatgpt·音视频
ChatGPT/API 调用故障排查指南:Realtime 音频、智能体浏览器操作与 AI 编码代理全流程修复手册从问题分类、原因排序到逐步排查,帮开发者快速定位 Realtime Audio、AI 智能体和 API 调用中的高频故障
celebrateyang21 小时前
音视频·下载
一个功能比较完整的在线视频工具站:freesavevideo.online 使用体验在日常开发、内容整理、学习资料收集以及视频处理过程中,经常会遇到一些和视频相关的需求,比如:保存在线视频; 提取视频中的音频; 转换视频格式; 在电脑和手机之间传输文件; 录制讲解视频或课程内容; 整理一些可重复观看的学习资源。
EasyDSS1 天前
安全·音视频
私有化视频会议系统/视频高清直播点播EasyDSS构筑智慧校园安全可控全场景音视频中枢随着智慧校园建设持续落地,音视频通信已经渗透到教学、管理、安防、家校联动等方方面面。过去很多校园选用通用公有云视频工具,虽上手简单,但普遍存在隐私无保障、网络不稳定、功能不定制、运维无自主权等痛点,难以满足校园高标准的安全管理与业务适配需求。
irpywp1 天前
macos·开源·github·音视频·媒体
平台禁下载、格式不兼容、剪辑太麻烦,Media Downloader:mac 原生媒体下载工具,一站式解决视频下载、转码、裁剪、管理难题想存个参考视频、素材片段、课程内容,常会碰到不少麻烦。打开喜欢的视频想保存,平台直接禁用下载按钮;找了网页嗅探工具,要么识别不到资源,要么下载完是加密格式没法打开;用命令行工具,一堆参数看得头大,复制粘贴半天还可能报错;好不容易下载成功,格式是FLV、MKV这类小众格式,播放器打不开、剪辑软件不兼容,又得额外装转码工具;下载的文件散落在各个文件夹,想回头找的时候翻半天找不到,重新下载又浪费时间;要是想剪个片段用,还得打开专业剪辑软件,导入、裁剪、导出一套流程下来,十几秒的片段要折腾半小时。
largecode1 天前
经验分享·笔记·音视频·课程设计·oneapi·segmentfault·微信开放平台
能不能让座机号码显示“XX公司”那样的认证名称?申请号码认证方法在存量竞争的生意场上,很多企业主都面临一个尴尬:为了谈成业务,销售团队每天拨出成百上千个座机电话,但接听率却低得让人心碎。客户看着屏幕上那一串毫无感情的数字,第一反应通常是“拒接”或“拉黑”。这种由于身份不明导致的沟通断层,不仅浪费了话费,更让潜在的机会白白流失。
美狐美颜sdk1 天前
人工智能·音视频·直播美颜sdk·视频美颜sdk·美狐美颜sdk
美颜SDK开发难点有哪些?Android/iOS美颜SDK接入如今,无论是直播、短视频、视频社交,还是在线教育、医疗问诊、电商带货,用户对“实时视频体验”的要求都越来越高。过去,大家可能只关注画面是否清晰;而现在,“美颜自然不自然”“滤镜高级不高级”“视频会不会卡顿”,已经直接影响用户留存与产品转化。
blevoice1 天前
单片机·ffmpeg·音视频·aac·ac6966b蓝牙音响方案·杰理智能音箱开发·杰理ac6965e蓝牙音频开发
JL杰理AC696N开发板上调试蓝牙音质优化:开启AAC高清音频支持所有配置基于个人工程经验整理。搞蓝牙音箱开发的朋友可能有这样的体会:明明喇叭选得不错、箱体也调过了,但用户一听还是觉得“闷”、“不够通透”。问题往往不在硬件,而是蓝牙音频传输环节的编码格式。AAC作为一种更高效的编码,在同等码率下音质明显优于SBC,也是苹果设备的主要蓝牙编码。
Elastic 中国社区官方博客1 天前
大数据·人工智能·elasticsearch·搜索引擎·ai·音视频·jina
jina-embeddings-v5-omni:用于文本、图像、音频和视频的 embeddings作者:来自 Elastic https://jina.ai/一个模型,四种模态:文本、图像、音频、视频。1.6B 和 0.9B 参数规模的业界领先 omni embeddings。
EasyGBS1 天前
网络·音视频
智慧工地、明厨亮灶、平安校园……国标GB28181视频平台EasyGBS凭什么成为ToB视频方案的“万能基座”?在ToB视频监控落地场景中,一直存在普遍行业痛点:各行业项目设备品牌杂乱、新旧设备混用、协议标准不统一,不同厂商设备接口不互通,单独定制开发成本高、适配难度大、系统稳定性难以保障。
CheungChunChiu1 天前
linux·运维·音视频·codec·audio·asla·dapm
Linux 音频子系统完整梳理:ALSA、ASoC、DAPM、Codec、Machine、es8389 与 rk‑multicodecs 全解析先给你一个总的结构图:ASoC 把一个 SoC 音频系统拆成三块:你现在看到的两个文件:就是这两层的典型实现。