音视频

AI搅拌机10 小时前
人工智能·音视频
LTX2.3 IC-LORA动作迁移,通过depth、POSE、Canny精准控制生成的视频!核心功能:通过深度图和姿势(Pose)精确控制视频生成控制方式:可提取参考视频的深度图和姿势信息通过调整参数控制生成视频的动作迁移效果
蒋胜山10 小时前
windows·经验分享·音视频
PowerPoint插入音频报错windows系统中遇到一个PowerPoint插入本地音频时候报错,如下图。显示错误是“无法执行此操作,因为音频设备不可用。请检查扬声器是否已插入和音频设备是否正常工作,然后重试。”
byte轻骑兵11 小时前
人工智能·音视频·低功耗·le audio
【LE Audio】CAP精讲[5]: 导演上线!Initiator音频协同全流程合规指南在LE Audio的CAP生态中,Initiator就像音频协同大戏的总导演——它负责发起音频流、统筹多设备配合、把控场景切换节奏,所有Acceptor的音频呈现和Commander的控制指令,最终都要围绕Initiator的流程展开。而Initiator角色要求,就是给这位导演制定的工作手册,明确了它必须掌握的核心流程、可灵活调整的操作、以及与其他角色配合的规则。本文拆解这份手册,看看Initiator要想导好一场协同大戏,到底需要满足哪些合规要求。
知识领航员14 小时前
adobe·音视频
2026年精选4款音频处理软件:Adobe Audition领衔,蘑兔AI音乐紧随其后音频处理是音乐制作、播客录制、视频配音等工作中不可或缺的一环。本文精选4款表现优秀的音频处理软件,按照专业程度和功能特色排序,Adobe Audition位居首位,蘑兔AI音乐位列第二。这些工具各具特色,适合不同场景的音频需求。
云天AI实战派14 小时前
人工智能·chatgpt·音视频
ChatGPT/API 调用故障排查指南:Realtime 音频、智能体浏览器操作与 AI 编码代理全流程修复手册从问题分类、原因排序到逐步排查,帮开发者快速定位 Realtime Audio、AI 智能体和 API 调用中的高频故障
celebrateyang15 小时前
音视频·下载
一个功能比较完整的在线视频工具站:freesavevideo.online 使用体验在日常开发、内容整理、学习资料收集以及视频处理过程中,经常会遇到一些和视频相关的需求,比如:保存在线视频; 提取视频中的音频; 转换视频格式; 在电脑和手机之间传输文件; 录制讲解视频或课程内容; 整理一些可重复观看的学习资源。
EasyDSS15 小时前
安全·音视频
私有化视频会议系统/视频高清直播点播EasyDSS构筑智慧校园安全可控全场景音视频中枢随着智慧校园建设持续落地,音视频通信已经渗透到教学、管理、安防、家校联动等方方面面。过去很多校园选用通用公有云视频工具,虽上手简单,但普遍存在隐私无保障、网络不稳定、功能不定制、运维无自主权等痛点,难以满足校园高标准的安全管理与业务适配需求。
irpywp16 小时前
macos·开源·github·音视频·媒体
平台禁下载、格式不兼容、剪辑太麻烦,Media Downloader:mac 原生媒体下载工具,一站式解决视频下载、转码、裁剪、管理难题想存个参考视频、素材片段、课程内容,常会碰到不少麻烦。打开喜欢的视频想保存,平台直接禁用下载按钮;找了网页嗅探工具,要么识别不到资源,要么下载完是加密格式没法打开;用命令行工具,一堆参数看得头大,复制粘贴半天还可能报错;好不容易下载成功,格式是FLV、MKV这类小众格式,播放器打不开、剪辑软件不兼容,又得额外装转码工具;下载的文件散落在各个文件夹,想回头找的时候翻半天找不到,重新下载又浪费时间;要是想剪个片段用,还得打开专业剪辑软件,导入、裁剪、导出一套流程下来,十几秒的片段要折腾半小时。
largecode16 小时前
经验分享·笔记·音视频·课程设计·oneapi·segmentfault·微信开放平台
能不能让座机号码显示“XX公司”那样的认证名称?申请号码认证方法在存量竞争的生意场上,很多企业主都面临一个尴尬:为了谈成业务,销售团队每天拨出成百上千个座机电话,但接听率却低得让人心碎。客户看着屏幕上那一串毫无感情的数字,第一反应通常是“拒接”或“拉黑”。这种由于身份不明导致的沟通断层,不仅浪费了话费,更让潜在的机会白白流失。
美狐美颜sdk17 小时前
人工智能·音视频·直播美颜sdk·视频美颜sdk·美狐美颜sdk
美颜SDK开发难点有哪些?Android/iOS美颜SDK接入如今,无论是直播、短视频、视频社交,还是在线教育、医疗问诊、电商带货,用户对“实时视频体验”的要求都越来越高。过去,大家可能只关注画面是否清晰;而现在,“美颜自然不自然”“滤镜高级不高级”“视频会不会卡顿”,已经直接影响用户留存与产品转化。
blevoice18 小时前
单片机·ffmpeg·音视频·aac·ac6966b蓝牙音响方案·杰理智能音箱开发·杰理ac6965e蓝牙音频开发
JL杰理AC696N开发板上调试蓝牙音质优化:开启AAC高清音频支持所有配置基于个人工程经验整理。搞蓝牙音箱开发的朋友可能有这样的体会:明明喇叭选得不错、箱体也调过了,但用户一听还是觉得“闷”、“不够通透”。问题往往不在硬件,而是蓝牙音频传输环节的编码格式。AAC作为一种更高效的编码,在同等码率下音质明显优于SBC,也是苹果设备的主要蓝牙编码。
Elastic 中国社区官方博客18 小时前
大数据·人工智能·elasticsearch·搜索引擎·ai·音视频·jina
jina-embeddings-v5-omni:用于文本、图像、音频和视频的 embeddings作者:来自 Elastic https://jina.ai/一个模型,四种模态:文本、图像、音频、视频。1.6B 和 0.9B 参数规模的业界领先 omni embeddings。
EasyGBS18 小时前
网络·音视频
智慧工地、明厨亮灶、平安校园……国标GB28181视频平台EasyGBS凭什么成为ToB视频方案的“万能基座”?在ToB视频监控落地场景中,一直存在普遍行业痛点:各行业项目设备品牌杂乱、新旧设备混用、协议标准不统一,不同厂商设备接口不互通,单独定制开发成本高、适配难度大、系统稳定性难以保障。
CheungChunChiu19 小时前
linux·运维·音视频·codec·audio·asla·dapm
Linux 音频子系统完整梳理:ALSA、ASoC、DAPM、Codec、Machine、es8389 与 rk‑multicodecs 全解析先给你一个总的结构图:ASoC 把一个 SoC 音频系统拆成三块:你现在看到的两个文件:就是这两层的典型实现。
ZC跨境爬虫20 小时前
前端·javascript·ui·html·音视频
跟着MDN学HTML_day_46:(HTMLCollection与NodeList)HTMLCollection 接口表示一个包含了元素的通用集合,这些元素按照文档流中的顺序排列。它是一个与 arguments 相似的类数组对象,提供了用来从集合中选择元素的方法和属性。
HwJack2020 小时前
华为·音视频·harmonyos
深潜 HarmonyOS APP开发中AVSession 音视频会话管理做过音视频类应用(比如音乐播放器、播客 App 或者带背景音的游戏)的朋友,大概率都遇到过这种让人抓狂的场景:用户退到后台,音乐还在响,但通知栏的播控按钮却失灵了;或者按了暂停,声音停了,但系统控制中心的进度条还在走。
潜创微科技1 天前
嵌入式硬件·音视频
IT9201+IT66021:便携 KVM 一站式方案,音视控三合一免驱即插即用机房运维、工控调试、嵌入式开发、现场抢修场景中,无网调试、离线控机、轻量便携已成核心刚需。传统 IP KVM 依赖网络、部署复杂、成本高昂;普通采集卡仅能看画面无法控机;外接键鼠显示器三件套笨重难携带。
音视频牛哥1 天前
音视频·harmonyos·大牛直播sdk·鸿蒙rtmp播放器·鸿蒙rtsp播放器·鸿蒙next rtsp播放器·鸿蒙next rtmp播放器
大牛直播SDK(SmartMediaKit)鸿蒙NEXT RTSP/RTMP低延迟播放器集成与实践指南本文介绍如何在 HarmonyOS NEXT 工程中集成 大牛直播SDK(SmartMediaKit)RTSP/RTMP直播播放模块,实现 RTSP、RTMP 实时直播播放(延迟低至100~200ms)、低延迟渲染、实时录像、快照、事件回调、画面控制、下载速度统计、分辨率回调等能力。
时空自由民.2 天前
音视频
优化ESP32 ADF 音频问题可以,现在已经进入音质调试阶段了,不是“能不能播放”的阶段。你现在的问题大概率不是一个单点问题,而是下面几类之一:
ZC跨境爬虫2 天前
前端·javascript·ui·html·音视频
跟着 MDN 学 HTML day_41:(DOMParser 接口详解)DOMParser 是 Web API 中一个非常重要的接口,它提供了将字符串中的 XML 或 HTML 源代码解析为 DOM Document 对象的功能。在传统的 Web 开发中,当我们从服务器获取到一段 HTML 或 XML 字符串时,需要将其转换为可操作的 DOM 对象,DOMParser 正是为解决这个问题而设计的。