音视频

ai产品老杨1 小时前
人工智能·架构·音视频
深度解析:基于国产化异构计算的 AI 视频管理平台架构——从 GB28181 接入到 NPU 边缘推流的解耦实践在安防行业深耕十年,我发现集成商和企业级开发者最头疼的往往不是业务逻辑,而是底层兼容性。面对海量异构硬件(NVIDIA GPU、华为昇腾 NPU、瑞芯微/比特大陆边缘盒子)以及杂乱的视频协议(GB28181、RTSP、ONVIF、私有SDK),传统的开发模式往往需要针对每一款芯片、每一个品牌摄像头重复造轮子。这种高耦合的架构不仅拉长了交付周期,更让维护成本成倍增加。
watson_pillow1 小时前
音视频
音视频相关基础知识储备入门-字幕字幕就是视频里出现的文字:台词翻译、歌词、甚至弹幕。从技术实现角度分为两类:音视频开发中,软字幕才是研究的重点:它更灵活,也带来了渲染、同步、特效等一系列技术挑战。
程序员JerrySUN2 小时前
c语言·开发语言·网络·udp·音视频
Jetson边缘嵌入式实战课程第二讲:JetPack 和 SDK Manager 是什么大家好,我是 孙杰。 一直在做嵌入式系统、边缘设备和 AI 应用相关工作,也持续分享一些技术学习和项目实践中的经验。这套课程的内容,主要也是基于这些年的系统开发和项目积累整理出来的。
weixin_6684 小时前
人工智能·音视频
NVIDIA VSSVideo Search and Summarization视频搜索与摘要蓝图详尽使用说明与技术报告版本NVIDIA VSSVideo Search and Summarization视频搜索与摘要蓝图详尽使用说明与技术报告
jiayong235 小时前
ai·音视频·agent
国内外视频/图像大模型与智能体工具平台竞品对比优先看 OpenAI、Google Gemini/Veo、BytePlus/ModelArk、Runway、Vidu、MiniMax、Luma、BFL、Stability、Ideogram、Leonardo。它们的文档、鉴权、计费、模型 ID、错误码和示例相对清晰,更适合做业务系统集成。
视频技术分享5 小时前
音视频
技术赋能生态革新:音视频产业开启千亿增长新周期 视频会议成核心增长亮点随着5G网络覆盖不断延伸,AI技术全面渗透音视频内容生产,车载、办公等多场景智能终端快速普及,我国音视频产业正从传统娱乐赛道,加速向全领域数字经济场景渗透,已然成为支撑数字经济发展的核心支柱。公开数据显示,当前国内音视频产业整体规模已经突破5万亿元,专业音视频系统行业预计到2030年将达到5500亿元的市场体量,年复合增长率稳定保持在11.8%的高位。在技术创新、政策支持与场景拓展的三重推力下,覆盖采、编、播、显、传全产业链的音视频行业,正迎来前所未有的发展机遇,包括视频会议在内的多个细分赛道都展现出强劲
音视频牛哥7 小时前
音视频·harmonyos·鸿蒙rtmp播放器·鸿蒙rtsp播放器·鸿蒙rtmp推流·鸿蒙next下rtmp同屏·鸿蒙rtsp服务器
SmartMediaKit 鸿蒙NEXT 产品生态之RTMP推流、轻量级RTSP服务与推送端录像能力详解随着鸿蒙 NEXT 生态逐步走向独立演进,面向政企、能源、教育、医疗、应急、交通、军工、无纸化会议等行业场景,国产化系统平台的重要性正在持续提升。
reasonsummer6 小时前
人工智能·音视频·豆包
【教学类-160-14】20260425 AI视频培训-练习014“豆包AI视频《月下枯蔷(哥特风)》+豆包图片风格:油画”20260425 《014月下枯蔷(哥特风)》风格:油画20260425 《014月下枯蔷(哥特风)》风格:油画
AI服务老曹6 小时前
arm开发·人工智能·音视频
深度解析:支持 GB28181/RTSP 及异构计算(X86/ARM+GPU/NPU)的 AI 视频管理平台架构方案(附源码交付与 Docker 部署)作为安防系统架构师,我们常面临这样的挑战:甲方要求在 X86 服务器上做中心化分析,又要求在 ARM 架构的边缘盒子上做预处理;既要对接传统的 GB28181 国标设备,又要兼容第三方厂商的 RTSP/RTMP 流。
byte轻骑兵7 小时前
人工智能·算法·音视频·语音识别·le audio·低功耗音频
【LE Audio】BASS精讲[5]: 状态特征解析,广播接收状态实时可视全流程在LE Audio的广播音频接收体系中,BASS的两大核心特征构成了指令-状态的完整交互闭环:上一篇解析的Broadcast Audio Scan Control Point是客户端向服务器下发指令的中央指挥台,而本次要详解的Broadcast Receive State则是服务器向客户端实时暴露广播接收状态的智能仪表盘。如果说控制点是让服务器做什么的指令入口,状态特征就是让客户端看得到服务器执行结果的状态窗口,所有与广播源同步、加密解密相关的状态变化,都会实时体现在这个仪表盘上,是客户端感知广播接收过程
LCMICRO-133108477467 小时前
单片机·嵌入式硬件·fpga开发·音视频·硬件工程·dsp开发·音频adc
长芯微LD1871完全P2P替代AD1871,是一款立体声音频ADC描述长芯微LD1871是一款立体声音频ADC,用于需要高性能模数转换的数字音频应用。本芯片具有两个24位转换通道,每个通道提供105dB的动态范围。芯片的音频数据接口支持I2S、左对齐、右对齐等 常见接口格式;芯片还具有SPI兼容的穿行配置端口,可方便地配置芯片参数和功能。本芯片与国外产品AD1871管脚兼容,可实现替代
甄心爱学习7 小时前
音视频
【数字图像处理】什么是视频任务的隐式神经表征?视频任务的隐式神经表征传统方法与新兴方法的本质区别在于如何“记忆”数据。由于现实图像极其复杂,无法用简单的解析代数式表示,因此引入深度学习模型来拟合该函数。
开开心心就好7 小时前
人工智能·游戏·ci/cd·docker·音视频·语音识别·媒体
支持批量添加水印的实用工具推荐软件介绍图片水印工具是一款专门用来给图片添加水印的工具。之前为了加水印功能安装了某大型图片处理软件,后来发现其实有很多小巧的工具就能满足需求,这款就是其中之一,比大型软件更轻便好用。
y小花7 小时前
android·音视频
安卓音频低延时与AAudio音频延迟是指“音频数据产生→硬件发声”或“硬件拾音→数据上抛”的总耗时,传统AudioTrack/AudioRecord链路延迟普遍在100ms以上,远超实时场景≤45ms的要求。结合前序全链路,延迟主要来源于这几处:
Lanren的编程日记7 小时前
flutter·音视频·harmonyos
任务77:Flutter 鸿蒙应用视频录制功能实战:视频录制+录制控制+视频编辑,打造完整视频处理能力欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net
_pengliang7 小时前
uni-app·音视频
uni-app 实现sse流式音频技术方案在 AI 对话场景中,需要实现 边生成边播放 的流式音频体验:最终选择:WebAudioContext + 流式 PCM 数据
AI服务老曹7 小时前
arm开发·人工智能·音视频
节省95%开发成本:支持X86/ARM与GPU/NPU异构部署的AI视频云网关架构深度解析作为一名深耕安防领域十年的架构师,我观察到近年企业在构建AI视频监控系统时面临三大“深水区”:硬件异构难题:从通用的X86服务器到各类ARM架构的边缘盒子,不同芯片(NVIDIA、华为昇腾、瑞芯微等)的驱动与SDK适配占据了研发50%以上的精力。
Lanren的编程日记7 小时前
flutter·华为·音视频·harmonyos
任务76:Flutter 鸿蒙应用音频录制功能实战:音频录制+录音管理+录音编辑,打造完整音频处理能力欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net
EasyGBS8 小时前
音视频
国标GB28181视频分析平台EasyGBS视频质量诊断技术实现全维度视频画质智能检测随着国标GB28181规范全面落地,视频监控已深度融入智慧城市、工业安防、园区管理等众多领域,海量摄像头构建起规模化视频防控网络,成为安全生产与全域治理的关键基础设施。当下多数监控运维仍依赖人工轮巡盯防,面对成百上千路前端视频,人工排查效率极低。