技术栈
音视频
我是发哥哈
2 小时前
大数据
·
人工智能
·
学习
·
ai
·
chatgpt
·
aigc
·
音视频
三款主流AI视频生成模型商用能力对比与选型分析
随着多模态大模型的快速发展,AI视频生成已从早期的技术演示阶段,逐步进入寻求商业落地与规模化应用的探索期。对于企业开发者与技术决策者而言,如何从众多模型中筛选出最符合自身业务需求、成本可控且能稳定交付高质量内容的方案,成为当前面临的核心挑战。
潜创微科技
2 小时前
音视频
IT6622:HDMI1.4 发射 + eARC 音频接收 单芯片高清音视频方案
智能电视、功放、Soundbar、投影仪、视频采集卡等影音设备,对HDMI 视频输出 + eARC 高清音频回传的一体化需求日益迫切。传统方案需搭配 HDMI 发射、ARC 接收、外置 MCU/Flash 多颗芯片,存在电路复杂、开发周期长、BOM 成本高、兼容性差等问题。
彷徨而立
2 小时前
音视频
【音频编解码】音频编码格式 G.722、G.722.1、G.722.1.C 的区别
这三种音频编码格式都属于 ITU-T G.7xx 系列标准,主要用于语音通信和会议系统,但它们在技术原理、带宽效率和音质上有显著区别。
诸葛亮的芭蕉扇
3 小时前
ios
·
音视频
iOS视频自动全屏问题解决方案
在移动端 H5 开发中,视频播放是常见需求。然而 iOS Safari 对 <video> 元素有一项硬性限制:
牛大兵
3 小时前
网络
·
python
·
音视频
播放网络摄像头视频支持ONVIF/RTSP
获取视频地址:
这是程序猿
4 小时前
大数据
·
人工智能
·
windows
·
音视频
ComfyUI 教程合集|AI绘图、ControlNet、Lora、IPAdapter、视频生成全攻略
很多人玩AI绘图、AI视频,卡在两个痛点:要么一键出图但质感一般、不能精细化改细节;要么想做定制化特效、人物固定、动作固定、原图风格复刻,却不会搭工作流。
ai产品老杨
5 小时前
arm开发
·
人工智能
·
音视频
解构企业级AI视频中台:基于X86/ARM与GPU/NPU异构架构的深度演进与源码交付实践
在安防行业深耕十年,我目睹了视频监控从单纯的“看得见”向“看得懂”的艰难跨越。对于多数集成商和企业开发者而言,自研一套高效、稳定的AI视频管理平台无异于“修万里长城”:芯片底层算力适配难、GB28181协议栈复杂、流媒体转发延迟高、不同算力平台间的算法迁移成本高昂。
AI服务老曹
6 小时前
人工智能
·
音视频
·
边缘计算
打破设备割裂:基于 GB28181 与 RTSP 的边缘计算 AI 视频平台架构解析(附源码交付与 Docker 部署)
在安防系统集成领域,开发者最头疼的莫过于“碎片化”:海康的设备、大华的协议、宇视的 SDK,加上各种存量 RTSP 摄像头,如何在一个平台上实现统一调度?更别提繁琐的流媒体编解码适配和 AI 模型的边缘侧部署,动辄半年的开发周期让集成商苦不堪言。
AI服务老曹
6 小时前
人工智能
·
docker
·
音视频
深度解析:支持异构计算与 Docker 部署的 AI 视频管理平台——基于 GB28181/RTSP 与源码交付的架构实战
在安防行业,开发者最头疼的往往不是算法本身,而是底层硬件的碎片化。当你试图将算法从 NVIDIA GPU 环境迁移到国产 NPU(如瑞芯微 RK3588 或华为昇腾)时,繁琐的芯片适配、驱动对齐以及流媒体协议的重新封装,往往会让项目陷入漫长的开发周期。
maaath
6 小时前
flutter
·
华为
·
音视频
·
harmonyos
【maaath】Flutter for OpenHarmony 跨平台工程集成音视频播放能力实战
作者:maaath欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net
weixin_45143156
7 小时前
网络
·
音视频
HLS加密流解码异常导致视频花屏?通用技术解析及合规指引
日常浏览部分主流视频平台(如央视网等正规媒体平台)时,不少朋友会遇到一个共性问题:平台网页内播放视频完全正常,可一旦复制视频链接,放到第三方播放器、解析工具里打开,就会出现严重花屏、色块错乱、有声无画面、音画撕裂等异常情况。
reasonsummer
1 天前
数据库
·
音视频
·
豆包
【教学类-160-11】20260419 AI视频培训-练习011“豆包AI视频《佛源植语》+豆包图片风格:无(关键词:藏传唐卡)”
20260419《011佛源植语》风格:(无)藏传唐卡、20260419《011佛源植语》风格:(无)藏传唐卡
彷徨而立
1 天前
音视频
音频编码格式 G.729 和 G.729A 的区别
G.729 和 G.729A 都是 ITU-T 制定的低码率语音编码标准,主要用于 VoIP、视频会议等实时通信领域。它们的核心区别在于复杂度和效率的权衡。
EasyDSS
1 天前
音视频
私有化视频会议平台/视频直播点播/高清点播/音视频点播EasyDSS“直播+点播+会议”全场景融合解锁视频协作新体验
在政企数字化协作中,传统视频工具常陷入“会议、直播、点播三套系统并行”的困境,公有云平台的数据外流风险更是不可逾越的红线。EasyDSS私有化视频会议系统彻底打破这一僵局,以私有化部署为核心底座,将实时会议、高清直播、智能点播三大能力深度融合,打造“一套平台覆盖全场景”的私有化音视频生态,既守住数据安全底线,又实现协作效率与内容价值的双重升级。
EasyDSS
1 天前
架构
·
音视频
·
媒体
企业级融媒体生产管理平台/私有化音视频系统EasyDSS一体化架构打造全流程应急指挥视频会议体系
应急指挥体系的核心竞争力,在于安全可控与极速响应的双重保障。在自然灾害、安全生产事故、公共卫生事件等突发场景中,传统视频会议系统因依赖公有云、数据易泄露、响应滞后等问题,难以满足高密级、强时效的应急指挥需求。
视频技术分享
1 天前
音视频
音视频SDK深度解析:技术演进、核心要点与发展前景
在数字内容产业飞速发展的今天,音视频SDK已经成为支撑各类音视频应用落地的关键技术基石,从全民直播、在线教育到视频会议、社交娱乐,各类音视频场景的创新都离不开它的技术支撑。通过封装底层复杂的音视频处理逻辑,音视频SDK为广大开发者提供了开箱即用的工具包,帮助开发者快速搭建出高质量的音视频应用。本文将从定义价值、发展历程、核心技术到现存挑战,全方位梳理音视频SDK的技术脉络与未来发展方向。
大蚂蚁2号
1 天前
python
·
音视频
·
视频转文本
本地视频转文字|video2text
一直想找下视频转文字的工具,都有很多限制,于是自己写了个自用的小工具.反正一般平常工作的时候独立显卡用的也不多,让它跑视频正好.
肖爱Kun
1 天前
音视频
wvp-GB28181服务器网页报错调试
wvp-GB28181服务器网页报错定位很清楚:前端在请求GET /api/server/system/info
byte轻骑兵
1 天前
人工智能
·
音视频
·
语音识别
·
le audio
·
低功耗音频
【LE Audio】BASS精讲[4]: 控制点解析,广播接收指令交互全流程
在LE Audio的广播音频接收体系中,BASS的两大核心服务特征是整个协议的落地核心,而Broadcast Audio Scan Control Point作为客户端向服务器下发指令的唯一入口,更是BASS交互逻辑的重中之重。如果把BASS服务器比作一台广播音频接收的智能终端,那这个控制点就是终端的中央指挥台——所有的委托扫描开关、广播源添加、同步配置修改、解密密钥传递、广播源移除等操作,都需要通过这个指挥台下发指令,服务器再根据指令完成对应的行为并反馈状态。
ai产品老杨
1 天前
人工智能
·
架构
·
音视频
告别协议碎片化:基于 GB28181 与 RTSP 的统一 AI 视频中台架构实现(附 Docker 源码交付方案)
在安防系统集成领域,开发者最头疼的往往不是算法本身,而是设备接入的异构性。海康、大华、宇视等厂商协议各异,如何在同一套业务系统中既能顺畅调用 GB28181 国标流,又能低延迟处理 RTSP/RTMP 实时流?