技术栈
音视频
sweetone
12 分钟前
经验分享
·
音视频
LINN莲CLASSIK桌面音响微修
署名 浙江 方位机主的一台英国品牌LINN(莲)CLASSIK(带CD/收音/两声道功放)的桌面音响。由于CD进出仓困难,让笔者帮助修一下。由于该机是交流100V供电,机主感觉外接一个220V/100V变压器不方便,所以想给音响更换一个交流220V供电的变压器。
晚霞的不甘
4 小时前
java
·
后端
·
spring
·
架构
·
音视频
CANN 编译器深度解析:UB、L1 与 Global Memory 的协同调度机制
在 GPU 编程中,开发者常关注“显存 vs 寄存器”;而在 Ascend NPU 上,真正的性能战场在 Unified Buffer(UB) ——一块仅 256KB(310P)或 512KB(910B) 的片上高速缓存。
美狐美颜SDK开放平台
5 小时前
人工智能
·
音视频
·
美颜sdk
·
直播美颜sdk
·
视频美颜sdk
多终端适配下的人脸美型方案:美颜SDK工程开发实践分享
在直播、电商、短视频、社交应用全面“视频化”的今天,美颜已经从“锦上添花”变成了“基础设施”。但真正参与过美颜SDK工程开发的人都知道:美颜效果好不好是一回事,能不能在多终端、多设备上稳定跑起来,是另一回事。
饭饭大王666
8 小时前
人工智能
·
音视频
CANN 生态深度整合:使用 `pipeline-runner` 构建高吞吐视频分析流水线
cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn 在边缘智能与云边协同场景中,实时视频流处理是 AI 落地的核心需求之一。然而,从摄像头输入到结构化输出(如目标检测、行为识别)的完整链路涉及数据采集、预处理、模型推理、后处理等多个阶段,若各环节割裂执行,极易造成资源浪费与延迟升高。
晚霞的不甘
10 小时前
人工智能
·
架构
·
开源
·
音视频
CANN 编译器深度解析:TBE 自定义算子开发实战
当你的模型包含 DCN(可变形卷积)、RoIAlign、自定义注意力机制 等非标准算子时,通用融合规则可能失效。此时,TBE(Tensor Boost Engine) 成为你的终极武器。
愚公搬代码
10 小时前
人工智能
·
音视频
【愚公系列】《AI短视频创作一本通》016-AI短视频的生成(AI短视频运镜方法)
💎【行业认证·权威头衔】 ✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家 ✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主 ✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者
那个村的李富贵
11 小时前
aigc
·
音视频
CANN赋能AIGC“数字人”革命:实时视频换脸与表情驱动实战
摘要:数字人(Digital Human)作为AIGC领域最具商业价值的应用之一,对模型推理的实时性、保真度提出了极高要求。本文基于华为昇腾CANN(Compute Architecture for Neural Networks)仓库的实时推理优化技术,深度解析其如何通过算子编译、内存零拷贝、动态批处理等核心技术,将InsightFace、FaceShifter等复杂模型部署至昇腾硬件,实现毫秒级的高保真视频换脸与表情驱动。文章包含完整的模型转换、实时视频流处理代码及性能对比数据,揭秘CANN如何让AI
晚霞的不甘
11 小时前
人工智能
·
神经网络
·
架构
·
开源
·
音视频
CANN 支持强化学习:从 Isaac Gym 仿真到机械臂真机控制
强化学习的核心挑战在于:“如何让智能体在复杂环境中,以毫秒级响应做出最优决策?”传统 GPU 方案在桌面端表现优异,但在嵌入式机器人、工业机械臂、无人系统等场景中,面临:
晚霞的不甘
15 小时前
人工智能
·
神经网络
·
架构
·
开源
·
音视频
CANN 支持多模态大模型:Qwen-VL 与 LLaVA 的端侧部署实战
多模态大模型(MLLM)正从“云端玩具”走向“边缘工具”。但一个现实问题是:“百亿参数的 Qwen-VL,如何跑进 8GB 内存、30W 功耗的边缘盒子?”
拾荒的小海螺
1 天前
开源
·
音视频
开源项目:LTX2 高效可控的开源视频生成模型
LTX2(LTX-Video 2) 是 Lightricks 团队推出的 新一代开源视频生成模型,属于 Text-to-Video / Image-to-Video 方向。
EasyGBS
1 天前
视觉检测
·
音视频
·
gb28181
·
花屏
·
视频质量诊断
·
蓝屏检测
视频画面模糊、卡顿、丢失?EasyGBS新增“视频质量诊断”功能,告别人工盯屏
近年来,随着视频监控在各行各业的广泛应用,如何保障视频图像的质量成为了行业关注的焦点。为了满足这一需求,国标GB28181视频监控联网EasyGBS算法算力平台,创新性地集成了视频质量诊断功能,为用户提供智能、高效的视频质量监测解决方案。
zhuweisky
1 天前
音视频
·
harmonyos
·
鸿蒙开发
ArkTS实现鸿蒙手机视频聊天、屏幕分享(HarmonyOS)
随着搭配原生鸿蒙(HarmonyOS)系统的电脑和手机越来越普及,之前刚实现鸿蒙版的文字聊天、传文件的Demo ,现在有必要再实现一个鸿蒙版的视频聊天Demo了,该鸿蒙版的Demo也是可以与之前的安卓版和PC版互通的。
XHW___001
1 天前
网络
·
音视频
·
webrtc
webrtc 关键模块创建的时机
Leinwin
1 天前
人工智能
·
音视频
·
语音识别
VibeVoice-ASR:突破60分钟长音频处理瓶颈,语音识别进入端到端时代
近日,微软宣布开源其新一代语音识别模型VibeVoice-ASR,该模型突破传统语音转文本技术的限制,实现了长音频单次处理的革命性进步,支持单次处理长达60分钟的连续音频输入。
EasyDSS
1 天前
音视频
·
hls
·
m3u8
·
点播技术
·
流媒体直播
直播点播/视频会议EasyDSS一站式视频云平台,全场景视频服务开箱即用
EasyDSS一站式视频云平台——以创新科技为驱动,以用户体验为核心,致力于构建高效、稳定、智能的下一代音视频基础设施。
Guheyunyi
1 天前
大数据
·
运维
·
人工智能
·
安全
·
音视频
什么是安全监测预警系统?应用场景有哪些?
在风险交织的现代社会,从网络攻击到自然灾害,从工业事故到公共安全事件,被动应对已难以满足安全治理需求。安全监测预警系统作为“防患于未然”的智能中枢,正成为国家治理体系与企业风险管理的关键基础设施。它通过实时感知、智能分析与精准预警,将安全防线前移,为生命财产与社会运行构筑起一道动态防护网。
LittroInno
2 天前
人工智能
·
计算机视觉
·
音视频
TVMS视频管理平台 —— 目标识别跟踪
客户端支持 AI 硬件产品下的目标识别功能与客户端模式下的目标识别。⚠️软件中为了减少误报情况,默认将目标宽或高大于画面一半以上的大物体进行了过滤,即便是识别到也不会显示与输出目标信息,在测试过程中需要注意。
newbiai
2 天前
人工智能
·
python
·
音视频
电商直播AI视频生成工具哪个方便快捷?
深夜的电商运营工位上,运营小张盯着屏幕里只完成了3条的直播素材列表发愁——下周的平台大促要上10个SKU,每条至少配3条不同场景的短视频,传统拍摄团队一周最多出15条,时间根本赶不上。这几乎是所有电商人都遇到过的困境,AI视频生成工具的出现本应是破局密钥,但市场上产品五花八门,选不对反而浪费时间成本。
又是忙碌的一天
2 天前
websocket
·
音视频
·
webrtc
SpringBoot+Vue+Netty+WebSocket+WebRTC 视频聊天实现
WebRTC 是什么:是浏览器内置的实时通信技术,能让网页直接实现音视频通话、数据传输,无需安装插件。
阿里巴啦
2 天前
python
·
ffmpeg
·
whisper
·
音视频
·
视频处理
·
ai摘要
·
音视频转录
python+yt-dlp开源项目,支持 YouTube, Bilibili, TikTok/抖音,快手 等多个平台的视频/音频/字幕下载/ai摘要等功能
我的开源项目 video-link-pipeline 这是一个集成了视频下载、音频提取、字幕处理、语音转录和 AI 摘要生成的全流程工具集。旨在帮助用户快速从各大视频平台获取内容,并利用 AI 技术进行深度处理。