音视频

许泽宇的技术分享32 分钟前
音视频·漫剧·ai漫剧
SkyReels V1 人像视频生成模型的技术拆解与实战指南如果一只戴墨镜的猫能在泳池边当救生员,那么你也可以用一张照片或一段文字让故事动起来。SkyReels V1 的目标,就是把这种魔法装进可落地的推理框架里。
EasyDSS1 小时前
音视频·无人机
视频推流平台EasyDSS无人机推流直播技术在水利巡检场景的应用与实践我国水利基础设施规模庞大,涵盖水库、堤防、水闸、泵站等多种类型设施,传统的人工巡检方式面临效率低、风险高、时效性差等挑战。随着无人机技术的成熟和5G网络的普及,结合EasyDSS视频推流平台的无人机直播技术为水利巡检带来了革命性的解决方案,实现了从“人工巡查”到“智能遥测”的转型升级。
EasyGBS4 小时前
音视频
EasyGBS:一体化视频监控与智能管理解决方案在数字化转型加速推进的背景下,视频监控已成为各行业安全管理、应急处置、运营优化的核心支撑手段。国标GB28181算法算力平台EasyGBS,凭借全协议兼容接入、全流程协同调度等核心能力,构建了一体化视频监控解决方案,广泛适配多样化视频管理需求,本文将全面介绍EasyGBS平台的核心价值、关键特性及适用场景,助力行业用户快速认知其技术优势与应用价值。
500844 小时前
flutter·华为·开源·wpf·音视频
鸿蒙 Flutter 隐私合规:用户授权中心与数据审计日志在《个人信息保护法》《数据安全法》及《个人信息保护合规审计管理办法》的严格监管下,跨端应用的隐私合规已成为开发者的必修课。鸿蒙(OpenHarmony)凭借系统级安全能力构建底层防护,Flutter 则以跨端高效开发优势降低合规落地成本,二者融合可实现 "原生安全 + 跨端适配" 的合规解决方案。本文聚焦用户授权中心与数据审计日志两大核心模块,结合实战代码与官方标准,详解鸿蒙 Flutter 应用的隐私合规落地路径,覆盖权限精细化管控、审计日志全链路设计等关键场景。
云山工作室5 小时前
stm32·单片机·嵌入式硬件·毕业设计·音视频
基于STM32的视力保护台灯设计与实现(论文+源码)1 系统方案设计 通过对视力保护台灯的功能进行分析,在此将整个系统架构如图2-1所示为系统设计框图,系统采用STM32单片机作为主控模块,通过HC-SR04模块实现超声波测距、DHT11传感器实现人体检测、光敏电阻实现光照检测、红外传感器检测是否有人、JDY-31蓝牙模块实现与手机APP的通信、JQ8400实现语音播报、OLED12864液晶实现数据显示功能。
EasyCVR6 小时前
音视频
安防监控进入“云边端”协同时代,EasyCVR视频中台将扮演什么角色?过去十年,安防行业经历了从模拟到数字,再到智能化的跨越。但在很长一段时间内,我们迷信“云端算力无限”,试图将所有视频流回传至中心处理。
小白狮ww6 小时前
人工智能·深度学习·机器学习·3d·音视频·图片处理·动作识别
挥手点亮圣诞:AI 3D 魔法树教程临近圣诞节,大家都在思考如何让今年更有仪式感:搞一棵圣诞树,还是干脆上一张滤镜海报?但如果你想让节日过得更「有科技味儿」,今年有个更酷的选择——一棵能听懂你手势、会展示你的照片、还能随你指挥聚散旋转的「3D Christmas Tree」。 这个由 moleculemmeng020425 打造的项目,用 React 与 Three.js(R3F)构建出一棵由粒子、灯光和影像组成的立体圣诞树;加上 AI 手势识别,只需张开手,就能让整棵树炸裂成漫天粒子,握拳又能瞬间重组,左右挥手更能让视角跟着你变化,交互感
EasyCVR6 小时前
安全·音视频
视频汇聚平台EasyCVR赋能校园周界防范构建全时段安全防线校园安全是教育教学工作开展的前提,而周界防范作为校园安全的第一道屏障,直接关系到师生的生命财产安全与校园的稳定秩序。随着智能化技术的快速发展,传统的人工巡逻等周界防范方式,已难以满足现代校园大区域、全时段、高精度的防范需求。
Blossom.1187 小时前
运维·人工智能·学习·决策树·stable diffusion·自动化·音视频
基于MLOps+LLM的模型全生命周期自动化治理系统:从数据漂移到智能回滚的落地实践摘要:大模型上线后,面对训练数据污染、Prompt注入攻击、推理成本失控、模型性能劣化等问题,运维团队每天疲于奔命。我用MLflow+LangGraph+Prometheus搭建了一套模型智能治理系统:自动检测数据分布漂移并触发重训,实时监控Prompt攻击模式,动态调整推理资源配额,模型效果劣化时自动触发金丝雀回滚。上线后,模型迭代周期从2周缩短至4小时,推理成本降低55%,线上事故率下降83%。核心创新是把LLM作为"治理策略生成器",将监控指标转化为可执行的MLOps流水线操作。附完整Kuberne
EasyDSS7 小时前
音视频
视频直播点播平台EasyDSS轻量化、高兼容的全场景音视频解决方案在音视频技术深度融入各行各业的今天,直播与点播已成为信息传播、业务协同、服务升级的重要载体。EasyDSS作为一款成熟的视频直播点播平台,凭借多协议兼容、高稳定传输等核心优势,广泛适配政企会议、应急指挥、文旅推广、教育培训等多元场景,为用户提供低成本、高效率、易运维的音视频解决方案。
一点晖光7 小时前
ffmpeg·音视频
ffmpeg视频分辨率转换9:16 视频在 16:9 画布上播放的命令ffmpeg -i 003.mp4 -vf "scale=-1:720,pad=1280:720:(1280-iw)/2:0,setsar=1" -c:v libx264 -preset fast -crf 28 -an 011.mp4
iFlow_AI7 小时前
测试用例·音视频·心流·iflow·iflowcli
用iFlow CLI写了一个简单的内容创作平台 ——OpenAIGC-App rocket (集图像、音频、视频、文本创作于一体的智能化创作工具 )作者:@OdysseyWarsaw话不多说,先上成品—— OpenAIGC-App 一个基于iflow cli全流程对话式开发的AI内容创作平台 - 集图像、音频、视频、文本创作于一体的智能化创作工具
顾道长生'7 小时前
人工智能·计算机视觉·音视频
(Arxiv-2025)零样本参考到视频生成的扩展paper是Meta 发布在Arxiv 2025的工作paper title:Scaling Zero-Shot Reference-to-Video Generation
feiyangqingyun7 小时前
qt·音视频·qt监控系统·qt视频轮询
记一次Qt视频监控系统的优化/双击打开分组可能崩溃的BUG/排对打开通道过程中关闭通道可能崩溃的BUG以前视频监控系统就做了双击打开分组的功能,但是现场也好和本地实际测试也好,都没有出现过问题,而近期在一个集团中测试下来,在双击打开分组的时候很容易蹦,一看每次都是64路同时打开,经常详细测试,发现问题出在两个现象才会发生,一个是分组中有部分通道是离线的,一个是上一个分组还没有全部打开完成,下一个双击触发又开始了,这两者杂交,必触发崩溃,核心就是锁资源竞争了,调用关闭和打开并不是在同一个线程完成的,于是把双击分组的打开也放到videomanage线程处理,其实内部是排队打开,默认间隔0.1s,也可以是0.0
习惯就好zz8 小时前
音视频·rk3588·安卓·hdmi·禁用音频输出
在 RK3588 上彻底禁用 HDMI 音频输出适用平台:Rockchip RK3588 / OK3588 Android 版本:Android 10+(Audio Policy v7.0) 关键词:audio_policy_configuration.xml、HDMI 音频禁用、AOSP 编译、vendor 分区、RK3588
xingqing87y8 小时前
音视频
索尼拍摄的视频怎么调亮度用索尼相机拍视频,画质是没话说,但很多人都会遇到同一个糟心问题:视频亮度不够!要么是灰蒙蒙的没质感,要么是室内、阴天拍出来暗沉沉,好好的素材差点变成废片。更头疼的是,传统工具调索尼视频亮度简直是“劝退级操作”——得先搞懂一级调色校色准、二级调色调层次、三级调色修细节,光熟悉参数就要2-3小时,调一段5分钟的视频平均耗时40分钟以上,新手看着满屏的曲线、色轮,直接原地放弃。而用影忆,不用懂专业调色知识,10分钟就能搞定,效率提升90%,小白也能轻松调出明亮清晰的质感视频!
好游科技8 小时前
音视频·webrtc·im即时通讯·社交软件·私有化部署im即时通讯·社交app
使用WebRTC开发直播系统与音视频语聊房实践指南WebRTC(Web Real-Time Communication)是一项支持浏览器和移动应用进行实时音视频通信的开源技术,由Google在2011年提出并已成为W3C标准。该技术通过简单API即可实现点对点的音视频传输,具有低延迟、半可靠传输等特点,特别适合开发直播系统和语聊房应用。
AI营销快线1 天前
人工智能·音视频
车企AI营销内容生产:2025图文与视频生成实战指南进入2025年,中国汽车市场的竞争已演变为一场关于“注意力”的无限战争。当传统营销手段逐渐失灵,汽车行业的市场营销人员与品牌负责人正面临前所未有的三重困境:首先,创意加速枯竭,无论是“人生第一台车”的温情叙事,还是“零百加速”的性能轰炸,消费者早已审美疲劳;其次,内容同质化泛滥,各品牌的新车海报、短视频脚本仿佛出自同一套模板,难以形成独特的品牌印记;最后,多平台分发效率低下,为抖音、小红书、视频号、品牌小程序等不同渠道定制内容,耗费了团队大量精力,却收效甚微。
EasyCVR1 天前
大数据·人工智能·音视频
视频汇聚平台EasyCVR助力农场实现全场景可视化管理在数字化浪潮席卷各行各业的今天,传统农业正加速向智慧农业转型,农场管理也迎来了前所未有的变革机遇。如何有效整合先进的信息技术,实现农场的精准化、智能化管理,成为现代农业数字化转型的关键课题。在这一背景下,视频汇聚平台EasyCVR凭借其强大的视频接入、汇聚、处理和分发能力,为农场实现全程数字可视化管理提供了切实可行的技术解决方案。
漫长的~以后1 天前
音视频
Qwen2.5-Omni横空出世:四模态统一模型如何破解音视频同步难题?作为一名深耕多模态交互开发 5 年的工程师,我曾无数次被同一个问题折磨:明明模型能看懂图片、听懂语音,却总在处理音视频时 “掉链子”—— 语音指令和视频画面差半拍,唇动与发音不同步,长视频关键事件定位偏差达几秒。直到 2025 年 5 月,阿里通义千问团队发布的 Qwen2.5-Omni 模型,用创新的时间对齐技术和双引擎架构,彻底打破了这个 “时间魔咒”。