技术栈
音视频
Jay Kay
4 小时前
音视频
MemVid:信息存储的未来?创新还是“视频噱头”?
免翻墙项目链接:https://gitcode.com/gh_mirrors/me/memvid/tree/main
昨日之日2006
6 小时前
人工智能
·
音视频
LatentSync V8版 - 音频驱动视频生成数字人说话视频 更新V1.6版模型 支持50系显卡 支持批量 一键整合包下载
LatentSync 是字节跳动开源的一款"AI口型同步神器",简单来说就是能让视频里的人物嘴巴动得和声音完美匹配的工具。比如你给一段配音,它能自动调整视频人物的嘴型,按照配音里的声音说出来,就像真人说话一样自然。简单说就是个让"假人说话像真人"的黑科技,拍视频、做直播的小伙伴用起来特别方便,也可广泛应用于数字人生成领域,自媒体必备神器。 今天分享的 LatentSync V8版,主要更新最新的1.6版模型(该版模型在 512 × 512 分辨率的视频上进行了训练,大幅度提升了生成嘴部的清晰度) 新增对5
知舟不叙
7 小时前
opencv
·
目标检测
·
目标跟踪
·
音视频
基于OpenCV实现视频运动目标检测与跟踪
运动目标检测是计算机视觉中的重要应用,广泛应用于安防监控、自动驾驶、人机交互等领域。本文将介绍如何使用OpenCV实现一个简单的视频运动目标检测系统,包括背景建模、形态学处理和轮廓检测等关键技术。
sukalot
10 小时前
驱动开发
·
音视频
window 显示驱动开发-处理视频帧
Microsoft Direct3D 运行时调用用户模式显示驱动程序的 VideoProcessBeginFrame 和 VideoProcessEndFrame 函数,以指示用户模式显示驱动程序可以处理视频帧的这些函数调用之间的时间段。 在用户模式显示驱动程序可以处理任何视频帧之前,Microsoft Direct3D 运行时必须调用用户模式显示驱动程序的 SetVideoProcessRenderTarget 函数来设置用于视频处理的呈现目标图面。 但是,对 SetVideoProcessRender
Sherlock Ma
11 小时前
人工智能
·
深度学习
·
计算机视觉
·
aigc
·
音视频
·
扩散模型
·
视频生成
Seedance:字节发布视频生成基础模型新SOTA,能力全面提升
Seedance 1.0 是由字节跳动推出的高性能视频生成基础模型,旨在突破当前视频生成模型在指令遵循、运动合理性与视觉质量平衡方面的瓶颈。该模型通过多源数据整合与精准视频字幕生成,实现了跨多样化场景的全面学习;采用高效的架构设计,支持多镜头生成以及文本到视频和图像到视频任务的联合学习;通过细粒度监督微调和多维度奖励机制的强化学习,显著提升了模型性能;并借助多阶段蒸馏策略和系统级优化,实现了 10 倍的推理加速。
Everbrilliant89
14 小时前
音视频
·
h.264
·
h.264编解码
·
h.264帧内预测
·
h.264帧间预测
·
h.264的sp/si帧技术
·
h.264码率控制
音视频之H.264/AVC编码器原理
系列文章:1、音视频之视频压缩技术及数字视频综述2、音视频之视频压缩编码的基本原理3、音视频之H.264/AVC编码器原理
s_little_monster
14 小时前
linux
·
运维
·
经验分享
·
学习
·
音视频
·
嵌入式开发
·
海思
【Linux开发】海思摄像头内部视频处理模块
个人主页~MIPI(Mobile Industry Processor Interface)即移动行业处理器接口,是由MIPI联盟发起的为移动应用处理器制定的开放标准,它定义了一系列用于连接移动设备内部组件的接口规范,主要目的是解决不同厂商的芯片、显示屏、摄像头等组件之间的互联互通问题,在手机等移动设备中,MIPI接口应用广泛,例如MIPI CSI(Camera Serial Interface)用于连接摄像头和处理器,MIPI DSI(Display Serial Interface)用于连接显示屏和处
vfvfb
1 天前
音视频
·
批量去掉视频开头
·
批量去掉崇
·
去掉mp3开头几秒
·
批量去掉视频结尾歌曲
视频音频去掉开头结尾 视频去掉前n秒后n秒 电视剧去掉开头歌曲
视频音频去掉开头结尾 视频去掉前n秒后n秒视频音频去掉开头结尾 视频去掉前n秒后n秒 电视剧去掉开头歌曲
Coovally AI模型快速验证
1 天前
神经网络
·
算法
·
3d
·
目标跟踪
·
音视频
SLAM3R:基于单目视频的实时密集3D场景重建
【导读】北京大学陈宝权教授团队联合港大等开发的 SLAM3R系统取得突破:首次仅用普通手机RGB视频,就能实时(20+FPS)生成高质量、高密度3D场景模型。 它颠覆传统流程,通过神经网络直接端到端预测3D点云,无需求解复杂相机参数。核心是“图像到点”和“本地到世界”双模块,利用滑动窗口处理视频片段并融合局部点云为全局模型。实验证明其精度和完整性超越现有实时方法,为AR、机器人等应用打开大门。>>更多资讯可加入CV技术群获取了解哦~
no_work
1 天前
pytorch
·
深度学习
·
cnn
·
音视频
·
语音识别
·
梅卡尔
深度学习小项目合集之音频语音识别-视频介绍下自取
内容包括:基于python深度学习对动物的异常声音识别179基于python深度学习对动物的异常声音识别_哔哩哔哩_bilibili
学习噢学个屁
1 天前
c语言
·
stm32
·
单片机
·
嵌入式硬件
·
音视频
基于STM32音频频谱分析设计
(程序+原理图+PCB+设计报告)采用咪头(话筒拾音传感器)采集音频信号,此音频信号过小,不利于单片机ADC直接采集,故将此音频信号经LM358放大电路放大后送入单片机的ADC口采集。
xijiancui
1 天前
音视频
AVCap视频处理成帧和音频脚本
直接执行脚本会报错,解决办法访问 FFmpeg 官方构建版本页面: https://github.com/BtbN/FFmpeg-Builds/releases
紫光展锐官方
1 天前
5g
·
音视频
紫光展锐T8300以创新音频技术重塑感知世界
数字化时代,从语音通话到智能交互,从聆听音乐到创作Vlog,声音已成为隐形的基础措施。日益发展的音频技术正在重构用户感知世界的方式,重塑用户的听觉体验。
大咖分享课
1 天前
人工智能
·
语言模型
·
音视频
顶级视频生成大模型分析:Seedance 1.0 Pro (字节跳动) - 新晋榜首
2025年,AI视频生成技术迎来了前所未有的发展高峰。从2024年2月OpenAI发布Sora开始,到如今的百花齐放,这个领域正在以前所未有的速度发展。目前市场上已有超过20款主流视频生成大模型,技术水平参差不齐,但顶级模型的能力已经接近专业级别。
墨尊
2 天前
开发语言
·
javascript
·
音视频
通过flv.js在网页中拉流进行视频播放
起因是我想在网页中展示流媒体服务器中的视频流。后来了解到flv.js,故作如下知识记录:FLV (Flash Video) 格式最初是为 Adobe Flash Player 设计的视频容器格式,但随着 HTML5 技术的发展,直接在网页中播放 FLV 文件变得越来越困难。HTTP-FLV 技术通过将 FLV 文件通过 HTTP 协议传输,并在前端使用 JavaScript 解码播放,实现了在不依赖 Flash 的情况下播放 FLV 视频流。
加油搞钱加油搞钱
2 天前
网络
·
安全
·
音视频
·
视频加密
·
鹰盾播放器
·
鹰盾加密器
鹰盾Win播放器作为专业的视频安全解决方案,除了硬件翻录外还有什么呢?
鹰盾Win播放器作为专业的视频安全解决方案,除了硬件翻录外,还构建了一套覆盖软件破解、网络攻击、内容盗用等多维度的盗版威胁防御体系。以下是其应对各类盗版威胁的技术实现与方案解析:
嘟嘟实验室
2 天前
windows
·
macos
·
开源
·
aigc
·
音视频
MatAnyone本地部署,视频分割处理,绿幕抠像(WIN/MAC)
大家好,今天要和大家分享的项目是MatAnyone,与上一篇分享的SAM2LONG类似,不过上次的分享没有提到如何在 MAC 上部署,后来有小伙伴私信说希望能出一个 MAC 版本的。那正好看到MatAnyone这个项目顺手就写下来。该项目基于SAM2同样可以一键抠出视频中的主体,快速输出绿幕视频或者是AlphaMask视频。本篇会分享本地手动部署流程以及MatAnyone的使用方法。
亿牛云爬虫专家
2 天前
音视频
·
爬虫代理
·
短视频
·
代理ip
·
品牌营销
·
小红书
·
热点分析
小红书视频图文提取:采集+CV的实战手记
你有没有遇到过这样的场景?老板说:“我们得看看最近小红书上关于‘旅行’的视频都说了些什么。”团队做数据分析的,立马傻眼:官网打不开、接口抓不着、视频不能保存。
摆渡搜不到你
2 天前
python
·
音视频
某腾X视频下载器2.1
成品示意图基于ts改造m3u8原理进行监听ts文件的请求地址并修改成M3U8地址,后调用m3u8DL-RE下载器进行下载:原理如下 TS分片请求 https://defaultts.tc.qq.com/vipts.tc.qq.com/A1V3juazeTbzm0BnbB3yuBWzRPq6N_Xea19LacsVUXrQ/B_-zZfQ0GV5vY5IDrVDPNMQV3Ogj2422QtEwqDuljZ-V8m1EQ8Fz6MOJflt66DEl3utoWhXuni2lEa0UPqYzEjXOui4HK
小草cys
2 天前
人工智能
·
音视频
·
工作流
·
coze
使用 Coze 工作流一键生成抖音书单视频:全流程拆解与技术实现
摘要:本文基于一段关于使用 Coze 平台构建抖音爆火书单视频的详细讲解,总结出一套完整的 AI 视频自动化制作流程。内容涵盖从思路拆解、节点配置、数据处理到最终草稿输出的完整工作流设计,适合希望利用低代码平台快速打造高质量短视频内容的创作者和开发者参考。