aigc

92year1 小时前
aigc
给 AI 编码 Agent 装一块硬盘:agentmemory 实测上周在用 Claude Code 做一个 Express 项目。Session 1 搭好了 JWT 认证,用的 jose 库,中间件写在 src/middleware/auth.ts。Session 2 想加限流功能,结果 Agent 又问我一遍:"你的认证方案是什么?用的哪个库?"
摄影图3 小时前
aigc·生活·智能家居·插画
智能家居图片素材 助力智慧生活内容高效创作智能家居素材合集 覆盖科技感智慧生活场景 最近整理出一套智能家居和智慧生活场景的高清素材库,内容覆盖智能设备、未来家居等多个方向,不管是做科技品牌宣传、房产推广、家居内容创作还是科技评测都能适配,能很直观地展现科技给日常居住品质带来的改变。这次精挑的5张素材各有适配的使用场景:智能控制客厅的图可以当智能场景展示的配图;现代简约客厅夜景的氛围感很强,适合放在家居氛围感相关的内容里搭配使用;现代化厨房场景的图,能用来补充智能厨房板块的细节;智能化家居系统管理的图,配科技评测的内容刚好合适;多种智能家居电子设备
日光明媚4 小时前
人工智能·计算机视觉·aigc·音视频·sglang
深度解析 SGLang 框架 Wan2.1 视频生成加速技术:从 49 分钟到 1 分钟的极致优化Wan2.1 作为当前开源视频生成模型的标杆,其 14B 参数版本在生成质量上已经达到了商业级水准,但原生推理速度却令人望而却步:单卡 A800 生成一段 5 秒 720P 视频需要近 50 分钟。
searchforAI4 小时前
人工智能·经验分享·笔记·gpt·aigc·知识图谱
AI工具自动解析B站、抖音等视频并整理成图文笔记B站上有很多优质的视频访谈、播客、学术讲座,也是日常重要的学习素材。但是想看的视频太多,许多也特别长(比如罗永浩的十字路口,动不动5小时起步)。
DisonTangor5 小时前
人工智能·ai作画·开源·aigc
【上篇】SenseNova-U1:基于NEO-unify架构统一多模态理解与生成[2026.05.10] 发布🔥SenseNova-U1技术报告🔥及模型权重SenseNova-U1-A3B-MoT-SFT与SenseNova-U1-A3B-MoT
canonical_entropy14 小时前
前端·aigc·ai编程
从 Spec-Driven Development 到 Attractor-Guided Engineeringnop-chaos-flux 是一个基于 React 19、Zustand 5 和 Vite 8 构建的低代码运行时框架。它受百度 AMIS 启发,但基于创新的设计原理从零开始独立实现,包含 JSON Schema 编译器和 runtime,也有报表设计器和 Flow Designer 等设计工具。
Hommy8816 小时前
github·aigc·剪映小助手·视频剪辑自动化
【剪映小助手】字幕信息生成接口字幕信息生成接口(/caption_infos)是CapCut Mate项目中的一个核心API端点,专门用于根据文本内容和时间线生成字幕信息。该接口支持多种字幕样式配置、关键词高亮、入场出场动画以及转场效果设置。
灵感__idea17 小时前
aigc·openai·ai编程
《AI工程》:在天才的游戏里,为普通人做点事教师应该学习术语,从而将这些职业领域内的知识转化为普通民众熟知的语言和表达形式,打破知识与需求间的隔阂 —《哲学的故事》
captain_AIouo18 小时前
大数据·人工智能·经验分享·aigc
降本增效突围,Captain AI助力Ozon商家提升盈利空间在Ozon市场竞争日益激烈的当下,“销量高、利润薄”成为很多商家的共同痛点——物流成本高、人力成本高、库存积压、佣金核算复杂等问题,不断压缩商家的盈利空间。对于中小商家而言,降本增效是生存和发展的核心诉求;对于资深大卖而言,规模化降本才能实现利润持续增长。
ZengLiangYi19 小时前
aigc·ai编程
vectra 向量索引文件损坏怎么办本文面向:ChatCrystal 语义搜索返回空结果或报错,怀疑向量索引损坏的开发者。预计阅读时间:7 分钟
怕浪猫20 小时前
aigc·openai·ai编程
AI 3D 大模型创作微软推出的 AI 3D 生成模型,主打用结构化潜在表示生成高质量 3D 资产。游戏资产制作、虚拟场景搭建、AR/VR 内容、电商 3D 展示等。
陆业聪21 小时前
人工智能·aigc·职业发展
DNS优化实战:从运营商DNS到HttpDNS的进化之路Android网络优化系列 · 第2/5篇从DNS到连接池,打造极速网络体验第1篇:Android网络全链路拆解:一次HTTP请求背后的性能陷阱
日光明媚21 小时前
人工智能·python·计算机视觉·stable diffusion·aigc
TensorRT-LLM 中对 wan 加速流程与方法本文详细拆解NVIDIA TensorRT-LLM 官方对 Wan 系列视频生成模型的完整加速实现,而非 Wan-AI 原生代码。TensorRT-LLM 凭借其深度优化的 CUDA kernel、灵活的并行策略和高效的缓存机制,提升了 Wan 2.1/2.2 系列模型的推理速度。
码农阿强21 小时前
人工智能·ai·aigc
MiniMax speech-2.8-hd 技术详解与API接入实战speech-2.8-hd 是 MiniMax 推出的高清级文本转语音(TTS)模型,主打广播级音质、强情感控制、多语言支持与高自然度,广泛用于播客、有声书、AI陪伴、视频配音等专业场景,兼顾性能与易用性。
手写码匠1 天前
人工智能·深度学习·算法·aigc
手写 AI 推理加速引擎:从零实现 KV Cache 与 Speculative Decoding大模型推理慢是生产环境的第一痛点。同样是 7B 模型,naive 逐 token 生成和经过优化的推理引擎,吞吐差距可达 5-10 倍。本文不依赖任何推理框架,从零手写 KV Cache 和 Speculative Decoding 两大加速技术,代码可直接运行,效果立竿见影。
DisonTangor1 天前
人工智能·3d·开源·aigc
【SIGGRAPH 2026】Pixal3D: 基于图像的像素对齐三维生成Pixal3D 可从单张图像生成高保真3D资产。与此前通过注意力机制松散注入图像特征的方法不同,Pixal3D通过反向投影将像素特征显式提升至3D空间,建立直接的像素到3D对应关系,从而实现接近重建级保真度的精细几何结构和PBR材质。
爱吃的小肥羊1 天前
aigc·ai编程
谷歌I/O解读:小模型反杀旗舰,3.5 Flash凭什么全面超越3.1 Pro?凌晨,谷歌开完了今年的I/O大会。照例,信息量巨大。模型、产品、Agent、搜索、硬件,加在一起十几项。Pichai开场就说,过去十年谷歌一直在往AI转,现在是时候让大家看看成果了。
明天有专业课1 天前
面试·aigc
RAG-重排序策略RAG 系统中的重排序(Reranking)是对初始检索结果进行二次排序的核心后处理环节。初始检索通常依赖向量相似度或关键词匹配,返回的结果在语义相关性上存在噪声,重排序通过更精细的相关性判断模型对候选文档重新打分,将最相关的内容提升到前列,从而提高大模型接收到的上下文质量。
风落无尘1 天前
人工智能·stable diffusion·aigc
AIGC(Stable Diffusion 生态)常用知识与参数速查手册本文针对游戏开发、日常出图、工业化生产场景,整理了SD生态最核心、最常用的知识与参数,覆盖基础概念、核心参数、模型体系、工作流与避坑指南,可直接作为日常工具书使用。
92year1 天前
aigc
用 GitHub spec-kit 做 Spec-Driven Development:从需求到代码一条线上周接了个小项目,照片管理工具,功能不复杂:相册按日期分组,支持拖拽排序,图片瀑布流预览。我估了三天工期,结果一天半就上线了。不是我代码写得快,是压根没怎么写代码——大部分时间在写需求文档。