aigc

Kayshen2 小时前
前端·aigc·agent
春节期间我们开源了一个 AI-Native 的矢量设计工具,对标 Pencil.dev,让 AI Agent 直接画 UI我做了一个开源矢量设计工具叫 OpenPencil,对标商业产品 Pencil.dev,核心差异点:如果你用过 Pencil.dev,你应该知道它的 AI 生成设计能力很强。但它是闭源的、付费的,而且设计稿锁在它的平台里。OpenPencil 想做的事情是——把同样的能力开源出来,同时让设计稿真正属于你的代码仓库。
得一录3 小时前
深度学习·aigc
AI Agent的主流设计模式之工具调用模式LLM本质上是“静态”的,它的知识截止于训练数据,且无法直接与外部世界交互。工具调用就是为了解决LLM的三大核心局限:
树獭叔叔3 小时前
后端·aigc·openai
04-残差连接与Pre-LN:让大模型的深度网络成为可能在前面的章节中,我们学习了注意力机制、位置编码和MLP层。现在让我们把它们组合成一个完整的Transformer层:
小熊巨离谱3 小时前
aigc
🔥从聊天到干活:三分钟搞懂 LLM、Agent、RAG、Skill这几个词儿你认识多少?如果你全都不认识,那么恭喜你来对地方了。2026 年开年,AI 圈的热度直接拉满。2 月 12 日豆包接入视频生成模型 Seedance 2.0,14 日豆包 2.0 Code 版牵手国产编程 AI Trae,智谱 GLM-5 也在近期正式亮相。一时间,LLM、RAG、Skill、Agent 这些新词刷屏技术圈,仿佛听不懂就跟不上时代。
多恩Stone4 小时前
人工智能·算法·3d·aigc
【3D-AICG 系列-13】Trellis 2 的 SC-VAE 的 Training Loss 细节本文是论文 3.2.2 VAE Training 与代码的逐项对应说明。论文:代码: ShapeVaeTrainer,lambda_vertice(默认 0.01)
AI袋鼠帝20 小时前
aigc
Seedance2.0还在做视频,这个AI已经开始"造世界"了..大家好,我是袋鼠帝。我们熟知的 AI 模型,有写文章的大语言模型,有画图的生图模型,有做视频的视频模型,还有音频模型。
AI袋鼠帝20 小时前
aigc·ai编程
我宣布:今年春节的年味,交给秒哒了!大家好,我是袋鼠帝。我发现,现在的年味儿是越来越淡了。小时候还会放鞭炮,一大家子人聚在一起,今天去舅舅家,明天去伯伯家,好不热闹,好不欢乐。
AI袋鼠帝20 小时前
aigc·ai编程·chatglm (智谱)
智谱GLM-5这次开源,让高级程序员也危险了...大家好,我是最近天天被AI狂轰滥炸的袋鼠帝。先看看我用GLM-5优化的营销短视频一键生成平台*生成效果不重要,后面接入更好的模型即可,关键是平台能力搭建起来了。 *
万里鹏程转瞬至20 小时前
论文阅读·深度学习·aigc
论文简读 | TurboDiffusion: Accelerating Video Diffusion Models by 100–200 Times论文地址:https://jt-zhang.github.io/files/TurboDiffusion_Technical_Report.pdf 项目地址:https://github.com/thu-ml/TurboDiffusion 发表时间:2025年12月18日 内容由豆包ai总结
万里鹏程转瞬至21 小时前
深度学习·aigc
SLA与Flash_attn对比测试项目地址:https://github.com/thu-ml/SLA 项目下有SageSLA与sparse_linear_attention两个版本,SageSLA是基于SageAttention实现的版本,sparse_linear_attention是基于triton实现的版本。
小程故事多_801 天前
人工智能·开源·aigc
抛弃工具堆砌,基于 LangGraph + 开源生态,打造可自愈的 AI Agent 系统在AI技术飞速迭代的当下,全自动化AI Agent已从概念走向实用,它无需人工干预,能自主规划任务、调用工具、处理异常,甚至在失败后自我恢复,广泛适用于内容创作、数据同步、自动化运营、代码调试等多个场景。很多开发者渴望搭建自定义的全自动化AI Agent,但往往陷入“工具堆砌”的误区,忽略了流程可控、安全隔离与长期可维护性的核心需求。事实上,依托当前成熟的开源生态,我们无需从零造轮子,只需理清模块逻辑、选对技术路径,就能快速构建一套稳定可用的全自动化AI Agent系统。
SmartBrain1 天前
人工智能·spring boot·架构·langchain·aigc·fastapi
技术洞察:SpringAI与LangGraph选型对比基于同时使用 Java 和 Python研发团队,以及医疗复杂场景的特殊需求,我总结了一份全面的 SpringAI 与 LangGraph 对比分析,重点聚焦医疗场景的 RAG 应用,并给出选型决策建议。
用户60648767188961 天前
aigc
Python + DALL·E / Gemini 批量生图实战:从单张到流水线的完整方案最近在做一个需要批量生成商品图的项目,踩了不少坑,把方案整理出来分享一下。手动用 ChatGPT 或 Gemini 网页版生图,一张张来效率太低。API 的优势:
软希网分享源码1 天前
python·自动化·aigc
AIGC自动化编程实战(Python、Java、JavaScript和VBA) -2.9G课程课程下载:https://download.csdn.net/download/m0_66047725/92626778
有点心急10211 天前
人工智能·python·aigc
SQL 执行 MCP 工具开发(一)调用MCP执行SQL时会自动弹出消息框,倒计时结束前未审批会自动拒绝该SQL的执行,此外可以通过备注介入,给AI合理的建议。
小程故事多_801 天前
java·前端·人工智能·重构·aigc
破局 LLM 黑盒困局,Phoenix 凭全链路可观测,重构大模型应用工程化落地规则在大语言模型(LLM)技术快速普及的今天,越来越多的团队和开发者开始搭建属于自己的LLM应用,从简单的智能客服、文档问答机器人,到复杂的多智能体系统、自动化工作流,LLM正在渗透到业务的每一个环节。但与此同时,几乎所有从业者都面临着同一个绕不开的难题,LLM应用的全生命周期管理,始终处在一个近乎黑盒的状态里,这也成为制约LLM应用规模化落地的核心瓶颈。
冬奇Lab2 天前
人工智能·开源·aigc
一天一个开源项目(第30篇):banana-slides - 基于 nano banana pro 的原生 AI PPT 生成应用"Vibe your PPT like vibing code."这是"一天一个开源项目"系列的第30篇文章。今天带你了解的项目是 banana-slides(GitHub),由 Anionex 开源。
win4r2 天前
aigc·openai·ai编程
🚀OpenClaw高级进阶技巧分享!模型精选策略+记忆系统优化经验+深度搜索集成+Gateway崩溃自动修复!Claude Code自动读日志修Bug重启验证OpenClaw 的下一站:从“能用”到“会协作”,从“模型”到“系统”的未来趋势洞见。🔥🔥🔥本篇笔记所对应的视频 : www.bilibili.com/video/BV1pe…
智算菩萨2 天前
人工智能·算法·aigc
交错多模态内容生成:从“单张图“到“图文混排长文“的创作范式变革摘要:随着大语言模型和视觉生成技术的飞速发展,人工智能内容生成正经历从单一模态向多模态融合的根本性转变。交错多模态内容生成技术使模型能够像人类创作图文并茂的文章那样,自由地交替生成文本和图像,形成连贯的叙事流。本文系统性地介绍了这一前沿领域的理论基础、核心技术和最新进展,深入分析了扩散模型、自回归模型和融合AR+扩散三大技术路线,详细解读了SEED-Story、Chameleon、Janus、Show-o和Emu3等代表性模型,并展望了未来的发展方向。
用户5191495848452 天前
人工智能·aigc
CitrixBleed 2 内存泄漏漏洞利用框架 (CVE-2025-5777)一个针对 CVE-2025-5777 的研究级利用与防御检测框架,深度剖析 Citrix NetScaler ADC/Gateway 越界内存读取漏洞。