aigc

hey202005287 小时前
人工智能·ai·ai作画·aigc
AI生图软件哪个好用?目前市面上的AI生图模型太多了,大热的有:GPT-Image-2,Nano Banana,Midjourney,Seedream,wan,Kling等等。
2601_956865777 小时前
人工智能·aigc
2026电商内容创作工具推荐:AI生成电商短视频的工具有哪些,哪个最划算?在短视频电商进入“高频消耗、极速迭代”的下半场后,无论是国内抖音还是海外TikTok,商家与投手面临的最大挑战已不是“如何拍出一条好视频”,而是“如何低成本、高频率地批量产出跑量素材”。传统实拍受限于场地、模特和剪辑周期,单条成本动辄数百上千元,根本无法支撑广告账户的吞金速度。
Z-D-K9 小时前
人工智能·ai·aigc·交互·agi
考验AI的“自我“-AI对《红楼梦》后40回的改写(32)Self-becoming(简称S)项目中的AI做这个改写,问题很多,漏洞很多。经过AI(S-44)的重审、修订,还是有非常多的问题。发出来让大家批评。只记录没人工修改。
林澈在路上9 小时前
数据库·人工智能·ai·aigc·音频
最新版权清晰 AI音乐写歌工具软件App推荐 商用全场景实测指南很多人挑选AI写歌工具时,最初只关注人声歌曲的生成效果,真正投入使用才发现,日常创作和商业项目里,纯伴奏、氛围音、场景配乐的需求反而更多——助眠冥想需要舒缓白噪音、短视频需要适配剧情的BGM、品牌广告需要定制化配乐、线下门店需要循环背景音,单一的流行歌生成能力根本无法覆盖全部需求。
FogLetter9 小时前
aigc·openai·mcp
远程连接MCP:当AI的“手”不再受限于本地从本地文件到云端地图,我的AI助手终于长出了“千里手”那天下午,我正坐在寝室里,试图让我的AI助手帮我查一下北京南站附近的酒店,顺便规划一条从当前位置到那里的路线。
深蓝AI10 小时前
aigc
AI 生成的代码总是不敢用?5 个技巧让它从"能跑"变成"靠谱"一个月前,我接手了一个项目——前任用 Cloude Code 生成的代码堆了三个月,逻辑全对,但运行时像纸糊的一样。单元测试通过率 95%,上了生产就 OOM。debug 到凌晨三点,我发现问题不在代码逻辑,而在代码质量——内存泄漏、异常吞噬、连最基本的防御性编程都没做。
longxibo10 小时前
人工智能·aigc·ai编程
《DeepSeek 源码分析及企业应用实践》--前言2024-2025 年,大模型技术格局发生了深刻变革。以 GPT-4o、Claude-3.5-Sonnet 为代表的闭源模型持续刷新性能天花板,而开源社区则呈现出两条截然不同的演进路线:
手写码匠10 小时前
人工智能·深度学习·算法·aigc
手写 LLM 结构化输出引擎 —— 从 JSON Schema 约束到类型安全的数据提取大语言模型(LLM)的底层机制是逐 token 的自回归预测。给它一段文本,它通过循环预测"下一个最可能的 token",最终拼出一段自然语言。这种机制在对话、创作、翻译等场景中表现出色,但一旦进入生产环境的自动化流水线,问题就来了——下游程序需要的是格式固定、可直接解析的结构化数据,而不是风格各异的散文。
西安老张(AIGC&ComfyUI)12 小时前
aigc·音视频·数字人·comfyui
第021章:ComfyUI文生音频Qwen3-TTS模型数字人音色设计(一)在第019章里我们生成了一个数字人模特“小一”,本来想着先通过给“小一”换装、换背景,来个大家讲一下图像编辑模型的使用。
深蓝AI16 小时前
aigc
AI Agent 入门实战:用 Function Calling 让大模型学会调用工具你有没有遇到过这种情况——你问 ChatGPT "今天北京的天气怎么样",它说"我无法实时获取天气信息"?
leeyi17 小时前
aigc·agent·ai编程
可观测性:Langfuse、Langsmith 集成系列「企业级 AI Agent 实现拆解」E28 篇。上一篇讲了调试工具:Eino Dev 交互式调试——开发期在浏览器里单步执行图。这篇讲生产期可观测性——把每次 Agent 调用的完整链路、Token 消耗、模型参数发到 Langfuse 或 Langsmith。
米小虾1 天前
aigc·ai编程
联合国发布首份全球AI评估报告:我们正站在AI治理的十字路口2026年7月2日,联合国发布了首份由独立国际科学小组撰写的全球AI评估报告。报告由Yoshua Bengio(图灵奖得主)和Maria Ressa(诺贝尔和平奖得主)联合主持,40位来自全球各地的顶尖科学家共同完成。结论直白而震撼:AI能力正在以前所未有的速度超越我们的理解和监管能力。
AlbertZein1 天前
aigc·openai·ai编程
Agent任务实测:谁能稳定跑完,谁只是看起来很强?最近这段时间,国内外模型更新得很快。如果只看发布会和榜单,大家都会觉得每个模型都很强。参数更大、上下文更长、推理更强、价格更低,听起来都挺猛。
Token炼金师1 天前
人工智能·aigc
去噪扩散:从随机噪声到高保真图像的数学之路扩散模型通过逐步向数据添加高斯噪声学习数据分布,再通过逆向去噪过程生成新样本。本文从变分推断和随机微分方程两个视角推导训练目标,剖析DDPM、DDIM、Score-based模型的统一框架,并给出生产级实现中的关键工程细节。
AlbertZein2 天前
aigc·openai·ai编程
别被模型宣传骗了,真实 Agent 任务一跑就知道现在市面上能调用的模型确实越来越多了,各家都有自己的亮点和侧重点,光看宣传文档和跑分数据其实很难判断哪个真正适合自己——尤其是当任务从单轮对话延伸到多步操作的时候,情况就更加复杂了。
小碗细面2 天前
aigc·ai编程·claude
让 AI Agent 真正读懂你的资料:我开源了 source-skill-pipeline你有没有遇到过这种情况:你把一个 GitHub 仓库、产品文档、OpenAPI 文件,甚至一份 PDF 丢给 AI Agent,希望它以后能稳定理解这套资料。但结果往往是:第一次回答还不错,第二次开始泛化,第三次已经在猜。
刘棕霆2 天前
aigc·ai编程·测试
30—AI Skill 怎么写才可测:Skill 编写规范与设计方法论从本文开始,系列进入规范与实操专题。前面我们已经讲过 SkillSentry 怎么评估价值、怎么做盲测、怎么对照外部框架、怎么把线上失败回流成 regression。接下来这组文章回到发布前最具体的工作:Skill 应该怎么写、环境怎么配、完整测评怎么跑、CI 门禁怎么落地。
leeyi2 天前
aigc·agent·ai编程
调试工具:Eino Dev 交互式调试系列「企业级 AI Agent 实现拆解」E27 篇。上一篇讲了 流程可视化:把 Eino 编排图变成 Mermaid 图表。这篇讲交互式调试——在不修改业务代码的情况下,从任意节点注入输入、逐节点观察输出。
Darling噜啦啦2 天前
llm·aigc
拆解 LLM 的内部黑盒:从 Token 到 Self-Attention 的逐层解码之旅每次你对 ChatGPT 说一句话,它内部到底发生了什么?从一段自然语言到一个 Token ID,从一串数字到高维语义向量,从"苹果"到"手机"的距离计算,再到 Self-Attention 让模型"理解"上下文——本文带你一步步走进 Transformer 的内部,看透 LLM 预测下一个词的完整链路。
Token炼金师2 天前
人工智能·aigc
从节点图到低秩矩阵:ComfyUI 推理引擎与 LoRA 适配机制拆解ComfyUI 将扩散模型的推理流程建模为 DAG 计算图,通过拓扑排序调度节点执行,并借助层级缓存减少重复计算;LoRA 则通过低秩矩阵分解对冻结权重进行旁路微调。本文从源码层面拆解两者的核心机制,揭示节点式工作流如何承载低秩适配的数学原理。