aigc

树獭叔叔20 分钟前
后端·aigc·openai
大模型行为塑造:SFT 与 LoRA 深度解析如果说**预训练(Pre-train)**是让模型在图书馆里读万卷书,那么 SFT(有监督微调) 就是教模型如何通过考试、如何与人沟通,而 LoRA 则是完成这一过程最经济高效的“手术刀”。
搞科研的小刘选手2 小时前
人工智能·算法·aigc·生成式ai·学术会议·计算机工程·生成式设计
【人工智能专题】2026年人工智能与生成式设计国际学术会议(ICAIGD 2026)2026年人工智能与生成式设计国际学术会议(ICAIGD 2026) 2026 International Conference on Artificial Intelligence and Generative Design
SmartBrain3 小时前
人工智能·语言模型·aigc
经营洞察:三种经营哲学的核心内涵和实践机制目录一、三种经营哲学的核心内涵与理论基础1.1 稻盛和夫:以 "敬天爱人" 为根基的价值创造哲学1.2 任正非:基于熵减理论的组织进化哲学
阿杰学AI3 小时前
人工智能·ai·语言模型·自然语言处理·aigc·大模型全栈工程师·新型职业
AI核心知识104—大语言模型之 LLM Full Stack Engineer(简洁且通俗易懂版)大模型全栈工程师 (LLM Full Stack Engineer) 是 AI 时代诞生的一种“超级个体”或新型技术角色。
孟健4 小时前
aigc·openai·ai编程
90%程序员还在让 AI 补代码,1%已经在指挥 AI 军团大家好,我是孟健。90%的程序员已经在用 AI 写代码了,但 90%的人还停留在"让 AI 补全下一行"。
智算菩萨4 小时前
人工智能·aigc
指令遵循的能力涌现:对齐假设与任务泛化大规模语言模型(Large Language Models, LLMs)近年来展现出了令人瞩目的指令遵循能力,这种能力的涌现现象引发了学术界对对齐假设与任务泛化机制的深入研究。本文从理论层面系统阐述了指令遵循能力涌现的内在机制,深入探讨了规模定律与涌现能力之间的非线性关系,分析了对齐假设的核心内涵及其理论支撑,并详细论述了任务泛化的实现路径。通过对InstructGPT、FLAN、LIMA等代表性工作的理论分析,本文揭示了指令遵循能力涌现背后的计算原理与认知机制,为理解大语言模型的智能本质提供了新的理论视
盛夏光年爱学习5 小时前
aigc
上下文隔离的两种模式在 Agent 系统刚流行时,很多团队都有一个直觉:一个 Agent 不够强,那就多来几个。但很快,另一个现实问题出现了。Cognition 等顶级团队都公开警告过:
得一录5 小时前
深度学习·算法·aigc
星图·全参数调试qwen3.1-Bswanlab: Tracking run with swanlab version 0.7.8 swanlab: Run data will be saved locally in /root/workspace/SFT/swanlog/run-20260214_194247-3pbhrarpfcqr95z67fwxq
盛夏光年爱学习8 小时前
aigc
AI Agent的Context Engineering:构建Manus的经验教训2025/7/18 --Yichao 'Peak' Ji在Manus项目的最初阶段,我和我的团队面临一个关键决策:我们应该使用开源基础模型训练一个端到端的agentic模型,还是在前沿模型的in-context learning能力之上构建agent?
xuegao080710 小时前
人工智能·python·aigc
星图AI_comfyUI部署实践_问题解决方案记录1. jupyter安装comfyUI 和 comfyUI-managergit clone https://github.com/comfyanonymous/ComfyUI.git
孟健21 小时前
aigc·openai·ai编程
用 OpenClaw 做视频:播放量从几十涨到 9000,成本一毛钱大家好,我是孟健。我做视频号不用剪映,不用 PR ,甚至不碰任何剪辑软件。 一条 60 秒的短视频,成本一毛钱,从选题到成片 15 分钟搞定。
小程故事多_8021 小时前
人工智能·架构·aigc
极简即王道 下一代Agent架构Pi Agent Core设计逻辑深度解析在当前人工智能Agent领域的发展浪潮中,各类框架层出不穷,大多数开发者都陷入了一种“加法思维”的误区,认为Agent的能力提升必然依赖更多的工具、更长的提示词、更复杂的规划链路以及更多的子Agent。然而,由Mario Zechner开发的Pi Agent Core(以下简称Pi)却走出了一条截然不同的道路,它以“极简主义”为核心哲学,用不到1500行代码、5个核心文件,在Terminal-Bench 2.0排行榜中与众多复杂架构的Agent同台竞技并跻身前列,重新定义了下一代Agent的设计逻辑。
ServBay1 天前
aigc·ai编程
GLM-5 拉高开源上限,离一人公司更近了以前我觉得开源模型大多是玩具,真要干活、写复杂逻辑,还得老老实实给闭源大厂交 API 的保护费。GLM-5 的发布,不是一次简单的版本号 +1,而是直接把开源模型从玩具拉到了员工的级别。
树獭叔叔1 天前
后端·aigc
从向量到文字:Transformer 的预测与输出(LM Head)在经过 NNN 层 Decoder 的复杂思考(Attention, MLP, MoE)后,模型最终需要将抽象的数学向量转化为人类可读的文字。这个过程主要发生在模型的“输出头”——LM Head。
reddingtons1 天前
游戏·3d·prompt·aigc·设计师·游戏美术·slg
Scenario: SLG 地图铺到吐?搭建“轴测流水线”,量产建筑不重样下午,Producer路过你的工位,顺手丢下一句让所有场景原画师血压飙升的话: “下个月内测,主城的那 50 个功能建筑,每种都要出 1 到 10 级的升级外观。周一先看‘魔法塔’的 10 个等级草图。” 你看着屏幕上那张还没画完的 Level 1 魔法塔,大脑一片空白。 对于国内主攻 SLG或模拟经营类手游的美术团队来说,“轴测资产量产” 就是毫无感情的消耗战。 透视要统一 30 度,光影要一致,还要画出“升级感”(Level 1 是茅草屋,Level 10 是水晶宫)。 纯手绘?画到手断也追不上策划的
德育处主任1 天前
人工智能·llm·aigc
『n8n』让大模型识别图片内容点赞 + 关注 + 收藏 = 学会了整理了一个n8n小专栏,有兴趣的工友可以关注一下 👉 《n8n修炼手册》
DisonTangor1 天前
人工智能·开源·aigc
【阿里拥抱开源】阿里inclusionAI开源多模态Ming-flash-omni 2.0📑 技术报告|🤗 Hugging Face| 🤖 ModelScope全新发布的Ming-flash-omni 2.0采用Ling-2.0架构——这是一种包含1000亿总参数和60亿活跃参数的混合专家模型(MoE)框架。相比前代产品实现了代际跨越,在开源全能多模态大语言模型领域创下了新的性能标杆。该版本成功实现了基础能力与专业领域知识的协同增效,尤其在视觉百科知识、沉浸式语音合成以及高动态图像生成与编辑方面展现出卓越性能。
IvanCodes1 天前
aigc·openai
从清华开源作业到 OpenAI:一个工程脑如何改写游戏规则有时候我会想,大模型时代最荒诞的一件事是什么。不是模型越来越强,也不是论文越来越多。而是我们明明站在一个技术爆炸的年代,却越来越容易被一种幻觉迷住:只要我想到一个好点子,我就能改变世界。
赛博鲁迅1 天前
人工智能·gpt·aigc·ai编程·dify·ai-native
dify添加中转站模型教程API地址填写 https://api.88api.chat
小陈Coding1 天前
aigc·音视频·java面试·电商·技术面试·互联网大厂·内容社区
互联网大厂Java面试实录:电商音视频内容社区场景深度解析面试官:张工,10年互联网大厂经验,阿里P8级别,专注于电商、音视频、内容社区领域 候选人:谢飞机,Java开发工程师,3年工作经验 面试场景:某互联网大厂电商音视频内容社区后端技术面试