大模型

丁学文武14 小时前
人工智能·gpt·语言模型·自然语言处理·大模型·llama·glm
大模型原理与实践:第三章-预训练语言模型详解_第3部分-Decoder-Only(GPT、LLama、GLM)第一章 NLP基础概念完整指南第二章 Transformer 架构原理第三章 预训练语言模型第四章 大语言模型
utmhikari1 天前
自动化测试·游戏·ai·大模型·llm·游戏测试
【测试人生】LLM赋能游戏自动化测试的一些想法在三年前笔者撰写的Game-Of-AutoTest专栏当中,聊了很多关于游戏自动化测试的实践思考。不论是对自动化测试在技术层面的认识,还是怎么落地一些技术基建保障游戏自动化测试的可扩展性,在这些专栏里都已经做了深度的科普。近年来,LLM在自然语言处理领域取得了突破性进展,并且随着游戏开发的复杂度不断提升,自动化测试在保障游戏质量方面变得尤为重要。直感来看,LLM作为通用的信息处理转换大脑,必然能为游戏自动化测试技术带来了新的可能性。因此,本文就浅聊一下LLM赋能游戏自动化测试的一些想法。
nju_spy2 天前
人工智能·面试·lora·大模型·rag·提示词工程·peft微调
大模型面经(一) Prompt + RAG + 微调目录大模型微调问题一:领域微调中,如何平衡 “领域知识习得” 和 “通用能力保留”?问题二:SFT 后模型出现 “指令遵循能力下降”
北邮刘老师2 天前
人工智能·大模型·智能体·智能体互联网
【未来】智能体互联时代的商业模式变化和挑战:从HOM到AOM【摘要】本文讨论了商业模式从 Human-Oriented Marketplace(HOM,以人为中心的市场)到 Agent-Oriented Marketplace(AOM,以智能体为中心的市场)的演变逻辑。首先,文章回顾了互联网时代及以前的商业模式特点:市场围绕人展开,商家与消费者直接连接,商业平台承担撮合和服务的中介作用。随后,文章分析了智能体互联时代的出现所带来的根本性变化:人类不再直接连接市场,而是通过智能体助手表达需求并完成交易;商家也通过智能体接口提供产品与服务,由此市场从“面向人”转变为“
北邮刘老师2 天前
人工智能·大模型·智能体·智能体互联网
关于智能体互联协议标准的130天终于,《人工智能 智能体互联》系列7项国家标准化指导性技术文件走入了公开征集意见环节,从5月22日第一次去开元大厦参加智能体互联协议标准讨论会(那时候还叫做《人工智能 智能体通用互联协作通信协议》),到今天,已经过去了整整130天。这130天里,有初次参会时一些厂商对刘老师掺和产业界标准的不理解,有电子四院高歌和各位领导的信任和支持,有技术讨论会上的激烈争论,有高铁站和候机室的临时办公,有夜晚到深夜的接力编写文稿,有技术小组熬夜编写代码,也有周末加班赶工时从雄安路途中点送的奶茶。。。太多一幕幕像电影胶片一
山顶夕景2 天前
大模型·微调·swift·强化学习
【LLM】基于ms-Swift大模型SFT和RL的训练实践lora微调脚本例子如下,10分钟在单卡3090上对Qwen2.5-7B-Instruct进行自我认知微调:
CoderJia程序员甲3 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-10-03)生成于:2025-10-03共发现热门项目:20 个榜单类型:日榜本期GitHub热榜呈现AI驱动开发、金融科技和开源工具三大趋势。AI应用持续爆发,涵盖LLM后训练库、RAG流水线、AI视频生成及智能体工作流,显示生成式AI正向终端应用深度渗透。金融领域聚焦高性能交易数据库与多智能体交易框架,强调安全与实时性。同时,自托管数据管理(如Nextcloud、Immich)和开发效率工具(如Claude Code、Quarkus)活跃,反映企业对数据主权与开发体验的双重追求。开源生态正加速AI与产业融合。
audyxiao0013 天前
大数据·人工智能·机器学习·大模型·智能体
NeurIPS 2025论文分享|FedFree:突破知识共享壁垒的异构联邦学习新框架第39届神经信息处理系统大会(NeurIPS 2025)将于2025年12月在美国圣地亚哥会议中心(San Diego Convention Center)隆重举行。NeurIPS是人工智能和机器学习领域最具影响力的国际顶级会议之一,涵盖深度学习、分布式机器学习、强化学习、自然语言处理、计算机视觉等多个研究方向。
大千AI助手5 天前
人工智能·语言模型·自然语言处理·大模型·图灵测试·big-bench·bbh
BIG-Bench:大规模语言模型能力的全面评估与挑战本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
大模型铲屎官6 天前
人工智能·python·大模型·二分查找·数据结构与算法·斐波那契·分块查找
【数据结构与算法-Day 37】超越二分查找:探索插值、斐波那契与分块查找的奥秘01-玩转LangChain:从模型调用到Prompt模板与输出解析的完整指南 02-玩转 LangChain Memory 模块:四种记忆类型详解及应用场景全覆盖 03-全面掌握 LangChain:从核心链条构建到动态任务分配的实战指南 04-玩转 LangChain:从文档加载到高效问答系统构建的全程实战 05-玩转 LangChain:深度评估问答系统的三种高效方法(示例生成、手动评估与LLM辅助评估) 06-从 0 到 1 掌握 LangChain Agents:自定义工具 + LLM 打造智能
pedestrian_h6 天前
ai·golang·大模型·graph·eino
AI大模型框架eino框架快速上手来具体看下eino框架的各个api注意这个图只定义了各个节点之间的流向,没有定义大模型,这个是eion框架设计的重要思想
charieli-fh6 天前
人工智能·深度学习·大模型·大语言模型
LoRA 高效微调大语言模型全流程:从原理、实践到参数调优在大语言模型(LLM)的微调实践中,LoRA (Low-Rank Adaptation) 是解决高昂计算成本的核心技术。本文基于 Hugging Face 生态,提供了一套完整的 LoRA 微调 Seq2Seq 模型 (mt0-large) 的工作流。通过对比三组不同超参数配置的实验数据,文章重点分析了 目标模块 (target_modules) 和学习率 (learning_rate) 对模型推理质量的决定性影响,并给出了经过验证的优化配置。
科技峰行者6 天前
人工智能·阿里云·ai·大模型·agi
通义万相2.5系列模型发布,可生成音画同步视频9月24日,在2025杭州云栖大会上,阿里发布通义万相Wan2.5 preview系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型,其中,通义万相2.5视频生成模型能生成和画面匹配的人声、音效和音乐BGM,首次实现音画同步的视频生成能力,进一步降低电影级视频创作的门槛。即日起,用户可在阿里云百炼平台调用API,或在通义万相官网直接体验。
精致先生6 天前
pdf·大模型·rag
多模态PDF解析在多模态 RAG(Retrieval-Augmented Generation)系统中,多模态 PDF 的解析是核心前提 —— 其目标不仅是提取传统文本信息,更要精准识别、分离并结构化 PDF 中嵌入的非文本模态内容(如图像、表格、公式、图表等),同时保留各模态与文本的上下文关联(如 “某段文字对应下方图表”“某公式解释了左侧数据表格”),为后续检索和生成提供结构化的多模态数据基础。
大千AI助手7 天前
人工智能·大模型·llm·强化学习·评估基准·数学推理能力·math500
MATH-500:大模型数学推理能力评估基准本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
AI绘画哇哒哒7 天前
人工智能·sql·深度学习·学习·ai·程序员·大模型
实战:SQL统一访问200+数据源,构建企业级智能检索与RAG系统(下)本篇内容:上篇我们已经体验到MindsDB的两大集成能力:数据源(RDBMS、文件、向量库等)的集成与AI模型(传统ML模型、语言模型、嵌入模型等)的集成。其独特之处在于:让你用一种统一的SQL接口方式来查询所有的数据源与模型,并能够巧妙的融合。
spader-ai8 天前
人工智能·大模型·rag·上下文工程
RAG is really dead? 大模型和知识之间的桥梁没了?作者:SpaderMan最近,Latent Space 播客发布了一期标题为["RAG 已死,上下文工程为王"](https://www.latent.space/p/chroma ""RAG 已死,上下文工程为王"")的访谈,其中开源向量数据库 Chroma 的创始人 Jeff Huber 的观点引发了广泛讨论。这个观点触及了一个核心问题:我们是否真的理解自己在构建什么?
烟锁池塘柳08 天前
大模型·大模型应用
【大模型】深入理解大模型输出的Temperature、Top-k与Top-p采样在与大型语言模型(LLM)如GPT系列、Llama等交互时,我们常常惊叹于它们生成文本的多样性和创造力。但你是否想过,这些模型是如何在“一本正经”地回答事实性问题和“天马行空”地进行文学创作之间自由切换的?这背后的“魔法”其实源于一系列精妙的参数控制,其中最核心的便是Temperature、Top-k和Top-p等。现在有的大模型可视化API调用程序(如 Google AI Studio 等)已经支持用户自主调控这些参数。
qq7422349848 天前
大模型·编辑器·markdown
免费版Markdown 编辑器:Typora要充分发挥Typora的潜力,可以从以下几个方面入手。当你熟悉基础操作后,这些进阶功能可以让你的文档更专业。
nju_spy8 天前
人工智能·pytorch·深度学习·大模型·多头注意力·rmsnorm·位置掩码
南京大学 LLM开发基础(二)大语言模型解析 -- 基于HF LlaMA实现的讲解https://njudeepengine.github.io/llm-course-lecture/2025/lecture4.html#1