大语言模型

deephub3 小时前
人工智能·深度学习·大语言模型·agent
让 AI 智能体学会自我进化:Agent Lightning 实战入门当前主流 AI 智能体框架有一个共同的局限:智能体只能按预设逻辑执行任务,无法从运行时反馈中持续学习。模型权重是静态的,提示词需要人工迭代,整个系统缺乏自我优化的闭环。
Jackson@ML6 小时前
python·大语言模型·kimi
Kimi K2.5横空出世!K2.5模型功能详解By Jackson@ML2026年1月27日,月之暗面技术有限公司(MoonShot AI)正式发布Kimi K2.5,它是迄今为止 Kimi 最智能的模型,在 Agent、代码、视觉理解以及一系列通用智能任务中实现了开源的最先进性能。
五点钟科技1 天前
人工智能·llm·ocr·论文·大语言模型·deepseek·deepseek-ocr
Deepseek-OCR:《DeepSeek-OCR: Contexts Optical Compression》 论文要点解读最近幻方又在搞事情了,一篇关于通过视觉进行语言理解的论文火遍圈子。迫不及待看了看论文,发现他们真是一支十分聪明又十分善于思考的团队,不得不佩服!
deephub1 天前
人工智能·pytorch·python·深度学习·大语言模型
用 PyTorch 实现 LLM-JEPA:不预测 token,预测嵌入这篇文章从头实现 LLM-JEPA: Large Language Models Meet Joint Embedding Predictive Architectures。需要说明的是,这里写的是一个简洁的最小化训练脚本,目标是了解 JEPA 的本质:对同一文本创建两个视图,预测被遮蔽片段的嵌入,用表示对齐损失来训练。
yuanlulu1 天前
人工智能·大语言模型·agent·智能体·skill·claude code·opencode
Agent_Skills_完全教程「AI生成」在opencode中使用kimi2.5生成的skil教程。Agent Skills 是由Anthropic开发并开源的一种轻量级、开放式格式,专门用于扩展AI智能体的能力。它是一种标准化的方式,让开发者可以将专业知识、工作流程和特定领域的操作封装成可复用的"技能包"。
大熊猫侯佩3 天前
llm·swiftui·大语言模型·foundationmodel·apple ai·apple 人工智能·summarize
赛博深渊(上):用 Apple Foundation Models 提炼“禁忌知识”的求生指南新九龙城的雨从未停过。霓虹灯的废气在湿漉漉的街道上晕染开来,像极了那个死于代码过载的倒霉蛋老王流出的脑浆。
小爷毛毛(卓寿杰)3 天前
人工智能·自动化·powerpoint·大语言模型
SlideFlow: AI 驱动的 PPT 自动化生成引擎重磅推荐专栏: 《大模型AIGC》 《课程大纲》 《知识星球》本专栏系统介绍了大语言模型(LLM)及其相关技术的系列文章。第一章从LLM基础概念入手,涵盖文本向量化、ChatGPT应用、模型架构等基础知识,并针对Qwen3模型进行了6篇技术报告的深度解读。第二章聚焦RAG(检索增强生成)与Agent技术,包括RAG架构实践、知识图谱应用和多篇行业案例解析,同时包含17篇Dify框架核心源码的模块化解读。文章内容涵盖从基础理论到行业应用的全方位技术解析,为开发者提供了大语言模型技术落地的完整知识体系。
Wilber的技术分享3 天前
人工智能·深度学习·transformer·大语言模型·大模型面试题·面试八股
【大模型面试八股 1】Transformer注意力机制:MHA、MQA、GQA、MLA原理解析与对比在自然语言处理(NLP)、计算机视觉(CV)等领域的突破性进展中,Transformer架构作为核心模型之一,已经成为众多任务的标准框架。然而,随着模型规模的持续增长,传统的多头注意力机制(MHA)在计算效率和内存消耗方面逐渐暴露出瓶颈。为了解决这些问题,研究者提出了新型的注意力机制,如多查询注意力(MQA)、分组查询注意力(GQA)和多头潜在注意力(MLA),它们通过不同的优化策略提升了Transformer的效率。
deephub4 天前
人工智能·大语言模型·agent·claude code
Claude Code子代理实战:10个即用模板分享如果你认为Claude Code 的使用流程就是随手丢一句话,然后就等结果那你就错了。比如你对Claude Code 说
deephub6 天前
人工智能·python·大语言模型·agent
用 PydanticAI 让 LLM 输出变成可信赖的 Python 对象构建过 AI agent 的人大概都遇到过这种情况:LLM 返回的数据"差不多"是你要的但又不完全对。比如会遇到字段名拼错了数据类型不对,或者干脆多了几个莫名其妙的 key。
武汉唯众智创6 天前
人工智能·语言模型·自然语言处理·大语言模型·自助式 ai 心理咨询系统·ai 心理咨询系统·ai 心理咨询
基于大语言模型的自助式 AI 心理咨询系统1.1 时代背景:传统心理咨询的痛点与 AI 技术的破局在快节奏、高压力的现代社会,心理健康问题日益凸显,焦虑、抑郁等情绪障碍困扰着众多人群 。据世界卫生组织(WHO)数据,全球约有 10 亿人正遭受精神健康问题的折磨,每 40 秒就有一人因自杀离世 。在中国,抑郁症患者超 9500 万,青少年抑郁检出率达 24.6%。这些数字背后,是对心理健康服务的迫切需求。
deephub8 天前
人工智能·知识图谱·大语言模型·rag
知识图谱的可验证性:断言图谱的设计原理大语言模型在文本生成和推理上的表现有目共睹,但对于从非结构化文本构建可靠知识图谱这件事,依然是个老大难。这个问题的根源在于:语言模型的运作机制与结构化知识提取的需求之间存在本质性的错位。 本文会介绍自动化知识图谱生成的核心难题:生成式模型为什么搞不定结构化提取,判别式方案能提供什么样的替代选择,生产级知识图谱的质量标准又是什么。
deephub9 天前
人工智能·深度学习·大语言模型·提示词优化
OPIK:一个开源的自动提示词优化框架大语言模型发展到今天,写提示词不仅是个体力活,还是一个技术活。提示词的措辞稍微改一下,性能波动 20-50% 是常有的事。那能不能让 LLM 自己改进提示词呢?
Struart_R11 天前
计算机视觉·大语言模型·强化学习·多模态·r1
VideoLLM相关论文(二)补充(一)中的VideoChat-R1和VideoAuto-R1motivation:在RL+MLLM基础上扩展更泛化的任务,比如时序定位,目标跟踪,并通过不同的奖励来强化。
蓝海星梦11 天前
论文阅读·人工智能·自然语言处理·大语言模型·强化学习
【强化学习】深度解析 GSPO:解决 GRPO 中优化目标与奖励不匹配的问题强化学习(RL)在大规模语言模型的训练中逐渐成为关键技术,但随着模型规模的扩大和任务复杂度的增加,现有算法(如GRPO)常常在训练过程中出现稳定性问题,特别是在长响应生成时。这是因为GRPO依赖于token级别的奖励和重要性比率,在长序列中容易导致噪声累积,进而引发模型崩溃。
xiao5kou4chang6kai411 天前
人工智能·自然语言处理·llm·大语言模型·n8n自动化
只是把AI当作一个更聪明的搜索工具??如何用大语言模型高效整合信息并把研究想法快速转化为可发表成果《贯通LLM应用→数据分析→自动化编程→文献及知识管理→科研写作与绘图→构建本地LLM、Agent→多模型圆桌会议→N8N自动化工作流深度应用》
镰刀韭菜12 天前
大语言模型·强化学习·知识蒸馏·指令微调·deepseek·推理模型·旅程式学习
【LLM】一文理解推理大模型2024年,大语言模型领域呈现出日益细化的趋势。除了预训练和微调之外,我们还见证了各种专业化应用的兴起,从检索增强生成到代码助手,不一而足。我预计这一趋势将在2025年进一步加速,对特定领域和应用场景的优化(即“专业化”)将得到更加重视。 图1:阶段1至阶段3是开发大型语言模型的通用步骤。阶段4则针对特定用例对大型语言模型进行专门化处理。
多则惑少则明13 天前
pdf·springboot·大语言模型
AI大模型综合(四)langchain4j 解析PDF文档目录一、langchain4j如何解析PDF文档二、向量数据库三、构建PDF文件摘要总结功能1.1 添加依赖
M宝可梦13 天前
人工智能·大语言模型·世界模型·lecun·jepa
I-JEPA CVPR2023 LeCun所说的world model和视频生成模型是一回事儿吗本文分为三大部分,一是对原论文的一些笔记;二是I-JEPA代码的一些记录;三是最后的一点总结;1.图像自监督学习分为invariance- based 方法以及 generative methods;
北京地铁1号线15 天前
人工智能·深度学习·计算机视觉·大语言模型
人工智能岗位招聘专业笔试试卷及答案(1)如何保证数据标注的质量,有哪些措施?(2)哪些因素影响深度学习模型训练的显存占用?训练的时候显存占用低可能是什么原因?