语言模型

莱昂纳多迪卡普利奥5 小时前
人工智能·语言模型·自然语言处理
LLM学习指南(五)——大语言模型(LLM)涌现能力(Emergent Abilities)上下文学习(In-context Learning)指令遵循(Instruction Following)
xixixi777776 小时前
人工智能·ai·语言模型·自然语言处理·大模型·claude·主流模型
解析 Claude模型 —— Anthropic公司打造,以安全性和推理能力为核心竞争力的顶尖大语言模型Claude并不单纯追求规模最大或速度最快,而是围绕一个“三位一体”的核心目标构建:有用:在复杂推理、编程、写作和多模态任务上表现卓越。
塔楼6 小时前
语言模型·大模型推理
Deep Think with Confidence:让大模型更准确论文:https://arxiv.org/abs/2508.15260github:https://github.com/paipeline/deep-think-with-confidence
2501_948120158 小时前
人工智能·语言模型·自然语言处理
基于大语言模型的教育舆情分析系统随着互联网技术的迅猛发展,信息传播速度和广度达到了前所未有的高度。教育领域作为社会发展的基石,其舆情状况直接关系到教育事业的健康发展。以下是对研究背景及意义的详细阐述:
zP1nG9 小时前
语言模型·机器人
Gemini 全能 QQ 机器人部署手册 (V1.0 Release)核心架构:OneBot V11 (NapCat) + NoneBot2 + Gemini Flash 适用系统:Ubuntu 22.04 LTS (阿里云/腾讯云)
得物技术9 小时前
人工智能·语言模型·推荐算法
入选AAAI-PerFM|得物社区推荐之基于大语言模型的新颖性推荐算法得物社区推荐的实践中,我们发现用户兴趣容易收敛到少数几个主兴趣上,难以做到有效的兴趣拓展,通过将大模型与推荐结合的方式,在得物社区的用户兴趣拓展方向上切实取得了突破,拿到了显著的业务收益并推全上线。因此我们将相关工作中采用的核心算法与模型策略总结整理,投稿了AAAI-PerFM,入选了长论文《Enhancing Serendipity Recommendation System by Constructing Dynamic User Knowledge Graphs with Large Languag
赋创小助手9 小时前
服务器·人工智能·深度学习·神经网络·语言模型·自然语言处理·tensorflow
NVIDIA H100与GH200选型指南:AI与HPC负载的硬件适配方案随着 AI 模型规模持续扩大、推理吞吐要求不断提高,以及数据处理流程日益复杂,算力硬件的选择早已不再只是“算力大小”的问题。显存容量、内存带宽、CPU 与 GPU 的协同效率,以及系统级架构设计,正在成为决定 AI 与 HPC 工作负载性能上限的关键因素。
yuezhilangniao10 小时前
人工智能·语言模型·自然语言处理
ai开发 名词解释-概念理解-LLMs(大语言模型)Chat Models(聊天模型)Embeddings Models(嵌入模型).市面上的模型多如牛毛,各种各样的模型不断出现,LangChain模型组件提供了与各种模型的集成,并为所有模型提供一个精简的统一接口。 LangChain目前支持三种类型的模型:LLMs(大语言模型)、Chat Models(聊天模型)、Embeddings Models(嵌入模型).
敲代码的猴先生10 小时前
论文阅读·人工智能·深度学习·语言模型
论文分享 | 基于红绿列表的大语言模型水印技术大语言模型的生成能力十分强大,但也同样容易遭到滥用,检测文本是否由模型产生是缓解潜在危害的重要手段。分享一篇发表于 2023 年 ICML 会议的论文,该研究提出了一种用于生成式模型针对输出文本的水印技术。
Lian_Ge_Blog10 小时前
语言模型
MOE/GShard/Switch_Transformers结构学习总结混合专家模型 (MoE:Mixed Expert Models) :一种稀疏激活的深度学习架构范式,核心思想是:将复杂任务拆解为多个子任务,由专业化的 “专家子网络” 并行处理,再通过 “门控网络” 动态选择并融合 Top-K 专家的输出
Loo国昌1 天前
人工智能·后端·算法·语言模型·架构·langchain
【LangChain1.0】第八阶段:文档处理工程(LangChain篇)版本信息:在前两篇中,我们学习了RAG的基础知识(第四篇)和高级优化技术(第五篇)。但在实际应用中,文档处理往往是RAG系统最大的痛点:
人工智能培训1 天前
人工智能·机器学习·语言模型·大模型·大模型幻觉·开源大模型·闭源大模型
开源与闭源大模型的竞争未来会如何?随着深度求索DeepSeek-V3.2系列开源模型在核心推理基准测试中“逼平”甚至超越GPT-5等顶尖闭源模型,全球AI行业正式告别闭源模型绝对主导的时代,迈入开源与闭源既激烈博弈又深度融合的竞合新纪元。未来两者的竞争将不再局限于单纯的性能比拼,而是围绕生态构建、成本效率、场景深耕等多维度展开,形成“分层共存、优势互补”的新格局。
Rabbit_QL1 天前
人工智能·语言模型·自然语言处理
【LLM背景】语言模型简史:从概率统计到通用智能接口近年来,“大语言模型(Large Language Model,LLM)”成为人工智能领域中出现频率最高的关键词之一。
分享牛1 天前
人工智能·语言模型·自然语言处理
LangChain4j从入门到精通-3-聊天与语言模型本文深入解析了LangChain4j框架中与大型语言模型(LLM)交互的核心底层API——ChatModel。作为渐趋淘汰的LanguageModel的现代化替代方案,ChatModel支持更复杂的多轮对话场景,通过接受多个ChatMessage作为输入并返回AiMessage,为开发者提供了更强大的交互能力。文章系统介绍了五种核心ChatMessage类型(UserMessage、AiMessage、SystemMessage等)及其应用场景,并通过丰富Java代码示例演示了如何进行多轮对话、支持多模态
renhongxia11 天前
人工智能·信息可视化·语言模型·自然语言处理·数据分析
多模型协作定律:大型语言模型模型集成的缩放极限近年来,大语言模型(LLMs)的进展主要受单模型扩展定律的推动,该定律预测随着模型参数量和数据量的增长,性能会相应提升。然而,任何单一LLM的能力都存在内在的局限。一种解决方案源自多个LLM之间复杂的交互作用,使得它们的集体性能能够超越其中任何一个单独模型。尽管模型路由、事后集成等多模型集成技术快速涌现,但目前仍缺乏一个关于多模型协作性能扩展的统一理论框架。
暴风鱼划水1 天前
python·语言模型·大模型·llm
大型语言模型(入门篇)C预训练模型是大型语言模型(LLM)完成其训练阶段后的结果。使用预训练模型的原因:预训练LLM的访问途径:
大模型任我行1 天前
人工智能·语言模型·自然语言处理·论文笔记
腾讯:RAG生成器感知的排序模型📖标题:Rank4Gen: RAG-Preference-Aligned Document Set Selection and Ranking 🌐来源:arXiv, 2601.11273v1
狮子座明仔2 天前
人工智能·深度学习·语言模型·自然语言处理
MatchTIR:用二分匹配解决LLM工具调用的“吃大锅饭“难题一句话总结:MatchTIR 提出用二分匹配(Hungarian算法/最优传输)来给多轮工具调用中的每一步精确打分,配合双重级优势估计,让4B小模型在复杂工具使用任务上干翻一众8B大模型。
机器学习社区2 天前
人工智能·语言模型·自然语言处理·面试·职场和发展·面试题
《大模型面试宝典》(2026版) 正式发布!2025年12月11日,OpenAI发布GPT-5.2,这次升级确实挺猛的,核心亮点就是‌更专业、更高效、更可靠‌,直接瞄准了办公、开发这些实际场景。
一碗甜汤ᐝ2 天前
语言模型·云计算·腾讯云
腾讯云部署bisheng毕昇小白学习记录,如有错误,请大家多多指教。毕昇(Bisheng)是 DataElement 团队开发的开源大模型应用开发平台,专为企业级场景设计。 毕昇基于 Langchain、Langflow 等流行的开源技术栈构建,以中国古代活字印刷术发明人毕昇命名,寓意推动知识和智能应用的广泛传播与高效开发。它是完全开源的项目,允许企业进行二次开发和定制化,免费使用,目标是降低大模型应用的开发门槛,满足企业级需求。 项目文档:https://dataelem.feishu.cn/wiki/ZxW6wZyAJicX4W