语言模型

XD7429716362 小时前
人工智能·机器学习·语言模型
大模型可解释性-颠覆认知:大语言模型在预训练中并非“稳定变聪明”新研究发现,我们关于模型学习过程的根本假设可能错了近日,一篇关于大语言模型(LM)预训练“泛化动态”的研究在社区内引发了广泛讨论。该研究通过一套精巧的评估工具,揭示了一个颠覆性的现象:在预训练过程中,模型并非如我们通常所设想的那样,从机械的“模式匹配者”(鹦鹉)平稳、线性地发展为具备深层理解的“通用智能”。
技术钱3 小时前
人工智能·python·语言模型·自然语言处理
大语言模型出现幻觉的原因与缓解方案大语言模型在处理自然语言时,有时会出现幻觉,表现为回答不准确或前后不一致的问题。这些幻觉可以分为两类:
viperrrrrrrrrr73 小时前
人工智能·macos·语言模型
语音AI的2026:从“听见声音“到“理解世界“🍋🍋AI学习🍋🍋🔥系列专栏:👑哲学语录: 用力所能及,改变世界。💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞
byzh_rc3 小时前
语言模型·自然语言处理·easyui
[自然语言处理-入门] 语言模型LM知乎:https://www.zhihu.com/people/byzh_rcCSDN:https://blog.csdn.net/qq_54636039
guslegend4 小时前
人工智能·语言模型·自然语言处理
测试工程师驾驭大语言模型的第一步FNN前馈神经网络 。FNN是最简单的神经网络,像一个完全新手的厨师,只看当前的步骤,没有前后步骤的记忆和关联。一个新手厨师第一次拿到菜谱后,就开始按照菜谱做饭,看一步做一步,每一步都是独立的,比如看到了“切葱”的步骤,就只看到切葱的输入“粗细、长短”等,输出就是“切成小段的细葱丝”。
郭龙飞98020 小时前
人工智能·windows·语言模型
OpenClaw技能拓展教程 五大场景高效办公实操指南OpenClaw实用技能大全|全方位提升电脑办公与操作效率OpenClaw(小龙虾)最核心的亮点,在于丰富的Skill技能拓展体系。激活对应的技能功能后,这款AI工具不再局限于基础的对话交互,能够落地各类电脑实操工作,助力用户解决办公、文件处理、网页操作、系统运维、内容编辑等各类场景问题。
古怪今人1 天前
人工智能·语言模型·langchain
大语言模型运行工具及格式 Ollama操作大模型 LangChain应用开发框架【2026】运行工具(软件):1、LM Studio:最推荐新手。2、Ollama:开发者。3、llama.cpp:底层引擎,性能天花板、可深度调优。
数智工坊1 天前
论文阅读·人工智能·算法·计算机视觉·语言模型
【SigLIP论文阅读】:重新定义视觉-语言预训练的损失函数——VLA模型的“语言理解“基石如果你正在研究具身智能或者VLA(视觉-语言-动作)模型,你会发现一个有趣的现象:几乎所有最新的开源VLA模型都不约而同地放弃了曾经的王者CLIP,转而使用SigLIP作为它们的视觉-语言编码器。OpenVLA用它,Octo用它,小米的Xiaomi-Robotics-0也用它。为什么SigLIP能在短短一年内就取代CLIP的地位?因为它用一个简单到不能再简单的改动——把softmax换成sigmoid——就解决了CLIP几乎所有的痛点:小批量性能差、内存占用高、训练不稳定。今天我们就来深度拆解这篇来自Go
纤纡.1 天前
阿里云·语言模型·交互
解锁大模型应用实战:从文本处理到智能交互的全维度实践在人工智能技术飞速发展的当下,大语言模型(LLM)已经成为提升工作效率、优化用户体验的核心工具。无论是电商场景的评论分析、客服系统的问题分类,还是结构化的信息整理、逻辑化的推理分析,大模型都能发挥出强大的作用。本文将结合实际的代码案例,从应用场景、技术实现、优化技巧等多个维度,详细拆解大模型在文本处理与智能交互中的落地方法,帮助开发者快速掌握大模型应用的核心逻辑。
Omics Pro1 天前
开发语言·人工智能·深度学习·语言模型·r语言·excel·知识图谱
全流程可重复!R语言脂质组学:原始数据→功能解析脂质组学已成为生物医学研究中具有变革性的学科,为代谢信号传导与疾病病理生理机制提供高分辨率解析。R语言凭借完善的生物统计基础架构,成为复杂脂质组学数据可扩展分析的主流平台。本文提出1套完整的R语言脂质组学分析路线图,围绕标准化分析全流程构建:从原始数据采集、预处理,到结构注释、统计建模与功能解析。本文筛选并整合了1套经严格验证的主流R包(4.3.0版本),包括用于特征提取的xcms、MSnbase,基于碎裂模式鉴定的LipidMS 3.0,以及用于质控与归一化的lipidr。同时阐述了如何整合mixOmi
Cosolar2 天前
人工智能·深度学习·语言模型·chatgpt·面试
AI Agent 记忆机制全景对比:OpenClaw vs QwenPaw vs Hermes vs HiClaw在理解了记忆机制的通用原理之后,最关键的问题来了:当前主流的开源 Agent,到底是怎么实现记忆的?它们之间有什么本质差异?
日取其半万世不竭2 天前
人工智能·语言模型·自然语言处理
Ollama + Open WebUI 部署教程:本地运行大语言模型,自建私有 AI 助手不想把对话内容发给 OpenAI?有私密需求或离线场景?Ollama 让你在自己的服务器上运行 Llama、Qwen、DeepSeek 等开源大语言模型,Open WebUI 提供和 ChatGPT 一样的聊天界面。这篇文章讲如何搭建一套完整的私有 AI 服务。
Leweslyh2 天前
人工智能·语言模型·自然语言处理
【论文翻译】意图驱动的多智能体大语言模型网络管理:Confucius框架第一作者:Zhaodong Wang 翻译工具:TRAE、Gemini 3.1 Pro Proview、MinerU等
AI技术控2 天前
人工智能·python·语言模型·自然语言处理·nlp
ReAct 论文解读:大模型 Agent 如何通过“推理 + 行动”完成复杂任务《ReAct: Synergizing Reasoning and Acting in Language Models》是 ICLR 2023 的一篇经典论文,也是理解大模型 Agent、工具调用、RAG 和外部环境交互时绕不开的一篇工作。
逆境不可逃3 天前
人工智能·语言模型·自然语言处理
Hello-Agents 第一部分总结:从智能体概念到大语言模型基础作者:逆境不可逃技术永无止境希望我的内容可以帮助到你!!!!!大家吼 ! 我是逆境不可逃 今天给大家带来文章《Hello-Agents 第一部分总结:从智能体概念到大语言模型基础》.
测试员周周3 天前
服务器·数据库·人工智能·python·测试工具·语言模型·appium
【Appium 系列】第09节-数据驱动测试 — YAML 数据 + parametrize对应代码:core/data_driver.py(206行)、testcases/data/login_users.yaml、testcases/yaml/login_test_cases.yaml
摆摊的豆丁3 天前
语言模型
2.对1文档中的内容做展开补充在 Claude Code 语境里,harness 可以理解为“把模型变成可用工程代理的外部运行框架/脚手架/控制层”。
AI技术控3 天前
人工智能·python·深度学习·语言模型·自然语言处理·prompt
Prompt Engineering 在企业大模型应用中的实践:从提示词模板到可控输出在大模型应用开发中,Prompt Engineering 是最容易被低估、也最容易被误解的部分。很多人认为提示词只是“把问题问清楚一点”,或者在系统提示词里写几句“你是一个专业助手”。这种方式做 Demo 可能够用,但一旦进入企业级场景,问题就会集中暴露:
耕烟煮云3 天前
人工智能·语言模型·自然语言处理
一篇文章讲清大语言模型发展史2017年的某个夏天,Google内部一群搞翻译的工程师,发了一篇论文。标题很狂,叫《Attention Is All You Need》。意思很明确:我们把RNN彻底扔了,只用注意力机制,翻译效果反而更好。
硅谷秋水3 天前
人工智能·科技·机器学习·语言模型·软件工程
ARIS:基于对抗性多智体协作的自主研究26年5月来自上海交大和上海创智学院的论文“ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration”。