语言模型

Honey Ro44 分钟前
深度学习·语言模型·llm·rag
浅析大模型 Agent 的记忆(Memory)机制💡 声明:个人观点,仅供参考。在目前的 AI 面试中,如果你去面 Agent 架构师 或 LLM 应用专家 岗位,“记忆机制(Memory)” 几乎是必问的硬核场景题。
小明同学013 小时前
服务器·c++·后端·计算机网络·语言模型
C++后端项目:统一大模型接入 SDK(五)目录一、开篇二、ChatSDK — 外观模式2.1 为什么需要外观模式?2.2 initModels — 注册 + 初始化
renhongxia14 小时前
人工智能·gpt·生成对抗网络·语言模型·自然语言处理·开源
从GPT到开源大模型2022年底,ChatGPT横空出世。普通人第一次发现,AI不仅能对答如流,还能写诗、编程、改论文。GPT系列模型展现出的通用智能,让全世界屏住呼吸。它基于海量数据训练,参数量高达数千亿,几乎所有自然语言任务都不在话下。
一勺菠萝丶4 小时前
人工智能·语言模型·embedding
常见 AI 模型类型整理:大语言模型、聊天模型、推理模型、Embedding 模型到底有什么区别?很多人刚开始接触 AI 的时候,最容易混淆几个概念:这些名字看起来都和 AI 有关,但它们的作用完全不一样。
U盘失踪了14 小时前
语言模型·embedding
Embedding 模型 和 大语言模型(LLM)的区别Embedding模型 → 一个超级图书管理员。他能把每本书的核心思想提炼成一张“索书号”,并摆放得井井有条。你问他“哪里有讲机器学习的书?”,他立刻就能给你找出最相关的几本,但他不会自己写一本新书。
ABCDEEE721 小时前
语言模型
2.神经网络、大语言模型初识
AI人工智能+1 天前
人工智能·计算机视觉·语言模型·ocr·不动产权证书识别
不动产权证书识别技术:融合了计算机视觉、自然语言处理(NLP)和人工智能的深度技术栈随着数字政府建设的深入推进和房地产交易市场的数字化转型,不动产权证书(俗称“房产证”)的自动化识别与核验已成为智慧政务、金融科技及法律服务领域的关键基础设施。本文旨在深入剖析不动产权证书识别技术的核心原理、功能特点及其广泛的实际应用。
DisonTangor1 天前
人工智能·语言模型·自然语言处理
【字节拥抱开源】ByteDance-Seed开源连续潜在扩散语言模型——Cola DLMCola DLM(Continuous Latent Diffusion Language Model)是一种分层连续潜空间扩散语言模型。它将文本自编码器(Text VAE)与基于块因果关系的扩散变换器(DiT)先验相结合:自编码器将文本映射为连续的潜在序列,并将潜在序列解码回令牌;而扩散变换器则通过流匹配(Flow Matching)实现潜在先验的传递。
Mr_sst1 天前
java·ai·语言模型·chatgpt·ai编程
Codex 部署、使用教程 & Vibe Coding 实战指南最近 AI 辅助编程非常火,尤其是 Vibe Coding(氛围编程 / 随心编程) 模式大火,很多开发者用 AI 代码模型快速实现需求、写项目、做自动化脚本。OpenAI Codex 作为 GPT 系列的代码专用模型,是实现 Vibe Coding 的神器。本文手把手教你:Codex 本地部署、日常使用、如何用它实现 Vibe Coding,小白也能直接上手,所有步骤可直接复制操作。
qq_525513751 天前
人工智能·学习·语言模型
第七章 指令微调学习(三)为指令数据集创建数据加载器;加载预训练的大语言模型已经实现了custom_collate_fn函数和InstructionDataset类,接下来,需要创建用于微调大语言模型(LLM)的PyTorch数据加载器。
前端小超人rui1 天前
语言模型·大模型调用·ai 大模型
ModelScope和DashScope对比ModelScope(魔塔)=开源模型社区/本地开发 DashScope (灵积 /百炼 ) = 通义大模型的在线API服务 上面两个都是阿里的 但是分工不同
AI技术控2 天前
人工智能·语言模型·自然语言处理·oracle·nlp
RAG 怎么做 Query 改写?从工程实践看检索增强生成的第一道关键关卡在 RAG(Retrieval-Augmented Generation,检索增强生成)系统中,很多人一开始会把重点放在向量数据库、Embedding 模型、文档切分、召回算法、重排序模型和大模型生成上,但真正落地以后会发现:用户输入的 Query 质量,往往直接决定整个 RAG 系统的上限。
XD7429716362 天前
人工智能·机器学习·语言模型
大模型可解释性-颠覆认知:大语言模型在预训练中并非“稳定变聪明”新研究发现,我们关于模型学习过程的根本假设可能错了近日,一篇关于大语言模型(LM)预训练“泛化动态”的研究在社区内引发了广泛讨论。该研究通过一套精巧的评估工具,揭示了一个颠覆性的现象:在预训练过程中,模型并非如我们通常所设想的那样,从机械的“模式匹配者”(鹦鹉)平稳、线性地发展为具备深层理解的“通用智能”。
技术钱2 天前
人工智能·python·语言模型·自然语言处理
大语言模型出现幻觉的原因与缓解方案大语言模型在处理自然语言时,有时会出现幻觉,表现为回答不准确或前后不一致的问题。这些幻觉可以分为两类:
viperrrrrrrrrr72 天前
人工智能·macos·语言模型
语音AI的2026:从“听见声音“到“理解世界“🍋🍋AI学习🍋🍋🔥系列专栏:👑哲学语录: 用力所能及,改变世界。💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞
byzh_rc2 天前
语言模型·自然语言处理·easyui
[自然语言处理-入门] 语言模型LM知乎:https://www.zhihu.com/people/byzh_rcCSDN:https://blog.csdn.net/qq_54636039
guslegend2 天前
人工智能·语言模型·自然语言处理
测试工程师驾驭大语言模型的第一步FNN前馈神经网络 。FNN是最简单的神经网络,像一个完全新手的厨师,只看当前的步骤,没有前后步骤的记忆和关联。一个新手厨师第一次拿到菜谱后,就开始按照菜谱做饭,看一步做一步,每一步都是独立的,比如看到了“切葱”的步骤,就只看到切葱的输入“粗细、长短”等,输出就是“切成小段的细葱丝”。
郭龙飞9803 天前
人工智能·windows·语言模型
OpenClaw技能拓展教程 五大场景高效办公实操指南OpenClaw实用技能大全|全方位提升电脑办公与操作效率OpenClaw(小龙虾)最核心的亮点,在于丰富的Skill技能拓展体系。激活对应的技能功能后,这款AI工具不再局限于基础的对话交互,能够落地各类电脑实操工作,助力用户解决办公、文件处理、网页操作、系统运维、内容编辑等各类场景问题。
古怪今人3 天前
人工智能·语言模型·langchain
大语言模型运行工具及格式 Ollama操作大模型 LangChain应用开发框架【2026】运行工具(软件):1、LM Studio:最推荐新手。2、Ollama:开发者。3、llama.cpp:底层引擎,性能天花板、可深度调优。
数智工坊3 天前
论文阅读·人工智能·算法·计算机视觉·语言模型
【SigLIP论文阅读】:重新定义视觉-语言预训练的损失函数——VLA模型的“语言理解“基石如果你正在研究具身智能或者VLA(视觉-语言-动作)模型,你会发现一个有趣的现象:几乎所有最新的开源VLA模型都不约而同地放弃了曾经的王者CLIP,转而使用SigLIP作为它们的视觉-语言编码器。OpenVLA用它,Octo用它,小米的Xiaomi-Robotics-0也用它。为什么SigLIP能在短短一年内就取代CLIP的地位?因为它用一个简单到不能再简单的改动——把softmax换成sigmoid——就解决了CLIP几乎所有的痛点:小批量性能差、内存占用高、训练不稳定。今天我们就来深度拆解这篇来自Go