语言模型

小苑同学16 分钟前
人工智能·语言模型·自然语言处理
Masked Language Models是什么?这个问题很关键!Masked Language Model(简称MLM,掩码语言模型)是现在很多顶尖大语言模型(比如BERT、RoBERTa)的核心训练基础,用通俗的话讲,它的核心逻辑就是让模型‘猜词填空’,从而学会理解语言。
山沐与山33 分钟前
人工智能·语言模型·自然语言处理
【AI】大语言模型基础知识详解ChatGPT 火了之后,"大模型"这个词天天出现在各种新闻里。但很多人其实不太清楚:大模型到底是什么?它是怎么"理解"我们说的话的?为什么有时候它会胡说八道?这篇文章用最通俗的方式,带你搞懂大语言模型的核心原理。
小陈phd1 小时前
人工智能·语言模型·自然语言处理
大语言模型实战(一)——基本介绍及环境配置LLMs的灵活性使其适用于多种任务,核心场景包括:通过Hugging Face Transformers库加载开源模型(以Microsoft Phi-3-mini为例),核心步骤包括:
小北的AI科技分享1 小时前
人工智能·语言模型·自然语言处理
AI智能体:连接大语言模型与现实任务的核心架构解析随着人工智能技术不断持续地演进,有一种架构范式被称作“智能体”,它正变成连接大语言模型与现实世界复杂任务的关键桥梁。被简称为智能体的AI智能体,不是一个全新概念,不过其内涵在通用人工智能技术取得突破之后,得到了极大地拓展与深化。本文会从它的定义,核心原理,技术架构,应用现状以及未来挑战等多个不同维度,对这一技术领域进行系统性梳理 。
爱装代码的小瓶子2 小时前
人工智能·语言模型·自然语言处理
大语言模型的巧用:我是小瓶子,将有我来完成带领大家进入ai的世界我的主页如下:主页:爱装代码的小瓶子 专栏:1. 关于Linux的学习 2.关于c++的学习 3.关于AI的学习
Loo国昌18 小时前
人工智能·算法·语言模型·自然语言处理
大型语言模型推理范式演进:从提示工程到思维算法摘要本文基于前沿研究与工业界实践,对大型语言模型(LLM)的推理机制进行详尽的解构与重构。我们系统性地梳理了从基础的 零样本(Zero-shot) 直觉反应,到 思维链(CoT) 的逻辑觉醒,再到 思维树(ToT)、思维图(GoT)及思维算法(AoT) 的复杂结构化推理演进路线。
古城小栈1 天前
人工智能·gpt·语言模型·边缘计算
边缘大模型本地部署与推理实战:以GPT-OSS-20B为例随着大模型技术的爆发式发展,“模型下凡”成为行业新趋势——边缘设备(个人电脑、嵌入式设备、边缘服务器等)本地部署大模型,无需依赖云端算力,既能规避数据传输的隐私泄露风险,又能实现低延迟响应。其中,GPT-OSS-20B这类200亿参数级的开源边缘大模型,凭借兼顾性能与部署门槛的优势,成为个人开发者与中小企业的首选。本文将从基础认知、环境准备、部署实操、推理测试、代码解析到技术拓展,全方位带你掌握边缘大模型本地部署与推理的核心技能。
小苑同学1 天前
人工智能·语言模型·llama
PaperReding:《LLaMA: Open and Efficient Foundation Language Models》论文链接: https://arxiv.org/pdf/2302.13971这篇论文核心是 Meta AI 团队推出了一套叫LLaMA的开源大语言模型,简单说就是 “好用又好获取” 的 AI 模型,普通人或研究者不用依赖大公司的专属资源也能用上、研究它。总结为以下几点: 1. 核心目标:做 “人人能用” 的顶尖模型 以前很多厉害的大模型(比如 GPT-3、PaLM)要么用了不公开的数据,要么太大了普通人跑不起来。LLaMA 的目标就是: 只靠公开数据训练(比如网页爬虫、维基百科、GitHub 代码、书籍、
AI架构师易筋1 天前
人工智能·microsoft·语言模型·llm·mcp
模型上下文协议(MCP)完全指南:从AI代理痛点到实战开发开发工具:Python + fast-mcp SDK(官方推荐)(一) 客户端三大核心能力(二) 典型应用场景
Coovally AI模型快速验证1 天前
人工智能·深度学习·计算机视觉·3d·语言模型·机器人
复杂工业场景如何实现3D实例与部件一体化分割?多视角贝叶斯融合的分层图像引导框在机器人操作、数字孪生等工业智能化场景中,精确的3D场景理解是核心技术基础。尤其在工厂环境中,零部件布局密集、尺度差异大、遮挡严重,传统分割方法往难以同时保证实例分割与部件级分割的精度。针对这一难题,《Hierarchical Image-Guided 3D Point Cloud Segmentation in Industrial Scenes via Multi-View Bayesian Fusion》提出了一种分层图像引导的3D点云分割框架,融合YOLO-World检测、SAM分割与多视角贝叶斯
我怎么又饿了呀1 天前
人工智能·语言模型
DataWhale RAG入门级教程RAG(Retrieval-Augmented Generation,检索增强生成)是一种将非参数化检索模块与参数化生成模型深度融合的混合架构范式。其本质在于:在生成阶段动态引入外部知识库中的相关文档片段,以缓解大型语言模型(LLM)在知识时效性、事实准确性、领域专业性上的固有缺陷。
Chloe.Zz1 天前
语言模型·微信小程序·小程序
微信小程序接入大模型实战 4:塔罗咨询室(含代码)本文将介绍如何利用大语言模型(LLM)与思维链(CoT)Prompt 设计,将传统塔罗小程序中生硬的“查表式解牌”,重构为一个具备多轮对话能力、上下文理解力的智能咨询系统。
AI算法蒋同学1 天前
人工智能·搜索引擎·语言模型
02.AIGC初学者指南-生成式人工智能和大型语言模型简介生成式人工智能是一种能够生成文本、图像及其他类型内容的人工智能技术。它的神奇之处在于,它让人工智能变得更加普及,任何人只需输入一个文本提示,即用自然语言写的一句话,就可以使用它。你不需要学习像Java或SQL这样的编程语言来完成有价值的事情,只需用自己的语言表达需求,人工智能模型就会给出建议。它的应用和影响是巨大的,你可以在几秒钟内撰写或理解报告、编写应用程序等等。
_Stellar2 天前
人工智能·语言模型·自然语言处理
从输入到输出:大语言模型一次完整推理简单解析大语言模型(LLM)的推理过程,本质上是一个在离散 token 空间中进行条件概率建模与自回归采样的计算流程。从系统角度看,这一过程可以被严格拆解为:文本离散化、全量上下文建模(Prefill)、概率分布构造、候选空间裁剪、随机采样、状态递推,直至满足终止条件。以下按照真实执行顺序,对每一阶段进行完整解析。
开放知识图谱2 天前
人工智能·语言模型·自然语言处理·知识图谱
论文浅尝 | 大语言模型在带超关系的知识图谱上的推理(ICLR2025)笔记整理:吕恬雯,浙江大学研究生,研究方向为大语言模型、AI for Science论文链接:https://openreview.net/pdf?id=rTCJ29pkuA
Rabbit_QL2 天前
人工智能·语言模型·自然语言处理
【LLM基础教程】语言模型基础语言模型起源于语音识别(speech recognition)领域,输入一段音频数据,语音识别系统通常会生成多个句子作为候选,究竟哪个句子更合理?就需要用到语言模型对候选句子进行排序。如今语言模型的应用范围早已扩展到机器翻译、信息检索、问答系统等众多NLP领域。
骚戴2 天前
java·人工智能·python·语言模型·自然语言处理·llm·开源大模型
大语言模型(LLM)进阶:从闭源大模型 API 到开源大模型本地部署,四种接入路径全解析摘要:在 2025 年的今天,大模型(LLM)已经成为开发者的标配工具。但面对 OpenAI、国产模型、本地部署等多种技术路径,开发者该如何抉择?本文将从工程实践角度,深入剖析国际主流 API、国产 API、本地开源部署以及聚合 API 四种主流方案的优劣,并提供完整的 Python 实战代码,助你构建最优的 AI 应用架构。
Rabbit_QL2 天前
深度学习·语言模型
【LLM基础教程】从序列切分到上下文窗口02_三种数据切分方法上一节内容:【LLM基础教程】从序列切分到上下文窗口01_为什么序列建模必须切分数据 本节也是对沐神课程的进一步理解:53 语言模型【动手学深度学习v2】
Rabbit_QL2 天前
语言模型
【LLM基础教程】LLM训练数据集是如何构造的:从文档到Token Block本文不讨论模型结构,而只回答一个看似简单、但极其关键的问题:大语言模型(LLM)训练时,究竟在“吃”什么样的数据?这些数据是如何被构造出来的?
阿杰学AI2 天前
人工智能·ai·语言模型·prompt·prompt engineer·提示词工程师·pe工程师
AI核心知识55——大语言模型之PE工程师(简洁且通俗易懂版)在大语言模型(LLM)的语境下,PE 工程师 指的是 Prompt Engineer,中文通常翻译为 提示词工程师。