语言模型

Coovally AI模型快速验证7 分钟前
人工智能·深度学习·计算机视觉·3d·语言模型·机器人
复杂工业场景如何实现3D实例与部件一体化分割?多视角贝叶斯融合的分层图像引导框在机器人操作、数字孪生等工业智能化场景中,精确的3D场景理解是核心技术基础。尤其在工厂环境中,零部件布局密集、尺度差异大、遮挡严重,传统分割方法往难以同时保证实例分割与部件级分割的精度。针对这一难题,《Hierarchical Image-Guided 3D Point Cloud Segmentation in Industrial Scenes via Multi-View Bayesian Fusion》提出了一种分层图像引导的3D点云分割框架,融合YOLO-World检测、SAM分割与多视角贝叶斯
我怎么又饿了呀1 小时前
人工智能·语言模型
DataWhale RAG入门级教程RAG(Retrieval-Augmented Generation,检索增强生成)是一种将非参数化检索模块与参数化生成模型深度融合的混合架构范式。其本质在于:在生成阶段动态引入外部知识库中的相关文档片段,以缓解大型语言模型(LLM)在知识时效性、事实准确性、领域专业性上的固有缺陷。
Chloe.Zz2 小时前
语言模型·微信小程序·小程序
微信小程序接入大模型实战 4:塔罗咨询室(含代码)本文将介绍如何利用大语言模型(LLM)与思维链(CoT)Prompt 设计,将传统塔罗小程序中生硬的“查表式解牌”,重构为一个具备多轮对话能力、上下文理解力的智能咨询系统。
AI算法蒋同学2 小时前
人工智能·搜索引擎·语言模型
02.AIGC初学者指南-生成式人工智能和大型语言模型简介生成式人工智能是一种能够生成文本、图像及其他类型内容的人工智能技术。它的神奇之处在于,它让人工智能变得更加普及,任何人只需输入一个文本提示,即用自然语言写的一句话,就可以使用它。你不需要学习像Java或SQL这样的编程语言来完成有价值的事情,只需用自己的语言表达需求,人工智能模型就会给出建议。它的应用和影响是巨大的,你可以在几秒钟内撰写或理解报告、编写应用程序等等。
_Stellar16 小时前
人工智能·语言模型·自然语言处理
从输入到输出:大语言模型一次完整推理简单解析大语言模型(LLM)的推理过程,本质上是一个在离散 token 空间中进行条件概率建模与自回归采样的计算流程。从系统角度看,这一过程可以被严格拆解为:文本离散化、全量上下文建模(Prefill)、概率分布构造、候选空间裁剪、随机采样、状态递推,直至满足终止条件。以下按照真实执行顺序,对每一阶段进行完整解析。
开放知识图谱16 小时前
人工智能·语言模型·自然语言处理·知识图谱
论文浅尝 | 大语言模型在带超关系的知识图谱上的推理(ICLR2025)笔记整理:吕恬雯,浙江大学研究生,研究方向为大语言模型、AI for Science论文链接:https://openreview.net/pdf?id=rTCJ29pkuA
Rabbit_QL17 小时前
人工智能·语言模型·自然语言处理
【LLM基础教程】语言模型基础语言模型起源于语音识别(speech recognition)领域,输入一段音频数据,语音识别系统通常会生成多个句子作为候选,究竟哪个句子更合理?就需要用到语言模型对候选句子进行排序。如今语言模型的应用范围早已扩展到机器翻译、信息检索、问答系统等众多NLP领域。
骚戴19 小时前
java·人工智能·python·语言模型·自然语言处理·llm·开源大模型
大语言模型(LLM)进阶:从闭源大模型 API 到开源大模型本地部署,四种接入路径全解析摘要:在 2025 年的今天,大模型(LLM)已经成为开发者的标配工具。但面对 OpenAI、国产模型、本地部署等多种技术路径,开发者该如何抉择?本文将从工程实践角度,深入剖析国际主流 API、国产 API、本地开源部署以及聚合 API 四种主流方案的优劣,并提供完整的 Python 实战代码,助你构建最优的 AI 应用架构。
Rabbit_QL21 小时前
深度学习·语言模型
【LLM基础教程】从序列切分到上下文窗口02_三种数据切分方法上一节内容:【LLM基础教程】从序列切分到上下文窗口01_为什么序列建模必须切分数据 本节也是对沐神课程的进一步理解:53 语言模型【动手学深度学习v2】
Rabbit_QL1 天前
语言模型
【LLM基础教程】LLM训练数据集是如何构造的:从文档到Token Block本文不讨论模型结构,而只回答一个看似简单、但极其关键的问题:大语言模型(LLM)训练时,究竟在“吃”什么样的数据?这些数据是如何被构造出来的?
阿杰学AI1 天前
人工智能·ai·语言模型·prompt·prompt engineer·提示词工程师·pe工程师
AI核心知识55——大语言模型之PE工程师(简洁且通俗易懂版)在大语言模型(LLM)的语境下,PE 工程师 指的是 Prompt Engineer,中文通常翻译为 提示词工程师。
小苑同学1 天前
人工智能·语言模型
PaperReading:《GPT-4 Technical Report》论文链接: https://arxiv.org/pdf/2303.08774这篇文章其实就是 OpenAI 对 GPT-4 的“官方说明书+成绩单”,主要包含以下几点内容:
Ma0407131 天前
论文阅读·语言模型·blip-2·q-former
【论文阅读24】-利用大型语言模型进行免训练的视频异常检测题目:Harnessing Large Language Models for Training-Free Video Anomaly Detection
一只乔哇噻1 天前
java·开发语言·人工智能·python·语言模型
java后端工程师+AI大模型开发进修ing(研一版‖day63)目录今日总结详细内容java随笔录1、什么是聚簇索引,什么是非聚簇索引?2、什么是覆盖索引?AI随探录
无妄无望2 天前
人工智能·语言模型·自然语言处理
大语言模型是零样本推理器 Large Language Models are Zero-Shot Reasoners论文:Large Language Models are Zero-Shot Reasoners摘要 预训练大型语言模型(LLMs)广泛应用于自然语言处理(NLP)诸多子领域,且被公认为结合任务专属样例的优秀少样本学习器。值得关注的是,思维链(CoT)提示技术——一种通过分步答案样例激发模型复杂多步推理能力的前沿方法——在算术推理与符号推理这两类高难度系统2任务中取得了最先进(SOTA)性能,而这类任务的性能提升并不遵循大语言模型的标准缩放定律。
暴风鱼划水2 天前
人工智能·语言模型·自然语言处理·大模型·llm
大型语言模型(入门篇)A大型语言模型,通常缩写为LLMs,是人工智能(AI)和自然语言处理(NLP)的一部分。LLM本质上是一种AI模型,专门用于理解、生成和与人类语言文本交互,可以将其视为一个经过训练、能处理单词、句子和段落的复杂系统。 “大型语言模型”名称拆解:
硅谷秋水2 天前
深度学习·机器学习·计算机视觉·3d·语言模型
PhysX-Anything:从单张图像创建可用于模拟的物理 3D 资源25年11月来自南洋理工和上海AI实验室的论文“PhysX-Anything: Simulation-Ready Physical 3D Assets from Single Image”。
chen_song_2 天前
人工智能·语言模型·aigc
AIGC大语言模型之词元和嵌入向量词元和嵌入向量是人工智能生成内容(AIGC)中使用LLM的两个核心概念。是在模型处理文本之前, 分词器会将文本分解成词或者子词。这个是根据特定的方法和训练过程进行的。
啊吧怪不啊吧2 天前
大数据·ai·语言模型·ai编程
从数据到智能体大模型——cozeAI大模型开发(第二篇)目录1. 人设与回复逻辑1.1 人设框架1.2 提示词库1.3 自动优化提示词编辑2. 知识库2.1 文本
java1234_小锋3 天前
深度学习·语言模型·transformer
Transformer 大语言模型(LLM)基石 - Transformer架构详解 - 残差连接(Residual Connection)详解以及算法实现锋哥原创的Transformer 大语言模型(LLM)基石视频教程:https://www.bilibili.com/video/BV1X92pBqEhV