语言模型

ReinaXue27 分钟前
图像处理·人工智能·神经网络·算法·生成对抗网络·计算机视觉·语言模型
快速认识图像生成算法:VAE、GAN 和 Diffusion ModelsVAE 是一种基于概率图模型的生成模型,它通过学习数据的潜在分布(Latent Distribution)来进行生成。它本质上是传统自编码器(AE)的一个概率化、正则化版本。
黑客思维者1 小时前
microsoft·搜索引擎·语言模型
大语言模型如何重塑搜索引擎:从链接罗列到知识服务的革命打开手机搜索 “2024 年中国新能源汽车销量 TOP5 及同比增速”,十年前你会看到一页页带蓝色标题的链接——行业报告的摘要、车企官网的新闻、财经媒体的分析,需要逐个点开比对数据来源、筛选有效信息,花十几分钟才能拼凑出完整答案;而现在,搜索框下方会直接跳出一段清晰的文字:“2024年中国新能源汽车销量前五品牌依次为比亚迪(302.5万辆,同比+18.2%)、理想(87.3万辆,同比+35.6%)、蔚来(49.8万辆,同比+22.1%)、小鹏(45.1万辆,同比+15.3%)、极氪(38.6万辆,同比+4
中國龍在廣州2 小时前
人工智能·深度学习·算法·语言模型·自然语言处理·chatgpt·机器人
李飞飞最新思考:语言模型救不了机器人过去几年里,AI 行业的节奏快得近乎失真。模型一次次刷新极限,产品迭代像在抢时间,讨论从“推理成本”到“智能涌现”再到“AGI 时间表”,情绪在乐观与焦虑之间来回摆动。
海底的星星fly2 小时前
人工智能·语言模型·langchain·prompt
【Prompt学习技能树地图】LangChain原理及应用操作指南大型语言模型(Large Language Model, LLM)的能力飞跃,标志着人工智能进入新阶段。然而,其卓越表现之下存在着由根本设计范式决定的固有局限性。深刻理解这些局限,是有效驾驭并扩展其能力的前提。
阿杰学AI2 小时前
人工智能·语言模型·自然语言处理·aigc·agi·cot·思维链
AI核心知识30——大语言模型之CoT(简洁且通俗易懂版)CoT 是 Chain-of-Thought(思维链)的缩写。它是提示工程(Prompt Engineering)中最著名、最有效、也是最神奇的一种技术。
LeeZhao@2 小时前
数据库·人工智能·redis·语言模型·机器人·agi
【狂飙全模态】狂飙AGI-智能图文理解助手官网网址:https://bigmodel.cn/
阿杰学AI3 小时前
人工智能·ai·语言模型·自然语言处理·aigc·embedding·多模态理解
AI核心知识31——大语言模型之Multimodal Understanding(简洁且通俗易懂版)多模态理解 (Multimodal Understanding) 是多模态技术中侧重于 “输入” 和 “感知” 的那一面。
LeeZhao@17 小时前
数据库·人工智能·redis·语言模型·aigc·agi
【狂飙全模态】狂飙AGI-智能答疑助手官网网址:https://bigmodel.cn/
AI浩17 小时前
人工智能·语言模型·自然语言处理
DeepSeek-V3.2:推动开源大型语言模型的前沿发展我们介绍了DeepSeek-V3.2,这是一个在高效计算与卓越推理及智能体性能之间取得平衡的模型。DeepSeek-V3.2的关键技术突破如下:(1) DeepSeek稀疏注意力(DSA):我们引入了DSA,这是一种高效注意力机制,在保持长上下文场景中模型性能的同时,大幅降低了计算复杂度。(2) 可扩展的强化学习框架:通过实施稳健的强化学习协议并扩展后训练计算,DeepSeek-V3.2的表现与GPT-5相当。值得注意的是,我们的高计算变体DeepSeek-V3.2-Speciale超越了GPT-5,其推
youcans_19 小时前
论文阅读·人工智能·语言模型·智能体·deepseek
【DeepSeek 论文精读】15. DeepSeek-V3.2:开拓开源大型语言模型新前沿欢迎关注[【AIGC论文精读】](https://blog.csdn.net/youcans/category_12321605.html)原创作品 【DeepSeek论文精读】1. 从 DeepSeek LLM 到 DeepSeek R1 【DeepSeek论文精读】14. DeepSeek-V3.2-Exp 技术报告详解 【DeepSeek论文精读】15. DeepSeek-V3.2:开拓开源大型语言模型新前沿
DisonTangor21 小时前
人工智能·语言模型·开源·aigc·音视频
Step-Audio-R1 首个成功实现测试时计算扩展的音频语言模型Step-Audio-R1 是首个成功实现测试时计算扩展的音频语言模型。它彻底解决了困扰现有模型的"逆向扩展"异常现象——即性能会随着推理链延长而反常下降的问题。
阿杰学AI21 小时前
人工智能·ai·语言模型·aigc·监督微调
AI核心知识19——大语言模型之SFT(简洁且通俗易懂版)SFT(Supervised Fine-Tuning)的全称是 “监督微调”。它是大语言模型训练的第二阶段,是让 AI 从 “知识储备” 迈向 “实用对话” 的关键一步。
迁 凉1 天前
语言模型
【不利用外界知识克服大模型的幻觉】Zero-knowledge LLM hallucination detection and mitigationLLM 能力强,但会“幻觉”:大语言模型虽然表现优异,但经常生成听起来合理却事实错误的内容,这被称为“幻觉”(hallucination)。 风险高:在企业或关键应用中,这种错误可能带来严重后果。
AI弟1 天前
人工智能·python·深度学习·机器学习·语言模型·自然语言处理
大语言模型进阶(一)之大语言模型基础目录2.1 Transformer结构2.1.1 嵌入表示层2.1.2 注意力层2.1.3 前馈层2.1.4 残差连接与层归一化
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·aigc·多模态·多模态大模型
AI核心知识29——大语言模型之Multimodality(简洁且通俗易懂版)多模态(Multimodality) 是大语言模型进化史上最重要的里程碑之一。如果说之前的 AI 是一个“虽然博学但又聋又瞎的哲学家”(只能读文字、写文字),那么多模态 AI 就意味着这个哲学家长出了眼睛、耳朵和嘴巴。
大白的编程笔记1 天前
人工智能·语言模型·自然语言处理
大语言模型(Large Language Model, LLM)系统详解大语言模型是参数量达亿级及以上、基于海量文本数据预训练的神经网络语言模型,核心具备通用的自然语言理解(Natural Language Understanding, NLU)与生成(Natural Language Generation, NLG)能力,是生成式AI的核心技术基座。以下分点梳理核心内容:
西柚小萌新1 天前
人工智能·语言模型·自然语言处理
【论文阅读】--多模态大语言模型的安全性研究综述知网地址:https://kns.cnki.net/kcms2/article/abstract?v=dSUnQCB_TmPMGARa7VoygnwKE7Y7HPvWwADp0cWRChFJXXTcdIszvem63yEwbaAXfu2R33g6dOOa2HeRJLJUyBJnFklp6coFC1cjIRcB7_vAMnNPhy-XNsyzVmNOSzk2p8gJTCv5dIgPRa4yoS7iTe6VMpYaWTEB6wEfzJqy0uu4_9aENSW1UQ==&uniplatform=NZKPT&l
Study9961 天前
人工智能·语言模型·自然语言处理·大模型·llm·gpt-3·大模型综述
【电子书】大语言模型综述(391页)2022 年底,ChatGPT震撼上线,大语言模型技术迅速“席卷”了整个社会,人工智能技术因此迎来了一次重要进展。面对大语言模型的强大性能,我们不禁要问:支撑这些模型的背后技术究竟是什么?这一问题无疑成为了众多科研人员的思考焦点。
AI弟1 天前
人工智能·深度学习·机器学习·语言模型·自然语言处理
大语言模型进阶(二)之大语言模型预训练数据目录3.1 数据来源3.1.1 通用数据3.1.2 专业数据3.2 数据处理3.2.1 质量过滤3.2.2 冗余去除
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·aigc·agent·多智能体系统
AI核心知识28——大语言模型之Multi-Agent Systems(简洁且通俗易懂版)多智能体系统(Multi-Agent Systems,简称 MAS) 是目前 AI 领域最前沿、也是最像科幻电影现实版的架构。