技术栈
语言模型
ReinaXue
27 分钟前
图像处理
·
人工智能
·
神经网络
·
算法
·
生成对抗网络
·
计算机视觉
·
语言模型
快速认识图像生成算法:VAE、GAN 和 Diffusion Models
VAE 是一种基于概率图模型的生成模型,它通过学习数据的潜在分布(Latent Distribution)来进行生成。它本质上是传统自编码器(AE)的一个概率化、正则化版本。
黑客思维者
1 小时前
microsoft
·
搜索引擎
·
语言模型
大语言模型如何重塑搜索引擎:从链接罗列到知识服务的革命
打开手机搜索 “2024 年中国新能源汽车销量 TOP5 及同比增速”,十年前你会看到一页页带蓝色标题的链接——行业报告的摘要、车企官网的新闻、财经媒体的分析,需要逐个点开比对数据来源、筛选有效信息,花十几分钟才能拼凑出完整答案;而现在,搜索框下方会直接跳出一段清晰的文字:“2024年中国新能源汽车销量前五品牌依次为比亚迪(302.5万辆,同比+18.2%)、理想(87.3万辆,同比+35.6%)、蔚来(49.8万辆,同比+22.1%)、小鹏(45.1万辆,同比+15.3%)、极氪(38.6万辆,同比+4
中國龍在廣州
2 小时前
人工智能
·
深度学习
·
算法
·
语言模型
·
自然语言处理
·
chatgpt
·
机器人
李飞飞最新思考:语言模型救不了机器人
过去几年里,AI 行业的节奏快得近乎失真。模型一次次刷新极限,产品迭代像在抢时间,讨论从“推理成本”到“智能涌现”再到“AGI 时间表”,情绪在乐观与焦虑之间来回摆动。
海底的星星fly
2 小时前
人工智能
·
语言模型
·
langchain
·
prompt
【Prompt学习技能树地图】LangChain原理及应用操作指南
大型语言模型(Large Language Model, LLM)的能力飞跃,标志着人工智能进入新阶段。然而,其卓越表现之下存在着由根本设计范式决定的固有局限性。深刻理解这些局限,是有效驾驭并扩展其能力的前提。
阿杰学AI
2 小时前
人工智能
·
语言模型
·
自然语言处理
·
aigc
·
agi
·
cot
·
思维链
AI核心知识30——大语言模型之CoT(简洁且通俗易懂版)
CoT 是 Chain-of-Thought(思维链)的缩写。它是提示工程(Prompt Engineering)中最著名、最有效、也是最神奇的一种技术。
LeeZhao@
2 小时前
数据库
·
人工智能
·
redis
·
语言模型
·
机器人
·
agi
【狂飙全模态】狂飙AGI-智能图文理解助手
官网网址:https://bigmodel.cn/
阿杰学AI
3 小时前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
aigc
·
embedding
·
多模态理解
AI核心知识31——大语言模型之Multimodal Understanding(简洁且通俗易懂版)
多模态理解 (Multimodal Understanding) 是多模态技术中侧重于 “输入” 和 “感知” 的那一面。
LeeZhao@
17 小时前
数据库
·
人工智能
·
redis
·
语言模型
·
aigc
·
agi
【狂飙全模态】狂飙AGI-智能答疑助手
官网网址:https://bigmodel.cn/
AI浩
17 小时前
人工智能
·
语言模型
·
自然语言处理
DeepSeek-V3.2:推动开源大型语言模型的前沿发展
我们介绍了DeepSeek-V3.2,这是一个在高效计算与卓越推理及智能体性能之间取得平衡的模型。DeepSeek-V3.2的关键技术突破如下:(1) DeepSeek稀疏注意力(DSA):我们引入了DSA,这是一种高效注意力机制,在保持长上下文场景中模型性能的同时,大幅降低了计算复杂度。(2) 可扩展的强化学习框架:通过实施稳健的强化学习协议并扩展后训练计算,DeepSeek-V3.2的表现与GPT-5相当。值得注意的是,我们的高计算变体DeepSeek-V3.2-Speciale超越了GPT-5,其推
youcans_
19 小时前
论文阅读
·
人工智能
·
语言模型
·
智能体
·
deepseek
【DeepSeek 论文精读】15. DeepSeek-V3.2:开拓开源大型语言模型新前沿
欢迎关注[【AIGC论文精读】](https://blog.csdn.net/youcans/category_12321605.html)原创作品 【DeepSeek论文精读】1. 从 DeepSeek LLM 到 DeepSeek R1 【DeepSeek论文精读】14. DeepSeek-V3.2-Exp 技术报告详解 【DeepSeek论文精读】15. DeepSeek-V3.2:开拓开源大型语言模型新前沿
DisonTangor
21 小时前
人工智能
·
语言模型
·
开源
·
aigc
·
音视频
Step-Audio-R1 首个成功实现测试时计算扩展的音频语言模型
Step-Audio-R1 是首个成功实现测试时计算扩展的音频语言模型。它彻底解决了困扰现有模型的"逆向扩展"异常现象——即性能会随着推理链延长而反常下降的问题。
阿杰学AI
21 小时前
人工智能
·
ai
·
语言模型
·
aigc
·
监督微调
AI核心知识19——大语言模型之SFT(简洁且通俗易懂版)
SFT(Supervised Fine-Tuning)的全称是 “监督微调”。它是大语言模型训练的第二阶段,是让 AI 从 “知识储备” 迈向 “实用对话” 的关键一步。
迁 凉
1 天前
语言模型
【不利用外界知识克服大模型的幻觉】Zero-knowledge LLM hallucination detection and mitigation
LLM 能力强,但会“幻觉”:大语言模型虽然表现优异,但经常生成听起来合理却事实错误的内容,这被称为“幻觉”(hallucination)。 风险高:在企业或关键应用中,这种错误可能带来严重后果。
AI弟
1 天前
人工智能
·
python
·
深度学习
·
机器学习
·
语言模型
·
自然语言处理
大语言模型进阶(一)之大语言模型基础
目录2.1 Transformer结构2.1.1 嵌入表示层2.1.2 注意力层2.1.3 前馈层2.1.4 残差连接与层归一化
阿杰学AI
1 天前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
aigc
·
多模态
·
多模态大模型
AI核心知识29——大语言模型之Multimodality(简洁且通俗易懂版)
多模态(Multimodality) 是大语言模型进化史上最重要的里程碑之一。如果说之前的 AI 是一个“虽然博学但又聋又瞎的哲学家”(只能读文字、写文字),那么多模态 AI 就意味着这个哲学家长出了眼睛、耳朵和嘴巴。
大白的编程笔记
1 天前
人工智能
·
语言模型
·
自然语言处理
大语言模型(Large Language Model, LLM)系统详解
大语言模型是参数量达亿级及以上、基于海量文本数据预训练的神经网络语言模型,核心具备通用的自然语言理解(Natural Language Understanding, NLU)与生成(Natural Language Generation, NLG)能力,是生成式AI的核心技术基座。以下分点梳理核心内容:
西柚小萌新
1 天前
人工智能
·
语言模型
·
自然语言处理
【论文阅读】--多模态大语言模型的安全性研究综述
知网地址:https://kns.cnki.net/kcms2/article/abstract?v=dSUnQCB_TmPMGARa7VoygnwKE7Y7HPvWwADp0cWRChFJXXTcdIszvem63yEwbaAXfu2R33g6dOOa2HeRJLJUyBJnFklp6coFC1cjIRcB7_vAMnNPhy-XNsyzVmNOSzk2p8gJTCv5dIgPRa4yoS7iTe6VMpYaWTEB6wEfzJqy0uu4_9aENSW1UQ==&uniplatform=NZKPT&l
Study996
1 天前
人工智能
·
语言模型
·
自然语言处理
·
大模型
·
llm
·
gpt-3
·
大模型综述
【电子书】大语言模型综述(391页)
2022 年底,ChatGPT震撼上线,大语言模型技术迅速“席卷”了整个社会,人工智能技术因此迎来了一次重要进展。面对大语言模型的强大性能,我们不禁要问:支撑这些模型的背后技术究竟是什么?这一问题无疑成为了众多科研人员的思考焦点。
AI弟
1 天前
人工智能
·
深度学习
·
机器学习
·
语言模型
·
自然语言处理
大语言模型进阶(二)之大语言模型预训练数据
目录3.1 数据来源3.1.1 通用数据3.1.2 专业数据3.2 数据处理3.2.1 质量过滤3.2.2 冗余去除
阿杰学AI
1 天前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
aigc
·
agent
·
多智能体系统
AI核心知识28——大语言模型之Multi-Agent Systems(简洁且通俗易懂版)
多智能体系统(Multi-Agent Systems,简称 MAS) 是目前 AI 领域最前沿、也是最像科幻电影现实版的架构。