技术栈
语言模型
AI弟
27 分钟前
人工智能
·
python
·
深度学习
·
机器学习
·
语言模型
·
自然语言处理
大语言模型进阶(一)之大语言模型基础
目录2.1 Transformer结构2.1.1 嵌入表示层2.1.2 注意力层2.1.3 前馈层2.1.4 残差连接与层归一化
阿杰学AI
1 小时前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
aigc
·
多模态
·
多模态大模型
AI核心知识29——大语言模型之Multimodality(简洁且通俗易懂版)
多模态(Multimodality) 是大语言模型进化史上最重要的里程碑之一。如果说之前的 AI 是一个“虽然博学但又聋又瞎的哲学家”(只能读文字、写文字),那么多模态 AI 就意味着这个哲学家长出了眼睛、耳朵和嘴巴。
大白的编程笔记
2 小时前
人工智能
·
语言模型
·
自然语言处理
大语言模型(Large Language Model, LLM)系统详解
大语言模型是参数量达亿级及以上、基于海量文本数据预训练的神经网络语言模型,核心具备通用的自然语言理解(Natural Language Understanding, NLU)与生成(Natural Language Generation, NLG)能力,是生成式AI的核心技术基座。以下分点梳理核心内容:
西柚小萌新
2 小时前
人工智能
·
语言模型
·
自然语言处理
【论文阅读】--多模态大语言模型的安全性研究综述
知网地址:https://kns.cnki.net/kcms2/article/abstract?v=dSUnQCB_TmPMGARa7VoygnwKE7Y7HPvWwADp0cWRChFJXXTcdIszvem63yEwbaAXfu2R33g6dOOa2HeRJLJUyBJnFklp6coFC1cjIRcB7_vAMnNPhy-XNsyzVmNOSzk2p8gJTCv5dIgPRa4yoS7iTe6VMpYaWTEB6wEfzJqy0uu4_9aENSW1UQ==&uniplatform=NZKPT&l
Study996
3 小时前
人工智能
·
语言模型
·
自然语言处理
·
大模型
·
llm
·
gpt-3
·
大模型综述
【电子书】大语言模型综述(391页)
2022 年底,ChatGPT震撼上线,大语言模型技术迅速“席卷”了整个社会,人工智能技术因此迎来了一次重要进展。面对大语言模型的强大性能,我们不禁要问:支撑这些模型的背后技术究竟是什么?这一问题无疑成为了众多科研人员的思考焦点。
AI弟
3 小时前
人工智能
·
深度学习
·
机器学习
·
语言模型
·
自然语言处理
大语言模型进阶(二)之大语言模型预训练数据
目录3.1 数据来源3.1.1 通用数据3.1.2 专业数据3.2 数据处理3.2.1 质量过滤3.2.2 冗余去除
阿杰学AI
3 小时前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
aigc
·
agent
·
多智能体系统
AI核心知识28——大语言模型之Multi-Agent Systems(简洁且通俗易懂版)
多智能体系统(Multi-Agent Systems,简称 MAS) 是目前 AI 领域最前沿、也是最像科幻电影现实版的架构。
大白的编程笔记
3 小时前
人工智能
·
语言模型
·
自然语言处理
语言模型(Language Model, LM)系统详解
语言模型是人工智能领域用于建模自然语言规律的核心模型,核心目标是计算文本序列的概率分布,或基于上下文生成符合语义、语法逻辑的自然语言内容,是NLP(Natural Language Processing,自然语言处理)的基础技术基座。以下分点梳理核心内容:
Ma040713
3 小时前
人工智能
·
语言模型
·
多模态
·
综述
【论文阅读20】MM-LLMs:多模态大语言模型的最新进展
题目:MM-LLMs: Recent Advances in MultiModal Large Language Models
亚里随笔
3 小时前
人工智能
·
语言模型
·
自然语言处理
·
llm
·
rlhf
·
agentic
DeepSeek-V3.2:开源大语言模型的新里程碑,在推理与智能体任务中突破性能边界
DeepSeek-V3.2作为最新开源大语言模型,通过创新的稀疏注意力机制、可扩展的强化学习框架和大规模智能体任务合成管道,成功缩小了开源与闭源模型之间的性能差距。该模型不仅在多个推理基准测试中与GPT-5表现相当,其高性能变体DeepSeek-V3.2-Speciale更在IMO 2025和IOI 2025等国际顶级竞赛中获得金牌水平表现,标志着开源LLM进入全新发展阶段。
一只乔哇噻
3 小时前
java
·
开发语言
·
算法
·
语言模型
java后端工程师+AI大模型进修ing(研一版‖day59)
目录今日总结详细内容java随笔录为什么使用Spring Security来获取用户身份,而不是用Threadlocal来直接获取呢?
Lvan的前端笔记
17 小时前
语言模型
大模型最核心的三大架构类型
大模型(LLM)常说的“架构”,主要指 Transformer 架构的不同变体,尤其是 Encoder、Decoder、Encoder-Decoder 三种宏观结构。除此之外,还有一些子结构与改进版本。下面我给你系统整理一套“目前主流大模型架构体系”。
玖日大大
1 天前
人工智能
·
microsoft
·
语言模型
LongCat-Flash-Omni:5600 亿参数开源全模态模型的技术革命与产业实践
https://www.captainbed.cn/jrhttps://www.captainbed.cn/jr
WenGyyyL
1 天前
人工智能
·
python
·
语言模型
·
nlp
·
昇腾
基于昇腾平台的Qwen大模型推理部署实战:从模型转换到推理(含代码)
基于昇腾平台的Qwen大模型推理部署实战:从模型转换到推理(含代码)本文目标:演示如何在基于GitCode平台的昇腾NPU服务器上,把一个轻量或中等规模的 vLLM(我们这里采用Qwen大模型)迁移、转换为昇腾可执行格式、部署推理服务,并给出一套可复现的测试、profiling 与初步调优流程。
西西o
1 天前
人工智能
·
语言模型
SpringAi GA1.0.0入门到源码完整系列课
Spring AI 是一个面向人工智能工程的应用框架。解决了 AI 集成的基本挑战:将企业数据和API与AI 模型连接起来。
阿杰学AI
1 天前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
aigc
·
agent
·
ai agent
AI核心知识27——大语言模型之AI Agent(简洁且通俗易懂版)
如果说 LLM(大语言模型) 是一个只会说话的“超级大脑”,那么 AI Agent(智能体) 就是给这个大脑装上了“手”和“脚”,让它不仅能思考,还能干活。
攻城狮杰森
1 天前
人工智能
·
语言模型
·
ai作画
·
aigc
·
googlecloud
AI·重启思维:Gemini 3 带你走进智能的下一个维度
近日,Google 与 DeepMind 联手推出旗下旗舰级别模型 “Gemini 3”——这不仅是一款语言模型的更新,更是一次人工智能理解与交互方式的全面升级。
随风一样自由
1 天前
人工智能
·
ai
·
语言模型
目前的AI大模型工具有哪些?具体都有哪些领域的应用?简单分析一下
目前AI大模型工具已经形成了丰富多元的生态系统,涵盖了通用对话、编程开发、内容创作、学术科研和垂直行业等多个领域。根据2025年11月的最新信息,以下是对主要AI大模型工具的基本梳理:
m0_65010824
1 天前
论文阅读
·
人工智能
·
语言模型
·
开源vlm
·
高质量多模态数据集
·
molmo
·
pixmo
Molmo&PixMo:全开源视觉语言模型的突破之路
在当前视觉语言模型(VLM)领域,GPT-4o、Gemini 1.5 等专有模型占据性能巅峰,但封闭的权重、数据与代码严重阻碍了科研社区的探索。多数开源 VLM 要么性能落后,要么依赖专有模型生成的合成数据,本质上是对封闭模型的蒸馏,缺乏 "从零构建高性能 VLM" 的基础认知。
阿杰学AI
1 天前
人工智能
·
语言模型
·
aigc
·
embedding
·
向量数据库
·
rag
·
vector database
AI核心知识26——大语言模型之Embedding与Vector Database (简洁且通俗易懂版)
如果说 RAG(检索增强生成) 是大模型的“外挂图书馆”,那么 Embedding(嵌入) 和 Vector Database(向量数据库) 就是让这个图书馆能瞬间找到书的“图书管理员”和“索引系统”。