语言模型

AI弟27 分钟前
人工智能·python·深度学习·机器学习·语言模型·自然语言处理
大语言模型进阶(一)之大语言模型基础目录2.1 Transformer结构2.1.1 嵌入表示层2.1.2 注意力层2.1.3 前馈层2.1.4 残差连接与层归一化
阿杰学AI1 小时前
人工智能·ai·语言模型·自然语言处理·aigc·多模态·多模态大模型
AI核心知识29——大语言模型之Multimodality(简洁且通俗易懂版)多模态(Multimodality) 是大语言模型进化史上最重要的里程碑之一。如果说之前的 AI 是一个“虽然博学但又聋又瞎的哲学家”(只能读文字、写文字),那么多模态 AI 就意味着这个哲学家长出了眼睛、耳朵和嘴巴。
大白的编程笔记2 小时前
人工智能·语言模型·自然语言处理
大语言模型(Large Language Model, LLM)系统详解大语言模型是参数量达亿级及以上、基于海量文本数据预训练的神经网络语言模型,核心具备通用的自然语言理解(Natural Language Understanding, NLU)与生成(Natural Language Generation, NLG)能力,是生成式AI的核心技术基座。以下分点梳理核心内容:
西柚小萌新2 小时前
人工智能·语言模型·自然语言处理
【论文阅读】--多模态大语言模型的安全性研究综述知网地址:https://kns.cnki.net/kcms2/article/abstract?v=dSUnQCB_TmPMGARa7VoygnwKE7Y7HPvWwADp0cWRChFJXXTcdIszvem63yEwbaAXfu2R33g6dOOa2HeRJLJUyBJnFklp6coFC1cjIRcB7_vAMnNPhy-XNsyzVmNOSzk2p8gJTCv5dIgPRa4yoS7iTe6VMpYaWTEB6wEfzJqy0uu4_9aENSW1UQ==&uniplatform=NZKPT&l
Study9963 小时前
人工智能·语言模型·自然语言处理·大模型·llm·gpt-3·大模型综述
【电子书】大语言模型综述(391页)2022 年底,ChatGPT震撼上线,大语言模型技术迅速“席卷”了整个社会,人工智能技术因此迎来了一次重要进展。面对大语言模型的强大性能,我们不禁要问:支撑这些模型的背后技术究竟是什么?这一问题无疑成为了众多科研人员的思考焦点。
AI弟3 小时前
人工智能·深度学习·机器学习·语言模型·自然语言处理
大语言模型进阶(二)之大语言模型预训练数据目录3.1 数据来源3.1.1 通用数据3.1.2 专业数据3.2 数据处理3.2.1 质量过滤3.2.2 冗余去除
阿杰学AI3 小时前
人工智能·ai·语言模型·自然语言处理·aigc·agent·多智能体系统
AI核心知识28——大语言模型之Multi-Agent Systems(简洁且通俗易懂版)多智能体系统(Multi-Agent Systems,简称 MAS) 是目前 AI 领域最前沿、也是最像科幻电影现实版的架构。
大白的编程笔记3 小时前
人工智能·语言模型·自然语言处理
语言模型(Language Model, LM)系统详解语言模型是人工智能领域用于建模自然语言规律的核心模型,核心目标是计算文本序列的概率分布,或基于上下文生成符合语义、语法逻辑的自然语言内容,是NLP(Natural Language Processing,自然语言处理)的基础技术基座。以下分点梳理核心内容:
Ma0407133 小时前
人工智能·语言模型·多模态·综述
【论文阅读20】MM-LLMs:多模态大语言模型的最新进展题目:MM-LLMs: Recent Advances in MultiModal Large Language Models
亚里随笔3 小时前
人工智能·语言模型·自然语言处理·llm·rlhf·agentic
DeepSeek-V3.2:开源大语言模型的新里程碑,在推理与智能体任务中突破性能边界DeepSeek-V3.2作为最新开源大语言模型,通过创新的稀疏注意力机制、可扩展的强化学习框架和大规模智能体任务合成管道,成功缩小了开源与闭源模型之间的性能差距。该模型不仅在多个推理基准测试中与GPT-5表现相当,其高性能变体DeepSeek-V3.2-Speciale更在IMO 2025和IOI 2025等国际顶级竞赛中获得金牌水平表现,标志着开源LLM进入全新发展阶段。
一只乔哇噻3 小时前
java·开发语言·算法·语言模型
java后端工程师+AI大模型进修ing(研一版‖day59)目录今日总结详细内容java随笔录为什么使用Spring Security来获取用户身份,而不是用Threadlocal来直接获取呢?
Lvan的前端笔记17 小时前
语言模型
大模型最核心的三大架构类型大模型(LLM)常说的“架构”,主要指 Transformer 架构的不同变体,尤其是 Encoder、Decoder、Encoder-Decoder 三种宏观结构。除此之外,还有一些子结构与改进版本。下面我给你系统整理一套“目前主流大模型架构体系”。
玖日大大1 天前
人工智能·microsoft·语言模型
LongCat-Flash-Omni:5600 亿参数开源全模态模型的技术革命与产业实践https://www.captainbed.cn/jrhttps://www.captainbed.cn/jr
WenGyyyL1 天前
人工智能·python·语言模型·nlp·昇腾
基于昇腾平台的Qwen大模型推理部署实战:从模型转换到推理(含代码)基于昇腾平台的Qwen大模型推理部署实战:从模型转换到推理(含代码)本文目标:演示如何在基于GitCode平台的昇腾NPU服务器上,把一个轻量或中等规模的 vLLM(我们这里采用Qwen大模型)迁移、转换为昇腾可执行格式、部署推理服务,并给出一套可复现的测试、profiling 与初步调优流程。
西西o1 天前
人工智能·语言模型
SpringAi GA1.0.0入门到源码完整系列课Spring AI 是一个面向人工智能工程的应用框架。解决了 AI 集成的基本挑战:将企业数据和API与AI 模型连接起来。
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·aigc·agent·ai agent
AI核心知识27——大语言模型之AI Agent(简洁且通俗易懂版)如果说 LLM(大语言模型) 是一个只会说话的“超级大脑”,那么 AI Agent(智能体) 就是给这个大脑装上了“手”和“脚”,让它不仅能思考,还能干活。
攻城狮杰森1 天前
人工智能·语言模型·ai作画·aigc·googlecloud
AI·重启思维:Gemini 3 带你走进智能的下一个维度近日,Google 与 DeepMind 联手推出旗下旗舰级别模型 “Gemini 3”——这不仅是一款语言模型的更新,更是一次人工智能理解与交互方式的全面升级。
随风一样自由1 天前
人工智能·ai·语言模型
目前的AI大模型工具有哪些?具体都有哪些领域的应用?简单分析一下目前AI大模型工具已经形成了丰富多元的生态系统,涵盖了通用对话、编程开发、内容创作、学术科研和垂直行业等多个领域。根据2025年11月的最新信息,以下是对主要AI大模型工具的基本梳理:
m0_650108241 天前
论文阅读·人工智能·语言模型·开源vlm·高质量多模态数据集·molmo·pixmo
Molmo&PixMo:全开源视觉语言模型的突破之路在当前视觉语言模型(VLM)领域,GPT-4o、Gemini 1.5 等专有模型占据性能巅峰,但封闭的权重、数据与代码严重阻碍了科研社区的探索。多数开源 VLM 要么性能落后,要么依赖专有模型生成的合成数据,本质上是对封闭模型的蒸馏,缺乏 "从零构建高性能 VLM" 的基础认知。
阿杰学AI1 天前
人工智能·语言模型·aigc·embedding·向量数据库·rag·vector database
AI核心知识26——大语言模型之Embedding与Vector Database (简洁且通俗易懂版)如果说 RAG(检索增强生成) 是大模型的“外挂图书馆”,那么 Embedding(嵌入) 和 Vector Database(向量数据库) 就是让这个图书馆能瞬间找到书的“图书管理员”和“索引系统”。