语言模型

Lvan的前端笔记2 小时前
语言模型
大模型最核心的三大架构类型大模型(LLM)常说的“架构”,主要指 Transformer 架构的不同变体,尤其是 Encoder、Decoder、Encoder-Decoder 三种宏观结构。除此之外,还有一些子结构与改进版本。下面我给你系统整理一套“目前主流大模型架构体系”。
玖日大大7 小时前
人工智能·microsoft·语言模型
LongCat-Flash-Omni:5600 亿参数开源全模态模型的技术革命与产业实践https://www.captainbed.cn/jrhttps://www.captainbed.cn/jr
WenGyyyL7 小时前
人工智能·python·语言模型·nlp·昇腾
基于昇腾平台的Qwen大模型推理部署实战:从模型转换到推理(含代码)基于昇腾平台的Qwen大模型推理部署实战:从模型转换到推理(含代码)本文目标:演示如何在基于GitCode平台的昇腾NPU服务器上,把一个轻量或中等规模的 vLLM(我们这里采用Qwen大模型)迁移、转换为昇腾可执行格式、部署推理服务,并给出一套可复现的测试、profiling 与初步调优流程。
西西o9 小时前
人工智能·语言模型
SpringAi GA1.0.0入门到源码完整系列课Spring AI 是一个面向人工智能工程的应用框架。解决了 AI 集成的基本挑战:将企业数据和API与AI 模型连接起来。
阿杰学AI9 小时前
人工智能·ai·语言模型·自然语言处理·aigc·agent·ai agent
AI核心知识27——大语言模型之AI Agent(简洁且通俗易懂版)如果说 LLM(大语言模型) 是一个只会说话的“超级大脑”,那么 AI Agent(智能体) 就是给这个大脑装上了“手”和“脚”,让它不仅能思考,还能干活。
攻城狮杰森10 小时前
人工智能·语言模型·ai作画·aigc·googlecloud
AI·重启思维:Gemini 3 带你走进智能的下一个维度近日,Google 与 DeepMind 联手推出旗下旗舰级别模型 “Gemini 3”——这不仅是一款语言模型的更新,更是一次人工智能理解与交互方式的全面升级。
随风一样自由10 小时前
人工智能·ai·语言模型
目前的AI大模型工具有哪些?具体都有哪些领域的应用?简单分析一下目前AI大模型工具已经形成了丰富多元的生态系统,涵盖了通用对话、编程开发、内容创作、学术科研和垂直行业等多个领域。根据2025年11月的最新信息,以下是对主要AI大模型工具的基本梳理:
m0_6501082411 小时前
论文阅读·人工智能·语言模型·开源vlm·高质量多模态数据集·molmo·pixmo
Molmo&PixMo:全开源视觉语言模型的突破之路在当前视觉语言模型(VLM)领域,GPT-4o、Gemini 1.5 等专有模型占据性能巅峰,但封闭的权重、数据与代码严重阻碍了科研社区的探索。多数开源 VLM 要么性能落后,要么依赖专有模型生成的合成数据,本质上是对封闭模型的蒸馏,缺乏 "从零构建高性能 VLM" 的基础认知。
阿杰学AI11 小时前
人工智能·语言模型·aigc·embedding·向量数据库·rag·vector database
AI核心知识26——大语言模型之Embedding与Vector Database (简洁且通俗易懂版)如果说 RAG(检索增强生成) 是大模型的“外挂图书馆”,那么 Embedding(嵌入) 和 Vector Database(向量数据库) 就是让这个图书馆能瞬间找到书的“图书管理员”和“索引系统”。
Ybaocheng11 小时前
人工智能·机器学习·语言模型
大模型第一章1、输入文本分词化2、token向量化3、大模型推理4、输出token5、输出文本temperature是一个调节器,它通过候选token的概率分布,影响大模型的内容生成,通过此参数,可以灵活的控制生成文本的多样性和创造性
黑客思维者13 小时前
人工智能·语言模型·自动化·e-cad
大语言模型重塑 E-CAD 自动化设计的技术革命的挑战与突破芯片设计的核心环节 E-CAD 正面临着功耗(P)、性能(P)、面积(A)的严苛优化需求与漫长迭代周期之间的矛盾。大语言模型(LLM)因其在自然语言和代码生成方面的强大能力,为 E-CAD 自动化带来了突破性解决方案。硬件描述语言(HDL)、EDA 脚本及设计文档等均以文本形式存在,使得 LLMs 天然具备介入 EDA 流程的能力,催生了 LLM4EDA 这一新兴研究方向。然而,从原理图到 PCB 布局,每一个环节都面临着独特的技术挑战。本文将从 AI 技术开发者的视角,系统性剖析 LLM 在 E-CAD
玖日大大13 小时前
人工智能·语言模型·自然语言处理
Ouro:预训练即推理的循环语言模型革命在大语言模型(LLM)的发展历程中,推理能力的构建始终依赖于训练后的辅助策略 —— 从思维链(CoT)到工具增强,这些方法虽能提升任务表现,却存在固有缺陷:推理过程与预训练阶段脱节,导致参数效率低下、推理轨迹缺乏因果一致性。2025 年 11 月,字节跳动 Seed 团队联合加州大学、北京大学等顶尖机构,推出了循环语言模型(Looped Language Models, LoopLM)系列 Ouro,其名源于象征循环与自我迭代的衔尾蛇(Ouroboros),首次将推理能力直接嵌入预训练过程,通过潜在空间迭
Dovis(誓平步青云)13 小时前
人工智能·语言模型·数据分析·智能体搭建·讯飞星辰
《高扩展性开源智能体开发:多插件集成与优质资源编排技术落地》前引:在 AI 技术席卷各行各业的今天,从智能客服到个性化推荐,从科研辅助到生活助手,智能体的应用场景越来越广泛。如果你也想跻身 AI 浪潮,却苦于 “入门无门、实战无路”,那么这篇教程将为你打通 “理论 + 实践” 的双路径 ——先推荐你去“AI 大学堂”免费学习 AI 基础课程,这里有 SQL 交互、TensorFlow 实战、AIGC 前沿应用等课程,能帮你快速建立 AI 知识体系;待你打好基础后,再带你深度玩转 “讯飞星辰 Agent 平台”,手把手教你搭建属于自己的智能体,让你从 “AI 学习者
阿杰学AI1 天前
人工智能·ai·语言模型·aigc·hallucination·ai幻觉
AI核心知识24——大语言模型之AI 幻觉(简洁且通俗易懂版)AI 幻觉 (Hallucination) 是大语言模型最著名、也是最让人头疼的一个缺陷。用一句最通俗的话来形容,就是:“一本正经地胡说八道”。
一只乔哇噻1 天前
java·开发语言·人工智能·算法·语言模型
java后端工程师+AI大模型进修ing(研一版‖day57)目录今日总结详细内容java随笔录Redis数据持久化RDBAOFAI随探录智能输入法案例数据集处理模型结构设计
python零基础入门小白1 天前
开发语言·人工智能·语言模型·架构·langchain·大模型教程·大模型面试
2025年大模型面试通关秘籍!大厂高频LLMs真题全解析,一文掌握,助你轻松斩获心仪offer!大模型技术迭代的速度正以“月”为单位颠覆行业认知——2025年的面试战场,早已不是比拼手写Transformer公式或调参技巧的擂台。随着技术落地深水区的到来,企业对人才的筛选逻辑发生剧变:能否用大模型撕开商业缺口,成为衡量价值的唯一标尺。
一只乔哇噻1 天前
java·开发语言·学习·算法·语言模型
java后端工程师+AI大模型进修ing(研一版‖day56)目录今日总结详细内容java随笔录OAuth2定义OAuth2的流程编辑OAuth2的应用授权过程JWT
极客BIM工作室1 天前
人工智能·语言模型·自然语言处理
AI论文整理:Flamingo: a Visual Language Model for Few-Shot Learning《Flamingo: a Visual Language Model for Few-Shot Learning》 下载地址:https://arxiv.org/pdf/2204.14198.pdf
阿杰学AI1 天前
人工智能·机器学习·语言模型·自然语言处理·aigc·agi·rag
AI核心知识25——大语言模型之RAG(简洁且通俗易懂版)RAG 是 Retrieval-Augmented Generation(检索增强生成)的缩写。如果说“幻觉”是大模型的病,那么 RAG 就是目前最有效的药。
帮帮志1 天前
ide·人工智能·python·语言模型·pycharm
05【AI大模型对话/创建项目】通过pycharm创建大模型项目,关联Anaconda环境提示:帮帮志会陆续更新非常多的IT技术知识,希望分享的内容对您有用。本章分享的是springboot的使用。前后每一小节的内容是存在的有:学习and理解的关联性。【帮帮志系列文章】:每个知识点,都是写出代码和运行结果且前后关联上的去分析和说明(能大量节约您的时间)。