语言模型

AndrewHZ24 分钟前
人工智能·gpt·深度学习·语言模型·llm·openai·规模定律
【LLM技术全景】规模定律与模型演进:为什么模型越大越强?摘要:本文是《LLM技术全景:从Token到部署》系列第五篇。大语言模型最令人震撼的现象之一是"规模定律"(Scaling Law)——模型性能随参数量、数据量、计算量的增加而可预测地提升。本期将深入解析Scaling Law的数学原理(Kaplan定律、Chinchilla定律)、模型演进的关键里程碑(BERT→GPT→LLaMA),以及为什么"大力出奇迹"在Transformer架构下依然有效。
醒醒该学习了!4 小时前
人工智能·语言模型·自然语言处理
大语言模型(理论篇)人类输入的是自然语言,模型真正处理的是数字。文本进入大模型通常经历以下步骤:这条链路里最重要的认识是:大模型并不是“直接读汉字或英文单词”,而是先把文本转换成可计算的数字表示,再进行预测和生成。
羊羊小栈7 小时前
人工智能·语言模型·毕业设计·知识图谱·创业创新·neo4j·大作业
基于知识图谱(Neo4j)和大语言模型(LLM)的图检索增强(GraphRAG)的数控车床主轴系统故障诊断智能问答系统b站演示视频与部署教程视频(点击这里) https://www.bilibili.com/video/BV1vKEE6dELs/?share_source=copy_web&vd_source=31c839f46a9a845dd6dd641cbd5c2ac1
LoserChaser10 小时前
人工智能·语言模型·交互
大语言模型基础-与大语言模型交互如果我们把大语言模型比作一个能力极强的“大脑”,那么提示 (Prompt) 就是我们与这个“大脑”沟通的语言。 提示工程,就是研究如何设计出精准的提示,从而引导模型产生我们期望输出的回复。
叫我:松哥10 小时前
人工智能·语言模型·自然语言处理·架构·flask·bootstrap
基于deepseek大语言模型的项目架构图设计与绘制系统第1章 引 言1.1 研究背景与意义在软件工程领域,系统架构图作为传达设计意图、指导开发实施的关键载体,其绘制质量直接影响团队协作效率与系统演进能力。当前行业实践中,架构图的创建与维护主要依赖人工操作,开发人员借助通用绘图工具或专用建模软件,通过拖拽、连线等方式逐项构建架构元素。这一过程不仅耗时费力,还面临需求理解偏差导致的架构偏差风险,尤其在敏捷开发模式下,需求频繁变更使得架构图同步更新的成本进一步放大。据Stack Overflow开发者调查报告,约67%的开发团队仍以静态文档形式维护架构图,超过半数
东方佑10 小时前
人工智能·语言模型·自然语言处理
递归创世:条件随机、自指递归与分形——一个贯穿真实世界、自然语言和大型语言模型的统一原理真实世界并非完全随机的混沌,也不是一部严格确定的钟表。本文将论证,真实世界的底层动力学是一个条件随机过程——在不变规律划定的疆域内不断进行随机试错。在这种永恒的扰动中,唯有那些恰好处于分形临界态的结构才能动态幸存。而分形本身,则是由自指与递归操作所必然生成的几何与统计指纹。这一原理不仅解释了物理世界中分形的普遍存在,更穿透了自然语言的本质:语言正是递归自指规则下的条件随机抽样,其表层统计必然涌现幂律、长程相关与结构自相似的分形特征。最终,我们揭示,当今大语言模型的自回归设计,正是这一原理在硅基上的完美映射
Sirius Wu1 天前
人工智能·机器学习·语言模型·prompt·aigc
意图&实体ToolCall_Prompt调优目标:基于商用和开源的强大LLM,在各自项目数据集上进行Prompt调优,目的是得到一个拓展性强、标准化高、效果好的通用PE模版。
zhumin7261 天前
人工智能·语言模型·自然语言处理
一种基于人类行为—内分泌映射的大语言模型动态情绪系统:从生理数据标定到虚拟激素驱动决策的工程化框架当前大语言模型(LLM)的具身智能与情感计算(Affective Computing)高度依赖于静态提示词(Prompt)工程或外部规则模板,缺乏人类情感固有的连续性、时滞性及环境累积效应。本研究提出一种全新的数据驱动型大模型动态情绪系统。该系统彻底摆脱传统情感计算的先验规则设定,开创性地设计了一条“人类生理数据标定 高维行为聚类 时间序列内分泌状态空间 LLM决策调制”的完整工程化路径。通过建立以“交互步(Interaction Step)”为单位的虚拟内分泌池,并引入基因种子(Seed)与环境积分(E
生成论实验室1 天前
人工智能·语言模型·机器人·自动驾驶·安全架构
判断力与六十四卦:AI的第三块基石作者:周林东,单位:莆田字序生命科技有限公司,地址:福建省莆田市本文核心观点:判断力是AI继Token和Transformer之后的第三块基石。六十四卦的本质是2⁶=64的完备态势空间,是判断力的数学底座。这不是占卜,而是中华文明对认知科学的结构性贡献。
挂科边缘1 天前
人工智能·语言模型·whisper·faster-whisper·实时语音输入转文本
手把手教你使用 Faster-Whisper 实时语音输入转文本,本地部署教程要想实现像豆包、微信等一样的语音输入功能,通常有两种主流方案:云端 API(轻量、准确度极高)和 本地模型(免费、隐私、无需联网)。由于目前开发的系统需要添加一个语音识别功能,刚好记录一下使用 Faster-Whisper 实时语音输入转文本。Faster-Whisper官网地址链接: Faster-Whisper官网地址
我爱cope1 天前
人工智能·设计模式·语言模型·职场和发展
【Agent智能体23 | 规划-规划工作流】声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。
生成论实验室1 天前
人工智能·语言模型·机器人·自动驾驶·安全架构
降U动力学:用一套原理统一解释21项AI技术作者:周林东,单位:莆田字序生命科技有限公司,地址:福建省莆田市声明:本文提出的降U动力学目前是一个统一解释框架,已通过思想实验与工程原型(WOLM判断力引擎)验证了可行性,但尚未在大规模公开基准上完成全部统计检验。欢迎同行进行实证验证与讨论。
樱花的浪漫1 天前
前端·javascript·人工智能·语言模型·自然语言处理·typescript
Typescript、Zod基础初始化项目目录与 package.json可指定 package.json中TS和zod的版本,然后下载
AI人工智能+1 天前
深度学习·语言模型·自然语言处理·ocr·药品注册证识别
药品注册证识别技术利用深度学习和多模态融合架构,实现药品注册证信息的自动化精准提取在医药监管与行业数字化进程中,药品注册证是药品合法上市的核心凭证。然而,随着海量历史档案的数字化以及新批文的高频发布,人工录入和核对注册证信息(如药品名称、证书编号、剂型、规格、受理号等)面临着效率低、易出错、标准不统一等痛点。
像风一样自由20201 天前
android·人工智能·语言模型·大模型
量化压缩实战:INT8 / INT4 / AWQ / GPTQ 全面对比《大模型知识与部署》系列 · No.12 / 35 适合人群:AI 工程师、后端开发 阅读时间:约 28 分钟
P-ShineBeam1 天前
数据库·人工智能·语言模型·自然语言处理·langchain
智能体-LangChain框架-Tools工具的使用指南Tools(工具)是 LangChain 中让大模型与外部世界交互的核心机制。模型本身只会“说话”,而工具让它能够真正“动手”——搜索、计算、查数据库、调 API。通过工具,Agent 可以执行搜索、计算、数据库查询等操作,极大扩展了 AI 的能力边界。
我爱cope1 天前
人工智能·设计模式·语言模型·职场和发展
【Agent智能体24 | 规划-创建和执行LLM计划】声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。
天青色等烟雨..1 天前
人工智能·语言模型·数据分析
AI大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模等深度科研随着人工智能技术的快速发展,大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练,能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。
东方佑1 天前
人工智能·语言模型·自然语言处理
碱基互补语言模型用 DNA 配对规则,从无标注文本中发现语法“如果语言也有一条双螺旋——我们只是还没有找到它?”有一个事实如此明显,以至于没有人想到去质疑它。
zhangfeng11331 天前
人工智能·语言模型·自然语言处理
大语言模型思维链技术研究报告 CoT | 推理模型 | 思维树 | 强化学习 | o1 / R1思维链(Chain of Thought,简称CoT)是一种提示工程技术,其核心思想是在向大语言模型提出问题时,不仅要求模型给出最终答案,还要求模型在回答过程中生成一系列中间推理步骤,就像人类在解决复杂问题时会逐步思考一样。这种方法通过将复杂的推理任务分解为多个可管理的子步骤,显著提升了大语言模型在数学推理、常识推理、符号推理等任务上的表现。思维链的本质是让模型的推理过程变得"可见"和"可追溯",从而不仅提高了答案的准确性,还增强了模型输出的可解释性和可信度。 在思维链提出之前,大语言模型通常采用"直接回