语言模型

清辞85343 分钟前
大数据·人工智能·学习·语言模型
Coze从入门到实战---第一、二章什么是AI Agent?AI Agent是能够感知环境、自主决策、使用工具完成任务的智能体Agent和大模型的区别是什么?
Samooyou1 小时前
人工智能·python·ai·语言模型
大模型微调(Fine Tuning)传统函数与大模型的本质对比:普通函数: f(x) = y (给定输入 x,通过固定数学规则,算出确定的输出 y)
东方佑5 小时前
人工智能·语言模型·自然语言处理
分形递归状态机 (FRSM) 实验报告-或将实现llm无限上下文分形递归状态机 (Fractal Recursive State Machine, FRSM) 是一种新型自回归语言模型架构,其核心原理是:
MartinYeung58 小时前
人工智能·学习·语言模型
[论文学习]透过增强式 Few-Shot Learning 实现高效 PII 从大型语言模型中提取大型语言模型(LLMs)在训练时大量摄取网路资料,其中包含大量个人识别资讯(PII),如姓名、电子邮件、电话号码、职业等。这些 PII 可能来自公开来源、资料外洩或未经同意的收集,导致模型「记住」并能在提示下重现敏感资料,带来严重隐私风险(例如 spear-phishing、骚扰或身分盗用)。
仙女修炼史8 小时前
人工智能·语言模型·自然语言处理
初代词向量:A Neural Probabilistic Language Model不要把词看成离散符号,而是映射到一个连续向量里,例如cat -> [0.2, 0.1, 0.01,…] m是向量的维度,相似的词应该有相似向。可以这样理解,每个词都有自己的向量,词与词之间的相似性,在向量空间中,以距离近的形式表现出来。
AndrewHZ1 天前
人工智能·gpt·深度学习·语言模型·llm·openai·规模定律
【LLM技术全景】规模定律与模型演进:为什么模型越大越强?摘要:本文是《LLM技术全景:从Token到部署》系列第五篇。大语言模型最令人震撼的现象之一是"规模定律"(Scaling Law)——模型性能随参数量、数据量、计算量的增加而可预测地提升。本期将深入解析Scaling Law的数学原理(Kaplan定律、Chinchilla定律)、模型演进的关键里程碑(BERT→GPT→LLaMA),以及为什么"大力出奇迹"在Transformer架构下依然有效。
醒醒该学习了!1 天前
人工智能·语言模型·自然语言处理
大语言模型(理论篇)人类输入的是自然语言,模型真正处理的是数字。文本进入大模型通常经历以下步骤:这条链路里最重要的认识是:大模型并不是“直接读汉字或英文单词”,而是先把文本转换成可计算的数字表示,再进行预测和生成。
羊羊小栈1 天前
人工智能·语言模型·毕业设计·知识图谱·创业创新·neo4j·大作业
基于知识图谱(Neo4j)和大语言模型(LLM)的图检索增强(GraphRAG)的数控车床主轴系统故障诊断智能问答系统b站演示视频与部署教程视频(点击这里) https://www.bilibili.com/video/BV1vKEE6dELs/?share_source=copy_web&vd_source=31c839f46a9a845dd6dd641cbd5c2ac1
LoserChaser1 天前
人工智能·语言模型·交互
大语言模型基础-与大语言模型交互如果我们把大语言模型比作一个能力极强的“大脑”,那么提示 (Prompt) 就是我们与这个“大脑”沟通的语言。 提示工程,就是研究如何设计出精准的提示,从而引导模型产生我们期望输出的回复。
叫我:松哥1 天前
人工智能·语言模型·自然语言处理·架构·flask·bootstrap
基于deepseek大语言模型的项目架构图设计与绘制系统第1章 引 言1.1 研究背景与意义在软件工程领域,系统架构图作为传达设计意图、指导开发实施的关键载体,其绘制质量直接影响团队协作效率与系统演进能力。当前行业实践中,架构图的创建与维护主要依赖人工操作,开发人员借助通用绘图工具或专用建模软件,通过拖拽、连线等方式逐项构建架构元素。这一过程不仅耗时费力,还面临需求理解偏差导致的架构偏差风险,尤其在敏捷开发模式下,需求频繁变更使得架构图同步更新的成本进一步放大。据Stack Overflow开发者调查报告,约67%的开发团队仍以静态文档形式维护架构图,超过半数
东方佑1 天前
人工智能·语言模型·自然语言处理
递归创世:条件随机、自指递归与分形——一个贯穿真实世界、自然语言和大型语言模型的统一原理真实世界并非完全随机的混沌,也不是一部严格确定的钟表。本文将论证,真实世界的底层动力学是一个条件随机过程——在不变规律划定的疆域内不断进行随机试错。在这种永恒的扰动中,唯有那些恰好处于分形临界态的结构才能动态幸存。而分形本身,则是由自指与递归操作所必然生成的几何与统计指纹。这一原理不仅解释了物理世界中分形的普遍存在,更穿透了自然语言的本质:语言正是递归自指规则下的条件随机抽样,其表层统计必然涌现幂律、长程相关与结构自相似的分形特征。最终,我们揭示,当今大语言模型的自回归设计,正是这一原理在硅基上的完美映射
Sirius Wu2 天前
人工智能·机器学习·语言模型·prompt·aigc
意图&实体ToolCall_Prompt调优目标:基于商用和开源的强大LLM,在各自项目数据集上进行Prompt调优,目的是得到一个拓展性强、标准化高、效果好的通用PE模版。
zhumin7262 天前
人工智能·语言模型·自然语言处理
一种基于人类行为—内分泌映射的大语言模型动态情绪系统:从生理数据标定到虚拟激素驱动决策的工程化框架当前大语言模型(LLM)的具身智能与情感计算(Affective Computing)高度依赖于静态提示词(Prompt)工程或外部规则模板,缺乏人类情感固有的连续性、时滞性及环境累积效应。本研究提出一种全新的数据驱动型大模型动态情绪系统。该系统彻底摆脱传统情感计算的先验规则设定,开创性地设计了一条“人类生理数据标定 高维行为聚类 时间序列内分泌状态空间 LLM决策调制”的完整工程化路径。通过建立以“交互步(Interaction Step)”为单位的虚拟内分泌池,并引入基因种子(Seed)与环境积分(E
生成论实验室2 天前
人工智能·语言模型·机器人·自动驾驶·安全架构
判断力与六十四卦:AI的第三块基石作者:周林东,单位:莆田字序生命科技有限公司,地址:福建省莆田市本文核心观点:判断力是AI继Token和Transformer之后的第三块基石。六十四卦的本质是2⁶=64的完备态势空间,是判断力的数学底座。这不是占卜,而是中华文明对认知科学的结构性贡献。
挂科边缘2 天前
人工智能·语言模型·whisper·faster-whisper·实时语音输入转文本
手把手教你使用 Faster-Whisper 实时语音输入转文本,本地部署教程要想实现像豆包、微信等一样的语音输入功能,通常有两种主流方案:云端 API(轻量、准确度极高)和 本地模型(免费、隐私、无需联网)。由于目前开发的系统需要添加一个语音识别功能,刚好记录一下使用 Faster-Whisper 实时语音输入转文本。Faster-Whisper官网地址链接: Faster-Whisper官网地址
我爱cope2 天前
人工智能·设计模式·语言模型·职场和发展
【Agent智能体23 | 规划-规划工作流】声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。
生成论实验室2 天前
人工智能·语言模型·机器人·自动驾驶·安全架构
降U动力学:用一套原理统一解释21项AI技术作者:周林东,单位:莆田字序生命科技有限公司,地址:福建省莆田市声明:本文提出的降U动力学目前是一个统一解释框架,已通过思想实验与工程原型(WOLM判断力引擎)验证了可行性,但尚未在大规模公开基准上完成全部统计检验。欢迎同行进行实证验证与讨论。
樱花的浪漫2 天前
前端·javascript·人工智能·语言模型·自然语言处理·typescript
Typescript、Zod基础初始化项目目录与 package.json可指定 package.json中TS和zod的版本,然后下载
AI人工智能+2 天前
深度学习·语言模型·自然语言处理·ocr·药品注册证识别
药品注册证识别技术利用深度学习和多模态融合架构,实现药品注册证信息的自动化精准提取在医药监管与行业数字化进程中,药品注册证是药品合法上市的核心凭证。然而,随着海量历史档案的数字化以及新批文的高频发布,人工录入和核对注册证信息(如药品名称、证书编号、剂型、规格、受理号等)面临着效率低、易出错、标准不统一等痛点。
像风一样自由20202 天前
android·人工智能·语言模型·大模型
量化压缩实战:INT8 / INT4 / AWQ / GPTQ 全面对比《大模型知识与部署》系列 · No.12 / 35 适合人群:AI 工程师、后端开发 阅读时间:约 28 分钟