语言模型

EchoL、25 分钟前
论文阅读·人工智能·语言模型
【论文阅读】Generative Text Steganography with Large Language Model(MM‘24)提出问题: 现有生成式文本隐写大多是“白盒范式”:需要共享语言模型、训练词表以及逐步采样概率分布,才能建立“比特↔词/概率”的隐写映射。但在大模型(LLM)实际使用中,用户通常只能通过黑盒 API / UI 访问,拿不到词表与采样概率;同时,传统映射往往会扰动原始采样分布,带来安全风险与可检测性问题。
阿杰学AI43 分钟前
人工智能·ai·语言模型·自然语言处理·aigc·ssm·状态空间模型
AI核心知识69——大语言模型之SSM (简洁且通俗易懂版)状态空间模型 (State Space Model,简称 SSM) 是目前 AI 架构领域最热门的“潜力股”。
shangjian0073 小时前
人工智能·语言模型·transformer
AI-大语言模型LLM-Transformer架构4-多头注意力、掩码注意力、交叉注意力为避免一学就会、一用就废,这里做下笔记在前文Transformer架构2-自注意力中,讲到上图中的1号、2号注意力都是自注意力,而在详细架构图中,他们又被描述为多头注意力、掩码注意力等。诸多概念容易让人混淆,必须澄清:这些注意力的类型并非互斥,他们只是从不同的角度对注意力机制进行的分类
shishi52113 小时前
ide·计算机视觉·语言模型
trae重装后,无法预览调试弹窗报错的解决方案1.问题2.根因trae无法调到电脑已安装的nodejs,如果没有安装直接安装即可,安装完成后记得配置环境变量。
玄同76514 小时前
人工智能·python·语言模型·langchain·llm·nlp·知识图谱
LangChain 核心组件全解析:构建大模型应用的 “乐高积木”【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
renhongxia117 小时前
人工智能·语言模型·知识图谱
将大型语言模型建立在反应知识图谱中以进行合成检索大型语言模型(LLM)能够辅助化学合成路径规划,但标准提示方法常产生虚构或过时的建议。本研究通过将反应路径检索构建为“Text2Cypher”(自然语言转图谱查询)生成问题,探究LLM与反应知识图谱的交互机制,并定义了单步与多步检索任务。
CV矿工20 小时前
人工智能·语言模型
【LLM】入门LLM开始,有阅读的一些文章记录
小陈phd20 小时前
人工智能·语言模型·自然语言处理
大语言模型实战(十七)——GraphRAG(图谱检索增强生成)介绍检索增强生成(Retrieval-Augmented Generation)技术是一种结合了检索和生成两个阶段的自然语言处理技术,它由 Facebook AI 团队在 2020 年提出。这种方法的核心思想是利用大规模的预训练语言模型生成技术,并结合信息检索的策略,以改善回答的准确性和相关性。
一碗甜汤ᐝ21 小时前
语言模型·大模型·微调·chatglm
chatglm3-6b部署和微调学习记录📝部署chatglm3-6b 项目地址:https://github.com/THUDM/ChatGLM3
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·aigc·ntp·机械学习
AI核心知识67——大语言模型之NTP (简洁且通俗易懂版)在大语言模型(LLM)中,NTP 是 Next Token Prediction(下一个 Token 预测)的缩写。
玄同7651 天前
数据库·人工智能·python·sql·mysql·语言模型·知识图谱
SQLAlchemy 初始化全流程详解:从引擎到会话的每一步【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
玄同7651 天前
人工智能·python·语言模型·自然语言处理·nlp·知识图谱·token
大模型生成 Token 的原理:从文本到模型理解的 “翻译官”【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
zhengfei6111 天前
人工智能·安全·语言模型
一款先进的、基于人工智能的渗透测试框架,充分利用了大型语言模型 (LLM) 的功能,增强攻击性安全操作具有 Web 图形用户界面的 AI 驱动渗透测试平台NeuroSploit v3 是一个先进的安全评估平台,它将人工智能驱动的漏洞测试与现代化的 Web 界面相结合。它采用提示驱动测试,根据自然语言指令动态确定要测试的漏洞。
薛定谔的猫19821 天前
人工智能·语言模型·langchain
四、基于LangChain与HuggingFace Pipeline的本地大语言模型对话系统搭建指南(使用阿里千问-模型)在人工智能快速发展的今天,大型语言模型(LLM)已成为自然语言处理领域的核心工具。然而,直接使用云端API不仅成本高昂,还存在数据隐私风险。本文将以Qwen1.5-0.5B-Chat模型为例,详细介绍如何利用LangChain框架与HuggingFace生态系统,在本地搭建一个功能完整的对话系统。
zhengfei6111 天前
人工智能·语言模型
Clawdbot技能合集,精彩纷呈。(Clawdbot已正式更名为Moltbot)Moltbot(原名 Clawdbot)是一款本地运行的 AI 助手,直接在您的计算机上运行。技能可以扩展其功能,使其能够与外部服务交互、自动化工作流程并执行特定任务。此合集可帮助您发现并安装满足您需求的合适技能。
杨_晨1 天前
人工智能·机器学习·ai·语言模型·batch
大模型微调训练FAQ - Batch Size与参数配置A: 主要体现在以下几个方面:1. 显存使用 💾影响机制:2. 训练速度 ⚡3. 模型效果 🎯 梯度稳定性:
阿杰学AI1 天前
人工智能·ai·语言模型·自然语言处理·aigc·nsp·下一状态预测
AI核心知识68——大语言模型之NSP (简洁且通俗易懂版)下一状态预测 (NSP,Next State Prediction) 是从 大语言模型 (LLM) 向 世界模型 (World Model) 进化时的一个核心概念。
狮子座明仔2 天前
人工智能·深度学习·语言模型·自然语言处理
Plan-and-Act:让AI智能体学会“先想后做“📖 论文标题:Plan-and-Act: Improving Planning of Agents for Long-Horizon Tasks 👥 作者:Lutfi Eren Erdogan, Zhengyuan Yang, Linjie Li, Shuohang Wang, Ahmed Awadallah, Chenguang Zhu, Liangke Gui, Lijuan Wang 🏫 机构:Microsoft 📅 发表:arXiv 2503.09572 🔗 论文链接:https://a
lixin5565562 天前
java·人工智能·pytorch·python·深度学习·语言模型
基于迁移学习的图像风格增强器📝分享的所有项目源码均包含(前端+后台+数据库),可做毕业设计或课程设计,欢迎留言分享问题,交流经验,白嫖勿扰🍅更多优质项目👇🏻👇🏻可评论留言获取!!
renhongxia12 天前
人工智能·信息可视化·语言模型·自然语言处理·数据分析·机器人
多机器人环境监测中的异质性,用于解决时间冲突任务在多机器人系统执行持续性任务时,若需中断处理紧急的时效性任务,常面临性能平衡的挑战。本研究以区域巡逻与异常无线电信号定位的双重任务场景为例,探讨这一平衡问题。