语言模型

Data-Miner18 分钟前
人工智能·microsoft·语言模型
大语言模型+智能体AI,122页PPT详解落地应用培训!本课件是面向人工智能通识教育的培训材料,系统讲解智能体(Agent)与智能体AI(Agentic AI)的核心概念、技术原理与应用场景,帮助学习者建立从传统AI到智能体AI时代的完整认知框架。
枫叶林FYL5 小时前
人工智能·语言模型
BRIDGE:多模态查询的强化学习对齐与文本检索重构本系列基于 Mounis et al. (2026), BRIDGE: Multimodal-to-Text Retrieval via Reinforcement-Learned Query Alignment (arXiv:2604.07201)。所有实验数据、架构设计与消融结论均引用自该工作,叙述方式按工程直觉范式重新编排。
暮云星影5 小时前
arm开发·人工智能·语言模型·自然语言处理
瑞芯微rk3588利用Rockchip NPU运行大语言模型(LLM)在 RK3588开发板上,利用 Rockchip NPU 运行大语言模型(LLM),测试模型包括:设备
生成论实验室6 小时前
人工智能·算法·机器学习·语言模型·机器人·自动驾驶·安全架构
自动驾驶:一个自主运动的系统我们先不谈传感器,不谈算法,不谈算力。先谈一个更根本的问题:自动驾驶汽车是什么?传统定义告诉我们:自动驾驶汽车是一种能够感知环境、规划路径并自动控制行驶的智能车辆。它由摄像头、激光雷达、毫米波雷达、高精地图、域控制器和执行器组成,按照预设规则或AI模型运行。
searchforAI8 小时前
人工智能·科技·深度学习·ai·语言模型·知识图谱·agent
啥是LLM?大语言模型从原理到选型的完整科普本文整理自B站「AI专业知识科普:啥是LLM(大语言模型)」,通过AI音视频总结工具 Ai好记 转文字+截取PPT整理,以下为精炼整理后的内容。
MartinYeung517 小时前
人工智能·学习·语言模型
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越Rethinking Machine Unlearning Objectives: A Gradient Perspective and Go Beyond
MartinYeung519 小时前
学习·算法·语言模型
[论文学习]DP2Unlearning:高效且具保证的大型语言模型遗忘框架(基于差分隐私的 LLM Unlearning 方法)An Efficient and Guaranteed Unlearning Framework for LLMs
troubles maker1 天前
语言模型·自然语言处理·lora·大模型·peft
LoRA: Low-Rank Adaptation of Large Language Models论文链接:https://arxiv.org/pdf/2106.09685v1/1000大模型下游迁移微调是行业落地的关键环节,传统全参数微调存在参数量大、算力消耗高、权重分发不便、易发生原有知识覆盖等缺陷。Adapter、Prefix Tuning、Prompt Tuning 等一系列参数高效微调(Parameter-Efficient Fine-Tuning,PEFT)方案被陆续提出,其中低秩自适应( Low-Rank Adaptation,LoRA)[1]方案凭借收敛速度快、推理无额外延迟、兼容性强
لا معنى له1 天前
人工智能·笔记·机器学习·语言模型
NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos本文提出了NeoVerse—— 一款功能通用的 4D 世界模型,可实现 4D 场景重建、新轨迹视频生成,并支持多种下游应用。现有 4D 世界建模方法普遍存在扩展性不足的问题:这类方法要么依赖采集成本高昂、场景受限的多视角 4D 数据,要么需要繁杂的训练预处理流程。与之不同,NeoVerse 以让整套流程可适配各类真实场景单目视频为核心设计思路。具体而言,该模型采用无位姿前馈式 4D 重建、单目画面退化效果在线模拟等一系列配套技术。上述设计赋予 NeoVerse 强大的通用性与跨场景泛化能力,同时模型在主流
nbtang20261 天前
人工智能·语言模型·自然语言处理
小型语言模型(SLM)调研:从端侧部署到专业化 Agent调研时间: 2026-06-12 适用读者: 关注本地 AI、端侧 Agent、低成本推理、私有化部署和模型选型的开发者 核心观点: 小模型不再只是“大模型的低配替代品”。在工具调用、代码补全、端侧助手、隐私敏感任务和固定流程自动化中,小模型正在成为更经济、更可控、更容易落地的默认选项。但在复杂推理、开放式长文档理解和高可靠多轮规划中,大模型仍然是必要兜底。
qzhqbb1 天前
人工智能·语言模型·知识图谱
论文精读|CR-Writing:大语言模型与知识图谱协同推理赋能专业写作随着生成式人工智能技术高速迭代,大语言模型(LLM)已深度普及至文案创作、智能问答、代码生成、内容优化等多个通用场景。以GPT-4、文心一言、通义千问、Kimi为代表的商用大模型,凭借强大的文本生成与语义理解能力,极大降低了普通用户的内容创作门槛。
Zzj_tju1 天前
人工智能·语言模型
Prompt Engineering 为什么不够了:从“写好提示词”到“构建可靠上下文系统”系列:生产级 LLM 应用方法论 01 日期:2026-06-10 适合读者:刚开始用大模型的产品/运营同学、正在做 LLM 应用落地的工程师、关注 LLM 系统论文与技术路线的研究生读者。
生成论实验室1 天前
人工智能·语言模型·系统架构·机器人·自动驾驶·agi·安全架构
六十四卦态势操作系统技术白皮书版本:V1.0 日期:2026年6月 作者:周林东 公司:莆田字序生命科技有限公司本文提出一种全新的操作系统范式:以六十四卦完备态势空间为内核,以事件关系网络为语法,以降U动力学为驱动的态势操作系统(Situational Operating System,简称SOS)。与传统操作系统管理硬件“资源”不同,态势操作系统管理的是系统内外的“事件”,并实时判断当前情境,自主调度资源、切换策略、保障安全。本文将从理论基础、系统架构、核心优势、应用场景及技术路线图等方面,系统阐述这一操作系统的设计蓝图。
羊羊小栈1 天前
人工智能·语言模型·毕业设计·知识图谱·创业创新·neo4j·大作业
基于GraphRAG的医疗健康知识诊断系统(Neo4j_大语言模型)b站演示视频与部署教程视频(点击这里) https://www.bilibili.com/video/BV1BKJK6wEkJ/?share_source=copy_web&vd_source=31c839f46a9a845dd6dd641cbd5c2ac1
workflower1 天前
人工智能·算法·机器学习·设计模式·语言模型·自然语言处理·重构
基于机器学习的设备故障预测分析方法数据准备(Data preparation)——数据处理(Merging data sources)——特征工程(Feature engineering: lag feature, static feature)——建模(Modeling: Bin-class, regression, multi-class)——训练、仿真(Training, Simulation)——决策(Decision)
Omics Pro1 天前
数据库·人工智能·机器学习·语言模型·自然语言处理·chatgpt
中医临床决策5款大语言模型,谁主沉浮?中医临床决策需整合辨证论治、体质评估与个体化方药,难以标准化与质控。大语言模型具备医学知识整合与临床推理能力,但其在中医领域的应用,尤其在辨证与组方方面,仍未被充分探索。
有来有去95271 天前
人工智能·深度学习·语言模型·gpu算力·vllm
【训推框架】Vime-大规模 LLM/VLM 强化学习训练框架Versatile Infrastructure for Model Evolution — 基于 Megatron + vLLM 的大规模 LLM/VLM 强化学习训练框架
开维游戏引擎2 天前
android·游戏·语言模型·游戏引擎·ai编程
AI自动生成游戏时,deepseek和mimo对比vscode+cline+skill自动生成游戏时,免费版本的deepseek和mimo生成游戏质量对比,以deepseek-v4-flash和xiaomi/mimo-v2.5为例。
文艺倾年2 天前
人工智能·python·语言模型·自然语言处理·面试·职场和发展·大模型
【强化学习】强化学习基本概念,20W字总结(一)😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本文讲解【强化学习】强化学习基本概念,20W字总结(一),期待与你一同探索、学习、进步,一起卷起来叭!
MartinYeung52 天前
人工智能·学习·语言模型
[论文学习]大型语言模型中个人可识别资讯(PII)的机器遗忘技术:UnlearnPII 基准与 PERMU_tok 方法的深度分析Machine Unlearning of Personally Identifiable Information in LLMs 核心问题与动机