技术栈
语言模型
小小工匠
18 小时前
人工智能
·
语言模型
·
自然语言处理
拆解大语言模型:从词向量到注意力机制的内部运行原理
当你向 ChatGPT 输入一句话,它在零点几秒内就能续写出流畅、连贯甚至富有洞察力的文字。这背后没有任何人类工程师编写的「逐步指令」,只有一张由数千亿参数构成的神经网络。本文尝试用尽量少的数学,把这张网络内部真正发生的事情讲清楚。
大鱼>
11 小时前
物联网
·
struts
·
语言模型
·
多模态
·
aiot
大语言模型+物联网:LLM理解物理世界
当LLM学会了"看"传感器数据、"听"设备告警、“说"控制指令,物联网就从"自动化"进化到了"智能化”。这不是科幻,而是正在发生的技术融合。
AndrewHZ
13 小时前
人工智能
·
语言模型
·
大模型
·
llm
·
cot
·
思维链
·
icl
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)
摘要:本文是《LLM技术全景:从Token到部署》系列第七篇。为什么大模型"看几个例子就能举一反三",而无需任何参数更新?为什么只是加上"Let’s think step by step",数学推理准确率就能翻倍?本文深度解析两大神秘能力——In-Context Learning(上下文学习)与Chain-of-Thought(思维链),拆解其工作机制,探讨涌现现象背后的规律,并给出实用的Prompt工程指南。
生成论实验室
13 小时前
人工智能
·
算法
·
语言模型
·
机器人
·
自动驾驶
·
agi
·
安全架构
机器人:一个自主运动的系统
我们先不谈AI,不谈传感器,不谈运动控制算法。先谈一个更根本的问题:机器人是什么?传统定义告诉我们:机器人是一种能够自动执行任务的机器装置。它由传感器、控制器和执行器组成,按照预设程序或AI指令运行。
Data-Miner
13 小时前
人工智能
·
microsoft
·
语言模型
大语言模型+智能体AI,122页PPT详解落地应用培训!
本课件是面向人工智能通识教育的培训材料,系统讲解智能体(Agent)与智能体AI(Agentic AI)的核心概念、技术原理与应用场景,帮助学习者建立从传统AI到智能体AI时代的完整认知框架。
枫叶林FYL
18 小时前
人工智能
·
语言模型
BRIDGE:多模态查询的强化学习对齐与文本检索重构
本系列基于 Mounis et al. (2026), BRIDGE: Multimodal-to-Text Retrieval via Reinforcement-Learned Query Alignment (arXiv:2604.07201)。所有实验数据、架构设计与消融结论均引用自该工作,叙述方式按工程直觉范式重新编排。
暮云星影
18 小时前
arm开发
·
人工智能
·
语言模型
·
自然语言处理
瑞芯微rk3588利用Rockchip NPU运行大语言模型(LLM)
在 RK3588开发板上,利用 Rockchip NPU 运行大语言模型(LLM),测试模型包括:设备
生成论实验室
19 小时前
人工智能
·
算法
·
机器学习
·
语言模型
·
机器人
·
自动驾驶
·
安全架构
自动驾驶:一个自主运动的系统
我们先不谈传感器,不谈算法,不谈算力。先谈一个更根本的问题:自动驾驶汽车是什么?传统定义告诉我们:自动驾驶汽车是一种能够感知环境、规划路径并自动控制行驶的智能车辆。它由摄像头、激光雷达、毫米波雷达、高精地图、域控制器和执行器组成,按照预设规则或AI模型运行。
searchforAI
21 小时前
人工智能
·
科技
·
深度学习
·
ai
·
语言模型
·
知识图谱
·
agent
啥是LLM?大语言模型从原理到选型的完整科普
本文整理自B站「AI专业知识科普:啥是LLM(大语言模型)」,通过AI音视频总结工具 Ai好记 转文字+截取PPT整理,以下为精炼整理后的内容。
MartinYeung5
1 天前
人工智能
·
学习
·
语言模型
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越
Rethinking Machine Unlearning Objectives: A Gradient Perspective and Go Beyond
MartinYeung5
1 天前
学习
·
算法
·
语言模型
[论文学习]DP2Unlearning:高效且具保证的大型语言模型遗忘框架(基于差分隐私的 LLM Unlearning 方法)
An Efficient and Guaranteed Unlearning Framework for LLMs
troubles maker
2 天前
语言模型
·
自然语言处理
·
lora
·
大模型
·
peft
LoRA: Low-Rank Adaptation of Large Language Models
论文链接:https://arxiv.org/pdf/2106.09685v1/1000大模型下游迁移微调是行业落地的关键环节,传统全参数微调存在参数量大、算力消耗高、权重分发不便、易发生原有知识覆盖等缺陷。Adapter、Prefix Tuning、Prompt Tuning 等一系列参数高效微调(Parameter-Efficient Fine-Tuning,PEFT)方案被陆续提出,其中低秩自适应( Low-Rank Adaptation,LoRA)[1]方案凭借收敛速度快、推理无额外延迟、兼容性强
لا معنى له
2 天前
人工智能
·
笔记
·
机器学习
·
语言模型
NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos
本文提出了NeoVerse—— 一款功能通用的 4D 世界模型,可实现 4D 场景重建、新轨迹视频生成,并支持多种下游应用。现有 4D 世界建模方法普遍存在扩展性不足的问题:这类方法要么依赖采集成本高昂、场景受限的多视角 4D 数据,要么需要繁杂的训练预处理流程。与之不同,NeoVerse 以让整套流程可适配各类真实场景单目视频为核心设计思路。具体而言,该模型采用无位姿前馈式 4D 重建、单目画面退化效果在线模拟等一系列配套技术。上述设计赋予 NeoVerse 强大的通用性与跨场景泛化能力,同时模型在主流
nbtang2026
2 天前
人工智能
·
语言模型
·
自然语言处理
小型语言模型(SLM)调研:从端侧部署到专业化 Agent
调研时间: 2026-06-12 适用读者: 关注本地 AI、端侧 Agent、低成本推理、私有化部署和模型选型的开发者 核心观点: 小模型不再只是“大模型的低配替代品”。在工具调用、代码补全、端侧助手、隐私敏感任务和固定流程自动化中,小模型正在成为更经济、更可控、更容易落地的默认选项。但在复杂推理、开放式长文档理解和高可靠多轮规划中,大模型仍然是必要兜底。
qzhqbb
2 天前
人工智能
·
语言模型
·
知识图谱
论文精读|CR-Writing:大语言模型与知识图谱协同推理赋能专业写作
随着生成式人工智能技术高速迭代,大语言模型(LLM)已深度普及至文案创作、智能问答、代码生成、内容优化等多个通用场景。以GPT-4、文心一言、通义千问、Kimi为代表的商用大模型,凭借强大的文本生成与语义理解能力,极大降低了普通用户的内容创作门槛。
Zzj_tju
2 天前
人工智能
·
语言模型
Prompt Engineering 为什么不够了:从“写好提示词”到“构建可靠上下文系统”
系列:生产级 LLM 应用方法论 01 日期:2026-06-10 适合读者:刚开始用大模型的产品/运营同学、正在做 LLM 应用落地的工程师、关注 LLM 系统论文与技术路线的研究生读者。
生成论实验室
2 天前
人工智能
·
语言模型
·
系统架构
·
机器人
·
自动驾驶
·
agi
·
安全架构
六十四卦态势操作系统技术白皮书
版本:V1.0 日期:2026年6月 作者:周林东 公司:莆田字序生命科技有限公司本文提出一种全新的操作系统范式:以六十四卦完备态势空间为内核,以事件关系网络为语法,以降U动力学为驱动的态势操作系统(Situational Operating System,简称SOS)。与传统操作系统管理硬件“资源”不同,态势操作系统管理的是系统内外的“事件”,并实时判断当前情境,自主调度资源、切换策略、保障安全。本文将从理论基础、系统架构、核心优势、应用场景及技术路线图等方面,系统阐述这一操作系统的设计蓝图。
羊羊小栈
2 天前
人工智能
·
语言模型
·
毕业设计
·
知识图谱
·
创业创新
·
neo4j
·
大作业
基于GraphRAG的医疗健康知识诊断系统(Neo4j_大语言模型)
b站演示视频与部署教程视频(点击这里) https://www.bilibili.com/video/BV1BKJK6wEkJ/?share_source=copy_web&vd_source=31c839f46a9a845dd6dd641cbd5c2ac1
workflower
2 天前
人工智能
·
算法
·
机器学习
·
设计模式
·
语言模型
·
自然语言处理
·
重构
基于机器学习的设备故障预测分析方法
数据准备(Data preparation)——数据处理(Merging data sources)——特征工程(Feature engineering: lag feature, static feature)——建模(Modeling: Bin-class, regression, multi-class)——训练、仿真(Training, Simulation)——决策(Decision)
Omics Pro
2 天前
数据库
·
人工智能
·
机器学习
·
语言模型
·
自然语言处理
·
chatgpt
中医临床决策5款大语言模型,谁主沉浮?
中医临床决策需整合辨证论治、体质评估与个体化方药,难以标准化与质控。大语言模型具备医学知识整合与临床推理能力,但其在中医领域的应用,尤其在辨证与组方方面,仍未被充分探索。