技术栈
语言模型
MartinYeung5
5 小时前
人工智能
·
学习
·
语言模型
[论文学习]重新思考大型语言模型忘却目标:梯度视角与超越
Rethinking Machine Unlearning Objectives: A Gradient Perspective and Go Beyond
MartinYeung5
7 小时前
学习
·
算法
·
语言模型
[论文学习]DP2Unlearning:高效且具保证的大型语言模型遗忘框架(基于差分隐私的 LLM Unlearning 方法)
An Efficient and Guaranteed Unlearning Framework for LLMs
troubles maker
11 小时前
语言模型
·
自然语言处理
·
lora
·
大模型
·
peft
LoRA: Low-Rank Adaptation of Large Language Models
论文链接:https://arxiv.org/pdf/2106.09685v1/1000大模型下游迁移微调是行业落地的关键环节,传统全参数微调存在参数量大、算力消耗高、权重分发不便、易发生原有知识覆盖等缺陷。Adapter、Prefix Tuning、Prompt Tuning 等一系列参数高效微调(Parameter-Efficient Fine-Tuning,PEFT)方案被陆续提出,其中低秩自适应( Low-Rank Adaptation,LoRA)[1]方案凭借收敛速度快、推理无额外延迟、兼容性强
لا معنى له
12 小时前
人工智能
·
笔记
·
机器学习
·
语言模型
NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos
本文提出了NeoVerse—— 一款功能通用的 4D 世界模型,可实现 4D 场景重建、新轨迹视频生成,并支持多种下游应用。现有 4D 世界建模方法普遍存在扩展性不足的问题:这类方法要么依赖采集成本高昂、场景受限的多视角 4D 数据,要么需要繁杂的训练预处理流程。与之不同,NeoVerse 以让整套流程可适配各类真实场景单目视频为核心设计思路。具体而言,该模型采用无位姿前馈式 4D 重建、单目画面退化效果在线模拟等一系列配套技术。上述设计赋予 NeoVerse 强大的通用性与跨场景泛化能力,同时模型在主流
nbtang2026
12 小时前
人工智能
·
语言模型
·
自然语言处理
小型语言模型(SLM)调研:从端侧部署到专业化 Agent
调研时间: 2026-06-12 适用读者: 关注本地 AI、端侧 Agent、低成本推理、私有化部署和模型选型的开发者 核心观点: 小模型不再只是“大模型的低配替代品”。在工具调用、代码补全、端侧助手、隐私敏感任务和固定流程自动化中,小模型正在成为更经济、更可控、更容易落地的默认选项。但在复杂推理、开放式长文档理解和高可靠多轮规划中,大模型仍然是必要兜底。
qzhqbb
12 小时前
人工智能
·
语言模型
·
知识图谱
论文精读|CR-Writing:大语言模型与知识图谱协同推理赋能专业写作
随着生成式人工智能技术高速迭代,大语言模型(LLM)已深度普及至文案创作、智能问答、代码生成、内容优化等多个通用场景。以GPT-4、文心一言、通义千问、Kimi为代表的商用大模型,凭借强大的文本生成与语义理解能力,极大降低了普通用户的内容创作门槛。
Zzj_tju
14 小时前
人工智能
·
语言模型
Prompt Engineering 为什么不够了:从“写好提示词”到“构建可靠上下文系统”
系列:生产级 LLM 应用方法论 01 日期:2026-06-10 适合读者:刚开始用大模型的产品/运营同学、正在做 LLM 应用落地的工程师、关注 LLM 系统论文与技术路线的研究生读者。
生成论实验室
15 小时前
人工智能
·
语言模型
·
系统架构
·
机器人
·
自动驾驶
·
agi
·
安全架构
六十四卦态势操作系统技术白皮书
版本:V1.0 日期:2026年6月 作者:周林东 公司:莆田字序生命科技有限公司本文提出一种全新的操作系统范式:以六十四卦完备态势空间为内核,以事件关系网络为语法,以降U动力学为驱动的态势操作系统(Situational Operating System,简称SOS)。与传统操作系统管理硬件“资源”不同,态势操作系统管理的是系统内外的“事件”,并实时判断当前情境,自主调度资源、切换策略、保障安全。本文将从理论基础、系统架构、核心优势、应用场景及技术路线图等方面,系统阐述这一操作系统的设计蓝图。
羊羊小栈
15 小时前
人工智能
·
语言模型
·
毕业设计
·
知识图谱
·
创业创新
·
neo4j
·
大作业
基于GraphRAG的医疗健康知识诊断系统(Neo4j_大语言模型)
b站演示视频与部署教程视频(点击这里) https://www.bilibili.com/video/BV1BKJK6wEkJ/?share_source=copy_web&vd_source=31c839f46a9a845dd6dd641cbd5c2ac1
workflower
16 小时前
人工智能
·
算法
·
机器学习
·
设计模式
·
语言模型
·
自然语言处理
·
重构
基于机器学习的设备故障预测分析方法
数据准备(Data preparation)——数据处理(Merging data sources)——特征工程(Feature engineering: lag feature, static feature)——建模(Modeling: Bin-class, regression, multi-class)——训练、仿真(Training, Simulation)——决策(Decision)
Omics Pro
17 小时前
数据库
·
人工智能
·
机器学习
·
语言模型
·
自然语言处理
·
chatgpt
中医临床决策5款大语言模型,谁主沉浮?
中医临床决策需整合辨证论治、体质评估与个体化方药,难以标准化与质控。大语言模型具备医学知识整合与临床推理能力,但其在中医领域的应用,尤其在辨证与组方方面,仍未被充分探索。
有来有去9527
17 小时前
人工智能
·
深度学习
·
语言模型
·
gpu算力
·
vllm
【训推框架】Vime-大规模 LLM/VLM 强化学习训练框架
Versatile Infrastructure for Model Evolution — 基于 Megatron + vLLM 的大规模 LLM/VLM 强化学习训练框架
开维游戏引擎
1 天前
android
·
游戏
·
语言模型
·
游戏引擎
·
ai编程
AI自动生成游戏时,deepseek和mimo对比
vscode+cline+skill自动生成游戏时,免费版本的deepseek和mimo生成游戏质量对比,以deepseek-v4-flash和xiaomi/mimo-v2.5为例。
文艺倾年
1 天前
人工智能
·
python
·
语言模型
·
自然语言处理
·
面试
·
职场和发展
·
大模型
【强化学习】强化学习基本概念,20W字总结(一)
😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本文讲解【强化学习】强化学习基本概念,20W字总结(一),期待与你一同探索、学习、进步,一起卷起来叭!
MartinYeung5
1 天前
人工智能
·
学习
·
语言模型
[论文学习]大型语言模型中个人可识别资讯(PII)的机器遗忘技术:UnlearnPII 基准与 PERMU_tok 方法的深度分析
Machine Unlearning of Personally Identifiable Information in LLMs 核心问题与动机
生成论实验室
1 天前
人工智能
·
语言模型
·
机器人
·
自动驾驶
·
安全架构
认知芯片:让判断力在物理定律上运行——AI芯片的第三条路
CPU、GPU、NPU,无论架构怎么变,本质都是同一件事:执行计算指令。它们比拼的是谁算得快、谁功耗低、谁晶体管密度高。摩尔定律、韬定律,都是围绕“计算”展开的。
黄狗操作员
1 天前
语言模型
·
云计算
·
运维开发
·
gpu算力
NCCL 2.29 官方文档参数解读
Broadcast属于1对多的通信原语,一个数据发送者,多个数据接收者,可以在集群内把一个节点自身的数据广播到其他节点上。如下图所示,圈圈表示集群中的训练加速卡节点,相同的颜色的小方块则代表相同的数据。当主节点 0 执行Broadcast时,数据即从主节点0被广播至其他节点。
来自于狂人
2 天前
人工智能
·
算法
·
语言模型
·
自然语言处理
第5章 记忆管理——让Agent记住事情
第4章我们给Agent加上了工具调用能力。它现在能查数据库、查天气、计算数字了。但你用着用着会发现一个尴尬的问题:这Agent怎么聊着聊着就忘了事呢?
皮皮蟹虾饺
2 天前
人工智能
·
语言模型
·
自然语言处理
MiniMind:从零训练大语言模型全流程实战指南
大语言模型(Large Language Model, LLM)的出现,引发了全球范围内对 AI 的空前关注。无论是 ChatGPT、DeepSeek 还是 Qwen,都以惊艳的效果让人真切感受到这场技术浪潮的冲击力。然而,动辄数百亿参数的模型规模,使得它们对个人设备而言不仅难以训练,甚至连部署都显得遥不可及。
ai_coder_ai
2 天前
运维
·
语言模型
·
自动化
在自动化脚本中如何调用大语言模型?
在自动化技术与人工智能深度融合的当下,单纯的流程化自动化脚本已难以应对复杂的交互、问答、内容生成等场景。将大语言模型能力嵌入自动化脚本,能够让传统自动化工具拥有语义理解、智能应答、内容创作、问题分析等高级能力,极大拓展自动化脚本的应用边界。本文从技术原理、前期准备、接口详解、实操案例、参数调优与应用拓展等维度,详细讲解在冰狐智能辅助自动化脚本中对接大语言模型的完整流程,帮助开发者和脚本使用者顺利实现自动化与 AI 能力的结合。