技术栈
ai对齐
阿杰学AI
10 天前
人工智能
·
安全
·
ai
·
语言模型
·
aigc
·
ai对齐
·
alignment
AI核心知识38——大语言模型之Alignment(简洁且通俗易懂版)
AI 对齐 (AI Alignment) 是人工智能领域最核心、最哲学,也最关乎人类命运的概念。简单来说,AI 对齐就是确保人工智能的目标、行为和价值观,与人类的意图和利益完全一致。
深度之眼
2 年前
人工智能
·
大语言模型
·
ai对齐
大语言模型对齐技术 最新论文及源码合集(外部对齐、内部对齐、可解释性)
大语言模型对齐(Large Language Model Alignment)是利用大规模预训练语言模型来理解它们内部的语义表示和计算过程的研究领域。主要目的是避免大语言模型可见的或可预见的风险,比如固有存在的幻觉问题、生成不符合人类期望的文本、容易被用来执行恶意行为等。
我是有底线的