技术栈
语言模型
阿杰学AI
2 小时前
人工智能
·
算法
·
ai
·
语言模型
·
rag
·
clm
·
语境化语言模型
AI核心知识78——大语言模型之CLM(简洁且通俗易懂版)
语境化语言模型 (Contextual Language Models, CLM) 是专门为 RAG (检索增强生成) 系统设计和优化的一类大模型。
玄同765
4 小时前
人工智能
·
语言模型
·
自然语言处理
·
langchain
·
交互
·
llama
·
ollama
Llama.cpp 全实战指南:跨平台部署本地大模型的零门槛方案
【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
玄同765
4 小时前
人工智能
·
语言模型
·
自然语言处理
·
langchain
·
nlp
·
交互
·
知识图谱
LangChain v1.0+ Prompt 模板完全指南:构建精准可控的大模型交互
【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
菜青虫嘟嘟
6 小时前
人工智能
·
语言模型
·
自然语言处理
Expert Iteration:一种无需人工标注即可显著提升大语言模型推理能力的简单方法核心
在大语言模型的监督微调(SFT)中,一个核心痛点在于:高质量的推理轨迹数据非常稀缺且制作成本高昂。人类专家编写复杂的数学推导或代码逻辑耗时费力,这严重制约了模型推理能力的提升。
MaoziShan
7 小时前
人工智能
·
python
·
搜索引擎
·
语言模型
·
自然语言处理
·
内容运营
·
生成式搜索引擎
[ICLR 2026] 一文读懂 AutoGEO:生成式搜索引擎优化(GEO)的自动化解决方案
分享一篇 ICLR 2026 论文《AutoGEO: What Generative Search Engines Like and How to Optimize Web Content Cooperatively》,代码、数据集、模型参数都已开源,请放心食用~
阿杰学AI
8 小时前
人工智能
·
深度学习
·
ai
·
语言模型
·
rag
·
联合训练
·
joint training
AI核心知识77——大语言模型之Joint Training(简洁且通俗易懂版)
联合训练 (Joint Training),或者叫联合优化 (Joint Optimization),是大语言模型(尤其是 RAG 2.0 和多模态模型)中一种高级的训练策略。
子夜江寒
9 小时前
pytorch
·
语言模型
基于PyTorch的语言模型实现详解
首先我们需要从文本文件中读取数据并进行预处理。在这个示例中,我们使用了一篇关于AI发展的英文报道作为训练数据。
zhangfeng1133
11 小时前
人工智能
·
语言模型
·
开源
·
llama
大模型微调主要框架 Firefly vs LLaMA Factory 全方位对比表
结合你做AI生物医药、小分子药物筛选、论文相关垂类微调的需求,给出针对性结论:核心适配理由:仅适用于:
PacosonSWJTU
11 小时前
数据库
·
语言模型
大模型应用开发rag-第1个rag应用
源码参见: https://github.com/TomJourney/python/tree/main/third_poetry_demo
shangjian007
11 小时前
人工智能
·
深度学习
·
语言模型
AI-大语言模型LLM-模型微调8-进阶操作
为避免一学就会、一用就废,这里做下笔记
2501_94812015
1 天前
人工智能
·
语言模型
·
自然语言处理
基于量化感知训练的大语言模型压缩方法
随着信息技术的飞速发展,人工智能技术取得了显著的进步,尤其在自然语言处理(NLP)领域,大语言模型(LLMs)如BERT、GPT等展现出卓越的性能。然而,这些模型往往伴随着巨大的计算资源消耗和存储需求,限制了其在实际应用中的普及和推广。为此,本研究旨在探讨基于量化感知训练的大语言模型压缩方法,以下为具体内容:
阿杰学AI
1 天前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
agent
·
多智能体协作
·
mas
AI核心知识75——大语言模型之MAS (简洁且通俗易懂版)
多智能体协作 (Multi-Agent Systems,简称 MAS) 是目前 AI 应用架构的“版本答案” 。
AndrewHZ
1 天前
人工智能
·
算法
·
语言模型
·
大模型
·
llm
·
ai智能体
【AI黑话日日新】什么是AI智能体?
本文将从定义、核心能力、技术架构、与传统AI的区别及应用场景,全面解析AI智能体,帮助开发者与技术爱好者理解这一AI领域的核心演进方向。
shangjian007
1 天前
人工智能
·
语言模型
·
自然语言处理
AI-大语言模型LLM-概念术语-Dropout
为避免一学就会、一用就废,这里做下笔记Dropout 是一种在神经网络训练过程中使用的正则化技术,通过随机临时丢弃(禁用)一部分神经元来防止模型过拟合。
余俊晖
1 天前
人工智能
·
语言模型
·
自然语言处理
多模态视觉语言模型:Molmo2训练数据、训练配方
如果想打造自己的VLM模型,不妨看看Molmo2,训练数据、训练配方均开源。最核心的还是这份开源数据。
阿杰学AI
1 天前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
rag
·
检索增强生成
·
rag2.0
AI核心知识76——大语言模型之RAG 2.0(简洁且通俗易懂版)
RAG 2.0 是对第一代检索增强生成(Retrieval-Augmented Generation, RAG)技术的重大升级,代表了从“拼凑式” 系统向“一体化端到端” 系统的进化。
shangjian007
1 天前
人工智能
·
语言模型
·
transformer
AI-大语言模型LLM-Transformer架构7-模型参数量计算
为避免一学就会、一用就废,这里做下笔记给出HuggingFace上模型Langboat/bloom-1b4-zh的结构信息如下:
大模型任我行
1 天前
人工智能
·
语言模型
·
自然语言处理
·
论文笔记
上海AI Lab:构建诊断型Agent守门员
📖标题:AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security 🌐来源:arXiv, 2601.18491v1
AndrewHZ
1 天前
语言模型
·
大模型
·
llm
·
claude code
·
skills
【AI黑话日日新】什么是skills?
Claude Code 中的 Skills 是一套可定制化的扩展机制,本质是将专业知识、任务流程、可执行代码等打包成独立模块,供 Claude 根据上下文自动或手动调用,以完成特定专业任务。以下从核心定义、特性、结构、使用方式等方面详细介绍:
shangjian007
1 天前
人工智能
·
语言模型
·
自然语言处理
AI-大语言模型LLM-概念术语-Causal LM
为避免一学就会、一用就废,这里做下笔记Causal LM,也称为自回归语言模型,是一种只关注单向上下文的语言模型。在预测下一个词时,它只能看到前面的词,不能看到后面的词。