语言模型

空白诗16 分钟前
人工智能·语言模型·矩阵
CANN ops-nn 算子解读:大语言模型推理中的 MatMul 矩阵乘实现本文基于 CANN ops-nn 仓库中的 MatMul 算子实现,解析其在 AIGC 大语言模型(LLM)推理场景中的核心优化技术。
玄同7651 小时前
jvm·数据库·人工智能·python·语言模型·sqlite·知识图谱
SQLite + LLM:大模型应用落地的轻量级数据存储方案【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
Kiyra2 小时前
人工智能·语言模型
作为后端开发你不得不知的 AI 知识——RAG我们知道,大模型的知识都是固化的,它不认识你公司的最新产品,而 RAG 就是为模型提供知识库的一种有效方法。
lili-felicity3 小时前
人工智能·语言模型·llama
CANN优化LLaMA大语言模型推理:KV-Cache与FlashAttention深度实践大语言模型(LLM)的推理性能一直是AIGC应用的核心挑战之一。LLaMA作为Meta推出的开源大语言模型,其推理过程涉及大量的矩阵乘法、注意力计算和内存访问操作。CANN针对LLaMA推理场景推出了专门的优化方案,通过KV-Cache技术减少重复计算,通过FlashAttention降低内存占用,通过算子融合提升计算效率。本文将深入剖析CANN如何优化LLaMA推理,重点讲解KV-Cache、FlashAttention和算子融合的具体实现。
kjkdd5 小时前
python·语言模型·langchain·ai编程
5. LangChain设计理念和发展历程LangChain 的存在旨在成为最易于上手的大语言模型(LLM)开发工具,同时兼具灵活性与生产环境适配能力。
算法狗25 小时前
人工智能·深度学习·机器学习·语言模型
大模型面试题:大模型的训练和推理中显存和计算量的情况我整理好的1000+面试题,请看 大模型面试题总结-CSDN博客 或者https://gitee.com/lilitom/ai_interview_questions/blob/master/README.md
盼小辉丶6 小时前
深度学习·语言模型·自然语言处理·transformer
Transformer实战——Transformer跨语言文本分类我们已经了解了跨语言模型能够理解不同语言,并且相似的句子(无论为何种语言)在语义向量空间中彼此接近。但问题在于,如何在样本较少的情况下,利用这种能力来解决实际问题。
fanstuck15 小时前
大数据·数学建模·语言模型·chatgpt·数据挖掘
从0到提交,如何用 ChatGPT 全流程参与建模比赛的在我真正开始用 AI 参与一场数学建模比赛之前,我对它的预期其实不高。一开始,它不过是我们计划中的“润色工具人”:负责最后三页的英语论文润色、生成几张美观的图表,顺便润色一下摘要。
zhangfeng113318 小时前
人工智能·机器学习·语言模型
氨基酸序列表示法,蛋白质序列表达 计算机中机器学习 大语言模型中的表达,为什么没有糖蛋白或者其他基团磷酸化甲基化乙酰化泛素化蛋白质的表达方式主要有以下几种:在我们创建的deepseekr1词库中,使用了以下特殊标记:这些表达方式在不同的应用场景中各有优势,我们之前创建的词库主要用于机器学习模型的蛋白质序列处理。
陈天伟教授18 小时前
人工智能·语言模型·自然语言处理
人工智能应用- 语言理解:06.大语言模型更重要的是,大语言模型通过超长上下文学习,形成了对语言的某种理解,这种理解让它打破了人类语言的壁垒,可以从我们积累了数千年的文字资料中汲取知识,从而表现出超乎预期的智能。具体表现在以下几方面:
zhengfei61120 小时前
vue.js·语言模型·langchain·知识图谱·多分类
【AI平台】- 基于大模型的知识库与知识图谱智能体开发平台结合LightRAG知识库的知识图谱智能体平台。一个集成LightRAG知识库和知识图的代理平台。构建LangChain v1 + Vue + FastAPI,支持DeepAgents、MinerU
陈天伟教授21 小时前
人工智能·语言模型·自然语言处理
人工智能应用- 语言理解:09.大语言模型代码生成和扩展能力:GPT 可以根据任务要求生成代码,实现强大的扩展能力。例如,它可以生成代码来控制外围设备,大大拓展了语言模型的应用领域。
陈天伟教授1 天前
人工智能·深度学习·语言模型
人工智能应用- 语言理解:07.大语言模型少样本学习(Few-Shot Learning):GPT 可以通过学习少量示例,推断出任务逻辑并给出正确答案。这种能力也被称为“上下文学习”(In-Context Learning, ICL)
acai_polo1 天前
人工智能·gpt·ai·语言模型·ai作画
如何在国内合规、稳定地使用GPT/Claude/Gemini API?中转服务全解析国内许多开发团队和企业在尝试集成GPT、Claude或Gemini等国际主流大模型时,常常会面临一个现实矛盾:技术上的强烈需求与网络访问上的客观限制。直接调用官方接口,不仅时常受到网络波动的影响,延迟和中断问题也让生产级应用变得遥不可及。在此背景下,API中转服务作为一种务实的技术方案逐渐普及,它核心是帮助开发者在符合常规技术路径的前提下,更顺畅地利用这些先进的AI能力。
阿杰学AI1 天前
人工智能·深度学习·ai·语言模型·超级对齐·superalignment·#ai安全
AI核心知识86——大语言模型之 Superalignment(简洁且通俗易懂版)超级对齐 (Superalignment) 是 AI 安全领域中难度最高、最紧迫、也是最终极的课题。如果说 普通对齐 是为了解决“如何让 GPT-4 听人类的话”; 那么 超级对齐 就是为了解决“当 AI 比人类聪明 100 倍时,人类如何控制它?”
阿杰学AI1 天前
人工智能·深度学习·ai·语言模型·aigc·rlaihf·基于ai反馈的强化学习
AI核心知识85——大语言模型之 RLAIF(简洁且通俗易懂版)RLAIF 是 Reinforcement Learning from AI Feedback(基于 AI 反馈的强化学习)的缩写。
kebijuelun1 天前
人工智能·算法·语言模型·transformer
ERNIE 5.0:统一自回归多模态与弹性训练这篇报告提出 ERNIE 5.0 :从零开始统一训练文本、图像、视频、音频的自回归基础模型,核心创新是 统一 Next-Group-of-Tokens 目标 + 模态无关的超稀疏 MoE 路由 + 弹性训练,并配套可扩展的 RL 与训练基础设施,最终在多模态理解与生成上取得均衡且强劲的表现。
翱翔的苍鹰1 天前
人工智能·语言模型·自然语言处理
大语言模型发展历程架构优化路径训练数据变化能力跃迁关键技术突破方向应用场景深化社会影响预测注:实际脑图建议使用树状结构可视化工具呈现,突出时间轴与技术路线的交叉影响。
野犬寒鸦1 天前
java·服务器·数据库·学习·语言模型
从零起步学习并发编程 || 第五章:悲观锁与乐观锁的思想与实现及实战应用与问题悲观锁秉持悲观的态度:认为并发操作一定会发生冲突,所以在整个数据处理流程中,都会将数据加锁,其他线程 / 事务想要操作该数据时,必须阻塞等待,直到锁被释放。简单理解:先加锁,再操作,独占资源。
陈天伟教授1 天前
人工智能·语言模型·自然语言处理
人工智能应用- 语言理解:08.大语言模型思维链推理(Chain of Thought Reasoning):GPT 可以按照示例中的思维过程分析问题,通过多步推理得到答案。这种能力尤其适合处理复杂的逻辑推理任务,例如数学推导。