语言模型

暴风鱼划水3 小时前
人工智能·语言模型·大模型·llm
大型语言模型(入门篇)B简单来说,可以将大型语言模型(LLM)想象成一位知识渊博、功能多样的助手,能够理解并生成人类语言。然而,像任何助手一样,它需要指令才能明白你需要它完成什么样的任务。这个指令,即你提供给LLM以引导其行为的文本,被称为提示词。 交互通常遵循以下流程: 提示词可以有多种形式,例如:
娃乐呵7 小时前
语言模型·大模型·excel·数据处理
免费的大批量Excel文档大模型处理数据工具我们提出了一种可以利用大模型批量对Excel条目做分类、汇总等操作的工具。工具地址:基于大模型批量分析Excel文件
xwz小王子9 小时前
学习·语言模型·人机交互
IROS 2025论文分享:基于大语言模型与行为树的人机交互学习实现自适应机器人操作近年来,大型语言模型(Large Language Model, LLM)展现出了强大的自然语言处理能力。 许多研究已将LLM应用于机器人,以实现指令执行任务,例如SayCan、RT-2、VoxPoser等。然而,这些方法需要反复调用LLM来处理外部干扰,这是一个非常耗时的过程。机器人领域的一个活跃研究方向是将LLM与行为树(Behavior Tree, BT)相结合。LLM被用于将用户指令解释为包含任务目标条件的行为树。当外部干扰导致BT中的条件无法达成时,行为树规划器(BT Planner)会基于动作
阿杰学AI11 小时前
人工智能·ai·语言模型·aigc·ai编程·vibe coding·ai coding
AI核心知识65——大语言模型之Vibe Coding (简洁且通俗易懂版)Vibe Coding 是 AI 编程领域最近非常火的一个新词,由前 OpenAI 联合创始人、特斯拉 AI 总监 Andrej Karpathy 带火。
阿杰学AI11 小时前
人工智能·ai·语言模型·自然语言处理·aigc·rlvr·基于可验证奖励的强化学习
AI核心知识64——大语言模型之RLVR (简洁且通俗易懂版)RLVR 是 Reinforcement Learning via Verifiable Rewards(基于可验证奖励的强化学习)的缩写。
java1234_小锋14 小时前
深度学习·语言模型·transformer
Transformer 大语言模型(LLM)基石 - 输出层(Output Layer)详解以及算法实现锋哥原创的Transformer 大语言模型(LLM)基石视频教程:https://www.bilibili.com/video/BV1X92pBqEhV
前端程序猿之路14 小时前
前端·人工智能·python·ai·语言模型·deepseek·rag agent
简易版AI知识助手项目 - 构建个人文档智能问答系统今天我想分享一个非常实用的入门版AI项目 - 简易AI知识助手。这是一个基于FastAPI构建的文档智能问答系统,能够帮助我们快速构建个人知识库,实现对个人文档的智能检索和问答。
LDG_AGI15 小时前
人工智能·pytorch·分布式·深度学习·机器学习·语言模型
【推荐系统】深度学习训练框架(二十):Meta Device — 延迟初始化,零显存定义超大规模模型torch.device("meta") 是 PyTorch 框架中的一个抽象设备,它表示只存储张量的元数据(metadata)而不包含实际数据的特殊设备。在 meta 设备上的张量只包含:
软件测试小仙女15 小时前
软件测试·人工智能·测试工具·ai·语言模型·自然语言处理·llm
认真测试大语言模型(LLM)生成式人工智能(GenAI)明显且天生地测试不足。有很多原因,但有一个理由就足够了:以合理且负责任的方式测试 GenAI 的成本非常高。而且,当你发现问题时,可能根本无法在不破坏大型语言模型强大功能的前提下修复它。即使某个问题被修复了,也会带来一个巨大且无限制的回归测试问题。
小陈phd15 小时前
人工智能·语言模型·架构
大语言模型实战(六)——面向目标架构案例之FunctionCall技巧介绍在“用户Prompt→分析需求→代码生成→审查→debug→代码执行/函数保存”的自动代码生成全流程中:
会飞的小新15 小时前
人工智能·语言模型
从 LLM 到 ReACT Agent:推理与行动协同的智能体框架深度解析过去几年,大语言模型(LLM)在文本生成、代码编写和知识问答等任务上取得了突破性进展。然而,随着应用场景从“回答问题”逐步走向“完成任务”,人们开始意识到一个关键事实:仅具备推理能力的语言模型,并不足以应对真实世界中的复杂问题。如何让模型在思考的同时采取行动,并根据行动结果不断调整策略,成为推动智能系统演进的核心问题。正是在这一背景下,ReACT Agent 应运而生。
无心水15 小时前
人工智能·机器学习·语言模型·stable diffusion·aigc·机器翻译·vgg
【神经风格迁移:多风格】17、AIGC+风格迁移:用Stable Diffusion生成自定义风格当神经风格迁移遇上Stable Diffusion,我们进入了一个前所未有的艺术创作新时代。传统的风格迁移受限于已有的艺术风格,而通过Stable Diffusion,我们可以生成任意想象的风格图像,再将其应用于风格迁移,这开启了无限的可能性。
HUT_Tyne26516 小时前
人工智能·语言模型·自然语言处理
第2章 语言模型基础Transformer模型是深度学习,尤其是自然语言处理(NLP)领域的一次重大突破。 从概念上看,Transformer模型可以被视为一个“黑盒子”,以机器翻译任务为例,它能够接收某种语言的输入文本,并输出对应语言的翻译版本。 从内部结构来看,Transformer由编码器(encoder)和解码器 (decoder)两大部分构成。
啊吧怪不啊吧16 小时前
人工智能·语言模型·langchain
初识Langchain之AI语言大模型目录1. 什么叫模型2. 什么是大语言模型2.1 神经网络2.2 自监督学习2.3 半监督学习2.4 语言模型
java1234_小锋16 小时前
深度学习·语言模型·transformer
Transformer 大语言模型(LLM)基石 - 构建完整的Transformer模型锋哥原创的Transformer 大语言模型(LLM)基石视频教程:https://www.bilibili.com/video/BV1X92pBqEhV
神一样的老师16 小时前
人工智能·深度学习·语言模型
混合大语言模型与强化学习用于高能效多星调度:从零开始的性能提升论文标题 Hybrid Large Language Models and Reinforcement Learning for Energy-Efficient Multi-Satellite Scheduling: Boosting the Performance from Scratch 混合大语言模型与强化学习用于高能效多星调度:从零开始的性能提升
前端程序猿之路1 天前
前端·vue.js·语言模型·ai编程·入门·next.js·deepseek
Next.js 入门指南 - 从 Vue 角度的理解关键区别:没有手动配置路由!Vue 示例 (views/Home.vue):Next.js 示例 (app/page.tsx):
Fuly10241 天前
人工智能·语言模型
大模型架构理解与学习所有的大模型的架构本质都是Transformer, 就像汽车是由轮子和地盘组成的一样; 一. 大模型的核心原理 基于 Transformer 架构,通过海量数据学习语言 / 语义规律,将文本转化为数字向量进行关联计算,再以概率化方式生成符合逻辑的输出,本质是 “数据驱动的语义映射 + 自回归生成”。
小马过河R1 天前
人工智能·语言模型
RAG检索增强生成:通过重排序提升AI信息检索精准度之前小马的文章《如何5分钟快速搭建智能问答系统》介绍过基于RAG实现的问答系统。然而,基于RAG的原理实现就有很多种,比如当语料有QA问答对和长文本时如何实现多路召回,当召回的语料长度过大时如何用模型进行重排再给到回答总结大模型等等,这些都是实际场景中需要精雕细琢的技术细节。今天我们就来简单感受下模型重排。
热爱专研AI的学妹1 天前
大数据·数据库·人工智能·python·ai·语言模型·流程图
【搭建工作流教程】使用数眼智能 API 搭建 AI 智能体工作流教程(含可视化流程图)本教程将基于数眼智能 API,结合 AI 智能体工作流的核心设计理念,手把手教你搭建一套可复用、高灵活的智能工作流。通过数眼智能 API 的多场景能力(如数据识别、智能分析、结果输出等),配合工作流的步骤拆分与逻辑编排,实现复杂任务的自动化处理。 适用场景:文档智能审核、数据批量处理、客户咨询自动响应、供应链数据协同等需要多步骤流程化的业务场景。前置条件: 已注册数眼智能平台账号并获取 API 密钥(Access Key/Secret Key) 具备基础的接口调用知识(HTTP/HTTPS) 了解 JSO