大模型

白熊18810 小时前
人工智能·大模型·llm
【大模型LLM】大模型训练加速 - 数据并行(Data Parallelism, DP)原理详解数据并行(Data Parallelism, DP)是一种并行计算的策略,它通过将数据分割成多个部分,并同时在多个处理单元上执行相同的操作来加速计算过程。这种技术特别适用于可以将大规模数据集分解成较小的、独立的块的情况,每个块可以在不同的处理器或核心上并行处理。
青衫客3610 小时前
langchain·大模型·llm·agent·langgraph
LLM——使用 LangGraph 构建 ReAct 智能体:多轮对话 + 工具调用 + 可视化流程图本文将带大家构建一个具有 ReAct 能力(Reasoning + Acting)的多轮智能体,同时集成 LangChain 工具调用、OpenAI 或通义千问大模型、LangGraph 状态流程管理,并输出流程图,适用于旅行规划、业务辅助、智能客服等多种场景(文末附项目完整代码)。
hlsilent16 小时前
linux·经验分享·笔记·ai·大模型·llm·vllm
关于vllm【常见问题解决方案】执行命令报错信息可能原因 这是 Triton 编译器 在生成 GPU 内核时失败,常见于: [1] Tesla T4(Compute Capability 7.5) 不支持某些 Triton 特性。 [2] vLLM 版本 + Triton 版本不兼容。 解决方案 [1] 禁用 --enable-prefix-caching
威化饼的一隅2 天前
大模型·llm·强化学习·rlhf·dpo
【多模态】DPO学习笔记RLHF需要使用人标注的偏好数据对,先训练一个reward model,然后再让reward model和LLM做强化学习 【1】SFT训练LLM: 使用目标任务的训练数据训练得到的模型记为 π S F T \pi^{SFT} πSFT 【2】训练reward model: 使用目标任务的另一份数据 x x x输入 π S F T \pi^{SFT} πSFT,每份数据得到2个输出,记为 ( y 1 , y 2 ) ∼ π S F T ( y ∣ x ) (y_1,y_2) \sim \pi^{SFT}(
点点小心思2 天前
人工智能·ai·大模型·提示词
【AI】大模型提示词学习路径:从入门到进阶的6个阶段了解提示词的基本概念和作用,能写出最简单的指令让大模型完成基础任务。提示词是用户输入给大模型的文字信息,用来告诉模型要做什么。比如 “写一句早安问候语” 就是一个简单的提示词。
AndrewHZ3 天前
图像处理·人工智能·python·大模型·实例分割·detectron2·遥感图像分割
【图像处理基石】如何对遥感图像进行实例分割?遥感图像实例分割是指在遥感影像中,不仅要识别出不同类别的目标(如建筑物、车辆、道路等),还要区分同一类别中的不同个体(如建筑物1、建筑物2),并为每个实例生成精确的像素级掩码。
WilliamHu.4 天前
开发语言·python·大模型·prompt
金融分类提示词演示代码结构解析1. 遍历输入句子2. 显示推理状态3. 构造提示词4. 调用模型进行推理5. 处理模型响应
缘友一世4 天前
语言模型·langchain·大模型·llm·langgraph
LangGraph智能体(天气和新闻助手)开发与部署
WSSWWWSSW4 天前
人工智能·大模型·音视频·显卡·文生视频·文生音频·文生音乐
华为昇腾NPU卡 文生视频[T2V]大模型WAN2.1模型推理使用先看效果:output_videooutput_video是之前使用910B系列 NPU,Wan2.1-T2V-1.3B模型生成的,效果没有我之前用的Wan2.1-T2V-14B生成的质量好。(参考链接:https://www.mindspore.cn/news/detail?id=3632)
青衫客365 天前
大模型·llm·mcp
LLM—— 基于 MCP 协议(Stdio 模式)的工具调用实践随着大语言模型的兴起,如何安全、高效、模块化地调用模型以外的外部工具函数(Tool),成为构建智能体系统的关键能力之一。OpenAI 提供了Function Calling 这一种高层封装(详情可见 基于 OpenAI Function Calling 的工具调用实践解析交互流程),而 MCP(Message Control Protocol)进一步提供了一种底层通信协议和标准化架构,支持双向消息、工具注册与执行、Agent 编排等高级能力。
Stara05115 天前
人工智能·大模型·ocr·飞书·工作流·ai agent·coze
基于Coze平台的自动化情报采集与处理引擎—实现小红书图文到飞书的端到端同步本文介绍了一个基于Coze平台的智能工作流设计与实现,旨在解决内容运营中信息采集、处理与归档的自动化难题。该系统通过集成小红书内容提取、OCR文字识别及飞书多维表格同步三大核心功能,构建了一套完整的“信息获取-智能解析-结构化存储”闭环。项目不仅实现了技术上的创新,更在实际应用中显著提升了工作效率,为内容创作者和运营团队提供了强大的数据支持。
Sherlock Ma5 天前
人工智能·计算机视觉·语言模型·机器人·大模型·aigc·具身智能
字节跳动GR-3:可泛化、支持长序列复杂操作任务的机器人操作大模型(技术报告解读)GR-3 是一个大规模的视觉 - 语言 - 动作(VLA)模型。它对新物体、新环境以及含抽象概念的新指令展现出较好的泛化能力。此外,GR-3 支持少量人类轨迹数据的高效微调,可快速且经济地适应新任务。GR-3 在处理长周期和灵巧性任务(包括需要双手操作和底盘移动的任务)上也展现出稳健且可靠的性能。
青衫客365 天前
python·大模型·llm
LLM—— 基于 MCP 协议(SSE 模式)的工具调用实践在上一篇博客中,我们介绍了 基于 MCP 协议(Stdio 模式)的工具调用实践。本文我们将聚焦于MCP协议(SSE模式)的工具调用实践,了解SSE模式下,客户端与服务端的交互方式,并通过实际的案例加深对该模式下交互的体验,那就让我们开始吧!
audyxiao0015 天前
人工智能·数据挖掘·大模型·热点分析·tkde
2025年6月数据挖掘顶刊TKDE研究热点有哪些?本推文对2025年6月出版的数据挖掘领域国际顶级期刊《IEEE Transactions on Knowledge and Data Engineering》进行了分析,对收录的53篇论文的关键词与研究主题进行了汇总,并对其中的研究热点进行了深入分析,希望能为相关领域的研究人员提供有价值的参考。
汀、人工智能6 天前
人工智能·大模型
AI Compass前沿速览:可灵创意工坊、字节Coze Studio&Coze Loop、通义万相2.2 、智谱GLM-4.5、腾讯混元3D世界模型开源AI-Compass 致力于构建最全面、最实用、最前沿的AI技术学习和实践生态,通过六大核心模块的系统化组织,为不同层次的学习者和开发者提供从完整学习路径。
XiaoLeisj6 天前
spring boot·阿里云·java-ee·大模型·ai编程·ai 大模型·ai 图片生成
【智能协同云图库】智能协同云图库第八弹:基于阿里云百炼大模型—实现 AI 扩图功能随着 AI 的高速发展,AI 几乎可以应用到任何传统业务中,增强应用的功能,带给用户更好的体验。对于图库网站来说,AI 也有非常多的应用空间,比如可以利用 AI 绘图大模型来编辑图片,实现扩图、擦除补全、图配文、去水印等功能。
白熊1886 天前
人工智能·大模型·llm
【大模型LLM】梯度累积(Gradient Accumulation)原理详解梯度累积是一种在深度学习训练中常用的技术,特别适用于显存有限但希望使用较大批量大小(batch size)的情况。通过梯度累积,可以在不增加单个批次大小的情况下模拟较大的批量大小,从而提高模型的稳定性和收敛速度。
AI4Sci.7 天前
人工智能·算法·机器学习·大模型·lora微调·大模型本地部署·qwen2.5-vl-7b
在云服务器上基于lora微调Qwen2.5-VL-7b-Instruct模型(下)承接上文在云服务器上基于lora微调Qwen2.5-VL-7b-Instruct模型(上)执行train.py之后,再输入swanlab的API,就训练流程就开始了:
陈敬雷-充电了么-CEO兼CTO7 天前
人工智能·gpt·chatgpt·开源·大模型·agi·coze
字节跳动开源Coze,开启AI Agent开发新时代?注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)【陈敬雷编著】【清华大学出版社】
Eastmount7 天前
人工智能·大模型·腾讯·ai coding·codebuddy ide
[AI Coding] 一.腾讯CodeBuddy IDE内测、安装及基本用法(国产AI IDE启航)在人工智能迅猛发展的今天,AI Coding 正逐步改变传统编程范式。广义上,AI Coding 是指以大语言模型(LLMs)为核心驱动,借助自然语言理解能力,自动生成、补全、调试与解释代码的智能编程方式。它不仅显著降低了编程门槛,也重塑了开发流程。随着Copilot、Cursor、Trae等工具走向成熟,国内AI Coding生态也在迅速崛起。越来越多的国产模型与平台开始提供中文语义理解更强、本地适配更好、安全可控的AI编程工具链。