大模型

找了一圈尾巴1 天前
人工智能·大模型
大模型-量化技术模型量化是一种重要的模型压缩技术。其核心目标是在可控精度损失下,将大模型中浮点型权重(通常为 float32 等高精度格式)近似转换为低精度离散值表示(通常为 int8)。
胡耀超2 天前
运维·docker·容器·大模型·知识图谱·rag·ollama
GraphRAG Docker化部署,接入本地Ollama完整技术指南:从零基础到生产部署的系统性知识体系相关推荐:Umi-OCR 的 Docker安装(win制作镜像,Linux(Ubuntu Server 22.04)离线部署)
AndrewHZ2 天前
人工智能·深度学习·大模型·llm·三维重建·立体视觉·大规模三维重建
【图像处理基石】如何入门大规模三维重建?入门大规模三维重建需要从基础理论、核心技术到实践工具逐步深入,同时需关注该领域的经典工作和前沿进展。以下是分阶段的入门路径及值得重点学习的工作:
两棵雪松3 天前
人工智能·大模型
Faiss能解决什么问题?Faiss是什么?1. Faiss能解决什么问题? 为了比较两个结构化的数据是否相似,例如两张图片是不是类似,两段文本表达的含义是否类似,则需要将非结构化的数据先转成向量数据,然后再进行相似度比较。 如何通过向量化技术比较非结构化数据,可以参考:https://www.cnblogs.com/twosedar/p/18973770 问题来了,在一群数据中找到两个相似度最高的向量数据,最常用的是暴力搜索法,也就是逐一遍历所有向量,计算距离(如欧氏距离、余弦相似度),虽准确,但时间复杂度高,无法处理百万级以上数据。 这个问题在
喜欢吃豆3 天前
人工智能·python·大模型·mcp
深入企业内部的MCP知识(四):FastMCP装饰器与类方法:正确结合面向对象与MCP组件的实践指南FastMCP的装饰器(如@tool、@resource、@prompt)是定义MCP组件(工具、资源、提示)的核心方式,但当它们与类中的方法(实例方法、类方法、静态方法)结合时,直接使用往往会出现意外行为——LLM可能看到self或cls等无关参数,甚至方法变得不可调用。本文将系统解析这一问题的根源,提供三种方法类型的正确使用姿势,帮助开发者在保持面向对象设计的同时,无缝集成MCP组件。
产品经理独孤虾3 天前
人工智能·大模型·aigc·产品经理·数字营销·智能营销·智能创意生成
如何利用AI大模型对已有创意进行评估,打造杀手级的广告创意广告创意是影响广告效果的最重要的因素之一,但是如何评估和优化广告创意,一直是一个难题。传统的方法,如人工评审、A/B测试、点击率等,都有各自的局限性和缺陷。本文将介绍一种新的方法,即利用人工智能大模型,对已有的广告创意进行评估和优化。人工智能大模型,是指能够处理海量数据,具有强大的自然语言理解和生成能力的深度学习模型,如GPT-3、BERT等。通过使用人工智能大模型,我们可以从以下几个方面提升广告创意的质量和效果:
Jiangnan_Cai3 天前
linux·docker·大模型·dify
Linux 系统 docker 部署 Dify
笑稀了的野生俊3 天前
linux·人工智能·ubuntu·大模型·glibc·flash-attn
ImportError: /lib/x86_64-linux-gnu/libc.so.6: version GLIBC_2.32‘ not found简介:在复现 VLM-R1 项目并尝试将其中的 GRPO 算法应用到自己的任务时,按照官方文档配置好环境后,运行过程中遇到了一个非常离谱的错误: ImportError: /lib/x86_64-linux-gnu/libc.so.6: version GLIBC_2.32' not found 这个问题极为冷门,卡了我整整五个小时,GPT 和网上的大多数解决方案都无效,最终才通过查阅大量 GitHub issues,定位到是 flash-attn 库与当前系统 GLIBC 版本不兼容导致的,才成功解决。
蓑雨春归4 天前
人工智能·大模型·agent
多代理系统(multi-agent)框架深度解析:架构、特性与未来在人工智能技术迭代的浪潮中,多代理系统(Multi-Agent System)正从实验室走向产业应用的核心舞台。这一技术范式的崛起源于三大驱动力:大模型能力的指数级提升、复杂任务分解的需求爆发,以及传统单体智能架构的局限性日益凸显。
北京地铁1号线4 天前
语言模型·大模型·agent
大模型 Agent(智能体)技术简介大模型 Agent(智能体)技术 是当前人工智能领域的前沿方向,它赋予大型语言模型(LLM)自主感知、规划、决策和行动的能力,使其不再局限于“被动应答”,而是能主动完成复杂任务。简单来说,Agent 是一个以 LLM 为“大脑”的自主智能系统,能够理解目标、使用工具、与环境交互并最终解决问题。
北京地铁1号线5 天前
人工智能·算法·大模型
Zero-Shot(零样本学习),One-Shot(单样本学习),Few-Shot(少样本学习)概述Zero-Shot Learning(ZSL) 指模型在未接收任何任务专属样本的条件下,仅通过任务描述或语义关联完成对新类别/任务的识别或生成。其核心是知识迁移——将预训练阶段学到的通用能力泛化到未知领域。
杀生丸学AI5 天前
人工智能·3d·大模型·aigc·蒸馏与迁移学习·扩散模型与生成模型
【三维生成】FlashDreamer:基于扩散模型的单目图像到3D场景标题:<Enhancing Monocular 3D Scene Completion with Diffusion Model> 代码:https://github.com/CharlieSong1999/FlashDreamer 来源:澳大利亚国立大学
踏莎行hyx5 天前
c++·ai·langchain·大模型·llama.cpp·deepseek
使用langchain连接llama.cpp部署的本地deepseek大模型开发简单的LLM应用langchain是一个基于python实现的开源LLM开发框架,llama.cpp是一个基于C++框架可以在本地部署大模型并开放服务端接口开放给外部应用使用。
CS创新实验室5 天前
安全·大模型·aigc·提示词·提示词注入
筑牢 AIGC 安全防线:警惕提示词注入攻击在 AIGC(生成式人工智能)技术蓬勃发展的当下,其在各个领域的应用日益广泛。然而,随着 AIGC 技术的深入应用,安全问题也逐渐凸显,提示词注入攻击便是其中不容忽视的一大威胁。对于 AIGC 开发者而言,深入了解提示词注入攻击并做好防范工作,是保障 AIGC 系统安全稳定运行的关键。
若兰幽竹5 天前
人工智能·大模型·opengauss·deepseek
基于DeepSeek构建的openGauss AI智能优化助手:数据库性能提升新利器在当今数字化时代,数据库的性能和管理效率对于企业和开发者来说至关重要。openGauss 作为华为开源的国产高斯数据库,拥有广泛的应用场景。而基于 DeepSeek 构建的 openGauss AI 智能优化助手 deepseek-opengauss-agent,则为 openGauss 数据库的优化和管理带来了全新的解决方案。本文将深入介绍这个智能优化助手的各个方面,带你领略其强大的功能和魅力。
产品经理独孤虾5 天前
人工智能·大模型·产品经理·电子商务·数字营销·智能营销·价格策略
人工智能大模型如何助力产品经理优化商品定价策略商品定价策略是电商、广告营销和用户增长等数字化营销业务中的重要环节,它直接影响着企业的收入和利润,以及用户的满意度和忠诚度。本文从产品经理的视角,介绍了如何应用人工智能大模型来优化商品定价策略的步骤,包括分析商品定价策略的影响因素、市场需求预测、商品成本分析、商品定价策略优化和使用人工智能大模型优化商品定价策略。本文旨在帮助产品经理和运营人员了解人工智能大模型在商品定价策略中的作用和价值,以及如何利用人工智能大模型提升商品定价策略的效果和效率。
半旧5186 天前
大模型·llm·aigc·agent·知识库·智能体
Deepseek搭建智能体&个人知识库你是否曾梦想拥有一个7x24小时在线、精通你所有专业领域、并能秒速解读你私密资料的AI助手?现在,通过 DeepSeek 的开源模型,这一切变得触手可及!
桂成林6 天前
大模型·agent·ai模型
N8N与Dify:自动化与AI的完美搭配“N8N”和“Dify”这两个工具彻底理清楚,它们其实是两个定位完全不同的开源平台,各自擅长解决不同类型的问题,但也能协同工作。以下是详细说明:
梦想blog6 天前
ai·大模型·llm·anythingllm·deepseek
DeepSeek + AnythingLLM 搭建你的私人知识库官网:https://anythingllm.com/AnythingLLM 是一款基于大语言模型(LLM)的企业级应用框架或工具,旨在帮助企业或开发者快速构建、部署和管理定制化的 AI 对话系统或知识助手。它的核心特点是高度灵活,支持多种大语言模型(如 OpenAI GPT、Anthropic Claude、开源 Llama 等),并允许用户私有化部署,确保数据安全。
喜欢吃豆7 天前
java·前端·人工智能·大模型·github·mcp
深入企业内部的MCP知识(三):FastMCP工具转换(Tool Transformation)全解析:从适配到增强的工具进化指南在MCP(Model Context Protocol)生态中,工具(Tools)是连接模型与业务逻辑的核心载体。但实际开发中,通用工具往往难以直接适配特定场景——可能参数命名不直观、描述模糊,或缺乏必要的输入验证。FastMCP的工具转换(Tool Transformation) 机制通过灵活的元数据修改、参数映射和行为扩展,让开发者无需重写代码即可将现有工具改造为场景专属版本。本文将从基础到进阶,全面解析工具转换的实现原理、核心能力与实战场景。