大模型

卷Java10 小时前
人工智能·gpt·大模型
2026年4月AI军备竞赛全景:DeepSeek V4 vs GPT-5.5 vs Gemini vs Claude说实话,我写这篇文章之前,自己先被震到了。4月份这一个月,AI圈打了一场真正意义上的"星球大战"。不是那种PR稿互吹,是真刀真枪地拼——模型发版、价格屠夫、开源战略,每一家都在赌上自己的身家。
xixixi7777712 小时前
人工智能·安全·ai·大模型·云计算·aws
AI的“账号”与“钱包”:AWS与Circle同日出手,AI正从工具进化2026年5月11日,两个看似无关的事件在同一天发生:AWS让Claude融入企业IAM控制面,Circle为AI Agent装上原生加密钱包。一个解决“AI归谁管”,一个解决“AI怎么付”。当“账号”与“钱包”同时到位,AI正式从人类的附属工具,进化为可管理、可交易的经济实体。
小李子呢021115 小时前
大模型·agent
大模型是什么?目录LLM(Large language model)大模型读文字的方式:token大模型的短期记忆上限:上下文窗口(Context window)
无敌昊哥战神15 小时前
python·算法·大模型
大模型(LLM)推理优化技术全景总结本博客单纯作为我想面试大模型实习岗进行临时抱佛脚的学习,如果有错误欢迎在评论区指正,我会修改的。大语言模型(LLM)的参数量动辄百亿、千亿。在学术界,我们关注如何把模型训练出来;但在工业界,真正的挑战在于如何把模型便宜、高效地部署上线。
Fleshy数模15 小时前
人工智能·数据挖掘·langchain·大模型
基于 LangChain 实现 PDF 文档检索:从加载到向量检索全流程在大模型应用开发中,文档检索是核心能力之一,尤其是针对 PDF 这类非结构化文档的精准检索,能极大提升问答、知识库等场景的体验。本文将基于 LangChain 框架,完整拆解从 PDF 文档加载、文本分割、向量嵌入到相似性检索的全流程,手把手教你实现针对 PDF 文档的智能检索。
Li_yizYa16 小时前
ai·大模型
【大模型篇】谈谈对于Function Calling、MCP、Skill的理解目录一、Function Calling1、工具定义2、完整的调用流程3、并行工具调用4、大模型能够调用工具的原理
ZGi.ai18 小时前
java·开发语言·大模型·私有化部署·sso·企业架构
私有化大模型接入企业系统:SSO+权限+API网关完整方案企业将大模型私有化部署后,下一个关键问题是:如何让大模型安全地接入企业现有系统?这不是简单的“调个接口”就能解决的问题。企业级接入面临三个核心挑战:
门豪杰18 小时前
ai·大模型·平台选择
2026年4月,我调研了15款主流大模型本文聚焦各模型的最新进展,核心特点和劣势,以及一些博主个人的看法,初衷为帮助我个人整理思路。 本文原始素材由博主通过多种渠道自行收集并整理,客观信息摘自公开渠道,个人评价会带有主观色彩。
DogDaoDao19 小时前
人工智能·深度学习·程序员·大模型·github·ai编程·ai agent
【GitHub】NousResearch/Hermes-Agent 深度技术解析:自我进化的AI Agent新范式Hermes Agent(项目地址:https://github.com/NousResearch/hermes-agent)是由 Nous Research 团队开发的自我改进型 AI Agent框架。该项目于2025年7月22日创建,短短数月内便积累了近 15万 Stars,目前稳居 GitHub 全球排名第 47 位,是当下最受关注的开源 AI Agent 项目之一。
key_3_feng20 小时前
大模型
大模型基础优化实战指南随着大语言模型(LLM)的快速发展,模型参数量从亿级跃升至千亿级,带来了巨大的计算和存储挑战。在实际应用中,如何在不显著降低模型性能的前提下,减小模型体积、提升推理速度,成为了亟待解决的问题。本文将深入探讨大模型的四大基础优化技术:量化、剪枝、知识蒸馏和混合精度训练,并提供完整的可执行代码。
小何code21 小时前
lora·大模型·微调·prompt工程
人工智能【第26篇】大模型应用实战:Prompt工程与微调技巧作者的话:在前面的文章中,我们学习了GPT等大语言模型。然而,拥有强大的模型只是第一步,如何有效地使用这些模型才是真正的挑战。本文将深入讲解Prompt工程(提示工程)和微调技巧,帮助你从"会用"大模型进阶到"用好"大模型!
龙侠九重天21 小时前
人工智能·语言模型·自然语言处理·大模型·json
大型语言模型结构化输出:用 JSON Schema 约束大模型输出在大型语言模型(LLM)蓬勃发展的今天,开发者们面临着一个核心挑战:如何让 AI 的输出变得可预测、可处理、可集成?
司南OpenCompass1 天前
人工智能·gpt·语言模型·大模型·大模型评测·司南评测
GPT领跑,头部模型“错位竞争”,强Agent能力成下一战场丨大语言模型4月最新榜单揭晓大模型技术在全球范围内加速演进,智能体能力不断深化,从多步执行走向多智能体协同,从辅助工具走向独立执行者,开始在跨平台、跨应用的真实场景中端到端地完成任务;推理能力在数学、科学等高难度任务上持续突破,可靠性进一步提升。模型的自进化能力亦在涌现,能够在执行中主动调整策略并迭代优化。长线程任务能力的增强,让模型得以在大型工程中稳步推进,承担起高度复杂的生产力任务。
绵满1 天前
大模型·推荐系统
"MixFormer: Co-Scaling Up Dense and Sequence in Industrial Recommenders" 论文笔记字节跳动精排 Scaling 的工作 Mixformer(和 HyFormer 算是同期工作吧),目前挂在 Arxiv 26.02 上,也是提出了一个新的架构实现更好的统一 Scaling
key_3_feng2 天前
大模型
Windows 11本地部署最新大模型深度方案随着大语言模型的快速发展,本地部署已成为保护数据隐私、降低API成本的重要选择。本方案将详细介绍在Windows 11系统上部署最新大模型的完整流程,包括硬件配置、环境搭建、模型选择和性能优化。
guslegend2 天前
人工智能·大模型
第2节:工程初始化AI Agent 拖拉拽:AI Agent 拖拉拽本节:第2节:工程初始化下一节:待更新# docker-compose -f docker-compose-environment-aliyun.yml up -d version: '3' services: ollama: image: registry.cn-hangzhou.aliyuncs.com/xfg-studio/ollama:0.5.10 container_name: ollama restart: unless-stopped por
xixixi777772 天前
人工智能·安全·ai·金融·大模型·政务·合规
《机密计算破局政务金融、截图工具漏洞泄露NTLM哈希、智能体仿冒日增200+:AI安全的三场“攻防战”》当前,大模型落地过程中面临的核心矛盾在于:越是高价值的专业技术领域,其训练数据和实时推理数据的安全级别就越高。在政务场景中,政府规划、财政数据、内部决策草案是国家机密的核心组成部分;在金融领域,客户账单、交易记录、企业财报等,一旦泄露必然引发连锁反应与合规连环追责。
小何code2 天前
人工智能·gpt·语言模型·chatgpt·大模型·生成式ai
人工智能【第25篇】GPT模型详解:生成式预训练的语言模型作者的话:在前面的文章中,我们学习了BERT模型。如果说BERT开启了预训练语言模型的理解时代,那么GPT系列则开启了生成式AI的新纪元。从GPT-1到GPT-4,OpenAI的GPT系列模型展示了强大的文本生成能力和涌现能力。本文将深入讲解GPT的原理、演进历程和应用,帮助你理解生成式AI的核心技术!
闲人编程3 天前
大模型·agent·智能体·工具调用·function·calling
什么是“工具调用”(Function Calling)?Agent的手和脚“大模型是大脑,但大脑不会自己动手。Function Calling 就是给这颗大脑接上神经和肌肉的过程——让它不仅能说‘我该做什么’,还能真正‘伸手去做’。没有工具调用的 AI,永远只是纸上谈兵的军师;有了它,AI 才第一次具备了改变现实世界的力量。”
给算法爸爸上香3 天前
大模型·多模态·qwen-vl·tensorrt-llm
tensorrt-llm部署Qwen-VL首先搭建环境(略)并下载好huggingface的Qwen2-VL-2B-Instruct模型。 测试代码: