大模型

翔云12345628 分钟前
人工智能·ai·大模型
vLLM全解析:定义、用途与竞品对比vLLM(Very Large Language Model inference) 是由加州大学伯克利分校LMSYS团队于2023年6月开源的高性能大模型推理与服务引擎,专注解决大模型部署中的显存效率低、吞吐量瓶颈、延迟高三大核心问题 。
翔云12345610 小时前
ai·大模型
大模型训练框架全景解析(2026最新)大模型训练框架按功能定位可分为三类:关键技术趋势(2026)混合并行成为标配:数据并行+模型并行+流水线并行深度融合,3D并行成为千亿模型训练基础
不懒不懒10 小时前
人工智能·分类·数据挖掘·大模型·ollama
【从零入门本地大模型:Ollama 安装部署 + Qwen2.5 实现零样本情感分类】目录一、准备工作二、安装 Ollama 客户端三、一键运行你的第一个大模型四、基于 Qwen2.5 实现零样本情感文本分类实战
翔云12345611 小时前
人工智能·ai·大模型
大模型部署全流程深度解析大模型部署是将训练完成的模型转化为稳定、高效、可扩展推理服务的全链路工程,核心目标是在性能、成本、延迟、精度间取得最佳平衡。以下从8大维度展开,覆盖从前期规划到生产运维的完整闭环。
码点滴11 小时前
人工智能·架构·大模型·deepseek-v4
DeepSeek-V4 全景地图:两款模型、三种模式,你该怎么选?核心主张:V4 不只是"更便宜的 GPT-4o"——它重新定义了"百万上下文"从奢侈品变为基础设施的临界点。读懂这篇文章,你能在正确的场景用正确的配置,成本节省 80% 以上。
翔云12345611 小时前
人工智能·ai·大模型
vLLM 全部8种部署方式(按从简单到企业级排序,附适用场景+最简命令)适用:本地开发、调试、二次开发、嵌入RAG/Agent项目 特点:最灵活,可自定义推理逻辑、接入业务代码 最简用法
DogDaoDao13 小时前
人工智能·深度学习·开源·大模型·github·ai编程·opeclaw
【GitHub】OpenClaw:开源个人AI助手的新标杆OpenClaw(官网:https://openclaw.ai)是一个功能强大的开源个人AI助手项目,其Slogan为"Your own personal AI assistant. Any OS. Any Platform. The lobster way. 🦞"。截至目前,该项目在GitHub上已获得超过 367,000 Stars,成为全球排名第6的热门开源项目,Fork数超过75,000,拥有来自全球2,000多位贡献者的参与。
m0_629494731 天前
人工智能·大模型·langgraph
LangGraph 构建AI Agent智能体在开始学习 LangGraph 构建 Agent 之前,你不需要有任何 Python 高级编程基础,也不需要懂什么是“智能体”,但必须掌握以下最基础的前置知识——我会像老师教新手一样,一步步讲明白,确保你能跟着操作、完全理解。
刘大猫.1 天前
人工智能·算法·机器学习·ai·大模型·算力·ai智能座舱助手
宝马发布全新AI智能座舱助手 能理解用户复杂出行需求在刚刚闭幕的 2026 北京车展上,宝马联合阿里云隆重推出了三款专为中国市场设计的 AI 智能助手。这些助手将全面提升用户在用车和出行方面的体验,让传统的车机语音助手从被动响应变为主动决策,真正做到 “听得懂,办得妥”。
码点滴1 天前
人工智能·架构·kubernetes·大模型·pagedattention
告别显存焦虑:PagedAttention 如何将大模型吞吐量提升 4 倍?本文从显存碎片化根因出发,系统拆解 vLLM + PagedAttention 核心机制,并深入三个高价值生产场景,覆盖:
CoderJia程序员甲2 天前
ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-05-01)生成于:2026-05-01共发现热门项目: 13 个榜单类型:日榜Token赞助:siliconflow
Resistance丶未来2 天前
人工智能·gpt·大模型·api·claude·kimi·kimi k2.6
Kimi K2.6 智能应用场景与落地指南在日常的高强度工作中,我们常常被淹没在海量的信息流里:几十页的技术文档需要快速提炼核心逻辑,复杂的遗留代码库让人无从下手,或是面对跨语言的沟通需求感到力不从心。传统的工具往往只能解决单点问题,比如简单的翻译或基础的代码补全,但在处理需要深度理解、长上下文关联以及复杂逻辑推理的任务时,显得捉襟见肘。开发者、产品经理和研究者们迫切需要一个能够真正“读懂”内容、“理解”意图并辅助决策的智能伙伴,而不仅仅是另一个聊天机器人。
谭文涛博士2 天前
大模型·agent·竞品分析
智能竞品分析多Agent系统【附带源码】在商业竞争日益激烈的今天,企业需要快速、全面、深入地了解竞争对手,但传统竞品分析依赖人工搜集和整理,存在信息分散、维度单一、效率低下、缺乏系统性等痛点。智能竞品分析多Agent系统通过多个AI智能体协同工作,将复杂的竞品分析任务拆解为竞品发现、数据采集、多维分析和策略建议等专业化子任务,实现从竞品搜索到战略输出的全流程自动化。系统采用“串行采集→并行分析→串行汇总”的混合协作模式,在效率与深度之间取得平衡,为企业提供产品功能矩阵、定价策略对比、市场趋势洞察和可落地的差异化行动方案,让商业决策从“凭经验”升
Bruce_Liuxiaowei2 天前
人工智能·安全·web安全·网络安全·大模型
2026年4月第5周网络安全形势周报覆盖周期: 2026年4月25日 - 5月1日 编制日期: 2026年5月1日(五一劳动节)本期(4月25日-5月1日)网络安全形势呈现"供应链危机深化 + AI工具链全线告警 + 国家级APT持续升温"三大主线:
Cc不爱吃洋葱2 天前
人工智能·elasticsearch·大模型·大语言模型·rag·ai工具·大模型应用
RAG最佳实践:用 ElasticSearch 打造AI搜索系统与RAG 应用全流程详解!今天这篇文章将介绍如何使用 Elasticsearch 搭建AI搜索系统和RAG应用系统。Elasticsearch 搭建 AI 搜索系统
一粒黑子2 天前
人工智能·gpt·安全·ai·大模型·ai编程
【实测】GitNexus实测:拖入GitHub链接秒出代码知识图谱,今天涨了857星腾讯10年程序员带你实测GitNexus——一款零服务器、纯浏览器端的代码知识图谱引擎,内置Graph RAG智能问答。今天GitHub Trending单日涨857星。
秋说2 天前
人工智能·大模型·知识图谱·同态加密·差分隐私·智慧医疗
【知识图谱】大模型驱动多模态健康智能问诊深度剖析【精选优质专栏推荐】每个专栏均配有案例与图文讲解,循序渐进,适合新手与进阶学习者,欢迎订阅。本文系统剖析健康智能问诊系统的核心技术架构,以大语言模型(LLM)为驱动引擎,实现症状匹配、疾病诊断辅助、医生资源调度与医疗知识图谱的深度集成,同时嵌入隐私保护机制,确保数据安全与合规。
乔代码嘚2 天前
人工智能·学习·大模型·知识图谱·ai大模型·大模型学习·大模型教程
Agentic-KGR:多智能体强化学习驱动的知识图谱本体渐进式扩展技术Agentic-KGR是一种通过多轮强化学习驱动的多智能体交互实现知识图谱本体渐进式自进化的技术框架。该框架遵循"提取→暂存→更新→奖励计算→晋升"的闭环流程,依赖LLM的知识发现能力和反馈闭环机制。系统通过多尺度提示压缩、Neo4j数据库管理、分层决策机制和双维度奖励评估,实现了本体结构与模型参数的协同优化,有效提升知识抽取与问答性能,同时降低推理成本。