大模型应用

༒࿈南林࿈༒6 天前
爬虫·大模型应用·mcp·skills
国家医保局 API 加密体系逆向全记录——SM2签名 + SM4加解密 + SHA256 头签名爬虫古法炮制似乎有点走下坡了(当然这个是个人见解),大模型的快速发展对各行各业冲击都很大,本次对国医保进行纯大模型(Qoder+DeepSeek-V4-Pro),用MCP和skills协调处理,本地纯协议实现
战族狼魂7 天前
prompt工程·大模型应用·ai提示词·零基础教程
Prompt新手第一课,从写好一句指令开始很多人第一次打开大模型对话框时,都会经历这样的落差:脑子里明明有很多想法,打出来的字却像撞墙——「帮我写个方案」发出去,得到的回复要么太泛,要么完全不对味。问题不在模型,而在指令本身。Prompt 工程的核心,就是把模糊需求翻译成模型能理解的结构化语言。对零基础读者来说,掌握一套可复用的公式,比背一百个技巧都管用。
minhuan9 天前
大模型应用·糖尿病·跨病种共病关联挖掘·大模型因果推理·慢病疾病关联分析·高血压·肾病
跨病种共病关联挖掘:高血压 + 糖尿病 + 肾病,大模型因果推理疾病关联分析实践.192在日常慢病临床与健康大数据场景里,高血压、2 型糖尿病、慢性肾病从来都不是单独存在的疾病。很多患者先是血压升高,长期代谢紊乱诱发血糖异常,久而久之肾脏微血管持续受损,一步步进展为慢性肾病,三种疾病相互叠加、恶性循环,最终大幅提升并发症、致残与死亡风险。
minhuan9 天前
大模型应用·k-means人群聚类分层·慢病人群健康画像·肘部法则·轮廓系数
K-Means多维聚类分层慢病群体,大模型智能归纳特征标签,构建慢病人群健康画像.191在慢性病长期健康管理场景里,高血压、糖尿病、心脑血管慢病患者基数庞大、病程长短不一、并发症差异明显、用药与生活习惯各不相同。传统人工分组方式效率极低、分层粗糙,只能按照单一指标简单划分,无法精准匹配每个人的健康风险、干预优先级与康复方案。
minhuan11 天前
大模型应用·单卡4090显存优化·模型单卡分片加载·显存贫瘠分析·张量并行原理
单卡4090显存优化实践:模型单卡分片加载、推理链路拆解、延迟与吞吐平衡调优.190基本我们做大模型推理落地、本地私有化部署,都会遇到一个非常头疼的现实问题:手握RTX 4090显卡,显存规格足够强悍,却依旧跑不动千亿、百亿参数级别的大模型。
minhuan12 天前
大模型应用·swiglu深入分析·激活函数分解·swiglu核心原理·qwen-7b swiglu
大模型激活函数迭代演进:SwiGLU替代传统ReLU/GELU激活逻辑提升模型性能.189在前一期《大模型主流激活函数解析:ReLU/GELU/SwiGLU 原理差异,拆解 FFN 前向逻辑》内容中,我们已经系统认识了神经网络激活函数的基础作用:线性矩阵运算无法拟合复杂语义规律,只有加入非线性激活,Transformer才能学习语言逻辑、上下文关联与世界知识。相信在我们初步了解后在对比 ReLU、GELU两种经典激活后都会产生疑问:既然ReLU计算简单高效、GELU平滑稳定适配早期模型,为什么如今ChatGLM3、Qwen-7B这类主流开源大模型,全都全面切换为SwiGLU门控激活?
minhuan13 天前
大模型应用·大模型主流激活函数·ffn 前馈网络·chatglm3模型拆解
大模型主流激活函数解析:ReLU/GELU/SwiGLU原理差异,拆解FFN前向逻辑.188很多刚接触大模型微调、模型结构分析、推理优化的同学,第一眼看到 Transformer、FFN 前馈网络、SwiGLU、GELU、ReLU 这些名词都会觉得很抽象。大家普遍只知道注意力机制是大模型灵魂,却不知道激活函数才是决定模型深浅、长文本效果、梯度会不会消失、能不能叠几十上百层的关键底层组件。
minhuan15 天前
自注意力机制·大模型应用·flashattention·pagedattention·注意力算法详解
FlashAttention、PagedAttention两代注意力算法,改写大模型推理生态详解.186大模型能够实现流畅对话、长文本理解、多轮交互应答,核心底层完全依靠自注意力机制。但早期原生Transformer注意力,天生带着算力与显存双重致命缺陷,序列长度一旦上涨,算力开销呈平方级暴涨,不仅推理速度极慢、显存占用失控,高并发多轮对话极易卡顿溢出,根本无法规模化商用落地。
minhuan16 天前
大模型应用·词嵌入embedding·rope位置编码·token离散转连续向量规则·embedding完整剖析
词嵌入Embedding:Token离散转连续向量规则、RoPE特性、微调适配实践.185如果接触过大模型调用、或从事AI应用开发的工程师,基本天天都和Embedding打交道,分词Token、向量检索、语义匹配、RAG知识库、大模型对话生成,处处都离不开词嵌入。但如果没有刻意的深入挖掘,很可能我们的了解程度仅仅停留在把文字变成数字向量这个浅层定义,不知道它为什么能支撑语义理解,不知道近义词、歧义词在向量空间如何区分,不清楚RoPE位置编码不能乱改的底层原因,更不懂词表、嵌入初始化、领域微调、多语言对齐的深层逻辑。
minhuan19 天前
大模型应用·pagedattention·vllm大模型高效加载·vllm推理流程
VLLM大模型高效加载原理解析PagedAttention核心机制、推理流程、性能优化.182通过反复对大模型的学习了解,我们知道Transformer架构大模型普遍存在参数量庞大、显存占用极高、推理并发能力弱、长文本对话卡顿、批量请求处理效率低下等行业痛点。传统Transformers原生推理方式采用逐Token串行计算,KV缓存无序占用显存,大量显存碎片无法复用,单卡只能支撑极低并发对话请求,完全无法适配在线 API 服务、多用户并发聊天、长上下文对话、批量离线推理等真实生产场景。
minhuan20 天前
大模型应用·本地大模型常见异常处理·大模型应用经验解析·模型应用处理实践
本地大模型常见异常全解:显存溢出、推理慢、驱动报错、环境冲突调试指南.181本地大模型即脱离云端API调用,将开源大语言模型权重文件下载至个人电脑、工作站、服务器本地,依托本机硬件算力完成模型加载、上下文编码、文本生成全流程运算的部署模式。区别于在线调用大模型,本地部署具备数据隐私性强、无调用频次限制、可离线运行、支持自定义微调与二次开发等核心优势,也是当下AI应用私有化落地、行业定制模型研发的核心基础路径。
minhuan21 天前
人工智能·大模型应用·rtx 4090显存优化·模型分层加载·cpu offload优化
RTX 4090显存终极优化:模型分层加载、CPU Offload显存和内存动态置换实践.179大语言模型的显存占用,是所有优化的核心起点。对于搭载24GB显存的RTX 4090,我们首先要明确:模型本身、推理计算、中间张量、上下文窗口,是四大显存消耗源头,也是优化的核心靶向。
minhuan23 天前
人工智能·大模型应用·opencv人脸检测·deepface视觉识别·情绪健康识别
基于OpenCV人脸检测与DeepFace视觉识别实现情绪抓拍、数据分析智能研判系统.178由于长期深耕青少年心理健康相关工作,在日常情绪疏导、心理状态观测中积累了大量实践经验,深刻意识到青少年情绪细腻多变、外在表达含蓄,很难通过简单交流精准捕捉真实内心状态,情绪隐藏、瞬时情绪波动都是普遍现象,也给心理干预、日常疏导带来诸多难点。青少年情绪监测、课堂心理状态评估、日常心理疏导预警,都有着大量刚需落地场景。
minhuan23 天前
令牌桶算法·漏桶算法·大模型应用·大模型流量治理·限流算法应用
大模型应用两大经典限流算法:漏桶算法vs令牌桶算法铸就大模型流量治理基石.177限流算法是用于控制请求处理速率、保护服务资源的标准化算法,是所有流量管控策略的底层核心。在大模型服务中,算法的作用不再是简单限制请求数量,而是精准管控GPU 算力、显存占用、推理并发、Token 消耗,避免服务因流量过载崩溃。
minhuan25 天前
大模型应用·ai服务器运维·显卡驱动安装·rtx 4090应用
全新服务器大模型部署进阶:RTX 4090显卡驱动安装与模型运行容错适配指南.176前面我们已经完整讲过全新服务器从零搭建、部署运行大模型的全套流程,今天咱们就在这个基础上,继续往下做关键一步:给服务器配置独立显卡,打通 GPU 硬件加速能力。本次实操同样基于 openEuler 22.03 (LTS-SP4) 服务器系统,整体复盘带大家走完RTX 4090 独显适配全流程:从系统内核与发行版信息查看、硬件显卡识别,到禁用系统自带开源驱动、安装编译所需依赖,再到NVIDIA官方驱动编译部署、安装过程常见报错故障排查;驱动装好后,接着完成PyTorch GPU版本环境搭建、大模型AI框架依
minhuan1 个月前
大模型应用·服务器环境部署实践·openeuler环境搭建·linux大模型完整构建·chatglm2大模型
新服务器从0到1完整部署实践:openEuler环境搭建ChatGLM2大模型完整流程.175玩过Linux服务器部署的都知道,这事特别熬人、格外劳心,尤其是碰上特定定制版本的Linux系统,各种环境兼容、配置坑点层出不穷,稍有不慎就卡死报错,出于习惯,每次部署一个环境,都是边部署边记录,好溯源产生问题的原因,避免总是在快完工时又推导重来;
minhuan1 个月前
大模型应用·大模型gpu服务资源监控·chatglm3模型·大模型自动化巡检应用实践·模型监测核心指标
大模型GPU服务资源与性能监控:基于ChatGLM3模型的自动化巡检应用实践.174传统业务监控只关注接口响应、CPU内存、网络状态,完全适配不了大模型推理场景。大模型服务监控是面向推理全链路的专属可观测体系,覆盖请求接入、文本分词、模型前向计算、Token 生成、结果返回、资源释放全部环节。
.唉1 个月前
大模型应用·longserve
07. LangServe 实战:一键将 LangChain 应用封装为高性能 API摘要: LangServe是LangChain官方推出的高性能服务框架,基于FastAPI构建,可一键将LangChain应用(如Agent、Chain)部署为RESTful API。通过add_routes自动生成接口与Swagger文档,支持同步调用(/invoke)和流式输出(/stream),同时保留FastAPI的灵活性,可添加认证(如Token验证)或自定义路由。适用于快速部署AI服务,尤其适合学生或开发者专注AI逻辑而无需手动封装接口。
千桐科技1 个月前
插件化·dify·智能体·大模型应用·qknow·智能体构建平台·插件中心
qKnow 行业智能体构建平台应用中心插件化:技术选型、架构设计与实现路径随着企业智能化建设从单点能力供给转向系统化业务落地,qKnow专业版完成了整体架构的全面升级。新定位下,qKnow不再仅是知识能力平台,而是演进为面向行业深度场景的AI能力构建平台与解决方案孵化平台。全新架构在原有知识图谱、知识库基础上新增了Bot构建层(内含白盒化开发中心,支持Code‑Native代码构建任意态),强化了应用层(横向通用应用与纵向行业应用,采用“预置+持续迭代扩展”模式),并明确了解决方案层为战略目标。
minhuan1 个月前
大模型应用·服务熔断设计·大模型限流计费·异常流量风控拦截·超限自动降配
大模型服务熔断限流计费联动:异常流量风控拦截与超限自动降配架构实践.165服务熔断是分布式架构与大模型推理服务中必备的故障隔离机制,类比电路中的保险丝设计逻辑。当底层大模型推理接口出现连续报错、响应超时、GPU显存溢出、服务进程卡死等问题时,熔断机制会主动切断流向故障节点的请求流量。