技术栈
大模型应用
minhuan
14 分钟前
api调用
·
大模型应用
·
pyinstaller打包运行
·
服务端部署
大模型应用:大模型本地化部署与API调用:打包迁移到服务器的多种方式实践.47
在过往的系列分享中,无论是轻量型向量模型的实操应用,还是大语言模型的生成推理与落地调试,我们始终围绕模型本地化调用这一核心场景展开,从环境搭建、参数优化到功能适配,逐步带领大家打通了本地跑通模型的全流程。但随着应用场景的升级,单一设备的本地化调用已难以满足多用户协同访问、高并发处理、长期稳定运行的需求,同时,将开源或自定义大模型封装为可网络访问的 API 接口,部署到服务器上实现稳定调用,已成为企业级应用、团队协作、产品集成的核心需求,此时,如何将调试成熟的模型平滑部署至云端服务器,实现从本地自用到全网可
minhuan
2 天前
api调用
·
大模型应用
·
大模型本地部署
·
jwt鉴权
大模型应用:本地大模型API调用鉴权可视化全解析:从基础实现到业务扩展.45
随着大模型本地化部署的普及,基于 FastAPI 封装大模型接口并实现鉴权、可视化交互,成为实现落地大模型应用的核心场景。前一篇博文我们讲解了大模型本地化部署以及api鉴权调用的基础示例,今天我们在初级理论的基础上强化实际应用,以“本地大模型文本生成 API+Streamlit 可视化前端”为核心案例,从代码分解、执行流程、技术栈解析、价值细节、实际应用意义五个维度,由浅入深讲解完整的开发与扩展逻辑。
minhuan
3 天前
fastapi
·
模型部署
·
大模型应用
·
模型接口鉴权
·
jwt应用
大模型应用:大模型的本地 API 服务:FastAPI 封装与接口鉴权.44
大模型的里里外外我们都进行了很多细节的讲解,但大模型的部署引用还没有涉及太多,今天我们重点讲一下模型的接口发布,以及利用Postman工具的鉴权调试,Postman 是一款轻量、易用的 API 调试与测试工具,无需编写复杂代码即可快速验证接口的可用性,是本地大模型 API 开发、调试阶段的首选工具。相比于浏览器的自动生成文档页面,Postman 更贴近实际业务中客户端调用 API的真实场景,如后端服务、移动端调用),能直观验证鉴权逻辑、参数传递、返回结果是否符合预期。
minhuan
6 天前
人工智能
·
bert
·
大模型应用
·
text2vec模型应用
·
bert 文本质量评分
大模型应用:语料库治理实战:基于 text2vec+BERT 的由浅入深解析.41
相信我们在接触大模型已经从很多地方收集各类零零散散的信息,数据的高价值已是行业共识,但并非只有海量数据才有价值,对于类似我们这样的中小企业、个人开发者或垂直场景,如客服机器人、行业知识库、本地化模型微调等,小型的小语料库反而更易落地、成本更低。
新知图书
8 天前
人工智能
·
fastgpt
·
ai agent
·
智能体
·
大模型应用
FastGPT开发一个智能客服案例
《玩转FastGPT:像搭积木一样构建智能体》(李振强,叶彦辛,等)【摘要 书评 试读】- 京东图书FastGPT 是一个基于大语言模型(LLM)的开源知识库问答系统,它通过检索增强生成(RAG)技术,将文档与AI模型结合,实现智能问答和自动化决策。本文用FastGPT 开发一个智能客服。
minhuan
10 天前
moe
·
混合专家模型
·
大模型应用
大模型应用:混合专家模型(MoE):大模型性能提升的关键技术拆解.37
最近我们强化学习了很多大模型相关知识,应该也注意到了“MoE”这个词,比如什么模型用了MoE架构,MoE让大模型性能得到大幅提升等等,我们初看一扫而过,再看一脸懵逼,那MoE到底是什么?为什么它这么重要?今天就用简单的视角,基础原理和代码演示,一起探究MoE的核心知识!
minhuan
12 天前
向量数据库
·
大模型应用
·
智能化索引优化
大模型应用:向量数据库智能化索引优化:基于数据特征的最优算法自适应选择.32
随着大模型应用的爆发,向量数据库成为支撑语义检索、图像相似性匹配、推荐系统等场景的核心基础设施。向量索引作为向量数据库的性能引擎,其算法选择直接决定了查询效率与召回率的平衡。
minhuan
14 天前
数据库
·
向量数据库
·
大模型应用
·
chromadb数据库
大模型应用:从交易行为到实时反欺诈:向量数据库驱动的智能风控实践.33
在数字支付与电商高速发展的今天,交易欺诈已成为金融与商业领域的顽疾。传统的反欺诈方案多依赖规则引擎或机器学习分类模型,存在规则僵化、对新型欺诈模式响应滞后、高误报率等痛点。
minhuan
17 天前
embedding
·
大模型应用
·
向量数据库与元数据
·
向量复合查询
大模型应用:向量与元数据联动:解锁向量数据库复合查询的核心能力.30
在大模型与检索增强生成(RAG)技术普及的今天,向量数据库已成为连接非结构化数据与 AI 应用的核心组件。传统向量检索仅依靠向量相似度匹配目标数据,在实际业务场景中却往往力不从心,比如在检索“2024 年发布的 AI 技术论文”时,仅通过向量相似性可能会返回大量无关领域的旧文档。
minhuan
18 天前
ann
·
大模型应用
·
精确最近邻搜索
·
近似最近邻搜索
·
向量数据库算法原理
大模型应用:近似最近邻搜索(ANN)算法驱动向量数据库的高效检索.29
在大模型与RAG技术深度融合应用提效增能的场景下,向量数据库成为了连接文本语义化与实时智能检索的关键枢纽。当海量的文本、图像、音频数据被转化为高维向量后,如何在毫秒级时间内从亿级向量库中找到与查询向量最相似的结果,成为了决定上层应用体验的核心瓶颈。
minhuan
19 天前
向量数据库
·
大模型应用
·
chromadb应用
大模型应用:向量数据库的技术内核解析:破局大模型的失忆困境.28
当大模型能够流畅地撰写文案、解答数学难题、生成代码时,知识固化与幻觉问题始终是一个致命短板制约着大模型的能力发挥。训练完成的大模型如同一个记忆定格的智者,既无法实时吸收新信息,又可能基于碎片化知识生成似是而非的答案。
递归尽头是星辰
19 天前
大数据
·
人工智能
·
大模型应用
·
spring ai
·
ai 报表
·
报表智能化
AI 驱动的报表系统:从传统到智能的落地与演进
本文基于《报表系统的那些事:四部演进史》的基础架构,聚焦当下大模型规模化落地背景,探讨报表系统智能升级路径。通过对比传统报表与 AI 报表核心差异,明确其 “自然语言交互、智能异常检测、动态指标推荐” 优势;详解新手友好的技术栈选型、三大核心场景落地思路与关键代码,以及工程化架构设计与动态管理方案;同时盘点热门开源项目与大厂布局,展望多模态等未来趋势,为传统报表开发者提供低成本、易落地的从 0 到 1 AI 拓展指南。
minhuan
20 天前
向量数据库
·
大模型应用
·
ollama部署
·
rag应用
大模型应用:RAG与向量数据库结合Ollama调用模型深度融合全解析.27
通过多篇博文我们也反复介绍说明了大模型知识滞后、生成幻觉成为制约智能问答、企业知识库等场景落地的核心痛点,检索增强生成(RAG)技术通过“外部知识检索 + LLM 生成” 的模式,为解决这些问题提供了关键思路,而向量数据库则是 RAG 发挥价值的核心底座。今天我们从一个新的视角,以本地员工手册智能问答系统为内容载体,从基础概念到实践,系统拆解 RAG 与向量数据库的深度融合逻辑,同时引入 Ollama 这一轻量级本地大模型运行工具,增加实用性和便捷性。
般若Neo
22 天前
大模型
·
大模型应用
·
企业级大模型
企业级大模型开发及应用 - 企业应用大模型的方法
插件是一种将外部能力与大语言模型相结合的机制,可以帮助大模型访问最新信息、运行计算或使用第三方服务,比如访问网络、访问文档、与第三方应用相连接、绘图等。
minhuan
23 天前
langchain
·
llamaindex
·
大模型应用
·
langgraph
大模型应用:LlamaIndex、LangChain 与 LangGraph 细节深度、协同应用.24
在大模型应用开发中,如何高效地利用私有数据、编排复杂任务以及管理多轮对话状态是三个核心挑战。LlamaIndex、LangChain和LangGraph分别针对这三个挑战提供了专业解决方案。今天我们将深度解析这三个框架的架构设计、核心细节,并通过实战案例展示如何协同使用它们构建强大的LLM应用。
minhuan
24 天前
大模型应用
·
musicgen模型应用
·
tta
·
文本生成音频
大模型应用:TTA文本驱动音频:MusicGen大模型参数调优+音频情绪可视化.23
随着语音大模型的普及,不管是TTS还是ASR,都与音频处理有着紧密的联系,AIGC的蓬勃发展,也催生了文本到音频(Text-to-Audio, TTA)的落地场景,音乐生成也走进了我们的实际应用。基于传统的信号合成技术凭借完全可控、轻量化的优势,在场景化音效补充中不可替代;而声乐大模型也是雨后勃发,以 MusicGen 为代表的 TTA 大模型,则通过海量数据训练实现了文本意图驱动的创意生成。
华东设计之美
25 天前
人工智能
·
软件开发
·
rag
·
大模型应用
·
增强检索生成
muti-Agent+RAG+KnowledgeGraph构建智能问诊系统的可行性分析
muti-Agent+RAG+KnowledgeGraph这套架构是目前 AI 领域最前沿的 GraphRAG (Graph-based Retrieval Augmented Generation) 的进化版。
新知图书
25 天前
人工智能
·
ai agent
·
智能体
·
大模型应用开发
·
大模型应用
智能体的自适应学习
《AI Agent智能体开发实践 邓立国 邓淇文著 五大实战案例掌握AI Agent开发 LangChain示例 人工智能技术丛书 清华大学出版社》【摘要 书评 试读】- 京东图书
minhuan
1 个月前
多模态模型
·
大模型应用
·
speecht5模型
·
剧情配音系统
·
tts模型应用
大模型应用:基于 SpeechT5 的自媒体多角色剧情配音系统:架构、细节与实践.20
在现在很多自媒体平台的剧情类短视频创作中,多角色配音是核心环节但痛点显著:真人配音成本高、周期长,通用 TTS 工具缺乏角色区分度,多语言 /多情绪适配性差,且难以批量处理剧本、生成标准化字幕。
minhuan
1 个月前
rag
·
llamaindex
·
大模型应用
大模型应用:从问题到答案:LlamaIndex RAG系统工作流程详解.15
在前面的文章我们对langchain和RAG都做过深入的探讨,检索增强生成(RAG)是解决模型核心痛点的关键技术,它能让大模型基于本地私有数据生成精准回答,彻底规避 幻觉问题,同时满足数据本地化、合规性要求。