大语言模型

G皮T2 天前
人工智能·chatgpt·llm·大语言模型·deepseek·deepseek-v3·deepseek-r1
【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析ChatGPT(由 OpenAI 开发)和 DeepSeek(由深度求索公司开发)都是基于 大语言模型(LLM,Large Language Model)的技术,但它们在模型架构、训练数据、优化目标和具体应用上存在差异。
亚里随笔2 天前
人工智能·llm·大语言模型·rlhf
L0:让大模型成为通用智能体的强化学习新范式在AI智能体研究领域,如何让大语言模型高效完成多轮、长周期任务仍是难题。本文将解读论文L0,其提出的端到端训练 pipeline 与 NB-Agent 架构,通过强化学习显著提升模型在问答任务上的表现,为通用智能体发展提供新思路。
在未来等你6 天前
大语言模型·rag·llamaindex·检索增强生成·ai开发
RAG实战指南 Day 4:LlamaIndex框架实战指南RAG,LlamaIndex,检索增强生成,大语言模型,AI开发本文是"RAG实战指南"系列的第4天,聚焦LlamaIndex框架的核心功能与实战应用。我们将深入解析LlamaIndex在RAG系统中的定位,详细讲解其数据连接器、索引构建和查询引擎三大核心组件的工作原理。文章包含完整的Python代码实现,展示如何从零构建一个基于LlamaIndex的文档问答系统,涵盖文档加载、索引创建、向量检索和响应生成全流程。通过与传统方法的对比分析,我们将揭示LlamaIndex在结构化数据处理和多源集成方面的独特
小白跃升坊1 个月前
ai·大语言模型·maxkb
【干货分享】手把手教你实现AI应用对话批量自动化测试(含源码)MaxKB对话应用在发布之后,可以使用本文提供的Python自动化测试脚本,快速验证对话应用的响应结果,响应时间,引用分段,消耗tokens数量等关键指标。请查看MaxKB-API.zip压缩包,详细了解Python自动化测试脚本的内容。
滴答滴答嗒嗒滴1 个月前
人工智能·ai·开源·llm·大语言模型·tensorzero
TensorZero:开源 LLM 应用优化与可观测性平台TensorZero 是一个开源的 LLM(大语言模型)应用全链路优化平台,聚焦于“数据—评估—优化—实验”自动化闭环,极大提升 LLM 产品的可观测性、可优化性和可扩展性。无论你是 GPT 应用开发者,还是需要管理和提升 LLM 服务质量的团队,TensorZero 都能帮你更快、更稳地跑通研发和运维全流程。
小白跃升坊1 个月前
ai·大语言模型·maxkb
AI赋能文档创作:智能生成+云端下载,解锁高效办公新姿势本文重点介绍如何将AI智能生成文字直接转换为word文档,支持下载提升大家学习和职场办公的效率。Pandoc是一个功能强大的文档转换工具,支持多种文档格式之间的转换。它广泛应用于学术写作、出版和技术文档处理领域。 Pandoc支持多种输入和输出的格式,包括但不限于:
小白跃升坊1 个月前
ai·大语言模型·maxkb
破局AI问答专有名词检索迷局:分词期神器强势登场!有客户深度使用全文检索模式检索分段,反馈一些专有名词无法被检索到(例如把“小米手机”分成了“小米”和“手机”两个词,对检索结果造成较大干扰),而 MaxKB 的分词器采用流行的 jieba 库,确认了一个临时解决方案。
小白跃升坊1 个月前
ai·大语言模型·maxkb
告别手动码字!AI智能生成+文档下载,职场/学习效率翻倍攻略!本文重点介绍如何将AI智能生成文字直接转换为word文档,支持下载,最终提升大家学习和职场办公的效率。
狐571 个月前
人工智能·大语言模型
2025-05-08-deepseek本地化部署参考博客 本地部署 DeepSeek:小白也能轻松搞定!如何给本地部署的 DeepSeek 投喂数据,让他更懂你
xiaoming-wu1 个月前
数据分析·大语言模型·agent
数据分析Agent构建代码资料来源于 Streamline-Analyst,旨在通过该仓库上的代码了解如何使用大语言模型构建数据分析工具;
程序员老周6661 个月前
人工智能·神经网络·线性代数·自然语言处理·大语言模型·概率论·数学基础
4.大语言模型预备数学知识复习一下在大语言模型中用到的矩阵和向量的运算,及概率统计和神经网络中常用概念。条件:行数列数相同的矩阵才能做矩阵加减法
InternLM1 个月前
大模型·大语言模型·大模型应用·书生
基于InternLM的情感调节大师FunGPT基于书生系列大模型,社区用户不断创造出令人耳目一新的项目,从灵感萌发到落地实践,每一个都充满智慧与价值。“与书生共创”将陆续推出一系列文章,分享这些项目背后的故事与经验。欢迎订阅并积极投稿,一起分享经验与成果,推动大模型技术的普及与进步。
小白跃升坊1 个月前
ai·大语言模型·maxkb·提示词模版
Prompt 生产及提示词案例(含完整提示词)提示词:其中系统角色和提示词基于 MaxKB (强大易用的企业级AI助手),结合工作流编排。其中{{知识库检索.data}}中的内容均为 workflows 中的各个节点输出的内容。
deephub1 个月前
人工智能·python·jupyter·大语言模型·mcp
Jupyter MCP服务器部署实战:AI模型与Python环境无缝集成教程Jupyter MCP 服务器是基于模型上下文协议(Model Context Protocol, MCP)的 Jupyter 环境扩展组件,它能够实现大型语言模型与实时编码会话的无缝集成。该服务器通过标准化的协议接口,使 AI 模型能够安全地访问和操作 Jupyter 的核心组件,包括内核管理、文件系统以及终端环境。本文将深入分析 Jupyter MCP 服务器的技术架构、核心功能以及部署配置方法。
网宿安全演武实验室1 个月前
人工智能·安全·大语言模型·mcp协议
AI生态警报:MCP协议风险与应对指南(中)——MCP Server运行时安全作为连接AI模型与外部工具的“USB-C接口”,MCP协议成为AI生态的核心枢纽,其安全风险已从理论威胁转化为实际攻击目标。
deephub1 个月前
人工智能·python·深度学习·神经网络·架构·大语言模型
图神经网络在信息检索重排序中的应用:原理、架构与Python代码解析现代信息检索系统和搜索引擎普遍采用两阶段检索架构,在人工智能应用中也被称为检索增强生成(Retrieval-Augmented Generation, RAG)。在初始检索阶段,系统采用高效的检索方法,包括词汇检索算法(如BM25)或密集嵌入检索器(基于近似最近邻算法),为给定查询获取初始候选文档或段落集合。这一阶段优先考虑检索速度而非完整性,因此常常返回包含噪声或不相关的结果,可能导致下游任务产生错误答案或幻觉问题。第二阶段即重排序过程,通过重新计算候选文档的相关性分数并生成更精确的排序列表来优化检索结
小白跃升坊1 个月前
ai·大语言模型·maxkb
最炫酷的企业 AI 助手来啦(含前端源码)!最近越来越多的企业开始将 MaxKB 在他们企业当中的应用场景官宣了。有时候我们会疑问,这真的是 MaxKB 做的吗?
lihuayong2 个月前
人工智能·大语言模型·few-shot·zero-shot·one-shot
One-shot和Zero-shot的区别以及使用场景Zero-shot是模型在没有任务相关训练数据的情况下进行预测,依赖预训练知识。One-shot则是提供一个示例,帮助模型理解任务。两者的核心区别在于是否提供示例,以及模型如何利用这些信息。
小白跃升坊2 个月前
ai·大语言模型·maxkb
【AI+教学】让课堂实时讲解语音知识库沉淀下来今天给大家分享一个教学的 AI 使用场景,主要用来解决课堂老师实时讲解的内容如何让学生快速了解学习。课堂上老师上完课后,课堂实时讲解的内容,部分与教材或者课件有偏差(临场发挥),希望通过AI小助手将这部分知识沉淀总结下来。方便学生了解回顾。