大语言模型

tkokof110 小时前
游戏·ai·大语言模型·汉化·卡牌之声
漫漫游戏汉化路本文简述了自己在汉化游戏 《卡牌之声:残次的巫女(Voice of Cards: The Forsaken Maiden)》过程中的经历和感想
deephub17 小时前
人工智能·python·prompt·大语言模型
不依赖对话日志检测Prompt注入,一套隐私优先的实现方案检测 Prompt 注入和越狱攻击的方法,大多建立在系统可以访问对话日志这个前提上。但是如果设计一个系统,每段对话只处理一次以提取特征,不保留原始文本可以吗?:
诸神缄默不语2 天前
论文阅读·笔记·大模型·llm·大语言模型·claude·大规模预训练语言模型
论文阅读笔记:Claude如何思考诸神缄默不语-个人技术博文与视频目录 诸神缄默不语的论文阅读笔记和分类本笔记涉及对如下2篇Anthropic公司对其旗下大模型Claude可解释性探索的论文:
deephub3 天前
人工智能·深度学习·大语言模型·agent
多 Agent 验证架构实战:从输出评分到过程验证多 Agent 流水线在每一次演示中都表现正常。但是到了生产环境,它可能在第四步之前就悄悄积累了三个错误决策,最终输出自信、流畅但是完全错误。并且最后没有人发现问题,因为根本没有信号可以捕捉链条末端只剩下一个看起来干干净净的结果。
QC·Rex6 天前
人工智能·langchain·大语言模型·rag·企业应用·ai 助手
国产大模型应用实践:从 0 到 1 搭建企业级 AI 助手本文详细介绍如何使用国产大模型(通义千问、文心一言、Kimi 等)从零开始搭建一个企业级 AI 助手。内容涵盖技术选型、架构设计、核心功能实现、RAG 检索增强、多轮对话管理、部署运维等完整流程。通过本文,读者可以独立完成一个支持文档问答、任务执行、数据分析的智能助手系统。全文约 5800 字,包含 8 个可运行代码示例和 6 张技术图解。
deephub6 天前
人工智能·深度学习·大语言模型·agent
信息访问 vs. 推理能力:LLM Agent 性能归因的实验分析LLM agent 看起来越来越智能了。但实际上它们可能只是拿到了更多信息。Agentic 工作流普及以后,LLM 开始被频繁用于迭代优化机器学习模型:提出配置方案、观察实验结果、逐步改进决策。表面上看这像是推理,但一个根本问题悬而未决:系统性能的提升,究竟源于推理能力,还是源于输入端信息的改善?
晨曦蜗牛7 天前
ai·飞书·大语言模型·openclaw
OpenClaw 接入飞书详细教程OpenClaw 是一个开源、本地优先的 AI 代理网关,能让大模型在你的电脑/服务器上 7×24 小时运行,支持直接操作电脑、浏览网页、执行命令,还能无缝接入飞书、Telegram、Discord 等聊天平台。本文详细介绍接入飞书的完整配置流程。
咸鱼豆腐7 天前
单元测试·大语言模型·ai编程·代码生成
Clawdbot惊艳案例:Qwen3-32B自动生成带单元测试的Python模块并执行验证你有没有过这样的时刻:刚写完一个功能函数,马上得打开另一个文件写单元测试;改了几行逻辑,又得回头检查测试用例是否覆盖全面;团队新人接手代码时,光看测试文件就要花半小时理解边界条件……这些重复、机械、却不得不做的工作,正在被一种新的方式悄然改变。
深瞳智检10 天前
人工智能·自然语言处理·llm·大语言模型
lesson-02 NLP 基础-文本表示与词向量目录学习笔记一、第 1 篇:分词(Tokenization)核心要点二、第 2 篇:词向量(Word Vector)
机器白学11 天前
人工智能·大语言模型
OpenClaw使用前置准备:Ollama+OpenwebUI本地部署/API调用大模型docker拉取显卡驱动、ollama(模型部署)、openwebui(前端对话)镜像modelscope下载官方gguf格式模型,根据硬件显卡显存大小选择其中一种量化模式的模型即可。
deephub13 天前
人工智能·大语言模型·claude·claude code
Claude Code 命令体系解析:三种类型、七大分类、50+ 命令Claude Code 内置了超过 50 个命令,但是大多数开发者只用了其中 3 到 5 个,剩下的基本没人翻过。
弗锐土豆13 天前
llm·大语言模型·安装·ollama
使用ollama运行本地大模型在研发一个AI与传统业务系统结合的产品,需要本地化LLM(大语言模型)环境。所以选择ollama来管理本地LLM,本次学会安装使用ollama。
_张一凡13 天前
llm·aigc·大语言模型·多模态·qwen3·大语言模型微调·全参量微调
【大语言模型学习】一文详解阿里Qwen3大模型以及全参量微调入门实战教程(代码完整)2025年4月,阿里巴巴正式发布新一代通义千问大模型Qwen3系列,这是继Qwen2.5之后又一次重大技术跃迁。作为目前全球最活跃的开源大模型家族之一,Qwen3不仅在多项权威基准测试中登顶榜首,更通过混合专家架构(MoE)与混合推理模式的创新,重新定义了大模型的效率边界。本文将带您全面了解Qwen3的技术全景、核心突破以及上手微调一个自己的对话模型。
deephub14 天前
人工智能·python·深度学习·大语言模型·agent
构建生产级 AI Agent 系统的4大主流技术:反思、工具、规划与多智能体协作多数人对AI Agent的理解还停留在"聊天机器人的升级版",这个思路在一段时间里这么理解其实也没什问题,比如问一个问题,拿到一个回答。但很快就能看出来单轮提示-响应的交互根本没有任何的意义,而真正有意义的跃迁发生在AI开始具备这些能力的时候:思考、规划、行动、观察、循环往复,这和我们处理复杂问题的方式几乎一致。
deephub16 天前
人工智能·深度学习·大语言模型·agent·rag
高级 RAG 技术:查询转换与查询分解检索增强生成(RAG)的基础流程是用户查询转换为向量嵌入,从向量数据库中取回相似文档,再将这些文档作为上下文送入大语言模型(LLM)生成答案。
深瞳智检17 天前
人工智能·笔记·学习·自然语言处理·llm·大语言模型
lesson-01 NLP 概述学习笔记 & 学习心得lesson-01 NLP 概述学习笔记 & 学习心得学习笔记1. 什么是 NLP2. NLP 的发展历程
deephub19 天前
人工智能·python·大语言模型·agent
多智能体系统的三种编排模式:Supervisor、Pipeline 与 Swarm多智能体系统是 2026 年主流构建方式,Claude 的智能体团队功能、OpenAI 的 Swarm 框架、LangGraph 的编排层以及 CrewAI都指向同一个结论:复杂任务需要协调配合的专家,而非一个万能通才。
rgb2gray19 天前
人工智能·python·llm·大语言模型·需求分析·多模态·maup
论文详解 | HDAM:破解 MAUP 的城市出行需求分析新方法,实现关键驱动精准识别原文:Unveiling the key drivers of travel demand via hotspot analysis: a new approach to mitigate the modifiable areal unit problem
ErizJ19 天前
llm·大语言模型·training
LLM | 训练与推理过程现代 LLM(如 GPT、LLaMA、Claude)均基于 Transformer 架构,核心是自注意力机制(Self-Attention)。
deephub21 天前
人工智能·python·深度学习·大语言模型·agent
LangGraph vs Semantic Kernel:状态图与内核插件的两条技术路线对比多数关于 LangGraph 和 Semantic Kernel 的比较文章已经过时。过去六个月里,两个框架分别进行了重大的更新,所以本文将梳理的是实际发生的变化、当前的代码形态,以及如何进行技术选型。