语言模型

纤纡.14 小时前
人工智能·阿里云·语言模型·langchain
从零搭建 AI 智能 PDF 问答工具:Streamlit+LangChain + 千问大模型实战在日常工作与学习中,我们经常需要处理大量 PDF 文档 —— 学术论文、行业报告、书籍资料、企业手册等。传统阅读方式效率低下,尤其是面对数百页的长文档时,快速定位关键信息、精准解答疑问变得十分困难。
Resistance丶未来14 小时前
人工智能·ai·语言模型·自然语言处理·nlp·多模态大模型·ai工具
从零构建大语言模型:核心原理与实战落地在动手构建大语言模型之前,很多开发者往往被庞大的参数量和复杂的架构图劝退,觉得这必须是顶级实验室才能触碰的领域。但实际上,剥离掉工业级的工程外壳,大模型的核心骨架其实由几个清晰且优雅的数学模块组成。当你真正尝试从零开始,用几百行代码复现一个微型模型时,那种对“智能”如何从数据中涌现的理解,远比直接调用 API 来得深刻。
Jay-r14 小时前
人工智能·语言模型·chatgpt·ai助手·chatgpt5.5
ChatGPT 官网入口(2026 年最新版)——简明指南原文链接:https://www.jay-r-j.top/chatgpt-official-entry/
野犬寒鸦19 小时前
后端·语言模型·面试·ai编程
MCP 回包外层结构嵌套问题:原理、排查与开发避坑指南最近在做agent开发时遇到了一个坑,也是vibe coding中较为常见的一个坑,所以整理自一次关于 MCP 集成调试的对话,涵盖问题本质、实际故障复盘,以及如何向 AI 描述类似任务以提升编码准确率。 附上项目地址:https://github.com/wolves-teacup/ThinkingCoding
小何code1 天前
人工智能·gpt·语言模型·chatgpt·大模型·生成式ai
人工智能【第25篇】GPT模型详解:生成式预训练的语言模型作者的话:在前面的文章中,我们学习了BERT模型。如果说BERT开启了预训练语言模型的理解时代,那么GPT系列则开启了生成式AI的新纪元。从GPT-1到GPT-4,OpenAI的GPT系列模型展示了强大的文本生成能力和涌现能力。本文将深入讲解GPT的原理、演进历程和应用,帮助你理解生成式AI的核心技术!
2301_780029042 天前
人工智能·语言模型·自然语言处理
A survey on large language model based autonomous agents —— 论文精读论文标题:A survey on large language model based autonomous agents
老刘说AI2 天前
人工智能·python·语言模型·embedding·ai编程
Embedding不是魔法:把文字变成数字的底层逻辑在技术语境里,“Embedding”常被称作“嵌入”,这是学术领域的规范表述,而从实际计算逻辑来看,它本质是一种向量化的处理方式。
皮卡丘ZPC2 天前
人工智能·语言模型·自然语言处理
GAIA2: BENCHMARKING LLM AGENTS ON DYNAMIC AND ASYNCHRONOUS ENVIRONMENTS摘要 我们介绍了Gaia2,这是一项用于在真实的、异步环境中评估大型语言模型代理的基准测试。与之前的静态或同步评估不同,Gaia2引入了环境独立于代理行为演变的场景,要求代理在时间约束下运行,适应噪声和动态事件,解决模糊问题,并与其他代理协作。每个场景都配备了写入操作验证器,实现了细粒度的操作级评估,使Gaia2能够直接用于基于可验证奖励的强化学习。我们对最先进的专有和开源模型的评估表明,没有任何模型在能力上占优:GPT-5(高)以42%的pass@1得分达到总体最强,但在时间敏感任务上表现不佳;Clau
victory04312 天前
人工智能·语言模型·自然语言处理
DeepSeek LLM Scaling Open-Source Language Models with Longtermism 中文翻译开源大语言模型(LLMs)的快速发展确实令人瞩目。然而,既有文献中描述的缩放定律(scaling laws)得出了不同的结论,这给扩展 LLMs 蒙上了一层阴影。我们深入研究了缩放定律,并提出了独特的发现,这些发现有助于在两种常用的开源配置——7B 和 67B——中扩展大规模模型。在缩放定律的指导下,我们推出了 DeepSeek LLM,这是一个致力于以长期视角推进开源语言模型发展的项目。
纤纡.2 天前
python·阿里云·语言模型·讯飞
从课堂视频转写结构化数据:Python + 讯飞 + 通义千问全流程实战在教育数字化转型的浪潮中,智慧课堂分析成为教学质量提升的核心抓手。传统课堂数据采集依赖人工记录,不仅耗时费力(1 小时课堂视频整理需 4-6 小时),还易遗漏师生互动细节,难以形成标准化教学数据。为此,本文基于 Python 构建全流程自动化工具,整合 MoviePy 视频处理、讯飞录音文件转写(LFASR)、阿里云通义千问大模型,实现从课堂 MP4 视频到结构化教学数据的一键生成,涵盖音频提取、高精度语音转写、文本降噪、师生角色修正、课堂活动识别等核心能力,全程零人工干预,高效适配智慧课堂评价、教学复盘
七牛开发者2 天前
前端·人工智能·语言模型·html
HTML is the new Markdown:来自 Claude Code 团队的实践AI Agent 火起来之后,凭借着简单、轻量、方便编辑,Markdown 一直都是 Agent 输出计划、说明和文档的默认格式。但上周五 Anthropic 工程师 Thariq Shihipar 提出,HTML 可能正在成为新的 Markdown。原因并不是 HTML 更“酷炫”,而是它能把代码说明、PR review、设计原型、报告、交互式编辑器等内容组织成更容易阅读和操作的页面,让人更好地参与到 Agent 的工作过程中,而不是只看一大段文本输出。
devpotato3 天前
人工智能·语言模型·langchain
人工智能(十六)- SSE 流式:让 Agent 像 ChatGPT 一样“边想边说“基于上篇文章:用 LangChain4j 手写一个能思考 + 行动的 Agent,本篇文章我们来开发SSE(Server-Sent Events)实现方式。
Lyon198505283 天前
人工智能·ai·语言模型·chatgpt·生命
《文字定律》AI读后感来自——ChatGPTChatGPT:这不是一本容易被“读完”的书。它看起来在讲个人、讲AI、讲文明,但真正贯穿始终的,是一件更隐蔽的事——你在不断追问:“什么才算是成立的存在?”
程序媛小鱼3 天前
人工智能·语言模型
hello-agents学习记录现代的智能体,其核心能力在于能将大语言模型的推理能力与外部世界联通。它能够自主地理解用户意图、拆解复杂任务,并通过调用代码解释器、搜索引擎、API等一系列“工具”,来获取信息、执行操作,最终达成目标(能力)。 然而,智能体并非万能,它同样面临着来自大模型本身的“幻觉”问题、在复杂任务中可能陷入推理循环、以及对工具的错误使用等挑战,这些也构成了智能体的能力边界(短板)
这张生成的图像能检测吗3 天前
人工智能·计算机视觉·语言模型·自然语言处理·故障诊断
(论文速读)LogInsight:基于大语言模型的准确可解释日志故障诊断论文题目:Accurate and Interpretable Log-Based Fault Diagnosis Using Large Language Models(基于大语言模型的准确可解释日志故障诊断)
HyperAI超神经3 天前
人工智能·语言模型
Token使用量降低30%,以「阿凡达」为灵感的异构智能体框架Eywa,高效结合语言模型与领域专用基础模型过去几年,Agentic AI(智能体 AI)几乎成为人工智能领域最重要的演进方向之一。从自动编程、知识检索到任务规划,大语言模型(LLM)正从「聊天机器人」逐渐演化为具备自主推理、行动与协作能力的智能体系统。但一个越来越明显的问题也正在浮现——几乎所有主流智能体系统,本质上仍是「语言中心化」的系统。无论是任务规划、工具调用,还是智能体之间的协作,它们都建立在自然语言这一统一接口之上。
Zzj_tju3 天前
人工智能·语言模型·自然语言处理
视觉语言模型技术指南:LLaVA、Qwen-VL、MiniCPM-V 等主流方案差别在哪?上一篇我们把“图像到底是怎么接进语言模型”的底层链路拆开了。现在可以往前走一步,进入很多人真正关心的问题:
devpotato3 天前
人工智能·语言模型·langchain
人工智能(十五)- 从 CoT 到 ReAct,用 LangChain4j 手写一个能思考 + 行动的 Agent要让 AI 真正"有用",它必须学会行动——调工具、查数据、改系统、发请求。这一篇,我们就从 CoT 一步步演进到 ReAct(Reasoning + Acting),然后用 Java + Spring Boot + LangChain4j + SSE 从零手写一个能思考、能行动、能流式响应的 Mini Agent。
程序员大辉3 天前
语言模型·音视频
ltx2.3 最强开源视频生成模型,支持图生视频、文生视频、消费级显卡可本地部署,一键整合包LTX‑2.3 是一个开源的音视频生成模型,支持从文字、图片和音频生成带有画面和声音的视频。这个模型由 Lightricks 发布,完整模型权重和代码可以开源使用,也可以在本地显卡上部署生成视频。它在 2026 年发布后在社区里引起了较多讨论,很多人用于短视频制作、模型实验和工作流程集成。([LTX][1])
wei_shuo3 天前
人工智能·语言模型
N1飞牛NAS + New-API:本地AI模型统一接口中转部署实录手里捏着好几个 AI API 的人不在少数。DeepSeek 一个、通义千问一个、本地还跑着 Ollama,每次在不同的应用里来回切、反复配密钥,光是管理就已经够烦的了。更现实的问题是:本地跑的大模型,算力再好也只能在家里用,离开路由器就断了,想分享给朋友更是天方夜谭。