大模型

Tadas-Gao8 小时前
人工智能·语言模型·自然语言处理·架构·大模型·llm·transformer
Mem0分层记忆系统:大语言模型长期记忆的架构革命与实现范式当前的主流大语言模型(如GPT系列、LLaMA等)虽然在单轮对话中表现出色,但在处理多轮、长程对话任务时,面临严重的记忆衰减和上下文长度限制问题。传统的做法是将整个对话历史作为上下文输入,但这会带来几个关键问题:
山顶夕景11 小时前
大模型·llm·cot·vlm·视觉模型
【VLM】HopChain视觉语言推理多跳数据合成框架这篇论文提出了HopChain,一个可扩展的框架,用于合成多跳视觉语言推理数据,以改进VLMs的可验证奖励强化学习(RLVR)训练。具体来说:
千桐科技14 小时前
人工智能·大模型·llm·知识图谱·大模型幻觉·qknow·行业深度ai应用
大模型幻觉难解?2026深度解析:知识图谱如何成为LLM落地的“刚需”与高薪新赛道导读:在大模型(LLM)席卷全球的今天,很多开发者都在问:“知识图谱(KG)还有前景吗?”、“现在入局会不会是49年入国军?”。本文带你穿透迷雾,看清知识图谱从“低迷”到“复兴”的真相,并揭秘未来5年最稀缺的复合型岗位。
CoderJia程序员甲17 小时前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-03-22)生成于:2026-03-22共发现热门项目: 9 个榜单类型:日榜本期 GitHub 热榜呈现出 AI 应用深度集成与系统级安全治理并行的趋势。技术热点聚焦于 AI 工程化落地,如 opendataloader-pdf 解决非结构化数据清洗难题,claude-hud 提升 Agent 开发透明度,vllm-omni 则优化了全模态模型推理效率。同时,MoneyPrinterV2 代表的内容自动化工具持续火热。在基础设施领域,trivy 和 systemd 展现了开发者对容器安全与系统管理的持久关注。项目普
一 铭19 小时前
人工智能·大模型
Agent设计方式-工具调用:从自然语言到工具调用的桥梁在智能体(Agent)的开发范式中,自然语言是用户与系统交互的核心接口。本文深入探讨了 12-Factor Agents 中的第一项原则:如何高效地将自然语言转化为结构化的工具调用(Tool Calls)。这不仅是提升智能体能力的关键,更是确保系统在生产环境中具备可预测性和安全性的基石。
xiaoxue..21 小时前
人工智能·ai·大模型
大模型全栈技术图谱:LLM → Token → Context → Prompt → Tool → MCP → Agent → Skill如果你最近被各种大模型名词轰炸得晕头转向——今天听说GPT-4o又进化了,明天看到Claude在写代码,后天又冒出个Agent要取代程序员——别慌。其实,剥去那些高大上的外衣,大模型的世界并没有那么神秘。
Shining059621 小时前
人工智能·算法·stable diffusion·大模型·图像生成·ai编译器·infinitensor
AI 编译器系列(六)《Stable Diffusion 在 InfiniTensor 推理框架中的适配与工程实践》目录Stable Diffusion 介绍Stable Diffusion 概述扩散模型概念Stable Diffusion 架构
庞轩px21 小时前
人工智能·大模型·笔试·ai编程·ai coding
2小时完成大模型推理网关:一次AI Coding实战记录在蚂蚁集团2026春季校园招聘的AI Coding笔试中,我用2小时完成了一个面向大模型推理场景的HTTP网关。这篇文章记录了我的设计思路、技术实现和AI协作体会。
星辰_mya1 天前
大模型·ai编程
一封AI的介绍信开始上难度了朋友,这篇老师给了三天时间,本来我以为是四天时间,留到了现在,开始框框赶进度,这习惯确实不好,也没人来帮忙一起写作业 😂;现在才写了一半太难受了~~~
twc8291 天前
大模型·llm
大模型基础概念(简要版)AI 的演进路径是:机器学习(ML)→ 深度学习(DL)→ 大语言模型(LLM)。深度学习包含两类模型:
xixixi777771 天前
大数据·人工智能·安全·ai·大模型·通信
2026 年 03 月 20 日 AI+通信+安全行业日报(来更新啦)
汤姆yu1 天前
大模型·openclaw·企业落地方案
OpenClaw企业级落地方案在企业数字化转型向深度智能化进阶的当下,传统流程自动化工具存在部署成本高、数据安全合规性不足、跨系统协同能力弱、定制化适配难度大、运维复杂度高等核心痛点,成为制约企业效率提升与数字化升级的关键瓶颈。一方面,多数企业内部ERP、POS、财务、会员、运维、办公OA等系统相互割裂,数据孤岛问题突出,人工处理重复流程、跨系统数据调取、常规运维值守等工作占比过高,不仅人力成本居高不下,还容易出现操作失误、响应滞后、决策数据支撑不足等问题;另一方面,市面上多数智能自动化方案采用公有云部署模式,无法满足金融、政务、高端
楚国的小隐士2 天前
ai·大模型·编程·ai编程·哲学·氛围编程·辩证唯物主义·马列主义·唯物论
“你用AI,那我也会用AI,我还要你干什么?”当我敏锐地察觉到AI可以提高工作效率之后,我就对AI展开了一系列的思考。比如思考AI会不会让人的思维能力退化的《努比亚M153和DeepSeek-Math-V2发布后,我对AI的思考》、思考AI时代下应试教育还有没有必要存在的《计算机应届生想成为人才,就不要去力扣刷题(文章合集)》、AI是不是先进生产力,以及为什么AI导致了失业的《程序员发明了AI,为何反被AI革了命?》。我个人非常推荐看最后一篇文章,这是最AI最根本的思辨,算是从根上论证了支持AI发展的正当性、合理性。根据这篇文章的逻辑,可以推导出以下
大龄码农有梦想2 天前
人工智能·大模型·智能体·大模型应用·spring ai·claude skills
Spring AI Alibaba Skills与 Claude Skills 深度对比分析:概念、机制与应用场景在大模型应用开发与智能体(Agent)落地过程中,Skills 作为封装任务逻辑、规范执行流程的核心单元,被广泛应用于不同生态体系中。Spring AI Alibaba Skills 与 Claude Skills 虽同名且核心设计思想同源,但因所属生态定位、运行环境及目标用户不同,在概念定义、运行机制与应用场景上存在显著差异。本文将从这三个核心维度展开对比分析,结合官方文档与实战逻辑,为开发者选择适配的技能方案提供参考。
twc8292 天前
人工智能·大模型·llm·提示词工程
写好提示词在大模型时代,测试开发工程师想要利用大模型技术,主要有四种方案:训练模型、微调模型、RAG和提示词工程。作者用吴恩达老师训练小狗的例子来解释这四种方案的区别,非常形象。
twc8292 天前
大模型·接口测试·rag
RAG加Text2SQL:自动生成接口测试脚本的完整流水线一个完整的接口测试用例由三部分组成:输入参数、测试步骤、预期结果。纯提示词工程可以解决"测试步骤"的生成——把 Controller 层代码输入给大模型,让它生成 JMeter 或 pytest 脚本骨架。但输入参数和预期结果依赖被测系统的私域知识(数据库数据、业务约束),大模型无法凭空生成。
何政@2 天前
人工智能·python·ai·大模型·love l
通过python 快速完成ai 构建前言人工智能的落地应用离不开技术的实际开发,Python 作为 AI 领域的主流开发语言,凭借简洁的语法和丰富的生态,成为了 AI 应用开发的首选。本文将从 AI 基础概念入手,逐步讲解大模型部署、调用、提示词工程,并通过AI 智能伴侣实战项目,完整演示如何用 Python 构建一个可交互、带会话记忆、支持会话管理的 AI 应用,同时补充核心开发知识点,让零基础也能快速上手 AI 应用开发。
小马过河R2 天前
人工智能·macos·大模型·nlp·agent·openclaw·龙虾
小白沉浸式本地Mac小龙虾OpenClaw部署安装教程3月5日公网已超22万OpenClaw部署实例,一发不可收拾。3月6日‌,腾讯在‌深圳腾讯大厦楼下‌举办过一次临时装机活动,引发近千人排队,之后国内兴起龙虾提供商大战。 早在2月份小龙虾开始火爆,小马曾经写过一篇《初探来会会OpenClaw这只龙虾》,简单阐述了小龙虾是什么以及如何安装。有小伙伴觉得过于简陋了,那行,安排!今天就来沉浸式体验下本地Mac小龙虾OpenClaw的部署安装。
竹之却2 天前
服务器·大模型·国内外主流大模型·openclaw·云养虾
国内外主流大模型全面解析(2026版)OpenClaw(大龙虾) 系列教程 安装教程接入QQ-Bot + Feishu(飞书)切换其他大模型
twc8292 天前
软件测试·大模型·mcp
MCP赋能测试:Tools、Resources、Prompts三种能力的开发与应用MCP 让大模型从"只会聊天"变成"能动手干活"。在测试场景中,这意味着大模型可以直接调用测试管理系统、缺陷管理系统、需求管理系统的接口,访问沉淀在这些系统中的测试资产,而不是每次都从零开始生成内容。