llm

海边夕阳20062 小时前
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·llm
【每天一个AI小知识】:什么是大语言模型(LLM)?目录一、小明的论文摘要风波:从故事说起二、大语言模型的基本概念2.1 什么是大语言模型?2.2 大语言模型的特点
bj_zhb2 小时前
python·llm
图片的base64表示以 data:image/ 开头的字符串是一种名为 Data URI(或称 Data URL)的方案。
CoderJia程序员甲3 小时前
git·ai·开源·llm·github
GitHub 热榜项目 - 日榜(2025-12-11)生成于:2025-12-11共发现热门项目: 14 个榜单类型:日榜本期GitHub热榜显示AI编程助手与智能体开发已成绝对主流,多款高星项目聚焦于此。技术热点集中在能自主执行复杂任务的高级AI智能体,例如能自动记录并压缩编程上下文的claude-mem、可执行安装测试的goose,以及开源的Agent开发规范agents.md。同时,面向实践的教育项目如《从零开始构建智能体》和微软的入门教程也异常火爆。这反映出行业正从单纯使用大模型转向构建具备记忆、执行和持续学习能力的可靠AI助手,开发者积极拥抱能解决
AI大模型3 小时前
程序员·llm·agent
【连载】零基础跟我学做AI Agent(第4课:用Autogen开发一个学霸Agent)本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。今天讲第4课,用Microsoft Autogen做一个多角色Agent应用。
AI大模型3 小时前
langchain·llm·agent
【连载】零基础跟我学做AI Agent(第3课:用LangChain开发一个做题Agent)本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。今天讲第3课,用一个做Agent的经典框架——LangChain,开发一个做数学题的Agent。
恋上钢琴的虫4 小时前
llm
【大模型实战篇】利用TensorRT LLM部署及推理大模型实战(bloom560m、chatglm-6b等大模型)摘自:https://blog.csdn.net/weixin_65514978/article/details/143815654
沛沛老爹4 小时前
大模型·llm·安装·helloworld·rag·lightrag·ai入门
LightRAG系列3:LightRAG 环境准备与快速启动图片来源网络,侵权联系删。LightRAG系列文章 ● LightRAG系列1:为什么 Web 开发者需要关注 RAG?
亚里随笔7 小时前
人工智能·语言模型·自然语言处理·llm·rl·agentic
推理语言模型训练策略的协同作用:预训练、中间训练与强化学习的交互机制近年来,强化学习技术在语言模型推理能力提升方面取得了显著进展,但后训练是否真正扩展了模型在预训练期间获得的推理能力仍存在争议。这项研究通过完全可控的实验框架,揭示了预训练、中间训练和强化学习后训练之间的因果贡献关系,为理解推理语言模型训练策略提供了重要基础。
Mintopia8 小时前
人工智能·llm·aigc
🚀 技术并购视角:AIGC领域的 Web 生态整合与资源重组在过去的十年,AIGC (AI Generated Content) 从学术论文里的冷僻缩写,华丽转身为市场的宠儿。 如今,AI 不仅能写(比如我👋),还能画、能唱、能推理、能陪你聊人生。
Baihai_IDP9 小时前
人工智能·面试·llm
压缩而不失智:LLM 量化技术深度解析编者按: 如何在资源受限的设备上高效部署大语言模型,同时还尽可能保持其性能表现?我们今天为大家带来的这篇文章,作者的核心观点是:量化技术通过在模型精度与效率之间寻找最优平衡点,使得大语言模型能够在资源受限的设备上高效部署,而几乎不降低其“智能水平”。
阿正的梦工坊9 小时前
人工智能·算法·语言模型·大模型·llm
R-Zero:从零数据自进化推理大语言模型今天,我想和各位深度学习及RL领域的同行分享一篇最近的arXiv论文:《R-Zero: Self-Evolving Reasoning LLM from Zero Data》(arXiv:2508.05004v2)。这篇工作出自腾讯AI西雅图实验室(Tencent AI Seattle Lab)等团队,核心贡献是一个完全自主的框架,用于训练推理大语言模型(LLM),无需任何预存任务或人类标签。论文代码已开源:GitHub链接。
吴佳浩16 小时前
人工智能·llm
大模型 MoE,你明白了么?最近被T4卡搞得有点抽风就多些一点关于大模型的讲解的。由浅至深的讲个透,愿天下用老旧显卡的人儿都可以远离傻*问题。
ssshooter1 天前
人工智能·算法·llm
小猫都能懂的大模型原理 1 - 深度学习基础本文旨在用简单易懂的语言解释大语言模型的基本原理,不会详细描述和解释其中的复杂数学和算法细节,希望各位小猫能有所收获 🐱
后端研发Marion1 天前
ai·大模型·llm·ai编程·gemini3
【Gemini 3 技术深度解析:架构、性能与生态应用】Google Gemini 3 正式发布:开启“深度思考”与“Vibe Coding”的新纪元 - 知乎
大模型教程1 天前
程序员·llm·agent
保姆级教程:从0手写RAG智能问答系统,接入Qwen大模型|Python实战本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。在大模型落地的众多路径中,RAG(检索增强生成)是几乎“最值得掌握”的一项技术。它将知识库与大模型结合,让模型不仅“知道”,还能“答得准、说得清”。
AI大模型1 天前
程序员·llm·agent
【连载】零基础跟我学做AI Agent(第2课:用CrewAI配置一个软件虚拟团队)本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。今天我们讲第一个AI Agent例子:用CrewAI配置一个软件虚拟团队。实际上,这个需要有69行代码,那为什么不叫开发而叫配置呢?因为代码中几乎没有程序化的内容,基本上就是配置信息。
大模型教程1 天前
程序员·llm·agent
AI Agent开发入门:5 个关键步骤,帮你打通落地链路本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。在实践中,AI Agent的开发需要以“感知-决策-行动”的核心逻辑,根据技术架构和场景需求,分五步进行:
AI大模型1 天前
程序员·llm·agent
【连载】零基础跟我学做AI Agent(第1课:环境安装)本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。从今天开始,作者介绍一系列AI Agent(智能体)的开发或部署。需要的基础只是要对Python有个大概的了解,几乎是从0开始实践。涉及到的代码都会比较简单,一般不会超过50行。
刘立军1 天前
后端·llm
本地大模型编程实战(38)实现一个通用的大模型客户端由于大部分AI平台提供的API/接口都兼容 OpenAI API ,所以我们可以使用 OpenAI SDK 实现通用的 LLM(大语言模型) 客户端。
16324015411 天前
llm
回顾-Mistral [1]-->“ 一句话概括论文核心+技术亮点总结”备注:回顾看过的论文,对目前看过的Mistral系列进行整理在此总结。(注:笔者水平有限,若有描述不当之处,欢迎大家留言。后期会继续更新LLM系列,文生图系列,VLM系列,agent系列等。如果看完有收获,可以【点赞】【收藏】【加粉】)