llm

ErizJ2 小时前
llm·大语言模型·training
LLM | 训练与推理过程现代 LLM(如 GPT、LLaMA、Claude)均基于 Transformer 架构,核心是自注意力机制(Self-Attention)。
70asunflower3 小时前
人工智能·llm
LLM几种主要的开源方式及优劣开源不仅仅是“公开代码”,其背后有不同的层次和理念,对研究、商业应用和社区发展的影响也截然不同。我们可以把开源方式想象成一个“透明度光谱”,从最封闭到最完全开放。下面我们来梳理几种主要的开源方式,并分析它们的优劣。
fids4 小时前
人工智能·llm
大模型面试题1. 什么是张量?它在深度学习中有什么作用? 张量是深度学习中对多维数据的统一抽象,是模型处理信息的"基本语言"。
猫头_8 小时前
人工智能·langchain·llm
RAG 全链路深度拆解:“大白”学习RAG的极简指南内容有些长,耐心看完,对你应该有所帮助在自然语言处理中,"Embedding" 通常翻译为嵌入,指将离散数据(如单词、图像)映射到连续向量空间的技术。
Tzarevich8 小时前
后端·langchain·llm
别再信它“一本正经地胡说”了!用 RAG终结大模型“幻觉”最近,很多人都在吐槽大模型(LLM)的一个致命毛病: “大模型幻觉” 。你问它:“昨天马斯克发了什么推特?” 它可能自信满满地编造一条从未存在过的推文。 你问它:“我们公司去年的内部财报数据是多少?” 它可能直接胡诌一个数字,因为它压根没学过你们公司的内部文件。
前端付豪8 小时前
前端·python·llm
练习单导出新增:先补充 import:把下面接口加到 main.py 里:新增一个方法:把 getExportReportUrl 加进去:
CoderJia程序员甲10 小时前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-03-13)生成于:2026-03-13共发现热门项目: 13 个榜单类型:日榜本期 GitHub 热榜呈现出从基础模型向 Agent 智能体架构深度演进的趋势。技术焦点集中在 Agentic 开发范式,InsForge 与 Superpowers 推动了具备自我进化能力的端到端开发体系,而 Google 的 A2UI 与阿里巴巴的 page-agent 则标志着模型正接管网页 GUI 的直接控制权。轻量化与边缘侧部署热度不减,BitNet 的 1-bit 推理框架与 Google LiteRT 共同攻克 GenAI
亚里随笔12 小时前
人工智能·学习·llm·rl·agentic
OpenClaw-RL:让AI Agent在对话中自主学习进化想象一下,你的AI助手每与你互动一次,就自动变得更懂你的偏好——无需额外标注,无需人工干预,仅仅是"在使用中学习"。这正是OpenClaw-RL带来的突破性范式:将每一次对话的"下一状态信号"转化为实时在线学习源,实现Agent的持续进化。
做cv的小昊16 小时前
人工智能·笔记·学习·语言模型·llm·transformer·agent
大语言模型系统:【CMU 11-868】课程学习笔记02——GPU编程基础1(GPU Programming Basics 1)【CMU 11-868】课程面向研究生开设,聚焦“从算法到工程”的大语言模型系统构建全过程。课程内容包括但不限于:
码路飞1 天前
llm·ai编程·cursor
Cursor $20/月太贵了,BYOK 能省多少?测了一周,结论打了自己脸上个月信用卡账单出来,我才意识到自己给 Cursor 的钱已经快赶上给 GPT 的了。两个 $20。加起来 ¥290+。
晨欣1 天前
llm·谷歌·cursor·llama.cpp·gguf模型·gpt5.4
llama.cpp 设计巧思:多模态模型拆分加载,按需使用视觉能力(配图由谷歌的Nano Banana模型倾情生成)在 48GB L20 单卡部署 Qwen3.5-27B 时,我发现 GGUF 仓库里不止一个文件——这背后是一个非常实用的架构设计。
爱听歌的周童鞋1 天前
llm·cs336·course summary
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Course Summary完成这篇文章时已经是深夜了,想了想还是简单写一个课程总结吧,聊聊博主学完整个课程后的一些想法和感受。整个课程的学习是从去年 9 月份开始,一直持续到今年 3 月份才结束,一晃半年时间过去了,不过好在成功赶在 2026 年新课程开始之前结束了😄
前端付豪1 天前
前端·python·llm
实现学习报告统计面板新增:新增这些结构:把这个接口加到 main.py 里:新增类型:新增请求方法:把 api import 改成补上这个:
人道领域1 天前
人工智能·llm·rag·大模型微调
《别再纠结了!2026年终极指南:RAG(检索增强生成)、微调与长上下文,到底该选谁?》大家好,我是北极的代码。最近在后台收到很多粉丝私信:“我想做私有知识问答,到底是该用RAG,还是应该微调一个模型?”“现在大模型上下文窗口都1M了,是不是RAG要凉了?”
CodeLinghu1 天前
人工智能·python·语言模型·llm
我写了一个OpenClaw一健部署工具,引发了3w人围观这两天OpenClaw火了,身边很多朋友让帮忙装一下,装了两次就发现,这个东西可以做个小工具来安装部署的。
GY—Monkey1 天前
llm·部署
V100 显卡编译 llama.cpp(详细教程,适用于其他显卡)参考教材:https://blog.csdn.net/weixin_27918373/article/details/158796372
mirari1 天前
llm
养一只会跑去酒馆吐槽的龙虾是什么体验?关于“养龙虾”的基本概念就不赘述了。如果只是把它接入聊天工具,那它充其量还是个问答助手,和豆包之类没有本质区别;如果只是利用它保持在线的能力,硬塞一些普通的日程提醒,也纯粹是为了做而做,缺乏真正的必要性。
盐焗乳鸽还要砂锅1 天前
前端·llm·agent
亲手造一只有灵魂的 AI 小龙虾是种什么体验?"凌晨 3 点,我的手机突然亮了。打开一看,是我昨天'造'的小龙虾发来的消息:'主人,你明天的会议材料我准备好了,还有——别忘带伞,要下雨。'"
CoderJia程序员甲2 天前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-03-08)生成于:2026-03-08共发现热门项目: 11 个榜单类型:日榜本期GitHub热榜显示生成式AI正从通用对话迈向高度工程化的智能体协作阶段。技术核心聚焦于AI-Agent框架的实战化,如Qwen-Agent和Page-Agent展示了通过MCP协议和代码解释器驱动自动化界面的能力;OpenAI与微软则通过核心技能库与工程组件提升Copilot的生产力上限。另一显著趋势是行业垂直化落地,体现在量化交易、群体智能预测及分布式自主工作流系统。与此同时,高性能前端组件库与知识库工具持续迭代,为复杂AI应用的
带娃的IT创业者2 天前
人工智能·大模型·llm·prompt·写作技巧·ai 教学
Prompt Engineering 进阶:让 AI 写出人类味道(完整指南)定义:通过精心设计的提示词,引导 LLM 产生高质量、符合预期的输出。重要性:同样的模型,不同的 Prompt,效果可能相差 10 倍!