技术栈
llm
自动驾驶小学生
2 小时前
人工智能
·
深度学习
·
llm
·
transformer
Transformer和LLM前沿内容(1):Transformer and LLM(注定成为经典)
视频链接:bilibi本系列将会介绍Transformer基础知识和Large Language Model前沿内容,今天记录的内容来自于MIT Song Han老师课程内容。
AI大模型
3 小时前
程序员
·
llm
·
agent
5本值得精读的AI实战书籍,助你从入门到精通大模型工程(附链接)
本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。在 AI 技术日新月异的今天,光靠博客和教程已远远不够。系统性学习,才是构建扎实工程能力的关键。
骚戴
3 小时前
人工智能
·
大模型
·
llm
·
api
·
ai gateway
架构视角:Gemini 3.0 Pro 原生多模态能力的边界与工程落地
Abstract: 随着 Model-as-a-Service (MaaS) 的普及,如何在受限网络环境下构建高可靠的 GenAI 应用成为工程挑战。本文将分析 Gemini 3.0 Pro 的 Native Multimodal 架构特性,并探讨基于 n1n.ai 聚合网关(Aggregation Gateway)的跨区域调用方案。
Mintopia
4 小时前
人工智能
·
llm
·
aigc
🤖 AIGC技术对Web行业就业结构的影响:替代与新增岗位分析
在过去,我们聊Web开发就像聊种田——HTML是耕地,CSS是装饰,JavaScript是那台永不停歇的拖拉机。 但如今,AIGC(AI Generated Content,人工智能生成内容)横空出世,把拖拉机换成了自动农场系统: 它不仅帮你种,还能预测哪块地明年长得更好。🌾
CoderJia程序员甲
5 小时前
ai
·
llm
·
github
GitHub 热榜项目 - 日榜(2025-12-14)
生成于:2025-12-14共发现热门项目: 15 个榜单类型:日榜本期GitHub趋势显示AI智能体开发工具成为绝对主流,实用型AI应用正从概念走向落地。CopilotKit、Dify和sim等项目聚焦于为AI助手与聊天机器人提供开箱即用的基础设施和可视化工作流构建平台,显著降低开发门槛。同时,智能编码助手的功能持续深化,claude-mem通过自动记录和压缩编程会话来优化上下文管理,而AGENTS.md则试图为编码智能体建立通用指引标准。此外,Next-ai-draw-io将AI与绘图工具结合,WeK
小霖家的混江龙
6 小时前
人工智能
·
python
·
llm
大模型如何分辨 “狼” 和 “狗” —— 词向量的训练过程
你有没有想过, 大模型世界里只有数字, 它是怎么知道 “狼” 和 “狗” 差异明显, “狗” 和 “犬” 意思相近的呢?
程序员老奥
16 小时前
lora
·
llm
·
fine-tuning
·
大模型微调
【有手就行】LoRA:用你自己的数据来微调大模型,让大模型真正懂你
上上周的周末无事在家,然后写了一篇《【有手就行】自己花20分钟从0开始训练一个“大模型”》,结果发现这两个星期涨了几十个关注,比我前面写了几个月文章得到的关注还多,看来这种浅显易懂的、入门级的技术文章相对来说会有更多人爱看一些。 既然如此,我再把早先在做OddAgent时候,微调语音助手功能的流程也简单理一下,然后放出来给大家做一个参考吧。
Mintopia
19 小时前
人工智能
·
llm
·
trae
⚙️ WebAssembly在AIGC推理中的优化细节
在浏览器中做AI推理看起来像“拿手电筒照太阳”—— JavaScript解释慢、内存不可控、类型不稳定、缺乏SIMD并行。
AI大模型
1 天前
程序员
·
llm
·
agent
小白必看!大模型入门指南
本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。01 什么是大模型?大模型,英文名为 Large Model,即大型模型,早期也被称为 Foundation Model(基础模型)。它是一个简称,完整表述是“人工智能预训练大模型”,其中“预训练”是一项关键技术,后续再做详细阐释。
TGITCIC
2 天前
llm
·
rag
·
ai agent
·
ai智能体
·
ai产品
·
大模型ai
·
rag增强检索
RAG中的语义理解与语义检索:别再混为一谈
近年来,RAG(Retrieval-Augmented Generation)架构已成为大模型落地应用的主流范式之一。它通过将外部知识库引入生成过程,有效缓解了模型幻觉、知识滞后等问题。然而,在实际构建和优化RAG系统时,许多开发者对其中两个核心概念——“语义理解”与“语义检索”——的理解仍显模糊。有人将二者等同,认为只要用了向量数据库就等于实现了语义能力;也有人误以为语义检索的结果质量完全取决于嵌入模型,而忽视了前端理解环节的关键作用。这种混淆直接导致系统设计偏差:要么过度依赖检索而忽略提示工程,要么在
坐吃山猪
2 天前
python
·
llm
·
playwright
·
browser-use
BrowserUse11-源码-LLM模块
LLM 模块的核心设计理念是通过抽象接口统一不同厂商的大语言模型调用方式。这种设计使得上层应用可以无缝切换不同的模型提供商,而无需修改业务逻辑。
AI大模型
2 天前
程序员
·
llm
·
agent
一篇图文彻底搞懂什么是AI Agent
本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。AI Agent也叫Agent,是开发复杂大模型应用场景中非常重要的概念,但是很多人并不清楚Agent是什么?它是如何运作的?本文用图文的形式彻底搞懂这两个问题。
云雾J视界
2 天前
llm
·
aiops
·
工具链
·
cld
·
心智模式
·
边界重构
AIOps失效?用“思考的魔方®“破解运维复杂性的三重维度
在微服务、云原生、AI大模型叠加的当代技术栈中,系统的动态性、关联性和涌现性已远超人类直觉的边界。告警不再是孤立的信号,而是系统结构发出的"人声";故障不再是偶发的事件,而是因果回路累积的"显影"。本文将揭示:AIOps的失效,本质是思维框架的失效。通过一套三维思考支架,我们将系统思考的底层逻辑注入智能运维实践,让工具回归工具,让思维驾驭复杂。
AI大模型学徒
2 天前
人工智能
·
chatgpt
·
大模型
·
llm
·
知识库
·
deepseek
大模型应用开发(十五)_知识库1
总结:大模型强在生成和语言理解,但弱在真实感知、因果推理、知识准确性和资源效率。“如何给大模型喂知识”,通常涉及 知识增强(Knowledge Injection/Integration) 的方法。不同场景下有不同手段,可以大致分为 训练时注入 和 推理时补充 两类:
flying_1314
2 天前
llm
·
对比学习
·
多模态大模型
·
icl
·
notellm
·
micl
·
late fusion
推荐大模型系列-NoteLLM-2: Multimodal Large Representation Models for Recommendation(二)
目录一、方法论模板说明视觉笔记表示多模态笔记表示后期融合关键点编辑二、实验2.1 性能评估2.2 增强型MLRM的显著性分数分析
flying_1314
2 天前
llm
·
推荐系统
·
多模态大模型
·
mllms
·
mlrms
·
端到端训练
·
生成式大模型
推荐大模型系列-NoteLLM-2: Multimodal Large Representation Models for Recommendation(三)
目录一、训练细节二、端到端MLRM细节三、Qwen-VL-Chat的显著性分数分析传统MLLMs与MLRMs的适配问题
302AI
2 天前
llm
·
chatglm (智谱)
GLM-4.6V 实测:当视觉模型学会“动手”,它离“顶尖”还差什么?
智谱 AI 于 12 月 8 日正式开源了其新一代多模态模型 GLM-4.6V 系列,包含面向高性能场景的 106B 版本与轻量本地部署的 9B Flash 版。此次升级不仅将训练上下文窗口一举推至 128K tokens,更在模型架构中做了一个关键变革:让工具调用(Function Call)成为视觉模型的原生能力。这意味着,模型不再止步于识别图像,而是能自主调用工具、处理结果并持续执行——从看清世界到动手完成的路径被首次彻底打通。
小鱼小鱼.oO
2 天前
llm
·
框架
4 大主流思考框架:CoT、ReAct 、Plan-Act 与 Plan-and-Execute
思维链(Chain of Thought,CoT)是提升大语言模型(LLM)处理复杂推理任务的核心技术。