AI机考-Transformers

Ref

  1. SelfAttention

概述

主要是Deep-ML中基于Transformer场景的一些题目

SelfAttention

基于numpy

py 复制代码
import numpy as np

def self_attention(Q, K, V):
	scores = Q @ K.T
	d_k = Q.shape[-1]
	scaled_scores = scores / np.sqrt(d_k)
	exp_scores = np.exp(scaled_scores - np.max(scaled_scores, axis=-1, keepdims=True))
	atten_weights = exp_scores / np.sum(exp_scores, axis=-1, keepdims=True)
	atten_out = atten_weights @ V
    
	return atten_out

def compute_qkv(X, W_q, W_k, W_v):
	Q = X @ W_q
	K = X @ W_k
	V = X @ W_v
	return Q, K, V
相关推荐
罗西的思考17 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab18 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab18 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸19 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云19 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny86520 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔20 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能
smallyoung20 小时前
AgenticRAG:智能体驱动的检索增强生成
人工智能
_skyming_20 小时前
OpenCode 如何做到结果不做自动质量评估,为什么结果还不错?
人工智能
南山安21 小时前
手写 Cursor 核心原理:从 Node.js 进程到智能 Agent
人工智能·agent·设计