AI机考-Transformers

Ref

  1. SelfAttention

概述

主要是Deep-ML中基于Transformer场景的一些题目

SelfAttention

基于numpy

py 复制代码
import numpy as np

def self_attention(Q, K, V):
	scores = Q @ K.T
	d_k = Q.shape[-1]
	scaled_scores = scores / np.sqrt(d_k)
	exp_scores = np.exp(scaled_scores - np.max(scaled_scores, axis=-1, keepdims=True))
	atten_weights = exp_scores / np.sum(exp_scores, axis=-1, keepdims=True)
	atten_out = atten_weights @ V
    
	return atten_out

def compute_qkv(X, W_q, W_k, W_v):
	Q = X @ W_q
	K = X @ W_k
	V = X @ W_v
	return Q, K, V
相关推荐
古城小栈17 分钟前
雾计算架构:边缘-云端协同的分布式 AI 推理
人工智能·分布式·架构
JoannaJuanCV17 分钟前
自动驾驶—CARLA仿真(7)vehicle_physics demo
人工智能·机器学习·自动驾驶
Allen正心正念202524 分钟前
AWS专家Greg Coquillo提出的 6种LLM ORCHESTRATION PATTERNS解析
人工智能·架构
每日学点SEO25 分钟前
「网站新页面冲进前10名成功率下降69%」:2025 年SEO竞争格局分析
大数据·数据库·人工智能·搜索引擎·chatgpt
HalvmånEver33 分钟前
AI 工具实战测评:从技术性能到场景落地的全方位解析
人工智能·ai
碧海银沙音频科技研究院42 分钟前
论文写作word插入公式显示灰色解决办法
人工智能·深度学习·算法
O561 6O623O7 安徽正华露1 小时前
露,AI人工智能Barnes迷宫 AI人工智能自动记录水迷宫
人工智能
十铭忘1 小时前
SAM2跟踪的理解6——mask decoder
人工智能·计算机视觉
不会计算机的g_c__b1 小时前
AI Agent 三大核心组件解析:规划、记忆与工具使用,构建真正智能体
人工智能
听风吹等浪起1 小时前
机器学习算法:随机梯度下降算法
人工智能·深度学习·算法·机器学习