AI机考-Transformers

Ref

  1. SelfAttention

概述

主要是Deep-ML中基于Transformer场景的一些题目

SelfAttention

基于numpy

py 复制代码
import numpy as np

def self_attention(Q, K, V):
	scores = Q @ K.T
	d_k = Q.shape[-1]
	scaled_scores = scores / np.sqrt(d_k)
	exp_scores = np.exp(scaled_scores - np.max(scaled_scores, axis=-1, keepdims=True))
	atten_weights = exp_scores / np.sum(exp_scores, axis=-1, keepdims=True)
	atten_out = atten_weights @ V
    
	return atten_out

def compute_qkv(X, W_q, W_k, W_v):
	Q = X @ W_q
	K = X @ W_k
	V = X @ W_v
	return Q, K, V
相关推荐
zuozewei1 分钟前
7D-AI系列:DeepSeek Engram 架构代码分析
人工智能·架构
love530love4 分钟前
技术复盘:llama-cpp-python CUDA 编译实战 (Windows)
人工智能·windows·python·llama·aitechlab·cpp-python·cuda版本
Katecat996639 分钟前
基于YOLO11-HAFB-1的五种羊品种分类识别系统详解
人工智能·数据挖掘
旧日之血_Hayter9 分钟前
Java线程池实战:高效并发编程技巧
人工智能
hit56实验室20 分钟前
【易经系列】《屯卦》六二:屯如邅如,乘马班如,匪寇,婚媾。女子贞不字,十年乃字。
人工智能
丝斯201143 分钟前
AI学习笔记整理(67)——大模型的Benchmark(基准测试)
人工智能·笔记·学习
咚咚王者1 小时前
人工智能之核心技术 深度学习 第七章 扩散模型(Diffusion Models)
人工智能·深度学习
github.com/starRTC1 小时前
Claude Code中英文系列教程25:非交互式运行 Claude Code
人工智能·ai编程
逄逄不是胖胖1 小时前
《动手学深度学习》-60translate实现
人工智能·python·深度学习
loui robot1 小时前
规划与控制之局部路径规划算法local_planner
人工智能·算法·自动驾驶