算法面试题_字节

BigWig杰克爱2024-07-12 17:38

问题一：Transfomer矩阵维度分析及MultiHead详解：

细致链接1
细致链接2

问题二：transformer的结构，流程，维度变换，encoder，decoder：

多头维度怎么变化：先在q，k，v的输入端就进行处理，让他们的维度为 embedding_size /nums_head。最后在注意力层的最后拼接。这就是原因：head的数量需被embedding_size整除

注意力：通过Q和K计算得到注意力权重，然后在作用于V得到整个权重和输出
细致链接

问题三：p-tuning，lora，adapter 的细致算法：

p-tuning

lora

adapter

问题四：评测框架的任务有哪些？cblue

问题五：训了哪些模型，dataset的问题

问题六：cv，deepsortv3，yolo的发展史，yolo的backbone

问题七：dataloader和dataset的区别：

ⅰ. dataset就是传统的类，用户根据特点的需求设定特定的类。

https://huggingface.co/docs/datasets/loading

ⅱ. dataloader则接受dataset定义的类进行分批次，分batch以方便后续的训练，推理等操作。

ⅲ. Dataset检索我们的数据集的特征并一次标记一个样本。dataloader在训练模型时，我们通常希望以"小批量"方式传递样本，在每个时期重新整理数据以减少模型过度拟合；这个有个shuffle决定是否在每个epoch之间打乱每个batch。

上一篇：软件测试——AI快速入门

下一篇：MySql性能调优02-[索引优化]

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 03国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 09AI科技热点日报 | 2026年07月01日 102026 年 AI 大模型 & AI 编程工具实战全总结