技术栈

tokenization

格桑阿sir
18 天前
ai·大模型·llm·agent·token·智能体·tokenization
04-大模型智能体开发工程师:Tokenization与模型推理流程系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文详解Tokenization(BPE/WordPiece/Unigram三种主流方法)及其对模型"字数限制"、"数错字"和成本的实际影响,并逐步拆解从用户输入到模型输出的完整推理流程(Tokenization→特殊Token→Embedding→位置编码→Transformer层→采样→自回归→Detokenization),涵盖采样参数(Temperature/Top-p/Top-k)和KV Cache加速原理,附OpenAI API实战
IMdandelion
10 个月前
wordpiece·tokenization·bbpe
子词分词器(Byte Pair Encoding + WordPiece)参考文章:子词分词器BPE和WordPiece理解_wordpeice-CSDN博客子词分词器BPE和WordPiece理解_wordpeice-CSDN博客
我是有底线的