前言:基于TRANSFORMER的结构在视觉领域是承上启下的作用。刚接触会比较难,上的话需要对RNN,LSTM,ATTENTION先有初步的了解。下的话需要学习VIT,GPT,DETR等结构先了解TRANSFORMER都是必要的。
?
???参考:Transformer结构详解 - 知乎
Transformer论文逐段精读【论文精读】_哔哩哔哩_bilibili