Transformer 原理详解
本视频是对论文 Attention is all you need 的导读与NLP领域经典模型 Transformer 的详解,通过介绍传统Seq2Seq 模型及 Attention ,引入 Transformer 模型,并对其架构进行宏观微观的解读,然后详细介绍Transformer每一步的工作流程,最后给出 Transformer 在训练阶段的细节提要,以及推理阶段的解码策略等内容。
PPT 链接🔗 https://pan.quark.cn/s/db3f598406dd,欢迎大家一键三连哦~