64 注意力机制 | 65 注意力分数【动手学深度学习v2】

发布时间:2024年01月06日

64 注意力机制

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

总结

在这里插入图片描述

65 注意力分数【动手学深度学习v2】

在这里插入图片描述

关键 是 a()如何设计?

在这里插入图片描述
加性:qkv向量长度可以不一样
在这里插入图片描述
在这里插入图片描述

总结

在这里插入图片描述

代码

在这里插入图片描述
在这里插入图片描述
更加精细的mask控制
在这里插入图片描述

加性注意力,还是看书吧 有解释

比较复杂,是因为要做成向量版本!
在这里插入图片描述
在这里插入图片描述

可视化这个图,看哪一帧比较重要?!

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

文章来源:https://blog.csdn.net/weixin_43154149/article/details/135424712
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。