セルフアテンションの公式の素晴らしいシンプルな視覚化。これは、私にとってLLMについて深く理解するのが最も難しいことの1つでした。 公式は簡単そうです。すぐに覚えることもできる。しかし、Q、K、V が何を表し、相互作用しているのかを実際に直感を得るのは難しいです。