拆解 LLM 底层逻辑 (一):自注意力机制与 Transformer 的暴力美学

一切现代大语言模型(LLM)的基石,都是 2017 年 Google 提出的 Transformer 架构。这篇文章我们将抛开晦涩的学术论文,从底层逻辑剖析大模型是如何“理解”上下文的。

April 15, 2026 · 3 min · 1250 words · 丹丹