拆解 LLM 底层逻辑 (二):从预训练到 RLHF 的炼丹之路

我们拿到手的 ChatGPT 或 Claude,是一个举止得体、对答如流的“AI 助理”。但在它成为助理之前,它只是一个贪婪吞噬了全人类互联网文本的狂暴巨兽(Base Model)。

April 15, 2026 · 3 min · 1357 words · 丹丹