如何更高效地使用 ChatGPT 与 Claude:从提示词到任务设计

多数用户并不是不会使用大模型,而是仍在沿用搜索引擎式提问方式。要让 ChatGPT 与 Claude 输出稳定、可用、接近生产级的内容,关键在于任务定义、约束条件与示例设计。

April 15, 2026 · 3 min · 1436 words · 丹丹

拆解 LLM 底层逻辑(一):Transformer 与自注意力机制如何工作

大多数现代大语言模型都建立在 Transformer 架构之上。理解自注意力机制、位置编码和多头注意力,是理解 LLM 为什么能处理长上下文、建立语义关联和进行复杂生成的基础。

April 15, 2026 · 3 min · 1450 words · 丹丹

拆解 LLM 底层逻辑(二):从预训练到 RLHF,大模型如何被塑造

用户看到的 ChatGPT 或 Claude,往往表现为一个可以对话、解释和执行任务的助手。但在成为助手之前,它首先是一个通过海量语料进行预训练的基础模型,随后再经过监督微调与人类反馈强化学习被塑造成今天的产品形态。

April 15, 2026 · 4 min · 1760 words · 丹丹