LLM | GNEWS

如何更高效地使用 ChatGPT 与 Claude：从提示词到任务设计

多数用户并不是不会使用大模型，而是仍在沿用搜索引擎式提问方式。要让 ChatGPT 与 Claude 输出稳定、可用、接近生产级的内容，关键在于任务定义、约束条件与示例设计。

大多数现代大语言模型都建立在 Transformer 架构之上。理解自注意力机制、位置编码和多头注意力，是理解 LLM 为什么能处理长上下文、建立语义关联和进行复杂生成的基础。

用户看到的 ChatGPT 或 Claude，往往表现为一个可以对话、解释和执行任务的助手。但在成为助手之前，它首先是一个通过海量语料进行预训练的基础模型，随后再经过监督微调与人类反馈强化学习被塑造成今天的产品形态。