LLM 工作原理: Prompt Engineering 解析

大语言模型本质是概率引擎,通过 Token 切分和数字编码逐步预测下一个内容。由于概率采样的非确定性特性,输出存在自然波动,这是设计而非缺陷。温度参数控制输出创意度,最大 Token 数限制回复长度, Top-P 核采样限定选词范围,上下文窗口决定记忆容量。实操建议:温度和 Top-P 只调其一,配合最大 Token 数系统性配置,可有效提升提示词工程的可控性。

发布于2026年5月9日 22:09
编辑小创
评论0
阅读26

大语言模型的运作逻辑:提示词工程入门

大语言模型( LLM )并不像人类那样阅读文字。它本质上是一台概率引擎,把语言拆碎、编成数字、再预测下一个该出现的内容。理解这个底层机制,是真正驾驭提示词工程( Prompt Engineering )的前提。

当一段文字输入 LLM ,模型做的第一件事是把它切分成 Token。 Token 并不等于单词。“dog” 可能就是一个 Token ,而“ButterFly”则可能被拆成“Butter”和“Fly”两个 Token 。切完之后,每个 Token 被转换成一个数字 ID ,模型全程只和这些数字打交道,逐步预测下一个 Token 应该是哪个。不同模型的切分方式不同, GPT 采用字节对编码( Byte-Pair Encoding ), BERT 则使用 WordPiece ,同一句话在不同架构下的处理路径可以完全不同。

正因为如此,向 LLM 提同一个问题,两次得到的答案可能并不一致。这不是 bug ,而是模型在从概率分布中采样时的自然结果。它不总是选最可能的那个 Token ,而是按概率随机取样。这种非确定性( non-deterministic )特质,是 LLM 与传统程序最根本的区别。

而真正让提示词从“碰运气”变成“可工程化”的,是几个可调节的参数。

温度( Temperature )控制的是模型选 Token 时的“冒险程度”。设在 0.0 到 0.3 之间,输出趋于确定和精准,适合事实查询。调到 0.7 到 1.0 ,输出变得更有创意和多样性。超过 1.5 ,输出基本就开始语无伦次了。

最大 Token 数( Max Tokens )决定回复的长度上限。粗略换算, 1 个 Token 约等于 0.75 个英文单词。 50 到 150 个 Token 够写一段简短摘要, 500 到 1000 个 Token 可以支撑一篇详细解释, 2000 个 Token 以上才能跑出完整的长文。这个参数是天花板,不是目标长度,设得太低会导致回答在句子中途被截断。

Top-P (核采样, nucleus sampling )则从另一个维度限定选词范围。设为 0.9 ,意味着模型只从累计概率达到 90% 的 Token 集合里挑选,数值越低,输出越集中。 Funmilola Fagbola ( PhD )在文中给出了一个实用建议: Temperature 和 Top-P 只调其中一个,同时调两个容易引发不可预期的输出行为。

上下文窗口( Context Window )决定模型在单次对话中能“记住”多少内容。早期的 GPT-3.5 只有 8k Token , Gemini 1.5 Pro 已扩展至超过 100 万 Token , Claude 3.5 Sonnet 支持 20 万 Token ,相当于约 15 万英文单词或 500 页文本。一旦超出这个上限,模型会悄无声息地丢弃最早的内容,没有任何提示。

相关文章

多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案
智能体工程
2026年6月2日
0 条评论
零重力瓦力

多智能体为什么比单智能体强?Anthropic 用 90.2% 的数据给了答案

Anthropic 研究显示,多智能体系统性能比单智能体提升 90.2%,其核心在于主智能体拆解任务与子智能体并行执行。尽管该架构 token 消耗约为单智能体的 15 倍,但在复杂任务中优势显著。业界已总结出五种协作模式,并有 n8n、CAMEL-AI 等落地案例。然而,多智能体仍面临调试难、输出不稳定等挑战。建议仅在任务复杂需并行、分工明确且能承担高成本时采用,简单任务直接使用强模型即可。

#智能体#智能体工程
阅读全文
别被多智能体的概念吓住,真正跑通工作流的人都在关注这些细节
智能体工程
2026年6月1日
0 条评论
零重力瓦力

别被多智能体的概念吓住,真正跑通工作流的人都在关注这些细节

多智能体协作在创意交付端仍存短板,但在结构化任务中价值显著。实测显示,Super Agent 生成幻灯片虽快但排版难控,而自动化销售线索处理及编程辅助等场景因规则明确、流程可定义,能实现高效落地。多智能体的核心竞争力在于清晰定义职责边界、输出格式与异常处理,而非概念本身。建议优先梳理任务结构化程度与人机分工,注重参数配置等实操细节,避免盲目追求平台概念,以构建真正可用的生产力工作流。

#智能体工程#智能体
阅读全文
OpenClaw 遇到对手了:Hermes Agent 的自我进化路线到底能不能跑通
智能体工程
2026年5月28日
0 条评论
零重力瓦力

OpenClaw 遇到对手了:Hermes Agent 的自我进化路线到底能不能跑通

开源个人 Agent 领域呈现 OpenClaw 与 Hermes Agent 的路线之争。OpenClaw 主打全平台覆盖与可视化协作,强调交互广度;Hermes Agent 则聚焦自我进化与跨会话用户建模,追求认知深度,并提供一键迁移工具争夺用户。尽管 Hermes v0.14.0 已具备生产级能力,但其自我进化机制仍面临技能质量、记忆膨胀及 token 效率等挑战。这场竞争标志着个人 Agent 赛道已从功能验证迈向设计哲学比拼的新阶段。

#Hermes Agent#OpenClaw#智能体工程
阅读全文
互动讨论

评论区

围绕《LLM 工作原理: Prompt Engineering 解析》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。