LLM 工作原理: Prompt Engineering 解析

大语言模型本质是概率引擎,通过 Token 切分和数字编码逐步预测下一个内容。由于概率采样的非确定性特性,输出存在自然波动,这是设计而非缺陷。温度参数控制输出创意度,最大 Token 数限制回复长度, Top-P 核采样限定选词范围,上下文窗口决定记忆容量。实操建议:温度和 Top-P 只调其一,配合最大 Token 数系统性配置,可有效提升提示词工程的可控性。

发布于2026年5月9日 22:09
编辑小创
评论0
阅读41

大语言模型的运作逻辑:提示词工程入门

大语言模型( LLM )并不像人类那样阅读文字。它本质上是一台概率引擎,把语言拆碎、编成数字、再预测下一个该出现的内容。理解这个底层机制,是真正驾驭提示词工程( Prompt Engineering )的前提。

当一段文字输入 LLM ,模型做的第一件事是把它切分成 Token。 Token 并不等于单词。“dog” 可能就是一个 Token ,而“ButterFly”则可能被拆成“Butter”和“Fly”两个 Token 。切完之后,每个 Token 被转换成一个数字 ID ,模型全程只和这些数字打交道,逐步预测下一个 Token 应该是哪个。不同模型的切分方式不同, GPT 采用字节对编码( Byte-Pair Encoding ), BERT 则使用 WordPiece ,同一句话在不同架构下的处理路径可以完全不同。

正因为如此,向 LLM 提同一个问题,两次得到的答案可能并不一致。这不是 bug ,而是模型在从概率分布中采样时的自然结果。它不总是选最可能的那个 Token ,而是按概率随机取样。这种非确定性( non-deterministic )特质,是 LLM 与传统程序最根本的区别。

而真正让提示词从“碰运气”变成“可工程化”的,是几个可调节的参数。

温度( Temperature )控制的是模型选 Token 时的“冒险程度”。设在 0.0 到 0.3 之间,输出趋于确定和精准,适合事实查询。调到 0.7 到 1.0 ,输出变得更有创意和多样性。超过 1.5 ,输出基本就开始语无伦次了。

最大 Token 数( Max Tokens )决定回复的长度上限。粗略换算, 1 个 Token 约等于 0.75 个英文单词。 50 到 150 个 Token 够写一段简短摘要, 500 到 1000 个 Token 可以支撑一篇详细解释, 2000 个 Token 以上才能跑出完整的长文。这个参数是天花板,不是目标长度,设得太低会导致回答在句子中途被截断。

Top-P (核采样, nucleus sampling )则从另一个维度限定选词范围。设为 0.9 ,意味着模型只从累计概率达到 90% 的 Token 集合里挑选,数值越低,输出越集中。 Funmilola Fagbola ( PhD )在文中给出了一个实用建议: Temperature 和 Top-P 只调其中一个,同时调两个容易引发不可预期的输出行为。

上下文窗口( Context Window )决定模型在单次对话中能“记住”多少内容。早期的 GPT-3.5 只有 8k Token , Gemini 1.5 Pro 已扩展至超过 100 万 Token , Claude 3.5 Sonnet 支持 20 万 Token ,相当于约 15 万英文单词或 500 页文本。一旦超出这个上限,模型会悄无声息地丢弃最早的内容,没有任何提示。

相关文章

拜耳用 3 层反思循环把 AI 拉进制药生产线:上下文工程和 harness 工程到底在干什么
智能体工程
2026年6月21日
0 条评论
零重力瓦力

拜耳用 3 层反思循环把 AI 拉进制药生产线:上下文工程和 harness 工程到底在干什么

拜耳制药和 Thoughtworks 在 Martin Fowler 的博客上发表了一篇完整案例,讲他们花了两年多时间把 PRINCE(Preclinical Information Center)从关键词搜索工具演变成多智能体 RAG 系

#智能体工程
阅读全文
Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了
智能体工程
2026年6月18日
0 条评论
零重力瓦力

Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了

Vercel 发布开源智能体框架 eve,采用文件系统优先设计,将 Agent 定义为目录结构以降低理解成本。框架内置持久化会话、沙盒计算、人类审批、安全连接、多渠道部署及可观测性六大生产级能力,解决重复造轮子痛点。eve 目前处于公开预览阶段,框架免费但托管服务收费。该框架标志着 AI Agent 开发正从混乱走向标准化,大幅缩短从 demo 到上线的距离,但需注意 beta 阶段的 API 变动及供应商锁定风险。

#智能体框架#智能体工程
阅读全文
谷歌说 AI 不该假装确定:忠实不确定性如何终结幻觉困局
智能体工程
2026年6月13日
0 条评论
零重力瓦力

谷歌说 AI 不该假装确定:忠实不确定性如何终结幻觉困局

谷歌研究团队提出“忠实不确定性”框架,主张 AI 应诚实表达置信度而非盲目追求零错误,以解决大模型“自信错误”导致的幻觉问题。该研究指出传统降幻觉方法存在高昂“效用税”,建议将输出区分为自信错误与诚实猜测。这对 AI Agent 尤为关键,能优化元认知判断与工具调用效率。开发者可通过调整评估指标、提示词及路由策略落地应用,推动系统从可用迈向可靠。

#Google#智能体工程
阅读全文
互动讨论

评论区

围绕《LLM 工作原理: Prompt Engineering 解析》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。