Google 在 Gemini API 中引入文件搜索工具

Google 在 Gemini API 中上线全托管文件搜索工具,支持 PDF、DOCX、TXT、JSON 及多种代码文件,自动完成分块、嵌入、语义检索与引用生成;首次索引按每百万 token 0.15 美元计费,存储与查询免费,大幅降低 RAG 应用开发门槛。

发布于2025年11月7日 04:05
编辑零重力瓦力
评论0
阅读20

Google 在 Gemini API 中引入文件搜索工具

作者:Ivan Solovyev (Google DeepMind,产品经理)、Animesh Chatterji(Google DeepMind,软件工程师)
原文地址:Introducing the File Search Tool in Gemini API

今天,我们正式推出文件搜索工具。这是一个直接内置于 Gemini API 的全托管 RAG 系统,它将检索流程进行了抽象化处理,让您可以把精力集中在应用构建上。文件搜索为 Gemini 提供了一种简单、集成且可扩展的方式来基于您的数据生成内容,让响应结果更加准确、相关且可验证。

为了让所有开发者都能简单且经济地使用文件搜索,我们将存储费用和查询时的嵌入生成费用全部免除。您只需在首次索引文件、创建嵌入时付费,固定价格为每百万个令牌 0.15 美元(或对应嵌入模型的实际费用,本例中使用的是 gemini-embedding-001)。这种全新的计费方式让文件搜索工具在构建和扩展时既简单又极具成本优势。

文件搜索的工作原理

文件搜索通过帮您处理 RAG 的复杂操作来提升开发效率。相比自行搭建管理系统,它提供了一个更加友好的解决方案。

简洁集成的开发体验:我们简化了整个 RAG 流程。文件搜索会自动处理文件存储、优化分块策略、生成嵌入,并将检索到的上下文动态注入您的提示词中。它在现有的

generateContent
API 内运行,上手非常容易。

强大的向量搜索能力:文件搜索基于我们最新的尖端 Gemini 嵌入模型,通过向量搜索来理解用户查询的语义和上下文。即使用户没有使用准确的关键词,它也能从您的文档中找到相关信息。

自动生成引用:模型的回答会自动附带引用信息,标明使用了文档的哪些部分来生成答案,让验证过程变得简单。

广泛的格式支持:您可以使用多种文件格式构建完整的知识库,包括 PDF、DOCX、TXT、JSON 以及众多常见编程语言的文件类型(完整的支持格式列表请查看文档)。

您可以通过我们在 Google AI Studio 中推出的新演示应用(需要付费 API 密钥)来体验文件搜索工具的实际效果。

基于 Gemini API 新文件搜索工具的"询问手册"演示应用

开发者的使用案例

参与我们早期体验计划的开发者已经在用它打造各种出色的应用,从智能客服机器人、内部知识助手到创意内容发现平台,应有尽有。让我们听听一位早期体验开发者的分享。

Phaser Studio 开发的 AI 驱动游戏生成平台 Beam 已经取得了不错的初步成效。Beam 将文件搜索集成到工作流程中,每天针对不断扩充的模板数据库执行成千上万次搜索。文件搜索可以在所有语料库中并行处理查询,并在 2 秒内完成结果整合,这相比以前需要花费数小时的手动交叉检索有了质的飞跃。

在 Beam,我们正在利用文件搜索来大幅提升游戏生成能力。我们的系统依托一个包含超过 3,000 个文件的资料库,这些文件分布在六个活跃的语料库中,涵盖了模板、组件、设计文档以及 Phaser.js 相关知识。文件搜索让我们能够即时找到所需的资料,无论是子弹模式的代码片段、游戏类型模板,还是来自 Phaser "大脑"语料库的架构指导。效果非常显著——过去需要几天时间才能完成原型的创意,现在几分钟内就能变成可玩的游戏。借助 Gemini 和这些强大的工具,我们正在构建一个让每位玩家都能成为创作者的未来。Phaser Studio CTO Richard Davey

开始使用文件搜索工具

from google import genai
from google.genai import types

client = genai.Client()
store = client.file_search_stores.create()

upload_op = client.file_search_stores.upload_to_file_search_store(
    file_search_store_name=store.name,
    file='path/to/your/document.pdf'
)

while not upload_op.done:
  time.sleep(5)
  upload_ops = client.operations.get(upload_op)

# Use the file search store as a tool in your generation call
response = client.models.generate_content(
    model='gemini-2.5-flash',
    contents='What does the research say about ...',
    config=types.GenerateContentConfig(
        tools=[types.Tool(
            file_search=types.FileSearch(
                file_search_store_names=[store.name]
            )
        )]
    )
)
print(response.text)

# Support your response with links to the grounding sources.
grounding = response.candidates[0].grounding_metadata
sources = {c.retrieved_context.title for c in grounding.grounding_chunks}
print('Sources:', *sources)

访问文件搜索文档了解详情,或者在 Google AI Studio 中查看我们的演示应用,您还可以对其进行改编,打造属于自己的应用。

相关文章

Google I/O 2026 前瞻,这次 Google 压上了全部家当
AI 新闻资讯
2026年4月22日
0 条评论
小创

Google I/O 2026 前瞻,这次 Google 压上了全部家当

Google I/O 2026 定档 5 月 19 日至 20 日,被视为谷歌史上赌注最大的一届。核心看点包括 Gemini 4 首秀、Veo 4 视频生成升级及轻量级 AI 眼镜发布。更关键的是 Aluminium OS 桌面系统亮相,旨在补齐移动与桌面闭环。在千亿美元投入下,谷歌试图通过搜索、OS、硬件与智能体的全面重构,应对来自 GPT-6 等竞品的激烈挑战。

#Google
阅读全文
今夏聪明旅行的 7 个 Google 妙招
AI 教程知识
2026年4月18日
0 条评论
小创

今夏聪明旅行的 7 个 Google 妙招

Google 在 2026 年暑期前推出 7 项出行工具更新,涵盖 AI 规划行程、酒店价格追踪、餐厅预订智能体、附近商店代询、实时翻译及机场数字证件等功能。通过将生成式 AI 、地图数据和语音模型嵌入已有产品入口, Google 从“搜索答案”升级为“代为完成任务”,开始承担预订、致电、追踪和提醒等执行动作,标志着从流量入口向用户事务代理权的延伸。

#Google
阅读全文
Google 转变策略,直接封禁不良广告
AI 新闻资讯
2026年4月17日
0 条评论
小创

Google 转变策略,直接封禁不良广告

2025 年 Google 屏蔽广告数量破纪录达 83 亿条,但暂停账户数却未相应增长。 Google 将此归因于 Gemini 模型等 AI 技术的深度应用,使超过 99%的问题广告在展示前即被拦截。这一转变体现了平台从“粗放暂停账户”转向“精准前置拦截”的执法策略,错误暂停同比减少 80%。生成式 AI 被诈骗者大规模滥用促使 Google 强化 AI 检测能力,通过分层防御体系从源头阻止不良行为者创建账户。

#Google#Gemini
阅读全文
互动讨论

评论区

围绕《Google 在 Gemini API 中引入文件搜索工具》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。