使用 Llama 3.2 构建一个本地版 PDF 聊天助手

基于本地部署的 Llama 3.2 模型与 Embedchain+ChromaDB 构建离线 PDF 聊天助手,支持上传 PDF、自动解析内容并用自然语言问答,全程无需联网。使用 Streamlit 搭建简洁交互界面,适合希望在本地安全处理敏感文档的技术用户快速上手。

发布于2024年9月28日 03:22
编辑零重力瓦力
评论0
阅读60

Meta 推出了新的开源模型 Llama 3.2。新版模型体积更小、生成令牌速度更快、准确度也更高,能够方便的构建基于 RAG 的 AI 应用。这个教程将展示如何使用 Llama 3.2 和 RAG 构建一个简单而强大的 PDF 聊天助手。到时,您能够上传PDF文件并向它提出问题。所有操作都在本地完成,完全免费无需联网。

构建目标

PDF 聊天助手使用 Llama 3.2 和 RAG 分析 PDF 文档,并根据它的内容回答问题。

  • 使用 Streamlit 创建一个简单的使用界面
  • 将 RAG 与 Llama 3.2 的强大功能相结合
  • 使用 Embedchain 框架实现 RAG 功能
  • 使用 ChromaDB 存储 PDF 内容的向量

前提条件

  • 需要在本地电脑安装 Python(建议使用 3.7 或更高版本)
  • 对 Python 编程有基本的了解
  • 选择一个你熟悉的 Python 代码编辑器(推荐 VSCode 或 PyCharm)

构建步骤

第一步:环境设置

1. 克隆 GitHub 仓库

git clone https://github.com/Shubhamsaboo/awesome-llm-apps.git

2. 前往 chat_with_pdf 文件夹

cd chat_with_pdf

3. 安装应用依赖项

pip install -r requirements.txt

第二步:创建 Streamlit 应用

创建一个新文件 chat_pdf.py 并添加以下代码:

1. 导入所需库

在文件顶部添加

import os
import tempfile
import streamlit as st
from embedchain import App
import base64
from streamlit_chat import message

2. 配置应用程序

在这个应用程序中,我们将使用 Ollama 的 Llama-3.2。您也可以选择 OpenAI、Anthropic 或其他任何 LLM。

使用开源的 ChromaDB 作为矢量数据库(您可以自由选择任何其他矢量数据库)。

def embedchain_bot(db_path):
    return App.from_config(
        config={
            "llm": {"provider": "ollama", "config": {"model": "llama3.2:latest", "max_tokens": 250, "temperature": 0.5, "stream": True, "base_url": 'http://localhost:11434'}},
            "vectordb": {"provider": "chroma", "config": {"dir": db_path}},
            "embedder": {"provider": "ollama", "config": {"model": "llama3.2:latest", "base_url": 'http://localhost:11434'}},
        }
    )

3. 处理 PDF 文件的上传和预览

def display_pdf(file):
    base64_pdf = base64.b64encode(file.read()).decode('utf-8')
    pdf_display = f''
    st.markdown(pdf_display, unsafe_allow_html=True)

4. 设置 Streamlit 应用程序

Streamlit 允许您仅使用 Python 代码创建用户界面。对于这个应用程序,我们将:

  • 使用'st.title()' 为应用程序添加标题
  • 使用'st.caption()' 为应用程序添加描述

5. 创建一个用于PDF上传和预览的侧边栏

with st.sidebar:
    st.header("PDF Upload")
    pdf_file = st.file_uploader("Upload a PDF file", type="pdf")

    if pdf_file:
        st.subheader("PDF Preview")
        display_pdf(pdf_file)

6. 将 PDF 添加到知识库。当上传 PDF 时,内容会被处理并添加到 ChromaDB 中以供检索。

  if st.button("Add to Knowledge Base"):
            with st.spinner("Adding PDF to knowledge base..."):
                with tempfile.NamedTemporaryFile(delete=False, suffix=".pdf") as f:
                    f.write(pdf_file.getvalue())
                    st.session_state.app.add(f.name, data_type="pdf_file")
                os.remove(f.name)
            st.success(f"Added {pdf_file.name} to knowledge base!")

7. 创建一个聊天界面,让用户可以向 PDF 文件提出问题

for i, msg in enumerate(st.session_state.messages):
    message(msg["content"], is_user=msg["role"] == "user", key=str(i))

if prompt := st.chat_input("Ask a question about the PDF"):
    st.session_state.messages.append({"role": "user", "content": prompt})
    message(prompt, is_user=True)

8. 处理用户问题并显示回复,并添加一个清除聊天历史记录的按钮

 with st.spinner("Thinking..."):
        response = st.session_state.app.chat(prompt)
        st.session_state.messages.append({"role": "assistant", "content": response})
        message(response)

if st.button("Clear Chat History"):
    st.session_state.messages = []

第三步:运行应用

1. 在终端中,进入项目文件夹,并运行以下命令,启动 Streamlit 应用

streamlit run chat_pdf.py

Streamlit 会提供一个本地 URL(通常是 http://localhost:8501)。通过浏览器打开这个链接就可以了。

相关文章

Windsurf 2.0 拆解:Devin 被塞进编辑器,氛围编程终于有了“调度中心”
AI 编程开发
2026年6月2日
0 条评论
零重力瓦力

Windsurf 2.0 拆解:Devin 被塞进编辑器,氛围编程终于有了“调度中心”

Cognition 发布 Windsurf 2.0,深度整合 Devin 实现本地思考与云端执行分工。新版推出 Agent Command Center 支持多智能体可视化管理,搭载自研 SWE-1.5 模型大幅提升代码定位与编辑速度,并引入 Spaces 容器解决上下文延续问题。Pro 版调整为日配额制且包含 Devin 功能。相比 Cursor 3,Windsurf 2.0 凭借自研模型与云端执行能力,更适合处理陌生代码库及长任务自动化场景。

#智能体#AI 编程
阅读全文
Claude Opus 4.8 震撼发布,多智能体协同让开发效率翻倍
AI 新闻资讯
2026年6月1日
0 条评论
小创

Claude Opus 4.8 震撼发布,多智能体协同让开发效率翻倍

Anthropic 发布 Claude Opus 4.8,在基准测试中超越 ChatGPT 5.5,重夺编程领域领先地位。新版本核心亮点为动态工作流与 Ultracode 模式,通过多智能体协同大幅提升复杂任务开发效率,同时幻觉率降至四分之一。得益于算力扩充,其性能提升且价格下调,快速模式费用降至三分之一。建议开发者日常使用常规上下文模式并调高努力程度,大项目再开至最大。此外,AI 时代专注力仍是拉开差距的关键。

#Claude#AI 编程
阅读全文
告别套壳与适配:2026 开发者主流 LLM 聚合网关选型指南
AI 编程开发
2026年5月29日
0 条评论
零重力瓦力

告别套壳与适配:2026 开发者主流 LLM 聚合网关选型指南

针对 AI 应用开发中多模型适配难题,LLM 聚合 API 平台通过统一接口有效降低维护成本。海外平台如 OpenRouter、Portkey 生态完善且兼容性强。国内平台如硅基流动、阿里云百炼侧重合规与本土模型支持。自建方案 LiteLLM、One API 则适合追求自主可控与极致性价比的团队。开发者应根据业务阶段、预算及合规要求灵活选型,生产环境推荐采用“自建网关+多渠道分流”的混搭架构,以兼顾成本、稳定性与灵活性。

#模型 API
阅读全文
互动讨论

评论区

围绕《使用 Llama 3.2 构建一个本地版 PDF 聊天助手》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。