求推荐一个轻量 RAG LLM chat 的部署方案

This topic created in 719 days ago, the information mentioned may be changed or developed.

需求：

构建英文 pdf 知识库，一次对话讨论可以涉及多个文件
向量数据库最好本地化
不需要本地部署模型，所有 embed, rerank, chat models 都用 api
不需要用户管理等冗余功能

看好多方案，ragflow fastgpt langchain-chatchat ，不知道实际用起来如何？或者有其他推荐的方案？

ChatGPT-Next-Web-langchain 感觉在上游的简单前端框架下加 rag 的逻辑，还是有点勉强了。

Supplement 1 · Jul 14, 2024

langchain-chatchat 0.3.1 ，尝试部署了下，这个确实挺轻量，但呈现出来的是一个相当 prototype 的产品，不知道为什么 star 这么多，最新的 docker 0.3.0 基本是不可用的。

Supplement 2 · Jul 15, 2024

好多人提到 dify ，如果有团队使用需求，可以尝试下 dify ragflow danswer 。这几个看了下 docker-compose ，感觉都比较重了。

Supplement 3 · Sep 20, 2024

update: 现在ragflow等已经支持graphrag了（dify不支持）。更好的rag策略还包括，anthropic的contextual-retrieval 等等。
对比使用来看，传统直接做分割的确实存在很多问题痛点。

rag

部署方案

本地化

18 replies • 2025-05-06 23:58:00 +08:00

mumbler

Jul 14, 2024

个人用吗，可以试试 flashai.com.cn 的云端版，开箱即用，支持 mac 和 win ，本地知识库+本地向量化，另外还有带本地大模型版本

GrayXu

Jul 14, 2024

@mumbler #1 谢谢，这个方案看上去限制蛮多的，付费了也只有 8b 的模型。我们已经有 embedding, rerank, chat 的完整 api 服务了。

lixen9

Jul 14, 2024

fastgpt 试用过感觉还行，蛮符合你的需求来着，开源版本即可

GrayXu

Jul 14, 2024

@lixen9 #3 谢谢试了一圈 fastgpt 确实是最好上手的。看了下小规模使用下，开源版本没啥问题，就是配置系统比较麻烦 XD

regent

Jul 14, 2024

@mumbler 这款产品您试过吗对比 AnythingLLM 效果如何

echoless

Jul 14, 2024

embed, rerank 这些 api 你是用的开源的么?

我倒是想整合 RAG 这些到 https://github.com/swuecho/chat (只有 chat 功能)
然后可以(optional) 配置 embed, rerank API.

GrayXu

Jul 14, 2024

@echoless #6 有的是开源的，有的不是

GrayXu

Jul 14, 2024

@echoless #6 你可以关注下 siliconflow ，最近上了 embedding ，后面会上 rerank 。

pieerepeng

Jul 14, 2024

补充个 dify.ai

本地 llm 选，ollama 或者 nitro

我搭建过，就是处理的英文 pdf 。

SoloKing

Jul 14, 2024 via Android

dify+1

wm5d8b

Jul 15, 2024 via Android

模型不在本地部署，全用 api ，钱包它同意嘛
本地用 ollama 部署挺简单的，就是大概 12G 显存得 24 小时处于 standby 状态

GrayXu

Jul 15, 2024

@wm5d8b #11 12G 算上量化只能部署个 9B 的模型吧。只能说离“能用”还有很大距离

zqqian

Jul 19, 2024

所以楼主最后调研的结果是什么，能说一下吗？

GrayXu

Jul 19, 2024

@zqqian #13
FastGPT ，感觉是满足功能需求的最轻的选择了。问题的话，还是存在一些小 bug ，然后看上去他们社区版维护的比较随意。

zqqian

Jul 20, 2024

@GrayXu #14 我在测试 FastGPT 后觉得他们的 PDF 分割的效果不太好，不知道有没有效果更好一些的

GrayXu

Jul 31, 2024

@zqqian #15 分割？感觉大家分割方案现在都差不多吧。还是等等 GraphRAG 吧

skykk1op

Dec 12, 2024

楼主有调研结果吗？我需要一个部署在本地的知识库

yibo2018

May 6, 2025

需要+1