开放式网页界面与检索增强生成基础

admin 发表于 2024-10-7 14:15:58

开放式网页界面与检索增强生成基础

## RAG 简介
RAG（Retrieval Augmented Generation，检索增强生成）是一种技术，通过为模型提供更多上下文信息来减少模型的幻觉并提高其注意力。
## RAG 的工作原理
RAG 的核心思想是为模型提供上下文信息，例如文档、网页、图片等。这些信息会被转化为向量数据，并存储在向量数据库中。当用户提问时，提问也会被转化为向量数据，并通过向量查询算法从数据库中检索相关信息。最终，这些信息与用户提问一起被送入聊天模型（如 ChatGPT、Claude、Gemini 等）进行处理，以实现上下文补充。
## RAG 的质量关键
RAG 的质量取决于以下几个方面：
* 嵌入向量模型：决定上下文向量化的质量
* 聊天模型：负责分析和思考所有信息
* 客户端：负责上下文整理、向量查询算法和内容提取算法
## Open WebUI 集成 RAG
Open WebUI 使用 RAG 主要用于文档对话和网页搜索。即使在使用网页搜索时，Open WebUI 也会对搜索到的网页数据进行向量化处理。

页: [1]

一元网络论坛's Archiver

开放式网页界面与检索增强生成基础