场景1：搭建RAG应用

操作流程

步骤一：准备知识库

本步骤的目的是创建一个的【知识库】供大模型在问答、对话、文本生成等任务中参考使用，提升模型的表现。知识库的创建来源支持本地上传、本部门共享知识库、申请其他部门共享的知识库。

1.选择【知识数据中心-知识库】菜单，进入知识库管理界面。点击“创建项目知识库”

2.进入项目知识库的新建页面，填写知识库基本信息，选择对应的数据源创建项目知识库。

1）选择数据源

导入已有文本：从本地上传，支持txt、markdown、pdf、html、xlsx、xls、docx、csv等文件类型，在大小不超过15MB的情况下可批量添加文件至页面，点击“下一步”后可进入文本分段与清洗的配置页面。

本单位知识库：用户能够选择本单位管理员创建的未分段的文件知识库。

已申请知识库：能够选择知识库广场中（已审批授权给本单位使用的）其他单位的文件知识库。

3.准备知识内容。

这里以“导入已有文本”为例，从本地上传。

4.文本分段与清洗。

1）分段设置

自动分段与清洗（推荐）：系统自动设置分段规则，对文件内容进行分段。

自定义（进阶）：用户可根据需求自行设置分段标识符、分段最大长度、分段重叠长度、选择文本预处理规则（可选择是否替换掉连续的空格、换行符和制表符，是否删除所有的URL和电子邮箱地址）。

采用Q&A分段模式（进阶）：开启后，大模型会自动对文档内容进行分段，并生成QA问答对，这种方式对相关问题的召回准确率更高，但需要对问答对质量有更严格的把控能力。

这里选择“自动分段与清洗”。

2)检索模式

混合检索：同时执行全文检索和向量检索，并应用重排序步骤，从两类查询结果中选择匹配用户问题的最佳结果。注意选择后需要选择一个ReRank重排序模型。

向量检索：通过生成查询嵌入并查询与其向量表示最相似的文本分段。适用于通过语义匹配知识库内容的场景。

全文检索：索引文档中的所有词汇，从而允许用户查询任意词汇，并返回包含这些词汇的文本片段。适用于通过关键字匹配知识库内容的场景。这里我们保持系统默认选项。

点击“保存并处理”进入下一步

5.处理并完成

当前页面能够查看文件解析的进度。文件解析动作由系统在后台完成，可以直接点击“前往知识库详情页”按钮进入知识库详情页查看文件列表和解析进度。

步骤二：创建应用

选择【智能编排中心-应用管理】，点击【新建AI应用】

应用类型分为聊天机器人、文本生成、Agent、工作流四个类别。

聊天助手：基于LLM构建对话式交互的助手

文本生成：构建面向文本生成类任务的助手，例如撰写故事、文本分类、翻译等

Agent：能够分解任务、推理思考、调用工具的对话式智能助手

工作流：基于流程编排的方式定义更加灵活的LLM工作流

这里以聊天助手为例，应用类型选择“聊天助手”，编排方法选择“快捷模式”

确认后即可进入应用配置界面

步骤三：配置应用

应用创建完成后即可进入配置页面，在该页面能够对应用进行相关设置，从而变成一个可以使用的应用。

1.设置提示词

提示词是用户输入的一段文本或指令，用于引导大型语言模型生成特定的输出。

示例如下，可根据实际情况进行调整：

背景

杭州市政府会持续发布对民众公开的法律法规及政策文件，文件内容较多，需要进行查找。

角色

你是一位法律咨询与政策解读专家，负责为用户进行法律及政策内容的搜索与解读。

目标

根据用户问题精确检索相关内容，给出相关内容的总结，并对内容进行解读，帮助用户更好的理解其含义、背景、目的或重要性。

关键结果

回答内容需要包含“主要内容”、“内容解读”两个部分，主要内容是与用户问题相关的知识内容，内容解读是对相关内容的解读说明。

试验并调整

根据收到的反馈来调整生成内容，如果有些策略、方法货资源不太有效，寻找新的策略或资源来替代。

2.配置知识库

1）在上下文中点击“添加”按钮，在应用中添加维护好的知识库。

2）打开“引用和归属”功能

打开后，能够在回复中查看引用的对应文件内容，提高回复的可信度。

3.应用调试，测试效果

步骤四：发布应用

完成应用调试后，可在应用详情的右上角“发布”按钮中，对当前应用进行发布。

发布完成后，应用即可在独立窗口中进行访问。

可保留对话窗口地址，进行分享与快速访问。

搭建rag应用

背景

角色

目标

关键结果

试验并调整

results matching ""

No results matching ""