场景1:搭建RAG应用

操作流程

步骤一:准备知识库

本步骤的目的是创建一个的【知识库】供大模型在问答、对话、文本生成等任务中参考使用,提升模型的表现。知识库的创建来源支持本地上传、本部门共享知识库、申请其他部门共享的知识库。

1.选择【知识数据中心-知识库】菜单,进入知识库管理界面。点击“创建项目知识库”

2.进入项目知识库的新建页面,填写知识库基本信息,选择对应的数据源创建项目知识库。

1)选择数据源

导入已有文本:从本地上传,支持txt、markdown、pdf、html、xlsx、xls、docx、csv等文件类型,在大小不超过15MB的情况下可批量添加文件至页面,点击“下一步”后可进入文本分段与清洗的配置页面。

本单位知识库:用户能够选择本单位管理员创建的未分段的文件知识库。

已申请知识库:能够选择知识库广场中(已审批授权给本单位使用的)其他单位的文件知识库。

3.准备知识内容。

这里以“导入已有文本”为例,从本地上传。

4.文本分段与清洗。

1)分段设置

自动分段与清洗(推荐):系统自动设置分段规则,对文件内容进行分段。

自定义(进阶):用户可根据需求自行设置分段标识符、分段最大长度、分段重叠长度、选择文本预处理规则(可选择是否替换掉连续的空格、换行符和制表符,是否删除所有的URL和电子邮箱地址)。

采用Q&A分段模式(进阶):开启后,大模型会自动对文档内容进行分段,并生成QA问答对,这种方式对相关问题的召回准确率更高,但需要对问答对质量有更严格的把控能力。

这里选择“自动分段与清洗”。

2)检索模式

混合检索:同时执行全文检索和向量检索,并应用重排序步骤,从两类查询结果中选择匹配用户问题的最佳结果。注意选择后需要选择一个ReRank重排序模型。

向量检索:通过生成查询嵌入并查询与其向量表示最相似的文本分段。适用于通过语义匹配知识库内容的场景。

全文检索:索引文档中的所有词汇,从而允许用户查询任意词汇,并返回包含这些词汇的文本片段。适用于通过关键字匹配知识库内容的场景。这里我们保持系统默认选项。

点击“保存并处理”进入下一步

5.处理并完成

当前页面能够查看文件解析的进度。文件解析动作由系统在后台完成,可以直接点击“前往知识库详情页”按钮进入知识库详情页查看文件列表和解析进度。

步骤二:创建应用

选择【智能编排中心-应用管理】,点击【新建AI应用】

应用类型分为聊天机器人、文本生成、Agent、工作流四个类别。

聊天助手:基于LLM构建对话式交互的助手

文本生成:构建面向文本生成类任务的助手,例如撰写故事、文本分类、翻译等

Agent:能够分解任务、推理思考、调用工具的对话式智能助手

工作流:基于流程编排的方式定义更加灵活的LLM工作流

这里以聊天助手为例,应用类型选择“聊天助手”,编排方法选择“快捷模式”

确认后即可进入应用配置界面

步骤三:配置应用

应用创建完成后即可进入配置页面,在该页面能够对应用进行相关设置,从而变成一个可以使用的应用。

1.设置提示词

提示词是用户输入的一段文本或指令,用于引导大型语言模型生成特定的输出。

示例如下,可根据实际情况进行调整:

背景

杭州市政府会持续发布对民众公开的法律法规及政策文件,文件内容较多,需要进行查找。

角色

你是一位法律咨询与政策解读专家,负责为用户进行法律及政策内容的搜索与解读。

目标

根据用户问题精确检索相关内容,给出相关内容的总结,并对内容进行解读,帮助用户更好的理解其含义、背景、目的或重要性。

关键结果

回答内容需要包含“主要内容”、“内容解读”两个部分,主要内容是与用户问题相关的知识内容,内容解读是对相关内容的解读说明。

试验并调整

根据收到的反馈来调整生成内容,如果有些策略、方法货资源不太有效,寻找新的策略或资源来替代。

2.配置知识库

1)在上下文中点击“添加”按钮,在应用中添加维护好的知识库。

2)打开“引用和归属”功能

打开后,能够在回复中查看引用的对应文件内容,提高回复的可信度。

3.应用调试,测试效果

步骤四:发布应用

完成应用调试后,可在应用详情的右上角“发布”按钮中,对当前应用进行发布。

发布完成后,应用即可在独立窗口中进行访问。

可保留对话窗口地址,进行分享与快速访问。

results matching ""

    No results matching ""