杭州城市大脑训练指南
模型训练指南V1
概述
适用范围:杭州市智能中枢平台账号管理、资源申请共享、无菌训练站管理。
术语与定义
无菌模型训练场:模型训练和智能体开发的安全开发中心,确保训练过程的安全和高效性。
数据集:负责数据的收集、清洗与标注,为模型学习提供高质量的原料,确保训练效果的最优化。
知识库:管理并维护知识库,实现信息的存储、组织与更新,为智能体提供全面、准确的知识支持。
插件:通过API与大模型无缝交互的独立模块,旨在扩展智能体的场景应用能力,提升其灵活性和功能性。
智能体:融合知识库、插件及大模型等多种能力,构建高效、智能的AI应用。
账号管理
账号开通
部门侧申请
部门管理员按照《智能中枢和数智公务员账号开通申请模板》,确定垂域模型的“项目空间”、垂域模型开发商以及开发人员(浙政钉手机账号)等信息,发送智能中枢专班进行审核,不符合要求的退回修订。详见附件1《智能中枢和数智公务员账号开通申请模板》。
ISV侧申请
ISV开发人员账号需集中到无菌环境(市本级到采荷嘉业)进行智能中枢登录操作。填写《智能中枢开发商账号开通申请模板》,由部门管理员发送智能中枢专班进行审核,不符合要求的退回修订。详见附件2《智能中枢开发商账号开通申请模板》。
新增成员
各企业管理员通过“IRS-ISV管理子系统”(https://irsisv.zj.gov.cn/login)新增成员,相关的关联应用需要编目上架。如企业用户已有账号,可直接进行云桌面和ASCM申请。
垂域模型开发商需签署《xx应用信息技术服务人员网络安全承诺书》,经市数据资源局审核,开通杭州市一体化平台的账号权限。
2. 
云桌面和ASCM账号申请
“IRS-ISV管理子系统”新增成员后,企业管理员按照《数据开发专区管理规范制度》,通过“一体化公共数据平台-一体化运营运维平台” (https://devops.szhz.hangzhou.gov.cn:5443/home),申请云桌面(一次最多只能申请七天,建议每周一操作一次)以及ASCM平台账号信息(证件照可以是普通照片制作门禁申请),经市数据资源局审核通过后开通模型训练场环境。
注意:申请云桌面时在备注中填写“智能中枢模型训练”。
角色分工
智能中枢访问权限管理工作角色包括平台管理员、部门管理员、项目空间管理员、普通用户、开发人员等。其中开发人员不得兼任平台管理员、部门管理员、项目空间管理员,普通用户不得赋予平台管理员、部门管理员、项目空间管理员、开发人员权限。
平台管理员、部门管理员、项目空间管理员、普通用户所有者为公职人员,开发人员账号所有者为ISV技术人员。
平台管理员
平台管理员主要工作职责如下:
(1)负责制定智能中枢访问权限管理相关制度,明确平台访问权限相关要求和流程;
(2)负责监督和指导平台访问权限管理相关制度和流程的落实;
(3)负责审核智能资源各类权限申请的合规性。
(4)负责各部门各类智能中枢账号权限的分配、开通、使用、变更、锁定、注销等操作;
区县管理员
区县管理员主要工作职责如下:
(1)负责本区县监督和指导平台访问权限管理相关制度和流程的落实;
(2)负责审核智能资源权限各类申请的合规性。
(3)负责本区县各部门各类智能中枢账号权限的分配、开通、使用、变更、锁定、注销等操作;
部门管理员
部门管理员主要工作职责如下:
(1)负责按照本部门数据载体相关管理要求,落实数据载体的安全管理工作;
(2)负责建立和维护各类数据载体的账号权限清单;
(3)负责各类智能资源申请、发布工单审批工作。
项目空间管理员
项目空间管理员主要工作职责如下:
(1)负责按照本部门相关管理要求,落实职责范围内的账号权限的安全管理工作;
(2)负责职责范围内权限系统账号权限的分配、使用、变更、锁定等;
(3)负责建立和维护职责范围内的权限系统账号权限清单,对开发人员的权限申请内容与其工作职责的一致性进行审核;
(4)负责各类智能资源申请、发布工单发起工作。
(5)负责配合安全日志审计与监督检查工作。
普通用户
普通用户主要工作职责如下:
(1)开发人员负责按照本规范的安全要求,落实账号权限申请、使用及口令管理等工作。
(2)负责配合安全日志审计与监督检查工作。
开发商
开发商主要工作职责如下:
(1)开发商负责按照本规范的安全要求,落实账号权限申请、使用及口令管理等工作。
(2)负责配合安全日志审计与监督检查工作。
训练场/站管理
为保障数据安全,各开发商需要集中至安全办公场所进行垂域模型训练。
市级统一集中至采荷嘉业无菌训练场进行训练。
区县已有无菌训练站,由区县管理员进行管理,遵从区县管理规范。区县管理员提供无菌训练站网段至智能中枢运营组成员,由运营组开通区县无菌训练站访问智能中枢平台权限。
区县暂无无菌训练站,可指定集中办公场所(需打通政务外网)为训练站,将该场所的ip地址段提交至智能中枢运营组成员,由运营组开通区县训练站访问智能中枢平台权限。
资源申请
训练资源
按照“自主可控、训练集中、推理分散”的原则,市级统一提供信创适配的公共资源组进行模型训练,部门管理员/开发商根据实际情况以及模型尺寸,合理选择资源节点规格进行模型训练。
推理资源
按照“自主可控、训练集中、推理分散”的原则,部门管理员提交《模型推理资源申请方案》,经市数据局审批,在市信创云自主提供或市级按需分配推理资源,通过多租户隔离手段,保证数据安全和推理服务独立运行。
智能资源发布流程
知识库发布
知识库分为项目知识库和单位知识库,项目知识库只用于本项目训练,单位知识库由部门管理员创建,可发布至知识广场与其他部门共享使用。
插件发布
各部门可根据插件的公共属性进行插件发布,供其他项目及部门使用。插件分为公共插件、受限共享插件和不共享插件。公共插件无需申请,即可使用;受限共享插件申请后可使用;不共享插件不可申请。
插件发布流程由项目空间管理员发起,部门管理员审批后,数据局(市级&区县)进行插件可用性确认,测试通过后插件上架至知识广场中的插件广场。
垂域模型发布
各部门完成垂域模型训练后,可根据实际需求进行模型上架,供其他项目及部门使用。
垂域模型由生产部门的项目空间管理员发起发布流程,部门管理员审批。在数据管理员部门审批环节中,区县模型由区县数据局审批,市级模型由市级部门审批。最后市数据局根据资源池算力情况,对区县垂域模型、市级垂域模型做审批上架。上架完成后,其他部门可在知识广场中的模型广场进行申请使用。
智能体发布
各部门完成智能体编排后,可根据实际需求进行上架,供其他项目及部门使用。
智能体由生产部门的项目空间管理员发起发布流程,部门管理员审批。在数据管理员部门审批环节中,区县由区县数据局审批,市级由市级部门审批。最后市数据局根据资源池算力情况,对区县、市级做审批上架。上架完成后,其他部门可在知识广场中的智能体广场进行申请使用。
智能资源共享流程
知识库、插件、垂域模型、智能体等智能资源采用统一共享流程。项目空间管理员根据自身业务需求在知识广场发起对应资源使用申请。生产单位部门管理员审批申请单后,申请流程流转至资源源单位,由源单位部门管理员进行申请审批。源单位审批完成后,即开通对应资源权限,生产单位可开始使用。
附件
附件1:《智能中枢和数智公务员账号开通申请模板》
附件2:《智能中枢开发商账号开通申请模板》
附件3:《模型推理资源申请方案》