AI引擎矩阵赋能档案核心业务全链路提质增效——绍兴市柯桥区档案馆创新实践

来源: 绍兴市柯桥区档案馆

  编者按:“十四五”期间,为深入贯彻落实习近平总书记对档案工作的重要指示批示精神,推广档案信息化建设创新成果与先进经验,助力档案事业高质量发展,国家档案局组织开展了档案信息化创新案例征集工作,我省报送的4个案例从全国报送的328个案例中脱颖而出,成功入选全国档案信息化创新案例。

 

  摘要:为破解档案业务人工依赖重、数据治理难、服务供给弱三大瓶颈,绍兴市柯桥区档案馆创新构建“AI引擎矩阵”,依托国产化算力底座和DeepSeek大模型驱动,集成15个垂直AI引擎与“163智能应用场景”(1个共享引擎、6大功能场景、3项服务输出),深度赋能“收-治-用”全链路,业务效率显著提升,服务体验全面革新,经济社会效益充分显现,为档案工作数字化深度转型和智能化场景应用提供了可复制的“柯桥方案”。

  一、形势背景:数字时代档案工作的挑战与机遇

  随着数字中国战略深入推进,档案工作面临数据量激增与需求度深化的双重挑战。传统模式存在三大瓶颈。一是业务高度依赖人工,档案整理、著录、质检、鉴定、公开等核心环节人工参与度超70%,效率低下且业务质量波动大。二是数据治理成本高昂,进馆数据质量参差不齐,质检、分类、标引等工作耗时耗力,治理效能受限。三是服务供给能力不足,非结构化数据占比高、关联弱,价值挖掘困难,难以支撑精准检索与深度利用,且传统服务模式响应慢,难以满足公众便捷查档需求。

  为响应国家档案局“推动档案信息化创新突破”的号召,柯桥区档案馆投入专项资金700余万元,以构建“AI引擎矩阵”为核心,探索了档案工作数字化深度转型和智能化场景应用的“柯桥路径”。

  二、技术支撑:AI矩阵技术架构解析

  建立坚实、灵活、可持续的AI技术底座,其核心架构包含:

  1.硬件底座,提供国产化算力支撑。部署5台国产服务器、12张昇腾AI算力卡、120T分布式存储,提供自主可控的高性能算力与存储。

  2.软件中枢,大模型驱动引擎矩阵协同。构建了以国产大模型为驱动核心、引擎矩阵为能力支柱、应用场景为价值出口、业务平台为中控枢纽的协同体系(技术架构):基于汉王天地大模型开发了15个垂直AI引擎,并以此搭建“163智能应用场景”。完成数字档案管理服务一体化平台、数字档案馆综合业务管理平台建设,将15个AI引擎与“163智能应用场景”深度整合嵌入。本地化部署DeepSeek-7B大模型并启动DeepSeek-32B部署,打通“163智能应用场景”,构建“大模型底座-场景需求-引擎矩阵”三层AI枢纽。充分发挥大模型在推理、审核、校对方面的优势与垂直引擎在运算、训练、效率上的特长,实现能力叠加与质量跃升。

  3.技术支撑,实现模块协同与普惠共享。一是模块化设计,15个AI引擎均采用容器化封装、微服务架构,专注解决特定痛点问题。二是矩阵化协同,引擎通过标准化API灵活组合调用。如公开鉴定引擎协同组件析分、要素抽取引擎,可精准开放切割内容,实现能力叠加。三是普惠化共享,引擎遵循国标,接口通用,既实现了馆内业务平台的无缝对接和一体化调用,也支持全区档案机构的实时按需协同调用,组件化封装模式便于跨区域复用,如公开鉴定引擎已在省内十余家档案馆成功应用。

  三、场景应用:六大矩阵贯通业务全链

  AI引擎矩阵深度融入核心业务,以六大场景构建全链路智能流水线。

  一是聚焦源头把控与效率提升,构建智能接收矩阵(收)。保管期限辅助鉴定场景,AI引擎凭借93.9%的准确率快速辅助基层准确判定保管年限,提升归档效率。档案副本规范质检场景,AI引擎自动校核核心字段与元数据等,全面替代人工质检。将质检耗时从每千件耗时一周大幅压缩至一天,归档效率提升7倍。

  二是聚焦数据活化与价值挖掘,构建全维治理矩阵(治)。数据治理精准建模场景中,OCR引擎协同与NLP引擎集群(含人名、地名、时间、图像、表格、结构要素抽取引擎),完成了240万件文书档案多文本化转换,建成高质量全文库。接收征集自主分类场景,基于建模引擎集群和文件自动分类标引引擎,构建七维标注标签体系,形成28个专题库48.8万条数据,文书智能归类准确率超90%。公开鉴定自动识别场景,引擎批量审核限制属性,准确率达97.8%,节省60%人力,实现智能流水线管理。

  三是聚焦体验升级与价值释放,构建极效服务矩阵(用)。开放文书智能析分场景,引擎批量切分档案组件,精准提取开放内容,识别切割率超80%,开放效率提升60%。深度查询引擎实现3秒级响应,查全率提升至95%。民生自助出证服务深度对接“浙里办”,实现全流程线上自助秒办,年办件量超3000件,满意度100%。

  六大场景通过引擎矩阵灵活组合,形成“收-治-用”闭环智能业务链。

  四、引擎优化:大模型驱动能力精进

  利用国产DeepSeek大模型持续优化引擎矩阵,取得显著成效。

  精度跃升方面,基于DeepSeek-7B大模型,对15个垂直引擎进行深度微调,利用馆藏数据和业务反馈持续优化参数。开放鉴定引擎准确率从92%提升至97.8%;人名、地名、时间抽取引擎覆盖率、准确率均超95%,业务处理质量显著提升。

  知识关联方面,依托大模型重新开展分类聚类和标识标签训练,完成28个专题库数据的分类、标识,将档案文本转化为向量存储,为后续深度检索、知识图谱、智慧编研工作奠定基础。

  复杂处理方面,深入探索大模型对复杂档案的理解、分析、处理能力。在“开放文书析分”业务中,利用大模型理解文档结构和语义逻辑,有效审核校对正文、附件、草稿混杂问题,智能切分精度突破85%。

  通过大模型深度赋能,各引擎在核心业务场景的处理精度与智能程度显著增强。

  五、实践成果:转型成效全面显现

  柯桥馆的实践创新,源于技术突破——国产大模型与行业小模型融合攻克业务难题,源于模式突破——构建了“收-治-用-享”全链闭环,源于生态突破——首创AI矩阵共享模式,成果较为显著。

  一是业务效率显著提升。经统计,开放审核效能飞跃,AI引擎日最高鉴定处理量达3.6万件,相较传统人工模式(5人团队日处理千件)提升360倍。数据治理效率革新,分类标引引擎日处理能力达6000件,效率较人工提升30倍。质检精度突破上限,档案数字化成果质检错误率从人工抽检下的约5%降至AI全检下的0.8%。各类AI引擎的规模化应用,使得核心业务环节年人工成本降低七成。

  二是服务质量升级优化。表现在:查档体验实现革新,响应速度和查全率大幅提升,用户体验显著优化。民生服务更加便捷,依托“浙里办”平台自助出证,办证效率、群众满意度100%。历史档案价值释放,开放鉴定引擎结合人工校检,3个月完成52万件历史档案开放审核,极大释放历史数据价值。精准服务能力提升,精准对接政企需求,黄酒、轻纺城等专题库档案年调用量增长80%。

  三是经济社会效益凸显。体现在:直接降本增效,各类引擎的使用年节约资金成本50%,节省时间成本70%;间接创造价值:支撑司法取证、企业维权、编史修志等场景,服务经济社会发展大局;行业示范引领:柯桥馆AI引擎矩阵入选省级《档案工作要点》与《数字化深度转型实施方案》,列入省级先行先试单位,省级科技项目立项2项,部分引擎在多家单位复制推广,相关学术文章在《浙江档案》刊发。

编辑:毕真