故宫博物院:零代码助力博物馆业务数据价值挖掘及创新
一、企业简介
成立于1925年的故宫博物院,是以明清两代皇宫(紫禁城)和宫廷旧藏文物为基础建立起来的,以宫廷建筑群、古代艺术品及宫廷文化史迹为主要展示内容的大型综合性国家级博物馆。院藏包括世界上规模最大、保存最完整的木结构宫殿建筑群以及明清时代遗留下来的旧藏珍宝。此后,通过国家调拨、向社会征集和接受私人捐赠等方式,故宫博物院院藏得到极大丰富,形成古书画、古器物、宫廷文物、书籍档案等领域蔚成系列、总数超过186万件的珍贵院藏。
1961年,经国务院批准,故宫被定为全国第一批重点文物保护单位。
1987年,故宫被联合国教科文组织列入世界文化遗产名录。
二、业务需求/挑战
故宫的建筑和存藏其间的186万余件文物是我国历史信息含量最丰富的、具有世界影响的重要文化遗产之一,共同构成了其世界遗产价值,在我国历史文化遗产中具有突出的、重大的、丰富的历史价值、文化价值、审美价值、科技价值和时代价值。作为集博物馆、古建筑群、旅游景区为一体的大型综合性博物馆,故宫博物院因其多重身份在管理运营、文化遗产保护和公共文化服务方面始终面临高度复杂的挑战。
作为故宫世界文化遗产的保护管理机构,坚定文化自信,研究保护故宫世界文化遗产并正确阐释其价值,传播弘扬故宫承载的中华优秀传统文化,是故宫博物院的时代责任。2019年,我院明确提出“四个故宫”建设的工作目标,开始全面统筹推进以“平安故宫”“学术故宫”“数字故宫”“活力故宫”为支撑的事业发展体系建设。其中,“数字故宫”强调要充分发挥数字技术对保护、研究、传承弘扬中华优秀传统文化的支撑引领作用,适应时代所需,持续推动信息化基础设施建设、基础数据资源采集、加工、利用以及公众数字化服务。在这一理念指导下,近五年来,我院在5G网络基础设施建设、文物藏品数字化、业务流程数字化以及管理运营智能化等方面都有了长足的进步与发展。
随着数字化转型的深入推进,博物馆事业对高质量发展的要求不断提升,各业务领域对数字技术应用的需求越来越广泛和深入。传统信息系统因其高度定制化和较长的建设周期,已难以高效地响应快速变化的业务需求。以藏品数字化和参观观众服务工作为例,均为故宫博物院的核心业务,均面临跨部门复杂协同的问题,主要体现在以下几个方面:
(1)传统的数据统计方式存在着统计效率低、准确性差的问题。在传统人力统计中,常见的问题包括数据遗漏和人工误录,尤其在数据量大且涉及复杂计算时,效率和准确性都受到影响。在藏品管理部门,相关业务人员通常依赖于Excel等离线报表来进行藏品数字化项目进展的日常数据统计,并通过工作群上报文物数字化进展数据。然而,这种方式存在着多人协作困难、实时性差、数据安全性低、处理大规模数据能力有限以及可视化和交互性不足等问题。在观众服务业务中,数据量通常较大且业务逻辑复杂,面对来自管理、运营、公共教育以及观众服务等部门的高度个性化的数据统计分析需求时,往往需要耗费大量时间和精力从业务系统中导出相关数据进行计算,而且准确性、及时性也难以得到保障。
(2)业务数据的价值挖掘和利用不足。作为非营利性的文化遗产管理、保护和公共文化服务机构,故宫博物院的各项业务逻辑具有领域特殊性,因此在信息化建设、数字化转型过程中,难以直接采用ERP、WMS、CRM等通用解决方案。为此,业务系统往往高度定制,如面向藏品数字资产管理与授权的数字资产管理系统,管理藏品信息编目、出入库、展览、保护修复等业务的藏品管理系统,以及基于“一张图”管理明清皇宫遗产要素的网格化管理系统等。这些系统经过20余年的建设和运营,积累了大量业务数据。但由于系统建设时期和架构的不同,业务数据难以灵活响应新的业务场景需求,无法实现跨业务流程的交叉、关联聚合分析和利用。各专项业务系统内部的报表和可视化页面开发周期长、维度不灵活、使用不便,导致数据价值未能充分发挥。
(3)数据共享形式单一的问题。故宫博物院的业务系统内部报表和可视化模块通常是根据系统目标用户在特定时期的需求定制开发的。这种定制开发在多个业务团队协作的场景下,往往带来复杂的系统权限设置问题,难以实现灵活的维度筛选和动态调整,无法满足多样化和协同的特定数据需求。例如,当藏品管理、修复和遗产监测部门需要共享遗产建筑要素或图纸数据时,系统权限管理的复杂性使得跨部门的数据访问和整合变得困难。此外,现有的报表和可视化工具通常缺乏灵活性,无法适应不断变化的业务需求。为了弥补系统内数据分析和共享功能的不足,用户常常需要依托系统开发人员,将数据从系统中导出进行离线分析和组合。然而,这种数据导出和分享方式不仅脱离了原有的组织架构,无法有效控制数据的查看范围和分享对象,还可能导致数据的安全性和准确性风险。尤其在例如涉及参观观众实名购票等留存了个人隐私数据的业务系统中,在需要保证数据隐私和合规性的情况下,数据导出的不受控性使得数据管理更加复杂和不可靠,影响了数据的共享效率和使用价值。这种形式单一、缺乏灵活性的共享方式显著限制了业务系统的数据价值发挥。
三、解决方案
2021年6月,故宫博物院首次将零代码产品应用于藏品数字化项目进度管理,以应对以下关键需求:
首先,梳理业务数据逻辑,深入挖掘数据内涵;
其次,快速构建核心指标体系并搭建数据看板,使业务人员能够随时随地了解工作进度;
再次,集成至机构的移动办公平台,基于组织架构为不同项目角色进行权限划分;
最后,对相关业务人员进行使用培训,内化搭建能力,以确保技术和业务流程的无缝对接。
到2022年9月,我们将简道云产品运用于参观观众大数据业务。初期,我们通过接口实时传输数据,并将其保存在简道云的数据表单中,同时通过看板和推送形式将数据分发至运营、安全、文创商品和遗产监测等多个部门。为应对海量数据的高度定制化分析需求,我们又引入了九数云平台,显著提高了数据查询与分析的效率。
2024年初,在一个技术研发项目中,项目组利用简道云集成多源业务数据,搭建了典型文物的多维多层级数据集。这一数据集不仅支撑了数据价值的深入挖掘,也为前端场景应用提供了强有力的支持。
文物数字化项目数据管理及服务前期需求调研
四、典型应用场景
场景一:在文物数字化项目中探索构建数据管理与服务模式
(1)痛点:
文物数字化工作是院内重点工作,将文物转化成可高清留存、传播的数字影像资产,是后续文化传播工作开展的基础,也是积极响应国家文化政策,将现有文化资源开放给观众的重要渠道。故宫院藏文物186万余件,藏品规模大,文物等级高,基础数字化程度近50%,仍有很大提升空间,后续文物数字化工作开展面临以下一些问题:
首先是多部门协同,基于院内现有组织架构,文物数字化工作分属5个部门、17个科组日常管理,文物管理部门和数字部门也参与其中共同推进近十万件文物数字化的年度计划,如何对齐各方颗粒度,避免人工通知造成的数据遗漏和误读?
其次是管理方式的优化,表格记录、工作群通知等传统方式相对于正规的业务数据全流程管理来说缺少了数据留痕、权限管理等过程,无法保障数据安全。如何优化全流程管理,提升管理水平?
最后是数据利用效率的提升问题。文物数字化工作积累的流程数据有待进一步挖掘,如何进行文物特点和采集效率等维度的综合分析,更好制定工作计划,推动文物数字化更好更快发展?
(2)解决方案:
利用简道云搭建业务数据管理全流程,首先考虑到数据来源于文物数字资产管理系统以及人工填报两方面,需要搭建多个数据管理表单收集数据。
其次梳理业务流程及数据维度,了解不同部门的数据需求,机构管理层需要能够反映项目进展全貌的宏观业务指标,对于业务部门来说,与文物特点和效率相关的数据分析更能帮助到计划的落实,根据梳理结果,搭建不同的看板分权限管理,保证数据的精准投放。
同时将看板和院内现有办公软件集成,降低了学习使用成本,能够快速上手,方便手机端随时查看。
(3)场景价值:
文物数字化工作对于大部分文博单位来说都是长期基础性工作,也是后续工作能否开展的关键环节,因而引入简道云搭建业务数据全流程管理应用,利用这一高效灵活的数字化工具,减少人工处理数据及沟通成本,优化多部门协同工作模式,推动年度计划落实;充分运用数据计算组件,挖掘业务数据内涵,搭建业务指标体系,科学统筹业务发展;数据管理更加规范,数据格式标准化方便后续各种平台的数据对接需求。
文物数字化数据推送提醒
移动端看板界面
文物数字化数据管理数据工厂
文物数字化工作现场
场景二:挖掘观众大数据价值,提高数据利用水平,辅助科学决策
(1)痛点:
故宫博物院作为国内热门旅游景区,每年接待上千万观众,产生海量的用户行为数据。这些数据与故宫的文物保护、开放服务、文创经营等工作息息相关,具有价值挖掘的潜力。之前受限于技术水平,这部分数据未能充分利用,数据分析还处于较低水平的应用层面,例如简单的数据统计、对比分析等等。
由于故宫的业务复杂,票务运营情况复杂,在面对比较复杂的数据分析需求时,往往无法快速响应,例如《智慧旅游创新发展行动计划》发布,要求提供适老化购票渠道,在调整过程中人员配备、路线分配、流程制定等方面都需要数据做支撑。面对复杂数据需求,再过去需要联系合作单位的技术人员协助进行定制化功能开发或者做数据查询分析,效率较低,耗费人力,不够灵活。而许多部门都需要票务数据来支持工作决策,传统的数据提供只能是定期报送或者人工通知,时效性差,不利于工作开展。
1.解决方案:
故宫博物院利用低代码平台快速搭建了一套集数据采集、传输、存储、分析和利用的规范化数据管理体系,以较低成本较高效率,一定程度上解决了博物馆大数据体系建设难、更新慢、技术能力缺乏等问题,帮助加速数字化转型进程。
观众服务数据体系架构
在这套体系的支撑下,千万级的海量数据得以在低代码平台上存储、分析,对于复杂的数据需求可以进行流程式的自助分析。至今,依托大数据分析,故宫开展了132项深入的专项分析,对观众的购票行为、参观时段、群体分布及特征、参观轨迹等方面进行全量分析。
九数云查询结果界面
此外,低代码平台还提供了强大的查询、筛选等数据处理功能,使得管理部门可以根据自己的需求,自由地对数据进行分析和挖掘。便捷的模块化设计,可以快速搭建直观的数据查询页面,提供丰富维度,提升了查询效率。
多条件查询界面
通过搭建票务数据看板,可以进行实时反馈特定区域内人流量状态、动态趋势数据,并将结果在移动设备上进行推送,从而实现及时导流、限流、预警等。这个过程无缝嵌入故宫的移动办公生态,使得故宫博物院自己的业务人员能便捷高效地使用数据服务,助力各项业务工作,实现数据驱动,提高业务决策的质量和效率。
九数云移动端界面
简道云看板移动端界面
观众服务数据推送
以故宫博物院分时参观政策制定为例,为缓解参观压力,避免观众聚集造成安全隐患,需要将每日的门票区分多个时段,但具体的实施需结合实际观众参观分布情况制定,过于松散无法起到分流作用,过于严格又会降低参观体验。因此,故宫借助观众大数据平台,分析了观众全年到访曲线,并根据特性制定了上下午分时,中间一小时缓冲的分时政策,目前处于试行阶段,收集数据,后续会逐步反馈优化。
观众全年到访曲线
2.场景价值:
故宫博物院观众大数据平台采用了低代码应用的建设方式。轻量化特性使得数据的采集、清洗、集成、存储和管理等环节可以在云端完成,大大降低了初期投资和后期维护成本,同时缩短了部署时间。规范化、标准化的工作流程确保数据的安全和服务的稳定,让数据价值在博物馆中得以快速显现。通过近两年的建设与探索,故宫博物院的大数据实践不仅仅在短期内提升了观众服务水平,也为博物馆如何利用数据技术来实现更长远的战略规划提供了见解。这一变革不仅仅局限于数据处理层面,它还改变了管理者对数据的思考方式。在大数据的辅助下,博物馆管理人员可以进行更加细致的洞察和分析,使得管理精度得到了进一步的提高,有助于形成更合理的服务策略,提升服务质量和效率。
场景三:关键技术研发项目中的原状陈列文物多维多层级数据集建设
(1)痛点:
在故宫博物院集博物馆、古建筑群和旅游景区为一体的大型综合性机构框架下,原状陈列文物扮演着关键角色。它们融合了丰富的空间信息、环境信息,以及管理、保护、利用和公共服务相关的数据,不仅自身蕴含历史文化价值,更是故宫博物院提供公共文化服务不可或缺的要素。原状陈列文物与遗产建筑空间相互依存,共同构成了可移动文物、遗产地和公共文化服务三者紧密融合的整体。它们是开展系统性古建筑与文物研究性保护工作的重要组成部分,体现了故宫“活态”传承文化遗产的独特性和价值。通过数字化手段,原状陈列文物的信息可被更好地保存、展示和利用,为博物馆、遗产地管理和运营提供决策支撑,为公众提供身临其境的文化体验。
在近期的一个关键技术研发项目中,针对院藏原状陈列文物的数据体系建设与数据挖掘技术研究,需要快速构建相关类别文物的基准数据集,支持智能服务应用,其中,文物的本体数据来源于藏品管理系统、不同时期的展览图录,环境数据来源于物联网传感器、管理数据则来源于遗产建筑管理系统、行政办公系统等多个渠道,数据种类多样,来源不一,高度异构,缺乏系统性的数据关联及组织模式。
(2)解决方案:
首先需要构建数据模型,元数据标准方面,考察了都柏林核心元数据集(Dublin Core Element Set,DC)、艺术品描述类目(Categories for the Description of Works of Art,CDWA)、Europeana数据模型(Europeana Data Model,EDM)、LinkedArt等广泛应用于文化遗产领域的规范,确保构建的数据集在结构、语义和格式层面具备规范性、一致性和互操作性,有利于数据的开放获取与共享利用。内容标准方面参考Spectrum等内容组织规范,为原状陈列文物信息描述建立了统一框架,确保数据内容的全面性与权威性。数据交换标准参考轻量级对象描述信息(Lightweight Information Describing Objects,LIDO)、展览对象数据交换模型(Exhibition Object Data Exchange Model,EODEM)等规范,使数据集能与异构系统高效对接,实现跨平台互操作和集成。在数据质量把控方面,信息单元值的填写规范借鉴了艺术与建筑索引典(Art & Architecture Thesaurus,AAT)、GeoNames、Iconclass、地理名称索引典(Thesaurus of Geographic Names,TGN)、维基数据(Wikidata)等权威知识源和链接开放数据,为数据集建设提供权威指引。
在确定数据集的维度划分、层级设计和信息单元规划后,课题团队基于零代码数据管理平台进行原状陈列文物数据集的建设。通过敏捷建设的方式搭建流程表单,实现对每个信息单元进行数据类型定义和填写规范制定,如文本、数值、日期等数据类型以及标准化的值域范围、格式要求等,确保填写内容的一致性和规范性。针对原状陈列文物的编目信息、流程数据和相关资源信息展开数据填写工作。在填写过程中,根据实际需求持续优化和完善表单结构设计,包括为需要重复填写的内容构建子表单;为机构名称、人员姓名等建立规范的基础数据表;将权威知识源和链接开放数据纳入,为唯一实体编码和相关信息提供永久链接,确保数据的权威性和可追溯性;实时数据格式验证,避免数据错录;数据版本备份,确保数据集更改可回溯;融合人工填写数据与系统导出数据时注意数据处理的标准化和规范化,并具有数据交换能力等。
数据集建设完成后,将数据导出为标准交换格式文件,该建设流程贯穿了数据集设计、表单构建、数据填报、数据融合和规范化处理等环节,不仅规范了操作步骤,更着力于通过不断优化和补充,确保最终输出数据集的质量和一致性。
(3)场景价值:
随着数字技术的快速发展,业务创新和解决方案研发日益需要对具体场景下的多源异构业务数据进行快速录入、整合和结构化处理,为后续的机器学习建模、试点应用等提供高质量数据支撑。因此,构建一体化的业务数据管理工具,能够高效汇总和处理各类非结构化和半结构化业务数据,面向不同需求形成不同规模和组织方式的样本数据集,不仅有助于挖掘现有数据的深层价值,更有利于赋能新技术在业务领域的创新应用,助推业务模式和运营方式的持续优化。
多维多层级数据集表单
多维多层级数据集数据管理页面
养心殿原状陈列文物图片
数据集标准交换格式文件
五、总结与展望
曾德麟等在《数字化转型研究:整合框架与未来展望》一文中写道:数字化转型是以数字化技术、数字化产品和数字化平台的基础设施为支撑起点,进而引发个人、组织、产业等多个层面变革的过程[ 曾德麟、蔡家玮、欧阳桃花《数字化转型研究:整合框架与未来展望》,《外国经济与管理》第43卷第5期 P63。]。他将数字化转型定义为一个过程,数字化的技术、产品和平台在这个过程中各自发挥着作用。这样的数字化转型正在社会的各个层面发生着,博物馆也不例外。2023年,故宫博物院通过简道云流转了16,470次流程,查看仪表盘超过3.7万次,API触发次数超过7152万次。
零代码解决方案在业务数据价值挖掘和技术创新中的应用,是故宫博物院在数字化转型不断深化过程中做出的尝试。该方案不仅提升了数据利用效率,减少了相关业务人员的工作量,还规范了数据管理流程。尽管零代码产品在数据私有化、数据处理能力及系统稳定性方面尚有提升空间,但其轻量化和便捷性的特点降低了学习成本,缩短了实施时间,对于数字化进程中出现的多种场景具有高度适配性。
当前,大型综合性博物馆在协同管理、运营、文化遗产保护和公共文化服务方面面临巨大挑战。为提升数字化管理水平,故宫博物院基于零代码技术解决方案赋能部分关键业务流程,为业务开展提供了更高效有力的数据支撑,它一方面打破了原先因精细化分工导致的各项业务条块分割的工作模式,实现了跨部门、跨系统的数据整合,有效整合了机构内外部的运营数据资源;另一方面通过数据建模等手段,深度挖掘数据价值,为科学决策提供数据支撑,并根据分析结果快速优化流程,推动持续改进,敏捷响应业务变化需求。该解决方案助力机构跨越数据鸿沟,融合分散的业务系统,有效推动贯穿运营全生命周期的数据化管理模式的逐步建立,促进博物馆事业高质量发展。