公共安全标准网
ICS01.040.35 CCSL70 35 福建省地方标准 DB35/T2240—2024 公共数据清洗技术要求 Technicalrequirementsforpublicdatacleaning 2024-12-24发布 2025-03-24实施 福建省市场监督管理局  发布 DB35/T2240—2024 I目次 前言..................................................................................II 1范围................................................................................1 2规范性引用文件......................................................................1 3术语和定义..........................................................................1 4基本原则............................................................................2 5过程要求............................................................................2 6方法要求............................................................................5 7安全要求............................................................................7 附录A(资料性)数据清洗的常见方法....................................................8 参考文献...............................................................................9 DB35/T2240—2024 II前言 本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由福建大数据一级开发有限公司提出。 本文件由福建省信息化标准化技术委员会(SAFJ/TC11)归口。 本文件起草单位:福建大数据一级开发有限公司、福建省数字经济发展促进中心、福建省市场监督 管理局行政服务中心、福建省网络与信息安全测评中心、福建省建设信息中心、福建奇比特信息科技有 限公司。 本文件主要起草人:李喆、陈国清、徐侃、涂平、王宇奇、邹建红、黄炜、石福仁、游鄂平、梁煜、 张镇晖、李元、傅腾宇、李海、吴春华、马腾、陈闪闪、谢丹丹、张健文。 DB35/T 2240 —2024 1 公共数据清洗技术要求 1 范围 本文件规定了公共数据清洗的基本原则、过程要求、方法要求和安全要求。 本文件适用于一体化公共数据的抽取、转换、核验、加载等清洗环节。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。 其中, 注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最 新版本(包括所有的修改单)适用于本 文件。 GB/T 22239 信息安全技术 网络安全等级保护基本要求 GB/T 35274 信息安全技术 大数据服务安全能力要求 GB/T 36344 —2018 信息技术 数据质量评价指标 GB/T 37973 信息安全技术 大数据安全管理指南 GB/T 39477 信息安全技术 政务信息共享 数据安全技术要求 GB/T 43697 数据安全技术 数据分类分级规则 3 术语和定义 下列术语和定义适用于本文件。 3.1 公共数据 public data 公共管理和服务机构在依法履职或者提供公共管理和服务过程中收集、产生的,以一定形式记录、 保存的各类数据及其衍生数据。 注1:公共管理和服务机构是指政务部门以及公益事业单位、公用企业。 注2:包含政务、公益事业单位数据和公用企业数据。 3.2 公共数据资源目录 public data resource catalog 依据公共数据资源的元数据,按照一定的分类方法进行编码的一组信息,用以描述各个公共数据资 源的特征,便于公共数据资源的检索、定位与获取。 3.3 缺失值 missing value 在数据归集与整理过程中未获得 的数值、属性或内容。 3.4 重复值 duplicate value 数据集存在两条及以上完全相同的记录,或在某一字段内存在多个相同的值。

.pdf文档 DB35-T 2240-2024 公共数据清洗技术要求 福建省

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
DB35-T 2240-2024 公共数据清洗技术要求 福建省 第 1 页 DB35-T 2240-2024 公共数据清洗技术要求 福建省 第 2 页 DB35-T 2240-2024 公共数据清洗技术要求 福建省 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-02-20 22:18:42上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。