首页 > 广播电影电视行业标准(GY) > GY/T 351-2021 广播电视和网络视听收视综合评价数据脱敏规则
GY/T 351-2021

基本信息

标准号: GY/T 351-2021

中文名称:广播电视和网络视听收视综合评价数据脱敏规则

标准类别:广播电影电视行业标准(GY)

标准状态:现行

出版语种:简体中文

下载格式:.zip .pdf

下载大小:255157

相关标签: 广播电视 网络 视听 收视 综合 评价 数据 规则

标准分类号

关联标准

出版信息

相关单位信息

标准简介

GY/T 351-2021.Masking rules of radio TV and internet video and audio service big data for comprehensive evaluation.
GY/T 351规定了广播电视和网络视听收视综合评价数据的脱敏原则、脱敏技术、脱敏流程和脱敏要求。
GY/T 351适用于广播电视和网络视听收视综合评价数据的脱敏。
2规范性引用文件
本文件没有规范性引用文件。
3术语和定义
下列术语和定义适用于本文件。
3.1个人敏感信息personal sensitive informat ion一旦泄露、非法提供或滥用可能危害人身和财产安全,极易导致个人名誉、身心健康受到损害或歧视性待遇等的个人信息。
注1:个人敏感信息包括身份证号码、个人生物识别信息、银行账号、通信记录和内容、财产信息、征信信息、行踪轨迹、住宿信息、健康生理信息、交易信息、14岁以下(含)儿童的个人信息等。
注2:个人信息控制者通过个人信息或其他信息加工处理后形成的信息,如一旦泄露、非法提供或滥用可能危害人身和财产安全,极易导致个人名誉、身心健康受到损害或歧视性待遇等的,属于个人敏感信息。[来源: GB/T 35273- 2020, 3. 2]
3.2敏感属性sensitive attr ibute数据集中需要保护的属性,该属性值的泄露、修改、破坏或丢失会对个人产生损害。
注:在潜在的重标识攻击期间需要防止其值与任何-一个个人信息主体相关联。[来源: GB/T 37964-2019, 3. 10]
3.3敏感数据sensitive data原始数据中具有敏感属性的用户个人信息数据。
3.4数据脱敏data masking按照一-定的规则对原始数据进行变形,屏蔽原始数据中的敏感信息,并保留业务环境所需要的数据特征和内容。
3.5用户ID user identificat ion

标准图片预览






标准内容

中华人民共和国广播电视和网络视听行业标准GY/T351—2021
广播电视和网络视听收视综合评价数据脱敏规则
Masking rules of radio TV and internet video and audio service big data forcomprehensiveevaluation
2021-05-31发布
国家广播电视总局
2021-05-31实施
规范性引用文件
术语和定义
数据脱敏原则
有效性
可用性
高效性
稳定性
防御性
可审计性
数据脱敏技术
概述,
6.2泛化技术
6.3抑制技术
扰乱技术,
数据脱敏流程
发现敏感数据
标识敏感数据
制定脱敏方案
执行脱敏操作
评估脱敏效果
数据脱敏要求
脱敏要求
用户数据,
设备数据
参考文献
GY/T351—2021
GY/T351—2021
本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由全国广播电影电视标准化技术委员会(SAC/TC239)归口。本文件起草单位:国家广播电视总局广播电视规划院、华数传媒网络有限公司、华数数字电视传媒集团有限公司、广东南方新媒体股份有限公司。本文件主要起草人:李忠、郑冠雯、聂明杰、李庆国、曹志、王志豪、胡曦宸、遇琪、诸葛海标、张玮、黄元浩、唐志燕、刘晓敏、股楚冬、张元迪。11
1范围
GY/T351—2021
广播电视和网络视听收视综合评价数据脱敏规则本文件规定了广播电视和网络视听收视综合评价数据的脱敏原则、脱敏技术、脱敏流程和脱敏要求,本文件适用于广播电视和网络视听收视综合评价数据的脱敏2规范性引用文件
本文件没有规范性引用文件。
3术语和定义
下列术语和定义适用于本文件。3.1
个人敏感信息personalsensitiveinformation一旦泄露、非法提供或滥用可能危害人身和财产安全,极易导致个人名誉、身心健康受到损害或歧视性待遇等的个人信息。
注1:个人敏感信息包括身份证号码、个人生物识别信息、银行账号、通信记录和内容、财产信息、征信信息、行踪轨迹、住宿信息、健康生理信息、交易信息、14岁以下(含)儿童的个人信息等。注2:个人信息控制者通过个人信息或其他信息加工处理后形成的信息,如一旦泄露、非法提供或滥用可能危害人身和财产安全,极易导致个人名誉、身心健康受到损害或歧视性待遇等的,属于个人敏感信息。来源:GB/T352732020,3.2
敏感属性
sensitiveattribute
数据集中需要保护的属性,该属性值的泄露、修改、破坏或丢失会对个人产生损害。注:在潜在的重标识攻击期间需要防止其值与任何一个个人信息主体相关联。L来源:GB/T37964-2019,3.10
敏感数据
居sensitivedata
原始数据中具有敏感属性的用户个人信息数据。3.4
数据脱敏datamasking
按照一定的规则对原始数据进行变形,屏蔽原始数据中的敏感信息,并保留业务环境所需要的数据特征和内容。
useridentification
用户ID
由数据提供方系统生成,用于唯一识别用户的一组不重复的编码。3.6
GY/T 351—2021
useraccount
用户账号
用户在互联网视听平台中代表自已身份的名称。4概述
数据脱敏是按照一定的方法、流程以及输出格式,对敏感数据进行处理,以确保敏感数据不泄露脱敏后的数据应尽可能体现原始数据的特征和内容,并能在相关业务中继续使用。广播电视和网络视听收视综合评价数据应为实现收视综合评价目的所必须的最小化数据,不包含用户姓名、出生日期、身份证号码、个人生物识别信息、住址、通信联系方式等个人敏感信息。对广播电视和网络视听收视综合评价数据包含的用户账号、设备信息、IP地址等,应按照本文件进行数据脱敏处理。
数据脱敏原则
5.1有效性
数据经过脱敏处理之后,原始信息中包含的用户个人敏感信息应已被移除,第三方应无法通过处理后的数据得到敏感信息:或需通过巨大的经济代价、时间代价才能得到用户个人敏感信息。5.2可用性
脱敏后的数据应保持数据的原有特征,保证数据在非原始环境中的可用性,在脱敏过程中应保留原始数据中的信息,保证收视大数据的开发、测试、培训过程中不会受到脱敏的影响。为保证可用性应满足以下要求:
保持原数据格式、类型、依存关系;-保持语义完整性;
一一保持引用完整性;
一一保持数据统计、聚合特征;保持唯一性。
5.3高效性
应保证数据脱敏的过程可通过程序自动化实现,可重复执行。5.4稳定性
为保障数据使用者可正常使用和分析数据,数据脱敏应保证脱敏后的数据与原始数据之间的关联性,脱敏数据之间的关联应是稳定的。5.5防御性
应保障数据脱敏算法不被同质属性、概率、知识推断等手段攻击,确保脱敏安全可靠。5.6可审计性
在数据脱敏各个阶段应加入安全审计机制,严格、详细记录数据处理过程中的相关信息,形成完整数据整理记录,用于后续问题排查与数据追踪分析。2
6数据脱敏技术
6.1概述
GY/T351—2021
广播电视和网络视听收视综合评价数据脱敏可采用泛化技术、抑制技术和扰乱技术。6.2泛化技术
泛化技术是指一种降低数据集中所选属性粒度的去标识化技术,对数据进行更概括、抽象的描述泛化技术包括但不限于:
截断:舍弃不需要的信息,仅保留部分关键信息,保证数据的模糊性:a)
偏移取整:按照一定粒度对时间进行向上或向下偏移取整,保证时间数据满足一定的分布特征b)
同时隐藏原始时间信息:
c)规整:将数据按照大小规整到预定义的多个档位进行分类。6.3抑制技术
抑制技术即对不满足隐私保护的数据项删除,不进行发布。包括从所有记录中对选定的属性(如房蔽)、对所选定的属性值(例如,局部抑制),或是从数据集中选定的记录(例如,记录抑制)进行的删除操作:或对敏感数据部分内容使用通用字符进行替换(掩码技术)。6.4:扰乱技术
扰乱是指通过加入噪声的方式对原始数据进行干扰,以实现对原始数据的扭曲、改变,扰乱后的数据仍保留着原始数据的分布特征,具体的技术方法包括但不限于:a)加密:使用加密算法对原始数据进行加密:b)重排:将原始数据按照特定规则进行重新排列;c
替换:按照特定规则对原始数据进行替换:均化;针对数值性的敏感数据,在保证脱敏后数据集总值或平均值与原数据相同的情况下,改d)
变数据的原始值;
散列:对原始数据取散列值,使用散列值来代替原始数据。e)
7数据脱敏流程
7.1概述
原始广播电视和网络视听收视综合评价数据经数据预处理后,应按发现敏感数据、标识敏感数据、制定脱敏方案、执行脱敏操作、评估脱敏效果的流程进行数据脱敏处理。7.2发现敏感数据
数据提供方应对原始数据进行梳理和分类,将数据分为高度敏感数据、中度敏感数据和非敏感数据:司时,应分析并建立完整的脱敏数据位置和关系库,确保数据脱敏能充分考虑到数据应用的业务范围、脱敏后数据对原始数据业务特性的继承等。7.3标识敏感数据
数据提供方应对敏感数据进行标识,并对敏感数据的关系进行调整,以保证数据的关联关系。3
GY/T351—2021
7.4制定脱敏方案
数据提供方应按照广播电视和网络视听收视综合评价的业务需求,根据场景确定脱敏规则和脱敏技术,确定数据脱敏的方案。
7.5执行脱敏操作
数据提供方应按照脱敏方案,对广播电视和网络视听收视综合评价数据执行脱敏操作。7.6评估脱敏效果
数据提供方和数据接收方对数据脱敏效果进行评估,确保脱敏操作有效、脱敏数据可用。8数据脱敏要求
8.1脱敏要求
数据提供方应对用户ID、用户账号、终端设备ID、终端设备网络IP等信息进行脱敏。数据提供方可根据数据安全要求,在不影响收视综合分析和合规的前提下,对其他敏感数据进行脱敏。
8.2用户数据
8.2.1用户ID
数据提供方可对用户ID进行脱敏处理,脱敏后的用户ID应保证数据关联性,并对数据提供方可逆。为方便数据分析,数据提供方对用户ID脱敏后,应按图1所示的格式,在用户ID前加上运营商类型和用户地域信息。
运营商
2字节
用户ID编码规则包含以下信息。用户地域编码
4字节
图1用户ID编码规则
a)运营商类型,2字节,取值如下:有线电视:01:
IPTV:02:
互联网电视:03:
互联网视听服务:04。
用户编码
用户地域编码:4字节,取值为地区邮政编码前4位,如北京市西城区为“1000”,上海浦东新b)
区为“2012”,浙江杭州萧山区为“3112”。8.2.2用户账号
数据提供方应对用户账号进行脱敏处理,脱敏时应保证用户账号唯一性。4
8.2.3用户年龄
数据提供方应对用户年龄进行脱敏处理GY/T351—2021
用户年龄脱敏采用规整算法,规整档位间隔应为5,如0至5岁规整为5,6至10岁规整为10,11至15罗规整为15。bZxz.net
3设备数据
终端设备ID
数据提供方应对终端设备ID进行脱敏处理,脱敏时应保证终端设备ID唯一性。终端设备网络IP
数据提供方应对终端设备网络IP进行脱敏处理。终端设备网络IP脱敏应采用掩码技术,对终端设备网络IP后两段字符使用字符“x”进行替换,替换后的IP地址如“58.100.xxx.xxx”。5
GY/T351—2021
GB/T35273—2020
GB/T37964—2019
GD/J075—2018
参考文献
信息安全技术个人信息安全规范信息安全技术个人信息去标识化指南电视收视数据交换接口规范
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。