电力大数据(八):数据安全为电网数据运营保驾护航
苟蛟龙 | 2016-05-03 14:35
【数据猿导读】 大数据蕴含着价值信息,但数据安全面临严峻挑战。本文基于电网营销数据和特点,探讨了在电网营销数据运营过程中保障数据安全的四个关键点,包括技术安全、业务安全、组织安全、制度安全。另外对如何利用基于隐私保护的数据挖掘技术(PPDM)解决电网运营中隐私保护的问题做了深入的剖析。...
摘要:大数据蕴含着价值信息,但数据安全面临严峻挑战。本文基于电网营销数据和特点,探讨了在电网营销数据运营过程中保障数据安全的四个关键点,包括技术安全、业务安全、组织安全、制度安全。另外对如何利用基于隐私保护的数据挖掘技术(PPDM)解决电网运营中隐私保护的问题做了深入的剖析。本文旨在通过研究电网营销数据运营中的数据安全技术,加速电网营销数据市场化进程,为数据运营保驾护航。
数据安全之我见
如果说电网营销数据运营的过程是“放”,那么在过程中注重数据的安全则是“收”。前者代表了分享,后者则诠释了控制。收放自如,在确保营销数据安全的基础上才能更好的数据运营,释放营销数据红利。 电网营销数据运营涵盖了从数据源到数据最终的价值变现,实现了将数据形成有价值资产到数据资产价值反馈业务优化的闭环。整个过程的特点是:业务众多、人员构成多样、需要完善的运营制度、技术类别多。电网营销数据安全就是要在符合国家安全法律要求的前提下,利用技术、业务、组织以及制度等确保数据的安全。
技术安全
营销数据运营的数据安全,需要从技术上最大程度保证数据的安全。结合大数据行业经验,技术安全可从以下五个部分和一个主动防御模块入手:
一、使用数据。避免原始数据对外的直接传输,可以通过数据脱敏、使用加工后的数据,按照客户隐私规则、商密保护规则,通过磁盘加密、文件加密的方式最小化数据泄露的风险。
二、数据管理。首先盘点数据资源,对数据分门别类,然后根据实际场景划分数据安全等级,实现数据安全等级化管理,最后提供数据销毁的功能。
三、访问控制。
1)身份管理,即“谁应该看什么,谁不应该看什么,谁看什么的时候只能看什么”。
2)认证管理,某角色需要查看或使用权限范围外的数据可以发起认证申请,通过后则提升该角色的权限范围。
3)功能授权,赋予某角色使用某功能。
四、网络安全。
1)客户端数据到集群的数据传输全过程加密。
2)集群内节点到节点传输加密。
3)集群内数据之间调度及数据结果可视化展现加密。
五、基础安全。
1)日志管理,沉淀电网营销数据运营系统运行日志,继而分析日志,流程,漏洞,发现高风险威胁。
2)终端安全,以安全管理中心策略控制为核心,以终端安全为基础,通过对现有操作系统进行安全增强,使得安全管理员能够对终端进行集中管理和控制,保证信息系统始终在可控状态下运行,从而从根源上有效抑制对信息系统安全的威胁,最终达到防止内部用户以及外部用户攻击的目的。
3)容灾备份,在相隔较远的异地,建立两套或多套功能相同的数据运营系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。
4)数据监控,结合运营沉淀数据,在线监测服务异动、数据异动等。
除了以上保障数据安全的五个部分,基于大数据技术的主动防御模块,也是为电网营销数据运营数据安全保驾护航的一把利器,防御模块提供了实时在线、主动防御、智能准确的数据防泄密功能,并且贯穿于数据运营整个过程。主动防御模块结合历史运营数据,利用雷尼信息熵、交互式网络流、决策树等算法模型,主动探寻数据运营中失泄密规律,当发生数据疑似失泄密时,主动防御模块立即将此疑似泄密事件上报管理员进行处理,最大程度上保障了电网营销数据的安全。
关于数据运营中的隐私保护的问题,如远程进行数据挖掘或使用数据,数据中可能包含客户的隐私数据,可利用基于隐私保护的数据挖掘(PPDM)技术来解决。隐私保护的主要目标是使用某种方法对原始数据进行处理,使得私有数据和知识在挖掘之后仍然是私有的。不但要在开始时对某些信息进行保护,而且对挖掘过程中产生的敏感规则也要进行保护,还要考虑挖掘产生的结果是否会包含某些重要的隐私信息。基于隐私保护的数据挖掘技术按照原始数据的隐藏情况,可以分为对原始数据进行扰动、替换和匿名隐藏等隐私保护技术,如安全多方计算SMC技术、匿名技术、数据转换技术等:
1、安全多方计算SMC技术。安全多方计算是解决分布式计算安全性的重要技术。在分布式环境中,为了保护隐私,参与数据挖掘的各个节点间互相不知道对方的原始数据,这样最能保证隐私不被泄漏。参与挖掘的各个节点互相不进行数据交流,把挖掘所需的原始数据都送到信任的第三方进行挖掘,最后取得挖掘结果。实际上,安全多方计算时一种分布式计算协议,而该协议通常是根据挖掘技术来制定的。比如远程对国家电网分省的电量数据做挖掘,则就可以使用这种安全多方计算技术,各个省公司不知道其他省的数据情况,而计算中心计算出结果后,直接推送挖掘结果给具体的省公司。
2、匿名技术。匿名技术是身份隐藏中最直接的技术。它作为隐私保护的数据挖掘技术不对数据挖掘结果进行保护,也不将原始数据进行隐藏伪装,而是公布带隐私的所有数据,但是他人拿到隐私数据却不能推导出该数据的所有数据。
具体的隐私保护方法可以分为以下两类:
1)保护隐私属性集合。单个节点公布数据的时候,节点的标识部分不加密,将隐私属性部分单独加密。系统对每个节点的数据进行汇总后也不能看到每个节点的隐私数据,而只能看到该节点的标识属性数据。系统将收集到的所有节点的标识属性进行归类统计,当统计得出某个节点的标识属性在整个系统中重复次数超过Mi解密第i个节点的隐私属性。
2)隐藏标志属性集合。节点参与系统的数据挖掘的时候,通过一个算法要求系统给出每个节点标识规则。系统应该能测算出至少满足节点标识重复度大于临界值的标识规则。节点根据这个规则在对外公布数据时,合理选取标识,使得系统得到的数据由于标识的重复不能一一对应,从而保护节点的隐私。
3、数据转换技术。
数据转换技术主要是将用户的真实隐私数据进行伪装或轻微改变,通过数据挖掘,得到可以接受的挖掘结果。根据不同的数据挖掘技术,对原始数据的伪装方式也不尽相同。常见的数据转换技术有数据几何变换方法、随机扰动方法等。
1)数据的集合变换法。利用计算机图形学中的几何变换思想来对数据进行变换达到保护数据的目的。常见的几何变换有数据平移、缩放、旋转等。该类数据转换方法在聚类挖掘技术中应用较好。
2)随机扰动技术。该方法将单个节点的原始值X1,X2,...Xn看作是n个具有相同分布的独立随机变量X1,X2,...Xn的值,随机变量X1,X2,...Xn具有相同的分布,密度函数是Fx。实际上真实的电网营销数据可能是X1+Y1,X2+Y2,...,Xn+Yn,其中Yi是加入的噪声数据,而Yi对应的密度函数是Fy。对于挖掘算法来说,如果已知Xi+Yi和Fy则需要推断出Xi的取值,才能进行相应的数据挖掘。这里可以利用贝叶斯规则迭代进行近似估算Fx利用随机扰动技术进行隐私保护的数据挖掘方法有决策树构造法、关联规则发现等。
业务安全
通过建立营销数据运营系统,我们一方面比较关注营销数据运营产生的价值,另一方面也应该关注业务安全。
业务安全是因为业务需要形成的业务逻辑的安全。业务安全应该包括因为业务设计、业务实现产生的安全问题。业务安全的例子很多,比如某系统因为未设定登录的错误限制次数,导致被攻击者暴力破解攻击。业务安全有一个重要的特点是个性化。比如,在大量的论坛登录中仅使用了用户名和口令;而工商银行的登录中不仅使用了用户名、口令、图片验证码,而且还对传输数据进行了加密。这也是因为业务需求的保障级别不同:论坛的用户不具备金钱交易,可能信息也不真实,因此对安全要求较低;而银行的交易必须非常安全,因此采用更多的安全手段。
因此,我们不能简单地说一个业务的设计是不是安全,具体的评判需要依据业务的需求、用户的应用场景来进行判断。
组织安全
营销数据运营是一个跨业务、跨部门的复杂工程和系统,需要科学、统一、完善的组织。
上图为组织安全的金字塔结构:
1)策略层,电网营销部门统一部署,组建数据安全小组,全面负责大营销数据运营的顶层设计,包括数据安全风险管理战略、规划,提出数据安全风险管理的政策和程序,建立数据安全风险评估体系,监督数据安全措施的执行情况。
2)管理层,设立营销数据运营中子项目的负责人,除了全面负责营销子项目正常平稳运营,还肩负项目中数据的安全政策、安全制度等的执行和内部管理和监督。
3)执行层,即普通员工,隶属于营销数据运营子项目,实际执行各项安全政策,每个普通员工实际只能接触到营销子项目的某个具体任务的数据,实现项目内子任务间的数据隔离。
统一部署的审计组需要从国家安全、系统安全和用户信息安全需求出发,按照电力营销信息的分级分类,进行电力营销及相关数据采集、传输、存储、处理和共享全过程的安全监管,具体包括策略层、管理层、执行层的审计。
制度安全
制度安全就是通过制定安全管理的制度,控制数据安全风险。电网营销数据运营系统的安全管理制度制定,可以从以下几个主要方面入手:
1)存放营销的备份数据的介质必须具有明确的标识。
2)保证存储介质的物理安全。
3)任何非应用性业务数据的使用及存放数据的设备或介质的调拨、转让、废弃或销毁必须严格按照程序进行逐级审批,以保证备份数据安全完整。
4)如果营销数据需要进行数据恢复,确保数据恢复的完整性和可用性。
5)数据清理前必须对数据进行备份,在确认备份正确后方可进行清理操作。
6)如果某些营销数据需要转存,必须有详细的文档记录。
7)非本单位技术人员对本公司的设备、系统等进行维修、维护时,必须在本公司相关技术人员现场全程监督。
8)营销数据运营管理部门应对报废设备妥善处理,防止数据泄密。
9)运维部门需指定专门人负责计算机病毒的防范工作,防范于未然。
10)禁止来历不明的载体,如移动硬盘、光盘等连接营销数据运营相关计算机。
数据安全之小节
安全生产无小事,电网营销数据运营更是如此,在确保营销数据安全的基础上才能更好的数据运营,释放营销数据红利。大数据时代,数据会越来越多,使用数据的用户和环节也越来越多,数据安全不仅需要从系统和技术的角度发力,更是需要组织和社会工程学的护航,如本文通过业务安全、组织安全、制度安全、技术安全四个方面,思考和探索了如何在营销数据运营中确保数据的安全。当然,有防守,就有攻击,数据安全一直在路上……
来源:美林大数据
我要评论
活动推荐more >
- 2018 上海国际大数据产业高2018-12-03
- 2018上海国际计算机网络及信2018-12-03
- 中国国际信息通信展览会将于2018-09-26
- 第五届FEA消费金融国际峰会62018-06-21
- 第五届FEA消费金融国际峰会2018-06-21
- “无界区块链技术峰会2018”2018-06-14