目录
大数据概念
大数据主要有四V特性,海量的数据规模,快速的数据流转,多样的数据类型以及价值密度低
大数据数据量很大,以前可能我们说的GB,到后来TB,再到后来PB、EB,再到ZB,它们的一个换算单位都是1024,也就是1TB等于1024g的,然后1PB又等于1024TB,后面一个又是它的1024倍,所以随着时代的发展,我们的数据量是呈爆炸式的增长,因为我现在有海量的数据规模
第二个快速的数据流转,现在在这个大数据的时代,数据流转很快,举一个最简单的例子,比如说每天都有热搜,今天的热搜跟明天的热搜是都不一样的,数据流转快的很
数据类型也很多,最典型的现在有音频视频,有文件等等各种各样的格式,然后由于你的数据量很大,其实从单个数据来讲,你的价值密度是比较低的
大数据的种类和来源非常多,它主要包括结构化,半结构化和非结构化的数据,结构化的数据主要就是数据库,就跟我们的Excel表格一样,它是非常标准的行和列,这叫结构化数据。非结构化的数据,最典型的就是音频视频,它是没有这种标准结构的,那当然还有一些数据,它可能有一部分是结构化的,还有一部分是非结构化的,这叫半结构化的数据,大数据的技术也非常多,包括大规模数据分析处理,数据挖掘,分布式文件系统,分布式数据库,云计算平台,互联网和存储系统,其实现在很多技术都可以把他们放到大数据里面去用
大数据安全威胁分析
第一个数据及安全边界日渐模糊,安全保护难度提升,比如说前面我们讲的工控安全,早期的工控系统,它是不接入互联网的,它的安全性就会更高,现在你把它接入互联网了,有一部分是接入的,也不是所有的接入,比如说你可以通过手机去交电费,我们的互联网跟工控系统之间是有数据的,连接有数据的交互了,它的边界就变得日益模糊了,你保护的难度就增加了,有可能会有来自互联网的攻击
第二点敏感数据泄露安全风险增大,现在这个信息化的社会,一些敏感数据真的是关系到国家安全,包括社会的稳定,经济的安全,没有网络安全,就没有国家安全,不是危言耸听的,一些敏感数据,比如说军事上的,政治经济上的
第三点数据失真和大数据污染的风险。数据失真,比如说电商的一些产品评分,刷评论,网站访问的流量可能有些异常,网页的一些虚假排名,数据获取隐患也会导致人工智能的安全问题,人工智能是通过大量的数据去训练它,如果你训练它的数据都被污染了,那你训练出来的人工智能,那肯定就有问题了
第四点大数据处理平台业务连续性与拒绝服务大数据,它底层也是一套软件,这个处理平台也是一套软件的话,你就会面临业务连续性的问题,还有拒绝服务的这种攻击
第五个个人数据广泛分布于多个数据平台,隐私保护的难度加大,在大数据时代,隐私保护是一个难题,包括你都要用微信QQ、用各种各样的互联网应用,其实你的很多信息,很多隐私,也都被泄露了,如果黑客想干坏事,其实是很容易找到你的一些信息的
第六个是数据交易安全风险,数据的交易能够促进商业合作,但是也存在潜在的安全风险,比如说非法的一些数据交易,虚假交易,交易不完整,交易数据汇聚导致敏感信息的一些泄露,包括跨境的数据流动等等安全风险
数据交易风险,你可以简单把它看作,你在淘宝上买个东西,这牵涉到交易了,而且是通过数字化的形式进行的,如果他的平台被攻击了或者你的交易被篡改了,那肯定是面临安全风险的,比如说你买了一个十万的,一个大的东西,然后你整个交易被篡改,被攻击了,那最后这十万块钱就损失了
第七个是大数据滥用,我们综合关联微信的图片数据,智能手机的一些位置可以识别到有人挖掘出你的一些隐私,大数据是一把双刃剑,可以干好事,也可以干坏事
我们的公安机关可以用一些数据去抓犯罪嫌疑人,那犯罪嫌疑人也可以利用这些数据来分析到某个人,能得到他想攻击的某个人的一些信息,所以这是双刃剑
大数据安全需求分析
第一个是大数据自身安全,大数据安全主要涉及数据的采集、存储、使用、传输、共享、发布、销毁等等。全生命周期具体安全包括数据的真实性、实时性、机密性、完整性、可用性、可追溯性
第二个大数据的安全合规,安全合规这顶帽子扣到任何一个技术和应用上,我觉得都是正确的,大数据要安全合规,工控系统要安全合规,云计算要安全合规,还有移动互联网,物联网需要安全合规
第三个大数据跨境安全,就随着跨境电商,跨境交易的发展,数据跨境的流动成为必然,目前,不同的国家和地区的数据保护法,对跨境流动的数据要求是有差异的,不同国家,它是有些差异,比如说在日本、美国一些网站,它就没有被禁止,如果你在美国,是可以去买一个DVD的,去日本也可以买,但是中国不能买,这是犯法的,要进去的
第四个大数据隐私保护,在现在这个时代,其实你很多数据容易被泄露
第五个大数据处理平台安全,大数据处理平台其实公用的比较多的就是hadoop平台,它是一个平台软件,但平台软件它肯定是运行在服务器之上的,服务器又放在机房里面,所以又涉及到物理安全、网络通信安全、操作系统安全、数据库安全、应用系统安全、数据存储安全,因为平台它是一套软件,它底层有很多依赖的组件
第六个大数据业务安全。大数据业务安全是大数据常见的业务,比如说最典型的就是舆情监控,我们会把各个社交软件的数据给它汇总起来,然后分析有没有一些不好的东西,相关部门都有舆情系统,出现了一些可能会影响社会风气或者社会导向舆论的一些话题,他该删的,就要把你给删了
我们把这么多数据汇集起来,我们要有一些安全的管理措施,防止被采集起来的各种数据被非法的恶意滥用
给大家举了一个舆情的例子,你收集到了这么多信息,万一被有关部门用,这是OK的,万一被其他不法分子给利用了,那就很危险
第七个是大数据安全运营,要建立大数据运营安全机制,比如说大数据的分类,大数据的安全服务,大数据平台的安全维护,现在很多地方,政务单位都有大数据局了,它主要是以前政务,就是政府里面分管政务网这个单位成立的,以前叫电子政务办,有些地方叫信息中心,现在基本上好多地方,特别省级的基本上都改名大数据局,以前是管交换机、管路由器、管理服务器的
现在你既要管路由器、交换机、服务器、网络安全设备,还要管上面的数据,要实现安全运营,这是大数据安全的几个需求,大数据安全的一些保护机制,因为这里面的一些技术和机制,它可以用到我们大数据安全里面去,大数据安全保护是一个综合性复杂的安全工程,涉及数据自身的安全,采集、传输、存储等等它自身的安全。它处理平台安全,平台就是一套软件,软件安装在服务器上,服务器又放在机房里边,所以肯定有这个机房的物理环境安全,通信网络安全,然后还有包括后台存储等等各方面的安全,处理平台它关系到的层面很多
数据业务的安全,业务不同的业务安全不一样,然后数据隐私、安全数据运营以及数据安全、法律政策与标准规范,你要满足相应的规范,围绕大数据安全保护基本的一些机制有数据分类分级,数据源认证、数据溯源、数据用户标识和鉴别,访问控制隐私保护备份和恢复审计与监测、安全管理
大数据安全保护机制
主要包括数据的真实性,数据的完整性、精密性、准确性
第二个是大数据平台的安全保护技术,涉及到大数据平台,涉及物理安全,网络通信、操作系统,数据库应用系统,数据存储等。安全保护通常采用防火墙、系统加固、数据防泄露等等来保护大数据平台
大数据业务安全保护技术,包括业务授权,业务逻辑安全,业务合规等等,其中业务授权主要基于角色的访问控制,按照业务功能执行所需要的权限进行分配,合理授权业务逻辑安全,针对业务流程进行安全控制,避免安全缺陷导致业务失控
业务合规性是指业务要满足政策以及相关法律法规的要求。敏感数据安全检查、系统安全配置基准,数据监控等等技术,用于解决业务合规性的一些需求
有匿名、差分隐私、脱敏加密,访问控制,大数据运营安全技术,主要是安全的维护、安全策略更新,安全设备配置、数据容灾备份,安全事件监测、应急响应,当然还有其他的各种各样的网络技术,比如说像入侵检测、态势感知,攻击取证,威胁情报分析,舆情分析,堡垒机等等这些技术都被用在大数据平台的一个保护当中去
数据资源经营过程中涉及到的数据使用、交易、跨境流动等安全问题,这也是我们运营的时候要考虑的,还有数据脱敏,数据监控,数据安全网关,都用于数据经营、安全保护
国家现在是有大数据的一些标准规范的,国家在政务层面,包括在公安,还有它单独的一些大数据规范
2020年,公安部颁布了大数据规范,它下发到全国的公安局。这是国家有一个大的规范,然后不同的行业,它也在制定自己的大数据安全的一些标准和规范,从而来规范化我们的数据格式,也指导我们的安全建设