数据挖掘一般分为机器学习和统计学习,大数据学的课程一般是关于机器学习,我们学的浅,主要关于统计学习,示意图如下所示:
这是一个大数据时代,但是数据挖掘的利用率不足0.5%,可见数据挖掘的空间巨大!
问题:数据挖掘对信息安全有什么用?
例如从几十万条终端行为数据中找到攻击者在内网渗透的迹象,或者发现某个内部员工周期性将企业内部敏感信息发到互联网上。 数据挖掘可以检查复杂的多源数据,通过模糊匹配、集合理论以及结合专家系统以执行数据函数或者建模分析。 最终了解与企业内的活动和趋势有关的信息,比如找到黑客攻击行为、内鬼或者企业内部的安全隐患等。 这些数据的挖掘最终会形成企业安全知识,通过可视化技术展现给客户管理层,辅助他们做出决策。