数据挖掘note(1)

数据挖掘一般分为机器学习和统计学习,大数据学的课程一般是关于机器学习,我们学的浅,主要关于统计学习,示意图如下所示:

这是一个大数据时代,但是数据挖掘的利用率不足0.5%,可见数据挖掘的空间巨大!

问题:数据挖掘对信息安全有什么用?

例如从几十万条终端行为数据中找到攻击者在内网渗透的迹象,或者发现某个内部员工周期性将企业内部敏感信息发到互联网上。 数据挖掘可以检查复杂的多源数据,通过模糊匹配、集合理论以及结合专家系统以执行数据函数或者建模分析。 最终了解与企业内的活动和趋势有关的信息,比如找到黑客攻击行为、内鬼或者企业内部的安全隐患等。 这些数据的挖掘最终会形成企业安全知识,通过可视化技术展现给客户管理层,辅助他们做出决策。

相关推荐
西猫雷婶16 分钟前
pytorch基本运算-导数和f-string
人工智能·pytorch·python
Johny_Zhao17 分钟前
华为MAAS、阿里云PAI、亚马逊AWS SageMaker、微软Azure ML各大模型深度分析对比
linux·人工智能·ai·信息安全·云计算·系统运维
顽强卖力18 分钟前
第二十八课:深度学习及pytorch简介
人工智能·pytorch·深度学习
述雾学java19 分钟前
深入理解 transforms.Normalize():PyTorch 图像预处理中的关键一步
人工智能·pytorch·python
武子康19 分钟前
大数据-276 Spark MLib - 基础介绍 机器学习算法 Bagging和Boosting区别 GBDT梯度提升树
大数据·人工智能·算法·机器学习·语言模型·spark-ml·boosting
要努力啊啊啊22 分钟前
使用 Python + SQLAlchemy 创建知识库数据库(SQLite)—— 构建本地知识库系统的基础《一》
数据库·人工智能·python·深度学习·自然语言处理·sqlite
武子康22 分钟前
大数据-277 Spark MLib - 基础介绍 机器学习算法 Gradient Boosting GBDT算法原理 高效实现
大数据·人工智能·算法·机器学习·ai·spark-ml·boosting
中杯可乐多加冰1 小时前
【解决方案-RAGFlow】RAGFlow显示Task is queued、 Microsoft Visual C++ 14.0 or greater is required.
人工智能·大模型·llm·rag·ragflow·deepseek
一切皆有可能!!6 小时前
实践篇:利用ragas在自己RAG上实现LLM评估②
人工智能·语言模型