大数据基础知识【大数据导论】

各位大佬好 ,这里是阿川的博客,祝您变得更强

个人主页在线OJ的阿川

大佬的支持和鼓励,将是我成长路上最大的动力

阿川水平有限,如有错误,欢迎大佬指正

大数据基础知识前 必看
【大数据导论】---大数据序言
【大数据导论】---大数据、人工智能、云计算、物联网、区块链序言

目录

大数据素养

技术性内容

  • 采集
  • 处理
  • 储存
  • 分析
  • 技术
  • 工具

非技术性内容

  • 大数据安全
  • 大数据伦理
  • 大数据思维

大数据基本知识

  • 其中大数据交易
    买卖数据 的活动,是以货币为媒介 获取数据商品 的过程

    数据商品三大特征

    • 处理后的数据才能交易
    • 数据交易主体涉及众多
    • 交易过程涉及多个产业链

      大数据交易形式
      • 大数据交易公司
      • 提供个人数据场所公司
      • 数据交易所
      • API模式
        用户提供接口允许 用户对平台数据进行访问

        大数据交易技术支撑

        大数据交易发展现状

        大数据数据来源
        • 政府公开数据
        • 企业内部数据
        • 数据供应方数据
        • 网页爬虫数据

          大数据数据产品类型
          • API
          • 数据包
          • 云服务
          • 解决方案
          • 数据产品
          • 数据定制服务

            大数据交易平台类型
            • 综合数据服务平台
              为用户提供定制化的服务,涉及数据的处理和加工
            • 第三方数据交易平台
              对交易过程进行监管 ,并提供数据出售、数据购买、数据供应方查询、数据需求发布等一系列服务

              从运行角度划分
              • 政府主导的大数据交易平台
              • 企业以市场需求为导向建立的大数据交易平台
              • 产业联盟性质的大数据交易平台

                大数据交易平台的运营模式
                数据中介数据处理加工 功能的交易平台

                只具备中介功能 的交易平台
  • 其中大数据思维

    大数据思维主要指

    • 全样而非抽样

      因为有了分布式储存和处理技术 ,从而可以对全部的数据进行分析而不是只能对小样本处理
    • 效率而非精确

      处理数据时往往要"秒级"响应 ,所以效率 往往是被关注的重点 ,分析的精确度达到一定的程度即可。
    • 相关而非因果

      解释 事物背后发展的机理
      预测 未来可能发生事件
    • 以数据为中心

      海量的数据 进行计算 ,从而推测结果
    • 我为人人,人人为我

      其中涉及
      • 数据采集
      • 数据处理
      • 信息发布
  • 其中大数据安全

    重点关注数据

    • 保密性
    • 完整性
    • 可用性

      大数据安全的隐患
      • 大数据成为网络攻击的显著目标

      • 大数据加大隐私泄露风险

      • 大数据技术被应用到攻击手段中

      • 大数据成为高级可持续攻击 的一个载体

        大数据安全的变化

        • 静态安全到动态安全

          大数据安全范围
          • 隐私和个人信息安全

            其中包含个人的
  • 其中大数据伦理

    • 个人信息被无形滥用
    • 生活隐私被窥探利用
    • 数据安全漏洞
    • 数据垄断
  • 其中数据共享

    不数据共享会导致

    • 数据孤岛
      政府和企业里各个部门各自储存数据 ,部门之间的数据无法共通 ,导致数据像各个孤岛 一样缺乏关联性

      数据共享意义
      • 对于政府\企业意义
  • 其中数据开放

    数据开放三大理论

好的,到此为止啦,祝您变得更强


想说的话

学习来源厦门大学林子雨老师《大数据导论》 (反反复复学习了5遍哈 并且做了相应的练习 然后才进行 的这篇博客的书写)

实不相瞒,写的这篇博客要写五个小时以上(加上自己学习和纸质笔记,共七小时 吧),很累希望大佬支持一下

道阻且长 行则将至
个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力
相关推荐
PersistJiao6 分钟前
在 Spark RDD 中,sortBy 和 top 算子的各自适用场景
大数据·spark·top·sortby
VertexGeek12 分钟前
Rust学习(八):异常处理和宏编程:
学习·算法·rust
2301_8112743118 分钟前
大数据基于Spring Boot的化妆品推荐系统的设计与实现
大数据·spring boot·后端
Yz987625 分钟前
hive的存储格式
大数据·数据库·数据仓库·hive·hadoop·数据库开发
青云交26 分钟前
大数据新视界 -- 大数据大厂之 Hive 数据导入:多源数据集成的策略与实战(上)(3/ 30)
大数据·数据清洗·电商数据·数据整合·hive 数据导入·多源数据·影视娱乐数据
武子康29 分钟前
大数据-230 离线数仓 - ODS层的构建 Hive处理 UDF 与 SerDe 处理 与 当前总结
java·大数据·数据仓库·hive·hadoop·sql·hdfs
武子康31 分钟前
大数据-231 离线数仓 - DWS 层、ADS 层的创建 Hive 执行脚本
java·大数据·数据仓库·hive·hadoop·mysql
管家婆客服中心34 分钟前
提成制是什么?如何高效管理提成制?
经验分享·管家婆软件
时差9531 小时前
Flink Standalone集群模式安装部署
大数据·分布式·flink·部署
锵锵锵锵~蒋1 小时前
实时数据开发 | 怎么通俗理解Flink容错机制,提到的checkpoint、barrier、Savepoint、sink都是什么
大数据·数据仓库·flink·实时数据开发