大数据:SAS数据分析1,数据步,和过程步

大数据:SAS数据分析

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试


### 文章目录

  • [大数据:SAS数据分析](#文章目录 大数据:SAS数据分析 @TOC 大数据多层模型 数据分析常用指标 sas数据分析挖掘和分析工具,可视化工具 sas数据步,和过程步 数据步的语句 总结)
  • [@[TOC](文章目录)](#文章目录 大数据:SAS数据分析 @TOC 大数据多层模型 数据分析常用指标 sas数据分析挖掘和分析工具,可视化工具 sas数据步,和过程步 数据步的语句 总结)
  • [大数据多层模型](#文章目录 大数据:SAS数据分析 @TOC 大数据多层模型 数据分析常用指标 sas数据分析挖掘和分析工具,可视化工具 sas数据步,和过程步 数据步的语句 总结)
  • [数据分析常用指标](#文章目录 大数据:SAS数据分析 @TOC 大数据多层模型 数据分析常用指标 sas数据分析挖掘和分析工具,可视化工具 sas数据步,和过程步 数据步的语句 总结)
  • [sas数据分析挖掘和分析工具,可视化工具](#文章目录 大数据:SAS数据分析 @TOC 大数据多层模型 数据分析常用指标 sas数据分析挖掘和分析工具,可视化工具 sas数据步,和过程步 数据步的语句 总结)
  • [sas数据步,和过程步](#文章目录 大数据:SAS数据分析 @TOC 大数据多层模型 数据分析常用指标 sas数据分析挖掘和分析工具,可视化工具 sas数据步,和过程步 数据步的语句 总结)
  • [数据步的语句](#文章目录 大数据:SAS数据分析 @TOC 大数据多层模型 数据分析常用指标 sas数据分析挖掘和分析工具,可视化工具 sas数据步,和过程步 数据步的语句 总结)
  • [总结](#文章目录 大数据:SAS数据分析 @TOC 大数据多层模型 数据分析常用指标 sas数据分析挖掘和分析工具,可视化工具 sas数据步,和过程步 数据步的语句 总结)

大数据多层模型

第一层:收集数据,ETL抽取

第二层是数据仓库

如果全部放在数据仓库的话,需要粗加工,然后放进去

OLAP是数据仓库层,存放数据,另外还要一些在线分析查询的一些工具,关系型数据库是物理存储,外加OLAP功能

OLTP是联机事务 处理:普通的事务存储,操作,2维平面表,Excel表

OLAP是联机分析处理:计算处理,简单的分析,多维建模和查询,高纬度的切片,钻取,分析

第三层:数据探索

统计量分析,查询,报告

看平均均值,方差,简单的统计

第四层:数据挖掘

仓库是放数据,挖掘是处理过程

第五层,结果展现给大家看,更直观,明了观看

第六层:给老板决策

老板知道了图就好办了。

数据分析常用指标

常用算法

sas数据分析挖掘和分析工具,可视化工具

sas好东西

做数据分析、建模的过程

并不是sas来做应用

它可以做分类,聚类等等的模型






影响和波及的范围

用户经常关注和点击的地方,因为左边是网页,右边是广告

这是网页设计导致的

BI不止是报表功能,而是数据存储和抽取功能。

BI包含了所有的这个层。

sas数据步,和过程步

cards下面都是数据,他会把数据放入student表中



类似于2维表单

分号是必须的,否则一直等你

窗口要关掉

其他的逻辑库是内置的

样本

work是临时的逻辑库,中转站呗

也可以手工构建,这些都是永久的

user和passd就够了

sql好像是区分大小写

c语言啥的也是

cr 临时变量,放临时work里面

字符串双引号都是一样的

data cr;一个cr表

建立一些数据,中间的变量就是列,字段,这跟普通的变量不同

length是定义长度,否则默认8字符

内置cards;开始内置数据,往里面观数据

直到;

就把数据集搬入数据库

开始run;

proc print;打印当前这个sfz

run;结束

定义数据时,三种时间格式

输出依次制定时间长度

%let宏变量

f1是文件,已存在的

data就是定义列

infile读入文件

列明是h w

完事就持续读

打印

列指针@从第几个位置开始读

读谁变量x几

读几个?

$字符串类型

没有就是数值

没有指针,那分隔符舒服多了


数据步的语句


上面的那个就是

datalines是什么玩意?

student放在work中的表

input列

datalines是cards

等价的,定义内置数据的

懂了

3列数据依次灌进去

再建一个score表

四列字段,不解释了

然后cards,datalines,相当于就是表格分割线

proc print;输出的是当前的最后那个数据集

如果你要指定输出student的话,就单独列

run;就是跑上面的代码

类似于数据库中 from 默认那个表读,然后我们操作普通的运算

libname是永久表

单独读到没有匹配,或者没有的就是.



衍生的列

num啥意思

看位数,基本就不管你中间数字,中阿金不够的用空格替代


总结

提示:重要经验:

1)

2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。

3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

相关推荐
STLearner9 分钟前
VLDB 2025 | 时间序列(Time Series)论文总结(预测,异常检测,压缩,自动化等)
数据库·人工智能·深度学习·神经网络·机器学习·数据挖掘·时序数据库
Hello.Reader17 分钟前
Flink SQL 的 UNLOAD MODULE 模块卸载、会话隔离与常见坑
大数据·sql·flink
禾高网络35 分钟前
互联网医院系统,互联网医院系统核心功能及技术
java·大数据·人工智能·小程序
AI营销实验室36 分钟前
原圈科技AI CRM系统:数据闭环与可视化革新的行业突破
大数据·人工智能
2501_941418551 小时前
腰果病害图像识别 Mask-RCNN HRNetV2P实现 炭疽病 锈病 健康叶片分类
人工智能·分类·数据挖掘
Deepoch1 小时前
仓储智能化新思路:以“渐进式升级”破解物流机器人改造难题
大数据·人工智能·机器人·物流·具身模型·deepoc·物流机器人
シ風箏3 小时前
Flink【基础知识 01】简介+核心架构+分层API+集群架构+应用场景+特点优势(一篇即可大概了解Flink)
大数据·架构·flink·bigdata
Dxy12393102163 小时前
Elasticsearch如何做向量搜索
大数据·elasticsearch
jkyy20143 小时前
AI赋能膳食管理:健康有益助力企业实现精准营养升级
大数据·人工智能·科技·物联网·健康医疗
cui_win3 小时前
Elasticsearch 分片满了?「cluster.max_shards_per_node」报错
大数据·elasticsearch·搜索引擎