数据的高级处理——pandas模块进阶——使用Python进行数据分析

由于新版的tushare需要权限,本人只是学习,看一下方法得了,必要再开开权限。这部分一笔带过,由于本人没有验证,不能够保证正确,因此不做笔记。

python 复制代码
##############################
##作者:白雪公主的后妈
##时间:2024年1月2日
##主题:数据的高级处理------pandas模块进阶------使用Python进行数据分析
##主要内容:本章主要完成几类基础数据分析,如相关性分析、假设检验、描述性统计分析、线性回归分析等
##############################

#1、相关性分析
'''
相关性分析是指对多个可能具备相关关系的变量进行分析,从而衡量变量之间的相关程度或密切成都。
本章通过计算皮尔逊相关系数,判断两只股票数据的相关程度。
'''
#1.1获取股价数据
#1.1.1获取日k线级别的股票数据      新旧版本的tushare有些区别,我这里是新版的使用方法
import tushare as ts
ts.set_token('0af26dd037a2c9dadc01c8dc6046d02a84c757e85a65a48aeef6a9ae')
pro = ts.pro_api()
data=pro.daily(ts_code='000061.SZ', start_date='20180101', end_date='20190101')     #ts_code新版的股票代号,start_date起始日期,end_date结束日期
print(data.head(10))
'''
运行结果:
     ts_code trade_date  open  high  ...  change  pct_chg        vol      amount
0  000061.SZ   20181228  4.83  4.88  ...    0.04   0.8316   36631.84   17756.246
1  000061.SZ   20181227  4.99  5.02  ...   -0.10  -2.0367   59757.01   29316.285
2  000061.SZ   20181226  5.02  5.02  ...   -0.12  -2.3857   73012.65   35955.318
3  000061.SZ   20181225  5.13  5.15  ...   -0.16  -3.0829   93694.17   46780.731
4  000061.SZ   20181224  4.98  5.22  ...    0.23   4.6371  118030.68   60755.546
5  000061.SZ   20181221  5.14  5.16  ...   -0.18  -3.5019   97390.22   48878.281
6  000061.SZ   20181220  5.17  5.22  ...   -0.01  -0.1942   79767.97   41141.726
7  000061.SZ   20181219  5.35  5.35  ...   -0.18  -3.3771  118225.75   61738.698
8  000061.SZ   20181218  5.48  5.48  ...   -0.23  -4.1367  187031.06   99994.758
9  000061.SZ   20181217  5.20  5.64  ...    0.43   8.3821  304727.05  166908.688
[10 rows x 11 columns]
'''
#上述使用Pytharm使用print()函数打印数据不全,使用以下爱代码强制显示所有列
import pandas as pd
pd.set_option('display.max_columns', None)
print(data.head(10))
'''
运行结果:
    ts_code trade_date  open  high   low  close  pre_close  change  pct_chg  \
0  000061.SZ   20181228  4.83  4.88  4.81   4.85       4.81    0.04   0.8316   
1  000061.SZ   20181227  4.99  5.02  4.80   4.81       4.91   -0.10  -2.0367   
2  000061.SZ   20181226  5.02  5.02  4.87   4.91       5.03   -0.12  -2.3857   
3  000061.SZ   20181225  5.13  5.15  4.81   5.03       5.19   -0.16  -3.0829   
4  000061.SZ   20181224  4.98  5.22  4.96   5.19       4.96    0.23   4.6371   
5  000061.SZ   20181221  5.14  5.16  4.93   4.96       5.14   -0.18  -3.5019   
6  000061.SZ   20181220  5.17  5.22  5.10   5.14       5.15   -0.01  -0.1942   
7  000061.SZ   20181219  5.35  5.35  5.15   5.15       5.33   -0.18  -3.3771   
8  000061.SZ   20181218  5.48  5.48  5.23   5.33       5.56   -0.23  -4.1367   
9  000061.SZ   20181217  5.20  5.64  5.19   5.56       5.13    0.43   8.3821   

         vol      amount  
0   36631.84   17756.246  
1   59757.01   29316.285  
2   73012.65   35955.318  
3   93694.17   46780.731  
4  118030.68   60755.546  
5   97390.22   48878.281  
6   79767.97   41141.726  
7  118225.75   61738.698  
8  187031.06   99994.758  
9  304727.05  166908.688 
'''
#1.1.2获取分钟级别的股价数据       注意新版的不是免费,如果需要大量的需要开权限,链接https://tushare.pro/document/1?doc_id=234
data = ts.pro_bar(ts_code='000061.SZ',freq='5min',start_date='2020-05-18 14:15:00',end_date='2020-05-18 15:00:00')
print(data)
#################第六章到此为止,没有权限的花钱,以后在研究,或者换一种第三方软件库
相关推荐
java1234_小锋3 分钟前
Scikit-learn Python机器学习 - 特征降维 压缩数据 - 特征提取 - 主成分分析 (PCA)
python·机器学习·scikit-learn
xiaowu0803 分钟前
策略模式-不同的鸭子的案例
开发语言·c#·策略模式
java1234_小锋6 分钟前
Scikit-learn Python机器学习 - 特征降维 压缩数据 - 特征提取 - 线性判别分析 (LDA)
python·机器学习·scikit-learn
m0_5750463423 分钟前
FPGA数据流分析
数据分析·fpga·数据流分析
edjxj28 分钟前
Qt图片资源导入
开发语言·qt
qq_259297247330 分钟前
QT-事件
开发语言·qt
专注VB编程开发20年33 分钟前
CSS 的命名方式像是 PowerShell 的动词-名词结构,缺乏面向对象的层级关系
开发语言·后端·rust
古译汉书34 分钟前
嵌入式铁头山羊stm32-ADC实现定时器触发的注入序列的单通道转换-Day26
开发语言·数据结构·stm32·单片机·嵌入式硬件·算法
XISHI_TIANLAN44 分钟前
【多模态学习】Q&A3:FFN的作用?Embedding生成方法的BERT和Word2Vec?非线性引入的作用?
学习·bert·embedding
思辨共悟1 小时前
Python的价值:突出在数据分析与挖掘
python·数据分析