Java爬虫-股票k线分析实践

可以荐嘉客,奈何阻重深。

1 前言

在前文中已经讲述了java 爬虫获取股票的基本信息,不过这些数据都是静态数据,在本文中将从k线中按照时间周期的维度获取指标数据进行分析,在此基础之上深入分析和解析股票的动态数据,建立数据模型来需要那些低估的标的。

2 数据来源分析

首先我们需要打开一个股票的详情页面,通过浏览器的控制台可以获取到 k 线数据的接口地址,通过分析我们可以知道请求参数的含义,具体如下所示:

ini 复制代码
# 股票详细页面
https://xueqiu.com/S/SZ002032
# 股票 k 线数据
https://stock.xueqiu.com/v5/stock/chart/kline.json?symbol=SZ002032&begin=1691505314056&period=week&type=before&count=-284&indicator=kline,pe,pb,ps,pcf,market_capital,agt,ggt,balance
# 请求参数
symbol=SZ002032 股票代码
begin=1691505314056 开始时间
period=week  查询周期
type=before 复权选择,前复权
count=-284  查询数据量
indicator=kline,pe,pb,ps,pcf,market_capital,agt,ggt,balance 统计指标
# 返回参数
timestamp 时间戳
open 开盘价
close 收盘价
high 最高价
low 最低价
chg 区间涨跌额
percent 涨跌百分比
turnoverrate 换手率
amount 成交量
pe 市盈率,每股股价/每股净利润,理解为盈利能力,数值越小盈利能力越强
pb 市净率,股票价格/每股净资产
ps 市销率, 股票价格/每股销售收入,
pcf 市现率,股票价格/每股现金流量 数值越小越好 

通过返回参数,可以得到指标有区间内开盘收盘最高价最低价数据,还有区间内的振幅、涨跌百分比、换手率,成交量,更重要的是还有区间内的 pe pb ps pcf 指标的展示,这对模型的建立以及分析提供了坚实的数据支撑。

3 数据获取

和之前抓取股票基本信息一样,需要调用雪球的接口来获取数据,在此处依旧需要在请求时添加 cookie ,否则抓取不到数据。具体的抓取代码如下图所示,由于雪球接口返回的数据都是数组格式,我们需要创建对象将数据进行抽取,转换,格式化最终进行展示。

在获取接口数据时,创建一个 LineDto 实体类,通过之前分析的 item 和 column 的对应关系,通过一个 build 方法通过建造者模式来创建每条 k 线数据的情况,如下图所示:

由于 k 线数据没有返回股票的流通市值,这里采用计算的方式来获取,通过成交金额和换手率计算得到,为了方便数据处理,将市值的单位换算成亿元。这里计算了时间戳的转换,将时间戳转换成为可读的时间字符串,其余的指标数据均为 BigDecimal 类型,无需处理。在构建完数据后,需要按照时间的数据将数据倒序排列,同时也可以输出 k 线的历史数据信息。

4 模型搭建

至于选择股票的模型搭建,作者选择的条件如下所示,综合了市值、市盈率、市现率等信息,并且根据最近三周的涨幅表现来选择股票,创建模型,具体的代码如下所示:

bash 复制代码
# 模型选股条件
1 判断股票市值, 选择市值大于 50亿元,小于 300亿流动市值的股票
2 判断市盈率,小于 15 倍的 或者大于 50倍的排除
3 判断市现率,小于 25 即可,数据越大表示公司现金流压力较大
4 近三周涨幅连续递增,涨幅大于0,且小于10,买在起点

最终在控制台将会输出运行选股模型筛选出的股票代码结果。

4 总结

在本文中,首先使用爬虫的方法,从雪球获取股票的周 k 线数据,然后进行数据的清洗和转换,并且建立选择股票的模型,通过筛选机制,找到符合条件的股票代码。本文中所涉及的代码已经上传至 github, 欢迎大家点赞关注。项目 github 地址 springboot-auth

相关推荐
程序员码歌4 小时前
明年35岁了,如何破局?说说心里话
android·前端·后端
橙*^O^*安5 小时前
Go 语言基础:变量与常量
运维·开发语言·后端·golang·kubernetes
工程师小星星5 小时前
Golang语言的文件组织方式
开发语言·后端·golang
哈喽姥爷6 小时前
Spring Boot---自动配置原理和自定义Starter
java·spring boot·后端·自定义starter·自动配置原理
舒一笑7 小时前
为什么where=Version就是乐观锁了?
后端·mysql·程序员
GoGeekBaird7 小时前
关于垂类AI应用落地行业的方法论思考
后端·github·agent
小宁爱Python8 小时前
Django 基础入门:命令、结构与核心配置全解析
后端·python·django
你的人类朋友8 小时前
认识一下Bcrypt哈希算法
后端·安全·程序员
tangweiguo030519878 小时前
基于 Django 与 Bootstrap 构建的现代化设备管理平台
后端·django·bootstrap
IT果果日记9 小时前
详解DataX开发达梦数据库插件
大数据·数据库·后端