Java爬虫-股票k线分析实践

可以荐嘉客,奈何阻重深。

1 前言

在前文中已经讲述了java 爬虫获取股票的基本信息,不过这些数据都是静态数据,在本文中将从k线中按照时间周期的维度获取指标数据进行分析,在此基础之上深入分析和解析股票的动态数据,建立数据模型来需要那些低估的标的。

2 数据来源分析

首先我们需要打开一个股票的详情页面,通过浏览器的控制台可以获取到 k 线数据的接口地址,通过分析我们可以知道请求参数的含义,具体如下所示:

ini 复制代码
# 股票详细页面
https://xueqiu.com/S/SZ002032
# 股票 k 线数据
https://stock.xueqiu.com/v5/stock/chart/kline.json?symbol=SZ002032&begin=1691505314056&period=week&type=before&count=-284&indicator=kline,pe,pb,ps,pcf,market_capital,agt,ggt,balance
# 请求参数
symbol=SZ002032 股票代码
begin=1691505314056 开始时间
period=week  查询周期
type=before 复权选择,前复权
count=-284  查询数据量
indicator=kline,pe,pb,ps,pcf,market_capital,agt,ggt,balance 统计指标
# 返回参数
timestamp 时间戳
open 开盘价
close 收盘价
high 最高价
low 最低价
chg 区间涨跌额
percent 涨跌百分比
turnoverrate 换手率
amount 成交量
pe 市盈率,每股股价/每股净利润,理解为盈利能力,数值越小盈利能力越强
pb 市净率,股票价格/每股净资产
ps 市销率, 股票价格/每股销售收入,
pcf 市现率,股票价格/每股现金流量 数值越小越好 

通过返回参数,可以得到指标有区间内开盘收盘最高价最低价数据,还有区间内的振幅、涨跌百分比、换手率,成交量,更重要的是还有区间内的 pe pb ps pcf 指标的展示,这对模型的建立以及分析提供了坚实的数据支撑。

3 数据获取

和之前抓取股票基本信息一样,需要调用雪球的接口来获取数据,在此处依旧需要在请求时添加 cookie ,否则抓取不到数据。具体的抓取代码如下图所示,由于雪球接口返回的数据都是数组格式,我们需要创建对象将数据进行抽取,转换,格式化最终进行展示。

在获取接口数据时,创建一个 LineDto 实体类,通过之前分析的 item 和 column 的对应关系,通过一个 build 方法通过建造者模式来创建每条 k 线数据的情况,如下图所示:

由于 k 线数据没有返回股票的流通市值,这里采用计算的方式来获取,通过成交金额和换手率计算得到,为了方便数据处理,将市值的单位换算成亿元。这里计算了时间戳的转换,将时间戳转换成为可读的时间字符串,其余的指标数据均为 BigDecimal 类型,无需处理。在构建完数据后,需要按照时间的数据将数据倒序排列,同时也可以输出 k 线的历史数据信息。

4 模型搭建

至于选择股票的模型搭建,作者选择的条件如下所示,综合了市值、市盈率、市现率等信息,并且根据最近三周的涨幅表现来选择股票,创建模型,具体的代码如下所示:

bash 复制代码
# 模型选股条件
1 判断股票市值, 选择市值大于 50亿元,小于 300亿流动市值的股票
2 判断市盈率,小于 15 倍的 或者大于 50倍的排除
3 判断市现率,小于 25 即可,数据越大表示公司现金流压力较大
4 近三周涨幅连续递增,涨幅大于0,且小于10,买在起点

最终在控制台将会输出运行选股模型筛选出的股票代码结果。

4 总结

在本文中,首先使用爬虫的方法,从雪球获取股票的周 k 线数据,然后进行数据的清洗和转换,并且建立选择股票的模型,通过筛选机制,找到符合条件的股票代码。本文中所涉及的代码已经上传至 github, 欢迎大家点赞关注。项目 github 地址 springboot-auth

相关推荐
潘多编程23 分钟前
Spring Boot微服务架构设计与实战
spring boot·后端·微服务
2402_8575893628 分钟前
新闻推荐系统:Spring Boot框架详解
java·spring boot·后端
2401_8576226629 分钟前
新闻推荐系统:Spring Boot的可扩展性
java·spring boot·后端
猿小猴子1 小时前
Python3 爬虫 中间人爬虫
开发语言·爬虫·python
YONG823_API2 小时前
电商平台数据批量获取自动抓取的实现方法分享(API)
java·大数据·开发语言·数据库·爬虫·网络爬虫
Amagi.2 小时前
Spring中Bean的作用域
java·后端·spring
2402_857589362 小时前
Spring Boot新闻推荐系统设计与实现
java·spring boot·后端
J老熊2 小时前
Spring Cloud Netflix Eureka 注册中心讲解和案例示范
java·后端·spring·spring cloud·面试·eureka·系统架构
Benaso3 小时前
Rust 快速入门(一)
开发语言·后端·rust
sco52823 小时前
SpringBoot 集成 Ehcache 实现本地缓存
java·spring boot·后端