python 天气与股票的关系--第3部分,建立模型

起因(目的):

继续瞎折腾。

过程:

  1. 假设有下面这些规则: 天气中的温度,
  • 如果最高温度大于 36, 那么就是坏天气。
  • 如果最低温度小于 5, 那么也是坏天气。
  • 如果下雨, 下雪, 那么也是坏天气。
  • 其他情况为 好天气
python 复制代码
import pandas as pd

def calculate_comfort(row, initial_comfort=17):
    # confy = initial_comfort
    confy = int(row['high'].replace('℃', '')) - int(row['low'].replace('℃', ''))  
    
    # 提取温度信息
    high_temp = int(row['high'].replace('℃', ''))
    low_temp = int(row['low'].replace('℃', ''))
    
    # 天气信息中的关键词
    weather_info = row['info']
    
    # 根据天气调整舒适度
    if '雨' in weather_info:
        confy -= 3
    if '雪' in weather_info:
        confy -= 5
    
    # 高温处理
    if high_temp >= 36:
        confy -= 0.1 * (high_temp - 35)
    
    # 低温处理
    if low_temp <= 5:
        confy -= 0.1 * (6 - low_temp)
    
    # 理想温度增加舒适度
    ideal_temp = 20
    if 18 <= high_temp <= 22:
        confy *= 1.8
    elif 16 <= high_temp <= 24:
        confy *= 1.3
    
    return confy
df['comfort_level'] = df.apply(calculate_comfort, axis=1)
  1. 此外, 开盘, 收盘,之间的差距, 作为一天的结果。 也是作为模型的 y!
python 复制代码
# ret --> mean       0.171798
df["ret"]  = (df["收盘"] -  df["开盘"] ) *100  # 17 
  1. 画图查看

如果只从数值的角度, 那么很难看出有什么关系!

  1. 换一种思路。 对比变换情况。
  • 今天与昨天的天气变化情况 A
  • 今天与昨天的股市变化情况 B
  • A 与 B 之间的关系!
python 复制代码
# 创建二元变量表示今天的值是否大于昨天的值
df['comfort_change'] = (df['comfort_level'] > df['comfort_level'].shift(1)).astype(int)
df['ret_change'] = (df['ret'] > df['ret'].shift(1)).astype(int)

# ret_change, 第二种思路, 根据正负值来判断!
df['ret_change2'] = (df['ret'] > 0).astype(int)  # 修改此行来适应新的规则

# 打印结果查看
df[['date', 'comfort_level', 'ret', 'comfort_change', 'ret_change', "ret_change2"]].head()

# 统计两个列中相等值的行数
equal_count = (df['comfort_change'] == df['ret_change']).sum()

输出 258, 而总共有484条数据,准确率是 258 / 484 = 0.533

结论 + todo

  1. 根据天气, 来猜测股市的涨跌, 猜对的概率为 53%
  2. 一个问题是, 由于节假日,休市, 所以日期是不连贯的。 数据中的昨天, 不一定是昨天(比如, 假设今天是周一, 那么"昨天", 不是真正的昨天, 而是上个星期的周五。) 这中间差了几天, 天气也变化了。所以有问题!

走过路过,支持一下啊。

相关推荐
Hy行者勇哥1 小时前
Python 与 VS Code 结合操作指南
开发语言·python
大力水手(Popeye)1 小时前
Pytorch——tensor
人工智能·pytorch·python
飞翔的佩奇5 小时前
【完整源码+数据集+部署教程】表盘指针检测系统源码和数据集:改进yolo11-CA-HSFPN
python·yolo·计算机视觉·数据集·yolo11·表盘指针检测
larance6 小时前
SQLAlchemy 的异步操作来批量保存对象列表
数据库·python
搏博6 小时前
基于Python3.10.6与jieba库的中文分词模型接口在Windows Server 2022上的实现与部署教程
windows·python·自然语言处理·flask·中文分词
lxmyzzs8 小时前
pyqt5无法显示opencv绘制文本和掩码信息
python·qt·opencv
萧鼎8 小时前
Python pyzmq 库详解:从入门到高性能分布式通信
开发语言·分布式·python
yujkss9 小时前
Python脚本每天爬取微博热搜-终版
开发语言·python
yzx9910139 小时前
小程序开发APP
开发语言·人工智能·python·yolo
飞翔的佩奇10 小时前
【完整源码+数据集+部署教程】二维码与查找模式检测系统源码和数据集:改进yolo11-CSwinTransformer
python·yolo·计算机视觉·数据集·yolo11·二维码与查找模式检测