python 天气与股票的关系--第3部分,建立模型

起因(目的):

继续瞎折腾。

过程:

  1. 假设有下面这些规则: 天气中的温度,
  • 如果最高温度大于 36, 那么就是坏天气。
  • 如果最低温度小于 5, 那么也是坏天气。
  • 如果下雨, 下雪, 那么也是坏天气。
  • 其他情况为 好天气
python 复制代码
import pandas as pd

def calculate_comfort(row, initial_comfort=17):
    # confy = initial_comfort
    confy = int(row['high'].replace('℃', '')) - int(row['low'].replace('℃', ''))  
    
    # 提取温度信息
    high_temp = int(row['high'].replace('℃', ''))
    low_temp = int(row['low'].replace('℃', ''))
    
    # 天气信息中的关键词
    weather_info = row['info']
    
    # 根据天气调整舒适度
    if '雨' in weather_info:
        confy -= 3
    if '雪' in weather_info:
        confy -= 5
    
    # 高温处理
    if high_temp >= 36:
        confy -= 0.1 * (high_temp - 35)
    
    # 低温处理
    if low_temp <= 5:
        confy -= 0.1 * (6 - low_temp)
    
    # 理想温度增加舒适度
    ideal_temp = 20
    if 18 <= high_temp <= 22:
        confy *= 1.8
    elif 16 <= high_temp <= 24:
        confy *= 1.3
    
    return confy
df['comfort_level'] = df.apply(calculate_comfort, axis=1)
  1. 此外, 开盘, 收盘,之间的差距, 作为一天的结果。 也是作为模型的 y!
python 复制代码
# ret --> mean       0.171798
df["ret"]  = (df["收盘"] -  df["开盘"] ) *100  # 17 
  1. 画图查看

如果只从数值的角度, 那么很难看出有什么关系!

  1. 换一种思路。 对比变换情况。
  • 今天与昨天的天气变化情况 A
  • 今天与昨天的股市变化情况 B
  • A 与 B 之间的关系!
python 复制代码
# 创建二元变量表示今天的值是否大于昨天的值
df['comfort_change'] = (df['comfort_level'] > df['comfort_level'].shift(1)).astype(int)
df['ret_change'] = (df['ret'] > df['ret'].shift(1)).astype(int)

# ret_change, 第二种思路, 根据正负值来判断!
df['ret_change2'] = (df['ret'] > 0).astype(int)  # 修改此行来适应新的规则

# 打印结果查看
df[['date', 'comfort_level', 'ret', 'comfort_change', 'ret_change', "ret_change2"]].head()

# 统计两个列中相等值的行数
equal_count = (df['comfort_change'] == df['ret_change']).sum()

输出 258, 而总共有484条数据,准确率是 258 / 484 = 0.533

结论 + todo

  1. 根据天气, 来猜测股市的涨跌, 猜对的概率为 53%
  2. 一个问题是, 由于节假日,休市, 所以日期是不连贯的。 数据中的昨天, 不一定是昨天(比如, 假设今天是周一, 那么"昨天", 不是真正的昨天, 而是上个星期的周五。) 这中间差了几天, 天气也变化了。所以有问题!

走过路过,支持一下啊。

相关推荐
喵叔哟7 小时前
6.配置管理详解
后端·python·flask
曾经的三心草7 小时前
基于正倒排索引的Java文档搜索引擎3-实现Index类-实现搜索模块-实现DocSearcher类
java·python·搜索引擎
MOMO陌染7 小时前
Python 饼图入门:3 行代码展示数据占比
后端·python
vvoennvv8 小时前
【Python TensorFlow】 TCN-GRU时间序列卷积门控循环神经网络时序预测算法(附代码)
python·rnn·神经网络·机器学习·gru·tensorflow·tcn
自学互联网9 小时前
使用Python构建钢铁行业生产监控系统:从理论到实践
开发语言·python
无心水9 小时前
【Python实战进阶】7、Python条件与循环实战详解:从基础语法到高级技巧
android·java·python·python列表推导式·python条件语句·python循环语句·python实战案例
xwill*9 小时前
RDT-1B: A DIFFUSION FOUNDATION MODEL FOR BIMANUAL MANIPULATION
人工智能·pytorch·python·深度学习
陈奕昆9 小时前
n8n实战营Day2课时2:Loop+Merge节点进阶·Excel批量校验实操
人工智能·python·excel·n8n
程序猿追9 小时前
PyTorch算子模板库技术解读:无缝衔接PyTorch模型与Ascend硬件的桥梁
人工智能·pytorch·python·深度学习·机器学习
秋邱10 小时前
高等教育 AI 智能体的 “导学诊践” 闭环
开发语言·网络·数据库·人工智能·python·docker