python 天气与股票的关系--第3部分,建立模型

起因(目的):

继续瞎折腾。

过程:

  1. 假设有下面这些规则: 天气中的温度,
  • 如果最高温度大于 36, 那么就是坏天气。
  • 如果最低温度小于 5, 那么也是坏天气。
  • 如果下雨, 下雪, 那么也是坏天气。
  • 其他情况为 好天气
python 复制代码
import pandas as pd

def calculate_comfort(row, initial_comfort=17):
    # confy = initial_comfort
    confy = int(row['high'].replace('℃', '')) - int(row['low'].replace('℃', ''))  
    
    # 提取温度信息
    high_temp = int(row['high'].replace('℃', ''))
    low_temp = int(row['low'].replace('℃', ''))
    
    # 天气信息中的关键词
    weather_info = row['info']
    
    # 根据天气调整舒适度
    if '雨' in weather_info:
        confy -= 3
    if '雪' in weather_info:
        confy -= 5
    
    # 高温处理
    if high_temp >= 36:
        confy -= 0.1 * (high_temp - 35)
    
    # 低温处理
    if low_temp <= 5:
        confy -= 0.1 * (6 - low_temp)
    
    # 理想温度增加舒适度
    ideal_temp = 20
    if 18 <= high_temp <= 22:
        confy *= 1.8
    elif 16 <= high_temp <= 24:
        confy *= 1.3
    
    return confy
df['comfort_level'] = df.apply(calculate_comfort, axis=1)
  1. 此外, 开盘, 收盘,之间的差距, 作为一天的结果。 也是作为模型的 y!
python 复制代码
# ret --> mean       0.171798
df["ret"]  = (df["收盘"] -  df["开盘"] ) *100  # 17 
  1. 画图查看

如果只从数值的角度, 那么很难看出有什么关系!

  1. 换一种思路。 对比变换情况。
  • 今天与昨天的天气变化情况 A
  • 今天与昨天的股市变化情况 B
  • A 与 B 之间的关系!
python 复制代码
# 创建二元变量表示今天的值是否大于昨天的值
df['comfort_change'] = (df['comfort_level'] > df['comfort_level'].shift(1)).astype(int)
df['ret_change'] = (df['ret'] > df['ret'].shift(1)).astype(int)

# ret_change, 第二种思路, 根据正负值来判断!
df['ret_change2'] = (df['ret'] > 0).astype(int)  # 修改此行来适应新的规则

# 打印结果查看
df[['date', 'comfort_level', 'ret', 'comfort_change', 'ret_change', "ret_change2"]].head()

# 统计两个列中相等值的行数
equal_count = (df['comfort_change'] == df['ret_change']).sum()

输出 258, 而总共有484条数据,准确率是 258 / 484 = 0.533

结论 + todo

  1. 根据天气, 来猜测股市的涨跌, 猜对的概率为 53%
  2. 一个问题是, 由于节假日,休市, 所以日期是不连贯的。 数据中的昨天, 不一定是昨天(比如, 假设今天是周一, 那么"昨天", 不是真正的昨天, 而是上个星期的周五。) 这中间差了几天, 天气也变化了。所以有问题!

走过路过,支持一下啊。

相关推荐
akhfuiigabv44 分钟前
使用Neo4j-Cypher-FT实现自然语言查询图数据库
数据库·python·oracle·neo4j
繁依Fanyi1 小时前
828华为云征文|华为Flexus云服务器搭建OnlyOffice私有化在线办公套件
服务器·开发语言·前端·python·算法·华为·华为云
zhangfeng11331 小时前
在 PyTorch 中,除了 pad_sequence 还有哪些其他处理序列数据的函数?时间序列数据 预处理
人工智能·pytorch·python·深度学习
python1561 小时前
Python Numpy布尔数组在数据分析中的应用
python·数据分析·numpy
AIAdvocate1 小时前
力扣-96.不同的二叉搜索树 题目详解
python·算法·动态规划
luthane2 小时前
python 实现entropy熵算法
python·算法·概率论
akhfuiigabv2 小时前
探索Timescale Vector与Postgres数据库的融合:AI应用的新选择
数据库·人工智能·python
hakesashou2 小时前
ruby和python哪个好学
开发语言·python·ruby
NiNg_1_2342 小时前
Python协程详解
开发语言·python
黑白子20002 小时前
python定时任务,定时爬取水质和天气
开发语言·python