数据集笔记:Pems 自行下载数据+python处理

以下载District 4的各station每5分钟的车速为例

1 PEMS网站下载数据

点击红色的

选择需要的station和区域,点击search,就是对应的数据,点击数据即可下载 (这个是station每5分钟的速度数据)

2 pems 速度数据

2.1 每一列的意义

|------------------|------------------------------------------------------------------------------------------------------------|
| Timestamp | 间隔开始的日期和时间。例如,08:00:00的时间表明聚合包含在08:00:00到08:04:59之间收集的测量数据。 请注意,五分钟聚合的秒值总是0。格式为MM/DD/YYYY HH24:MI:SS。 |
| Station | 独特的车站标识符。 |
| District | 区号 |
| Freeway | 高速公路号 |
| Direction | 行驶方向 东南西北 ESWN |
| 车道类型 | 表示车道类型的字符串。 可能的值(及其含义)为: * CD(收集/分配) * CH(传统公路) * FF(高速公路-高速公路连接) * FR(下匝道) * HV(高占用车道) * ML(主线) * OR(上匝道) |
| Station Length | 车站覆盖的路段长度,单位为英里/公里。 |
| Samples | 所有车道接收的样本总数 |
| % Observed | 在这个位置有observation的车道的百分比 |
| Total Flow | 所有车道5分钟内流量总和。 |
| Avg Occupancy | 5分钟内所有车道的平均占用率,以0到1之间的小数表示 |
| Avg Speed | 所有车道5分钟内的流量加权平均速度。如果流量为0,则为5分钟车速的数学平均值 |
| Lane N Samples | 车道N收到的良好样本数。 |
| Lane N Flow | 5分钟内车道N的总流量。 |
| Lane N Avg Occ | 5分钟内车道N的平均占有率 |
| Lane N Avg Speed | 5分钟内车道N的平均速度 |
| Lane N Observed | 车道N是否有观测值(1代表有,0代表没有) |

2.2 python 读取PEMS

python 复制代码
import numpy as np
import pandas as pd


#设置header
new_headers = ['Timestamp', 'Station', 'District', 'Freeway', 'Direction',
               'Lane Type', 'Station Length', 'Samples', '%Observed',
               'Total Flow', 'Avg Occupancy', 'Avg Speed']
for i in range(1, (pems04.shape[1]-12)//5+1):
    new_headers.extend([
        f'Lane {i} Samples', f'Lane {i} Flow', f'Lane {i} Avg Occ',
        f'Lane {i} Avg Speed', f'Lane {i} Observed'
    ])


pems04=pd.read_csv('d04_text_station_5min_2023_01_02.txt',names=new_headers)
pems04

3 pems station 元数据

3.1 每一列的意义

|--------------------|---------------------------------------------------------------------------------------------------|
| ID | station 的标识 |
| Freeway | 高速公路编号 |
| Freeway Direction | 表示高速公路方向的字符串 |
| County Identifier | 县id |
| City | 城市 |
| State Postmile | 州公里标 |
| Absolute Postmile | 绝对公里标 |
| Latitude,Longitude | 经纬度 |
| Length | 长度 |
| Type | 类型 可能的值(及其含义)为: * CD(收集/分配) * CH(传统公路) * FF(高速公路-高速公路连接) * FR(下匝道) * HV(高占用车道) * ML(主线) * OR(上匝道) |
| Lanes | 车道数 |
| Name | 名字 |
| User IDs | 用户输入的字符串标识符 |

3.2 python读取

python 复制代码
import numpy as np
import pandas as pd

pems04=pd.read_csv('d04_text_meta_2022_12_13.txt',delimiter='\t')
pems04
相关推荐
U盘失踪了20 小时前
【笔记】Flask 用 session 对象存储用户状态
笔记
Brilliantwxx1 天前
【C++】 vector(代码实现+坑点讲解)
开发语言·c++·笔记·算法
码途漫谈1 天前
Easy-Vibe高级开发篇阅读笔记(五)——CC教程之Agent Teams
人工智能·笔记·ai·开源·ai编程
憧憬成为原神糕手1 天前
FFmpeg 音视频开发笔记(一):H.264 解码为 YUV
笔记·ffmpeg·音视频
爱听歌的周童鞋1 天前
Learn-Claude-Code | 笔记 | Collaboration | s11 Autonomous Agents
笔记·llm·agent·claude code·collaboration·autonomous
05候补工程师1 天前
[线性代数] 判定线性相关性的“降维打击”:从基本定理到速通特殊法
经验分享·笔记·学习·线性代数·考研
sweetheart7-71 天前
go/golang 入门学习笔记(Java/Python/C++转Go快速上手)
笔记·学习·golang·go语言
Byron__1 天前
Java JVM核心知识点复习笔记
java·jvm·笔记
爱莉希雅&&&1 天前
MySQL MGR + MySQL Router 高可用集群完整笔记(含手动配置 + Shell 接管双路线)
linux·数据库·笔记·mysql·mysqlrouter·mysqlshell
凉、介1 天前
Armv8-A virtualization 笔记 (一)
c语言·笔记·学习·嵌入式·虚拟化·hypervisor