MATLAB表格Table与时间序列Timetable的高效操作方法

MATLAB中的表格(Table)时间序列(Timetable) 是处理结构化数据和时间相关数据的核心工具。以下从基础操作到高级技巧,分步骤详解其使用方法。


一、创建与基础操作

1. 表格(Table)的创建与访问

创建表格:
复制代码
% 定义列数据
Name = {'Alice'; 'Bob'; 'Charlie'};
Age = [25; 30; 35];
Employed = logical([1; 0; 1]); % 逻辑类型

% 创建表格
myTable = table(Name, Age, Employed); 
disp(myTable)
访问数据:
  • 按列名访问myTable.NamemyTable.('Name')

  • 按行、列索引

    复制代码
    % 获取第一行所有列数据
    row1 = myTable(1, :); 
    
    % 获取第2到3行的'Age'列
    subset = myTable(2:3, 'Age');

2. 时间序列(Timetable)的创建与访问

创建Timetable:
复制代码
% 定义时间戳(规则时间)
Time = datetime('2023-01-01 08:00:00') + seconds(0:2)';
Data = [1.2; 3.4; 5.6];

% 创建Timetable
myTT = timetable(Time, Data);
disp(myTT)
访问特定时间点数据:
复制代码
% 提取特定时间的数据
row = myTT(myTT.Time == datetime('2023-01-01 08:00:01'), :);

二、数据筛选与查询

1. 表格的条件筛选

复制代码
% 筛选条件:年龄大于30且被雇佣
selectedRows = myTable(myTable.Age > 30 & myTable.Employed, :);

2. 时间序列的时间范围筛选

  • 使用timerange函数

    复制代码
    % 筛选时间范围内的数据
    tt_sub = myTT(timerange('2023-01-01 08:00:00', '2023-01-01 08:00:02'), :);
  • 使用时间容忍度(WithTol)(适合非精确匹配):

    复制代码
    % 忽略时间点±2秒误差
    tt_sub = myTT(withtol(datetime('2023-01-01 08:00:01'), seconds(2)), :);

三、数据增删改

1. 新增或删除列

复制代码
% 新增列
myTable.Salary = [50000; 60000; 75000];

% 删除'Employed'列
myTable = removevars(myTable, 'Employed');

2. 合并表格或时间序列

  • 垂直合并(追加行)

    复制代码
    newData = table({'David'}, 28, 'VariableNames', {'Name', 'Age'});
    myTable = vertcat(myTable, newData);
  • 水平合并(添加列)

    复制代码
    extraInfo = table([70; 80; 90], 'VariableNames', {'Weight'});
    myTable = [myTable, extraInfo];
  • 基于时间的合并(Timetable)

    复制代码
    % 同步两个时间序列
    syncedTT = synchronize(myTT1, myTT2);

四、高级操作:重采样与统计

1. 时间序列重采样

  • 降采样(聚合)

    复制代码
    % 每2秒计算一次数据的平均值
    tt_resampled = retime(myTT, 'regular', 'mean', 'TimeStep', seconds(2));
  • 填充缺失值

    复制代码
    % 填充前向数据(使用线性插值)
    tt_filled = retime(myTT, 'regular', 'linear', 'TimeStep', seconds(1));

2. 表格的统计计算

复制代码
% 按分组计算平均年龄(如按某列分组)
groupStats = groupsummary(myTable, 'GroupColumn', 'mean', 'Age');

五、性能优化技巧

1. 避免循环,使用向量化操作

复制代码
% 直接计算新列(非循环)
myTable.DoubleAge = myTable.Age * 2;

2. 优化数据类型节省内存

  • 将字符串分类变量转换为categorical类型:

    复制代码
    myTable.Name = categorical(myTable.Name);

3. 预分配内存

在循环外预先分配足够大的表格:

复制代码
% 预定义表格大小
outputTable = table('Size',[1000, 3], 'VariableTypes', {'string', 'double', 'logical'});

六、常见问题与处理

1. 时间戳不唯一

  • 检测重复时间:

    复制代码
    isDuplicate = duplicated(myTT.Time);
  • 通过retime合并处理:

    复制代码
    % 对重复时间取平均值
    tt_unique = retime(myTT, 'regular', 'mean', 'TimeStep', seconds(1));

2. 缺失值处理

  • 删除含有NaN的行:

    复制代码
    myTable = rmmissing(myTable);
  • 填充缺失数据:

    复制代码
    myTable = fillmissing(myTable, 'linear');
相关推荐
睿思达DBA_WGX12 分钟前
Python 程序设计讲义(36):字符串的处理方法——去除字符串头尾字符:strip() 方法、lstrip() 方法与rstrip() 方法
开发语言·python
下页、再停留1 小时前
【PHP】CURL请求第三方API接口
开发语言·php
爱吃KFC的大肥羊1 小时前
C/C++常用字符串函数
c语言·数据结构·c++·算法
武文斌772 小时前
嵌入式——数据结构:基础知识和链表①
数据结构
我要成为c嘎嘎大王3 小时前
【C++】类和对象(2)
开发语言·c++
慕y2743 小时前
Java学习第九十一部分——OkHttp
java·开发语言·学习
神器阿龙3 小时前
排序算法-冒泡排序
数据结构·算法·排序算法
海奥华23 小时前
操作系统到 Go 运行时的内存管理演进与实现
开发语言·后端·golang
C++ 老炮儿的技术栈4 小时前
在vscode 如何运行a.nut 程序(Squirrel语言)
c语言·开发语言·c++·ide·vscode·算法·编辑器