MATLAB表格Table与时间序列Timetable的高效操作方法

MATLAB中的表格(Table)时间序列(Timetable) 是处理结构化数据和时间相关数据的核心工具。以下从基础操作到高级技巧,分步骤详解其使用方法。


一、创建与基础操作

1. 表格(Table)的创建与访问

创建表格:
复制代码
% 定义列数据
Name = {'Alice'; 'Bob'; 'Charlie'};
Age = [25; 30; 35];
Employed = logical([1; 0; 1]); % 逻辑类型

% 创建表格
myTable = table(Name, Age, Employed); 
disp(myTable)
访问数据:
  • 按列名访问myTable.NamemyTable.('Name')

  • 按行、列索引

    复制代码
    % 获取第一行所有列数据
    row1 = myTable(1, :); 
    
    % 获取第2到3行的'Age'列
    subset = myTable(2:3, 'Age');

2. 时间序列(Timetable)的创建与访问

创建Timetable:
复制代码
% 定义时间戳(规则时间)
Time = datetime('2023-01-01 08:00:00') + seconds(0:2)';
Data = [1.2; 3.4; 5.6];

% 创建Timetable
myTT = timetable(Time, Data);
disp(myTT)
访问特定时间点数据:
复制代码
% 提取特定时间的数据
row = myTT(myTT.Time == datetime('2023-01-01 08:00:01'), :);

二、数据筛选与查询

1. 表格的条件筛选

复制代码
% 筛选条件:年龄大于30且被雇佣
selectedRows = myTable(myTable.Age > 30 & myTable.Employed, :);

2. 时间序列的时间范围筛选

  • 使用timerange函数

    复制代码
    % 筛选时间范围内的数据
    tt_sub = myTT(timerange('2023-01-01 08:00:00', '2023-01-01 08:00:02'), :);
  • 使用时间容忍度(WithTol)(适合非精确匹配):

    复制代码
    % 忽略时间点±2秒误差
    tt_sub = myTT(withtol(datetime('2023-01-01 08:00:01'), seconds(2)), :);

三、数据增删改

1. 新增或删除列

复制代码
% 新增列
myTable.Salary = [50000; 60000; 75000];

% 删除'Employed'列
myTable = removevars(myTable, 'Employed');

2. 合并表格或时间序列

  • 垂直合并(追加行)

    复制代码
    newData = table({'David'}, 28, 'VariableNames', {'Name', 'Age'});
    myTable = vertcat(myTable, newData);
  • 水平合并(添加列)

    复制代码
    extraInfo = table([70; 80; 90], 'VariableNames', {'Weight'});
    myTable = [myTable, extraInfo];
  • 基于时间的合并(Timetable)

    复制代码
    % 同步两个时间序列
    syncedTT = synchronize(myTT1, myTT2);

四、高级操作:重采样与统计

1. 时间序列重采样

  • 降采样(聚合)

    复制代码
    % 每2秒计算一次数据的平均值
    tt_resampled = retime(myTT, 'regular', 'mean', 'TimeStep', seconds(2));
  • 填充缺失值

    复制代码
    % 填充前向数据(使用线性插值)
    tt_filled = retime(myTT, 'regular', 'linear', 'TimeStep', seconds(1));

2. 表格的统计计算

复制代码
% 按分组计算平均年龄(如按某列分组)
groupStats = groupsummary(myTable, 'GroupColumn', 'mean', 'Age');

五、性能优化技巧

1. 避免循环,使用向量化操作

复制代码
% 直接计算新列(非循环)
myTable.DoubleAge = myTable.Age * 2;

2. 优化数据类型节省内存

  • 将字符串分类变量转换为categorical类型:

    复制代码
    myTable.Name = categorical(myTable.Name);

3. 预分配内存

在循环外预先分配足够大的表格:

复制代码
% 预定义表格大小
outputTable = table('Size',[1000, 3], 'VariableTypes', {'string', 'double', 'logical'});

六、常见问题与处理

1. 时间戳不唯一

  • 检测重复时间:

    复制代码
    isDuplicate = duplicated(myTT.Time);
  • 通过retime合并处理:

    复制代码
    % 对重复时间取平均值
    tt_unique = retime(myTT, 'regular', 'mean', 'TimeStep', seconds(1));

2. 缺失值处理

  • 删除含有NaN的行:

    复制代码
    myTable = rmmissing(myTable);
  • 填充缺失数据:

    复制代码
    myTable = fillmissing(myTable, 'linear');
相关推荐
不会C语言的男孩40 分钟前
C++ Primer Plus 第8章:函数探幽
开发语言·c++
方也_arkling8 小时前
【Java-Day08】static / final / 枚举
java·开发语言
风吹夏回9 小时前
Python 全局异常处理:从“满屏 try-except”到优雅兜底
开发语言·python
Chengbei119 小时前
一站式源码安全检测工具、云安全 / APP / 小程序源码敏感信息递归多层目录扫描AK、JWT、手机号、身份证等敏感信息
java·开发语言·安全·web安全·网络安全·系统安全·安全架构
llz_1129 小时前
web-第一次课后作业
java·开发语言·idea
kkeeper~9 小时前
0基础C语言积跬步之数据在内存中的存储
c语言·数据结构·算法
小熊Coding9 小时前
Python爬取当当网二手图书项目实战!
开发语言·爬虫·python·beautifulsoup·requests·二手图书
秋99 小时前
Java项目运行5天左右自动宕机:系统性定位与解决方案
java·开发语言·python
2401_868534789 小时前
论企业网络设计
数据结构
xiaoshuaishuai89 小时前
C# 内存管理与资源泄漏
开发语言·c#