MATLAB构建一些简单的人工数据集

1. 构建一个2维3类的数据集

复制代码
%高斯二维三类  1  3
mul=[0,0]; % 均值
S1=[.1 0;0 .1]; % 协方差
data1=mvnrnd(mul, S1, 100); % 产生高斯分布数据
% 第二组数据
mu2=[1.25 1.25];
S2=[.1 0;0 .1];
data2=mvnrnd(mu2,S2,100);
% % 第三组数据
mu3=[-1.25;1.25]
S3=[.1 0;0 .1]
data3=mvnrnd(mu3,S3,100)
% % 显示数据
 plot(data1(:,1),data1(:, 2),'b+');
 hold on;
 plot(data2(:,1),data2(:,2),'r+');
 plot(data3(:,1),data3(:,2),'g+');
 data=[data1;data2;data3];


2. 构建一个2维5类的数据集

复制代码
%高斯2维5类
N=300;
%数据维度
dim=2;
%混合比例
para_pi=[0.4 0.15 0.15 0.15 0.15];
%第一类数据
mul=[0 0]; % 均值
S1=[1 0;0 1]; % 协方差
data1=mvnrnd(mul, S1, para_pi(1)*N); % 产生高斯分布数据
%第二类数据
mu2=[4 4];
S2=[2 -1;-1 2];
data2=mvnrnd(mu2,S2,para_pi(2)*N);
%第三类数据
mu3=[-4 4];
S3=[2 1;1 2];
data3=mvnrnd(mu3,S3,para_pi(3)*N);
%第四类数据
mu4=[-4 -4];
S4=[2 -1;-1 2];
data4=mvnrnd(mu4,S4,para_pi(4)*N);
%第五类数据
mu5=[4 -4];
S5=[2 1;1 2];
data5=mvnrnd(mu5,S5,para_pi(5)*N);
%显示数据
plot(data1(:,1),data1(:, 2),'bo');
hold on;
plot(data2(:,1),data2(:,2),'ro');
plot(data3(:,1),data3(:,2),'go');
plot(data4(:,1),data4(:,2),'ko');
plot(data5(:,1),data5(:,2),'mo');
data = [data1, ones(para_pi(1)*N,1);
    data2, 2*ones(para_pi(2)*N,1); 
    data3, 3*ones(para_pi(3)*N,1);
    data4, 4*ones(para_pi(4)*N,1); 
    data5, 5*ones(para_pi(5)*N,1)];


3. 构建一个3维3类的数据集

复制代码
%高斯数据三维三类
%数据规模
N=500;
%数据维度
dim=3;
%混合比例
para_pi=[0.2 0.3 0.5];
%第一类数据
mul=[0 0 0]; % 均值
S1=[1 0 0;0 1 0;0 0 1]; % 协方差
data1=mvnrnd(mul, S1, para_pi(1)*N); % 产生高斯分布数据
%第二类数据
mu2=[-3 3 3];
S2=[2 -1 0;-1 1 0;0 0 1];
data2=mvnrnd(mu2,S2,para_pi(2)*N);
%第三类数据
mu3=[3 3 0];
S3=[2 1 0;1 2 0;0 0 1];
data3=mvnrnd(mu3,S3,para_pi(3)*N);
%显示数据
plot3(data1(:,1),data1(:, 2),data1(:,3),'bo');
hold on;
grid on
xlabel('x');
ylabel('y');
zlabel('z');
plot3(data2(:,1),data2(:,2),data2(:,3),'r*');
plot3(data3(:,1),data3(:,2),data3(:,3),'gx');
data = [data1, ones(para_pi(1)*N,1); 
    data2, 2*ones(para_pi(2)*N,1);
    data3, 3*ones(para_pi(3)*N,1)];


4. 构建一个3维4类的数据集

复制代码
%高斯数据三维四类
%数据规模
N=300;
%数据维度
dim=3;
%混合比例
para_pi=[0.1 0.2 0.3 0.4];
%第一类数据
mul=[0 0 0]; % 均值
S1=[1 0 0;0 1 0;0 0 1]; % 协方差
data1=mvnrnd(mul, S1, para_pi(1)*N); % 产生高斯分布数据
%第二类数据
mu2=[3 3 2];
S2=[2 -1 0;-1 1 0;0 0 1];
data2=mvnrnd(mu2,S2,para_pi(2)*N);
%第三类数据
mu3=[-3 3 1];
S3=[2 1 0;1 2 0;0 0 1];
data3=mvnrnd(mu3,S3,para_pi(3)*N);
%第四类数据
mu4=[0 -3 3];
S4=[2 1 0;1 1 0;0 0 2];
data4=mvnrnd(mu4,S4,para_pi(4)*N);
%显示数据
plot3(data1(:,1),data1(:, 2),data1(:,3),'bo');
hold on;
grid on
xlabel('x');
ylabel('y');
zlabel('z');
plot3(data2(:,1),data2(:,2),data2(:,3),'ro');
plot3(data3(:,1),data3(:,2),data3(:,3),'go');
plot3(data4(:,1),data4(:,2),data4(:,3),'ko');
data = [data1, ones(para_pi(1)*N,1); data2, 2*ones(para_pi(2)*N,1); data3, 3*ones(para_pi(3)*N,1); data4, 4*ones(para_pi(4)*N,1)];
%将数据集存入文件
相关推荐
@小匠1 天前
Read Frog:一款开源的 AI 驱动浏览器语言学习扩展
人工智能·学习
山间小僧1 天前
「AI学习笔记」RNN
机器学习·aigc·ai编程
网教盟人才服务平台1 天前
“方班预备班盾立方人才培养计划”正式启动!
大数据·人工智能
芯智工坊1 天前
第15章 Mosquitto生产环境部署实践
人工智能·mqtt·开源
菜菜艾1 天前
基于llama.cpp部署私有大模型
linux·运维·服务器·人工智能·ai·云计算·ai编程
TDengine (老段)1 天前
TDengine IDMP 可视化 —— 分享
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据·时序数据
小真zzz1 天前
搜极星:第三方多平台中立GEO洞察专家全面解析
人工智能·搜索引擎·seo·geo·中立·第三方平台
AI前沿晓猛哥1 天前
2026年安卓加固工具横向对比:哪个防护效果最好且不卡顿?
数据挖掘
GreenTea1 天前
从 Claw-Code 看 AI 驱动的大型项目开发:2 人 + 10 个自治 Agent 如何产出 48K 行 Rust 代码
前端·人工智能·后端
火山引擎开发者社区1 天前
秒级创建实例,火山引擎 Milvus Serverless 让 AI Agent 开发更快更省
人工智能