MATLAB构建一些简单的人工数据集

1. 构建一个2维3类的数据集

复制代码
%高斯二维三类  1  3
mul=[0,0]; % 均值
S1=[.1 0;0 .1]; % 协方差
data1=mvnrnd(mul, S1, 100); % 产生高斯分布数据
% 第二组数据
mu2=[1.25 1.25];
S2=[.1 0;0 .1];
data2=mvnrnd(mu2,S2,100);
% % 第三组数据
mu3=[-1.25;1.25]
S3=[.1 0;0 .1]
data3=mvnrnd(mu3,S3,100)
% % 显示数据
 plot(data1(:,1),data1(:, 2),'b+');
 hold on;
 plot(data2(:,1),data2(:,2),'r+');
 plot(data3(:,1),data3(:,2),'g+');
 data=[data1;data2;data3];


2. 构建一个2维5类的数据集

复制代码
%高斯2维5类
N=300;
%数据维度
dim=2;
%混合比例
para_pi=[0.4 0.15 0.15 0.15 0.15];
%第一类数据
mul=[0 0]; % 均值
S1=[1 0;0 1]; % 协方差
data1=mvnrnd(mul, S1, para_pi(1)*N); % 产生高斯分布数据
%第二类数据
mu2=[4 4];
S2=[2 -1;-1 2];
data2=mvnrnd(mu2,S2,para_pi(2)*N);
%第三类数据
mu3=[-4 4];
S3=[2 1;1 2];
data3=mvnrnd(mu3,S3,para_pi(3)*N);
%第四类数据
mu4=[-4 -4];
S4=[2 -1;-1 2];
data4=mvnrnd(mu4,S4,para_pi(4)*N);
%第五类数据
mu5=[4 -4];
S5=[2 1;1 2];
data5=mvnrnd(mu5,S5,para_pi(5)*N);
%显示数据
plot(data1(:,1),data1(:, 2),'bo');
hold on;
plot(data2(:,1),data2(:,2),'ro');
plot(data3(:,1),data3(:,2),'go');
plot(data4(:,1),data4(:,2),'ko');
plot(data5(:,1),data5(:,2),'mo');
data = [data1, ones(para_pi(1)*N,1);
    data2, 2*ones(para_pi(2)*N,1); 
    data3, 3*ones(para_pi(3)*N,1);
    data4, 4*ones(para_pi(4)*N,1); 
    data5, 5*ones(para_pi(5)*N,1)];


3. 构建一个3维3类的数据集

复制代码
%高斯数据三维三类
%数据规模
N=500;
%数据维度
dim=3;
%混合比例
para_pi=[0.2 0.3 0.5];
%第一类数据
mul=[0 0 0]; % 均值
S1=[1 0 0;0 1 0;0 0 1]; % 协方差
data1=mvnrnd(mul, S1, para_pi(1)*N); % 产生高斯分布数据
%第二类数据
mu2=[-3 3 3];
S2=[2 -1 0;-1 1 0;0 0 1];
data2=mvnrnd(mu2,S2,para_pi(2)*N);
%第三类数据
mu3=[3 3 0];
S3=[2 1 0;1 2 0;0 0 1];
data3=mvnrnd(mu3,S3,para_pi(3)*N);
%显示数据
plot3(data1(:,1),data1(:, 2),data1(:,3),'bo');
hold on;
grid on
xlabel('x');
ylabel('y');
zlabel('z');
plot3(data2(:,1),data2(:,2),data2(:,3),'r*');
plot3(data3(:,1),data3(:,2),data3(:,3),'gx');
data = [data1, ones(para_pi(1)*N,1); 
    data2, 2*ones(para_pi(2)*N,1);
    data3, 3*ones(para_pi(3)*N,1)];


4. 构建一个3维4类的数据集

复制代码
%高斯数据三维四类
%数据规模
N=300;
%数据维度
dim=3;
%混合比例
para_pi=[0.1 0.2 0.3 0.4];
%第一类数据
mul=[0 0 0]; % 均值
S1=[1 0 0;0 1 0;0 0 1]; % 协方差
data1=mvnrnd(mul, S1, para_pi(1)*N); % 产生高斯分布数据
%第二类数据
mu2=[3 3 2];
S2=[2 -1 0;-1 1 0;0 0 1];
data2=mvnrnd(mu2,S2,para_pi(2)*N);
%第三类数据
mu3=[-3 3 1];
S3=[2 1 0;1 2 0;0 0 1];
data3=mvnrnd(mu3,S3,para_pi(3)*N);
%第四类数据
mu4=[0 -3 3];
S4=[2 1 0;1 1 0;0 0 2];
data4=mvnrnd(mu4,S4,para_pi(4)*N);
%显示数据
plot3(data1(:,1),data1(:, 2),data1(:,3),'bo');
hold on;
grid on
xlabel('x');
ylabel('y');
zlabel('z');
plot3(data2(:,1),data2(:,2),data2(:,3),'ro');
plot3(data3(:,1),data3(:,2),data3(:,3),'go');
plot3(data4(:,1),data4(:,2),data4(:,3),'ko');
data = [data1, ones(para_pi(1)*N,1); data2, 2*ones(para_pi(2)*N,1); data3, 3*ones(para_pi(3)*N,1); data4, 4*ones(para_pi(4)*N,1)];
%将数据集存入文件
相关推荐
有为少年1 小时前
Welford 算法 | 优雅地计算海量数据的均值与方差
人工智能·深度学习·神经网络·学习·算法·机器学习·均值算法
GISer_Jing1 小时前
跨境营销前端AI应用业务领域
前端·人工智能·aigc
Ven%1 小时前
从单轮问答到连贯对话:RAG多轮对话技术详解
人工智能·python·深度学习·神经网络·算法
OpenCSG1 小时前
OpenCSG社区:激发城市AI主权创新引擎
人工智能·opencsg·agentichub
大厂技术总监下海1 小时前
没有千卡GPU,如何从0到1构建可用LLM?nanoChat 全栈实践首次公开
人工智能·开源
机器之心1 小时前
谁还敢说谷歌掉队?2025年,它打了一场漂亮的翻身仗
人工智能·openai
元智启1 小时前
企业AI智能体加速产业重构:政策红利与场景落地双轮驱动——从技术验证到价值交付的范式跃迁
人工智能·重构
智算菩萨1 小时前
强化学习从单代理到多代理系统的理论与算法架构综述
人工智能·算法·强化学习
San30.1 小时前
从零到一:开启 LangChain 的 AI 工程化之旅
人工智能·langchain·node.js
机器之心1 小时前
字节做了个 AI 手机,钉钉做了台 AI 主机
人工智能·openai