IBM Qiskit量子机器学习速成(二)

分类与回归

本章节介绍如何使用量子神经网络处理机器学习中的分类与回归任务。一般而言,我们将这两大内容归类为"监督学习(supervised learning)"

一般流程

使用量子神经网络处理分类与回归任务的一般步骤如下:

  1. 创建参数化电路,参数可以是Parameter(单参数)、由Parameter组成的列表或ParameterVector(多参数)
  2. 将参数化电路传入量子神经网络(EstimatorQNN或者SamplerQNN,前者一般用于期望值估计,后者一般关注某一特殊状态的概率),一般格式为
py 复制代码
xxxQNN(
    circuit=qc,  # 你的参数化电路
    input_params=params1, # 你的输入参数,即你准备的数据
    weight_params=params2, # 你的权重参数,即机器学习模型本身的参数
)
  • 需要从qiskit_machine_learning.neural_networks库中导入神经网络
  1. 创建分类器或回归器
  • 需要从qiskit_machine_learning.algorithms.classifiers库中导入NeuralNetworkClassifier
  • 需要从qiskit_machine_learning.algorithms.regressors库中导入NeuralNetworkRegressor
py 复制代码
# 分类器
c1 = NeuralNetworkClassifier(
    neural_network=qnn, # 你准备的量子神经网络
    optimizer=optimizer # 误差函数或优化器
)

# 回归器
r1 = NeuralNetworkRegressor(
    neural_network=qnn, # 你准备的量子神经网络
    optimizer=optimizer # 误差函数或优化器
)
  1. 分类器或回归器的使用
py 复制代码
c1.fit(train_X, train_y)  # 使用训练数据拟合分类器
c1.predict(test_X)  # 预测测试数据的结果
c1.score(test_X, test_y)  # 计算得分以评判模型优劣(神经网络和误差函数是否选择得当)

r1.fit(train_X, train_y)  # 使用训练数据拟合回归器
r1.predict(test_X)
r1.score(test_X, test_y)
  1. 使用Qiskit提供的VQC或VQR类简化上述步骤
  • 需要从qiskit_machine_learning.algorithms.classifiers库中导入VQC
  • 需要从qiskit_machine_learning.algorithms.regressors库中导入VQR
py 复制代码
vqc = VQC(
    feature_map=feature_map,  # 数据编码电路
    ansatz=ansatz,  # 模型参数所在电路/神经网络的层所在电路
    optimizer=optimizer,  # 优化器
)

vqr = VQR(
    feature_map=feature_map,  # 数据编码电路
    ansatz=ansatz,  # 模型参数所在电路/神经网络的层所在电路
    optimizer=optimizer,  # 优化器
)

其中出现的feature_map、ansatz等词的含义下文会讲。

实战演练

回归问题

温馨提醒:以下代码段应合并为一整个代码文件

首先导入本次需要的所有库文件

py 复制代码
import numpy as np
from qiskit import QuantumCircuit       # 量子电路
from qiskit.circuit import Parameter        # 参数
from qiskit_algorithms.optimizers import L_BFGS_B  # 优化器的一种,你可以选择其他优化器
from qiskit_machine_learning.algorithms.regressors import NeuralNetworkRegressor, VQR
from qiskit_machine_learning.neural_networks import EstimatorQNN
from qiskit_machine_learning.circuit.library import QNNCircuit

接下来我们先"故意"编造我们的数据

py 复制代码
num_samples = 20
eps = 0.01
lb, ub = -np.pi, np.pi
X_ = np.linspace(lb, ub, num=50).reshape(50, 1)
f = lambda x: np.sin(x)

X = (ub - lb) * np.random.random([num_samples, 1]) + lb
y = f(X[:, 0]) + eps * (2 * np.random.random(num_samples) - 1)

num_samples是我们的样本点个数或说样本容量,eps是误差。我们首先在 [ − π , π ] [-\pi, \pi] [−π,π]区间上均匀地获得了若干自变量值,随后随机地在这个区间上采样得到X,代入函数值并加上噪声得到y。如果不加噪声,y会是一个X的精确函数,既不现实,也不没有执行回归算法的意义。

下一步,我们要创建量子神经网络

py 复制代码
param_x = Parameter("x")
feature_map = QuantumCircuit(1, name="fm")
feature_map.ry(param_x, 0)

# construct simple ansatz
param_y = Parameter("y")
ansatz = QuantumCircuit(1, name="vf")
ansatz.ry(param_y, 0)

# construct a circuit
qc = QNNCircuit(feature_map=feature_map, ansatz=ansatz)

regression_estimator_qnn = EstimatorQNN(
    circuit=qc
)

feature_map意为特征映射,意味着我们需要把经典数据代表的数据特征映射成量子比特。ansatz本意为"假设",在量子机器学习中表示我们"对机器学习模型结构的初始猜测",这一模型的参数后续可以得到优化(就像高中数学中的二分法求根,需要先指定一个点才能开始迭代)。

随后,我们就可以创建变分量子回归器(Variational Quantum Regressor, VQR)了。我们这里先用最繁难的方法处理一遍(即使用NeuralNetworkRegressor)。

py 复制代码
regressor = NeuralNetworkRegressor(
    neural_network=regression_estimator_qnn,
    loss="squared_error",
    optimizer=L_BFGS_B(maxiter=5),
)

我们这里先是传入了自定义的神经网络,又传入了一个指定的损失函数L_BFGS_B,并且规定最大迭代次数为5。

最后,我们直接代入数据进行拟合

py 复制代码
regressor.fit(X, y)

print(regressor.score(X, y))

如果想简化上述过程,我们可以使用VQR

py 复制代码
vqr = VQR(
    feature_map=feature_map,
    ansatz=ansatz,
    optimizer=L_BFGS_B(maxiter=5),
    callback=callback_graph,
)
vqc.fit(X, y)

print(vqc.score(X, y))

部分聪明的读者会想尝试拟合直线,但是得到了极其离谱的得分。原因在于Qiskit官网的这一例子能给出的期望值被限制在 [ − 1 , 1 ] [-1,1] [−1,1]之间。

分类问题

本次用到的库如下

py 复制代码
from sklearn.datasets import load_iris
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from qiskit.circuit.library import ZZFeatureMap, RealAmplitudes
from qiskit_algorithms.optimizers import COBYLA
from qiskit.primitives import Sampler
from qiskit_machine_learning.algorithms import VQC

由于我们要使用真实数据(知名的鸢尾花数据),所以导入了sklearn库。我们通过如下方式使用这一数据

py 复制代码
iris_data = load_iris()  # 加载数据
features = iris_data.data  # 特征即数据
labels = iris_data.target  # 标签即目标

你可以尝试打印这两个变量,观察数据的形状。其中记录了鸢尾花花萼与花瓣的大小,我们知道这两个数据的范围是不同的(如果高中主科和副科的考试总分不同),这对我们的训练不利,我们需要将其标准化到 [ 0 , 1 ] [0,1] [0,1]区间上。

py 复制代码
features = MinMaxScaler().fit_transform(features)  # 标准化数据/特征

下一步,我们将总数据分割成训练集与测试集(就像人类学习知识时,先做习题,再考试)。

py 复制代码
train_features, test_features, train_labels, test_labels = train_test_split(
    features, labels, train_size=0.8
)

制备好数据集后,我们可以正式进入到量子机器学习的分类方法了。首先我们使用ZZFeatureMap将我们鸢尾花的花萼与花瓣两类数据编码为量子比特。

py 复制代码
num_features = features.shape[1]  # 特征数

# 特征数与数据集保持一致,reps的数量会决定量子门序列的重复次数,影响保真率
feature_map = ZZFeatureMap(num_features, reps=1)

注意!我们只是准备了导入接口,还没有导入数据!

随后,使用RealAmplitudes作为神经网络的层(即可调参数的一种模型)。

py 复制代码
ansatz = RealAmplitudes(num_qubits=num_features, reps=4)

最后,我们创建量子分类器

py 复制代码
vqc = VQC(
    num_features,
    feature_map,
    ansatz,
    optimizer=COBYLA(maxiter=100)
)

拟合数据并打印结果

py 复制代码
vqc1.fit(train_features, train_labels)
print(vqc1.score(train_features, train_labels))
print(vqc1.score(test_features, test_labels))
相关推荐
__基本操作__几秒前
边缘提取函数 [OPENCV--2]
人工智能·opencv·计算机视觉
Doctor老王5 分钟前
TR3:Pytorch复现Transformer
人工智能·pytorch·transformer
热爱生活的五柒5 分钟前
pytorch中数据和模型都要部署在cuda上面
人工智能·pytorch·深度学习
HyperAI超神经2 小时前
【TVM 教程】使用 Tensorize 来利用硬件内联函数
人工智能·深度学习·自然语言处理·tvm·计算机技术·编程开发·编译框架
扫地的小何尚3 小时前
NVIDIA RTX 系统上使用 llama.cpp 加速 LLM
人工智能·aigc·llama·gpu·nvidia·cuda·英伟达
埃菲尔铁塔_CV算法6 小时前
深度学习神经网络创新点方向
人工智能·深度学习·神经网络
艾思科蓝-何老师【H8053】6 小时前
【ACM出版】第四届信号处理与通信技术国际学术会议(SPCT 2024)
人工智能·信号处理·论文发表·香港中文大学
秀儿还能再秀7 小时前
机器学习——简单线性回归、逻辑回归
笔记·python·学习·机器学习
weixin_452600697 小时前
《青牛科技 GC6125:驱动芯片中的璀璨之星,点亮 IPcamera 和云台控制(替代 BU24025/ROHM)》
人工智能·科技·单片机·嵌入式硬件·新能源充电桩·智能充电枪
学术搬运工7 小时前
【珠海科技学院主办,暨南大学协办 | IEEE出版 | EI检索稳定 】2024年健康大数据与智能医疗国际会议(ICHIH 2024)
大数据·图像处理·人工智能·科技·机器学习·自然语言处理