这是啥设计模式-观察者模式

召回算法有很多个模型，这些模型使用的都是同一份特征数据进行训练，当训练数据有更新的时候就调用每一个算法的train方法进行训练，生成最新的模型。

基本思路就是把这些模型都放到一个数组中，当数据集有更新的时候，就遍历所有的模型执行训练

cpp 复制代码

class Model {
public:
	virtual ~Model() = default;
	virtual void train() = 0;
}
class DSSM : public Model {
public:
	void train(){}
}
class AFM : public Model {
public:
	void train(){}
}
class FFM : public Model {
public:
	void train(){}
}

class DataSet{
public:
	void update(){}
}


std::vector<std::shared_ptr<Model>> models;
auto dssm = std::make_shared<DSSM>();
auto afm = std::make_shared<AFM>();
auto ffm = std::make_shared<FFM>();

models.emplace_back(dssm);
models.emplace_back(afm);
models.emplace_back(ffm);

auto dataset = std::make_shared<DataSet>();
dataset->update();

for(auto model : models) {
	model.train();
}

老实讲，我觉的这种方案已经可以了，但是有一个小问题，就是数据更新之后应该通知每个模型。使用观察者模式来实现数据更新后自动调用注册模型的训练方法。

1. 面向接口编程，而非实现

cpp 复制代码

class Observer {
public:
    virtual ~Observer() = default;
    // 拿到的数据进行处理
    virtual void train(std::string data) = 0;
};

class Subject {
public:
    virtual ~Subject() = default;
    virtual void attach(std::shared_ptr<Observer> observer) = 0;
    // virtual void Detach(std::shared_ptr<Observer> observer) = 0;
    virtual void notify() = 0;
};

2. 实现接口

首先实现模型的训练接口，每个模型收到的都是同一份特征，但是对这个特征数据有自己的处理

cpp 复制代码

class DSSM : public Observer {
public:
    void train(std::string features)
    {
        std::string transFeatures;
        std::transform(features.begin(), features.end(), transFeatures.begin(), ::toupper);
        std::cout << "dssm train " << transFeatures << std::endl;
    }
};

class AFM : public Observer {
public:
    void train(std::string features)
    {
        std::string transFeatures;
        std::transform(features.begin(), features.end(), transFeatures.begin(), ::tolower);
        std::cout << "afm train " << transFeatures << std::endl;
    }
};

class FFM : public Observer {
public:
    void train(std::string features)
    {
        std::reverse(features.rbegin(),features.rend());
        std::cout << "ffm train " << features << std::endl;
    }
};

然后实现训练数据集，每个模型都订阅了这个数据集，当这个数据集有更新的时候，就会把数据同步给各个模型，每个模型拿到数据后各自训练处理。

cpp 复制代码

// 训练数据集
class DataSet : public Subject {
public:
    void attach(std::shared_ptr<Observer> observer) override {
        m_observers.emplace_back(observer);
    }
    void notify() override {
        for (auto &observer : m_observers) {
            observer->train(m_data);
        }
    }
    void update(){
		m_data = "uid,adid,context";
		notify();
	}

private:
    std::vector<std::shared_ptr<Observer>> m_observers;
    std::string m_data;
};

客户端调用

客户端调用就非常的简单了

cpp 复制代码

auto dataSet = std::shared_ptr<DataSet>();
auto dssm = std::shared_ptr<DSSM>();
auto afm = std::shared_ptr<AFM>();
auto ffm = std::shared_ptr<FFM>();

dataSet.attach(dssm);
dataSet.attach(afm);
dataSet.attach(ffm);

dataSet.update();