召回算法有很多个模型,这些模型使用的都是同一份特征数据进行训练,当训练数据有更新的时候就调用每一个算法的train方法进行训练,生成最新的模型。
基本思路就是把这些模型都放到一个数组中,当数据集有更新的时候,就遍历所有的模型执行训练
cpp
class Model {
public:
virtual ~Model() = default;
virtual void train() = 0;
}
class DSSM : public Model {
public:
void train(){}
}
class AFM : public Model {
public:
void train(){}
}
class FFM : public Model {
public:
void train(){}
}
class DataSet{
public:
void update(){}
}
std::vector<std::shared_ptr<Model>> models;
auto dssm = std::make_shared<DSSM>();
auto afm = std::make_shared<AFM>();
auto ffm = std::make_shared<FFM>();
models.emplace_back(dssm);
models.emplace_back(afm);
models.emplace_back(ffm);
auto dataset = std::make_shared<DataSet>();
dataset->update();
for(auto model : models) {
model.train();
}
老实讲,我觉的这种方案已经可以了,但是有一个小问题,就是数据更新之后应该通知每个模型。使用观察者模式来实现数据更新后自动调用注册模型的训练方法。
1. 面向接口编程,而非实现
cpp
class Observer {
public:
virtual ~Observer() = default;
// 拿到的数据进行处理
virtual void train(std::string data) = 0;
};
class Subject {
public:
virtual ~Subject() = default;
virtual void attach(std::shared_ptr<Observer> observer) = 0;
// virtual void Detach(std::shared_ptr<Observer> observer) = 0;
virtual void notify() = 0;
};
2. 实现接口
首先实现模型的训练接口,每个模型收到的都是同一份特征,但是对这个特征数据有自己的处理
cpp
class DSSM : public Observer {
public:
void train(std::string features)
{
std::string transFeatures;
std::transform(features.begin(), features.end(), transFeatures.begin(), ::toupper);
std::cout << "dssm train " << transFeatures << std::endl;
}
};
class AFM : public Observer {
public:
void train(std::string features)
{
std::string transFeatures;
std::transform(features.begin(), features.end(), transFeatures.begin(), ::tolower);
std::cout << "afm train " << transFeatures << std::endl;
}
};
class FFM : public Observer {
public:
void train(std::string features)
{
std::reverse(features.rbegin(),features.rend());
std::cout << "ffm train " << features << std::endl;
}
};
然后实现训练数据集,每个模型都订阅了这个数据集,当这个数据集有更新的时候,就会把数据同步给各个模型,每个模型拿到数据后各自训练处理。
cpp
// 训练数据集
class DataSet : public Subject {
public:
void attach(std::shared_ptr<Observer> observer) override {
m_observers.emplace_back(observer);
}
void notify() override {
for (auto &observer : m_observers) {
observer->train(m_data);
}
}
void update(){
m_data = "uid,adid,context";
notify();
}
private:
std::vector<std::shared_ptr<Observer>> m_observers;
std::string m_data;
};
客户端调用
客户端调用就非常的简单了
cpp
auto dataSet = std::shared_ptr<DataSet>();
auto dssm = std::shared_ptr<DSSM>();
auto afm = std::shared_ptr<AFM>();
auto ffm = std::shared_ptr<FFM>();
dataSet.attach(dssm);
dataSet.attach(afm);
dataSet.attach(ffm);
dataSet.update();