- 我们可以从以下四个方面来了解
(1)、业务模型
(2)、构建表关系/表链接
(3)、数学模型
(4)、算法模型
- 业务模型
建立业务模型的重点是懂业务,即了解业务的整个过程。结合项目,就需要了解CMS系统以及具体业务,比如我们有采购、库存、销售、财务几个环节,各环节都有些流程,不同环节之间有哪些关联,以及行业及企业规范要求等,都属于业务的范畴
我们建的模型大部分是业务模型,指标体系大多数的本质也是在反映业务本身,也可以归为业务模型
第二、构建表关系/表链接
构建表关系/表链接的核心含义是使几个相关的表之间建立好联系,以供我们可以更好的数据分析,解决数据表结构层面上连接的一些问题,底层依赖SQL语言,是BI工具/可视化建模工具的主要设计思路。
图中所示是数据之间常见的几种关系、在数学上称为交集、并集和差集。在SQL中可以通过等关联、合并、左关联来实现。
通俗来讲就是,我们在业务分析时,需要的数据遍布在不同的表中(可以简单理解为excel),而很多情况下需要从不同的表中获取我们想要的信息,那么了解表间关系建立表接,并进行相应计算,就是我们要解决的问题。
第三、数学模型
数学模型是指按照一定的规律进行计算的模型,比如excel公式计算。包括简单模型和复杂模型,比如有的指标可能用到表很少,条件相对简单,统计方法也比较单一,可以归为简单模型,也有的指标用到很多表,各种复杂的关联关系,条件也比较多,还涉及到一些不常用的函数,可以归为复杂模型。我们常用的评分模型/积分模型,通过单个维度打分,再进行加权或其他计算,综合总分,就属于数学模型。
数学模型的本质是通过数学计算/公式计算,得出最终确定的结果,即通过已知得出已知。难点在于计算结果是否可以解决业务问题。
我们常说的数据建模主要指数学模型。
第四、算法模型
比如社交购物App的推荐系统,通过采集个人行为推送一些可能感兴趣的话题或商品,并且随着个人行为的变化影响推送结果。
算法模型涉及到数据挖掘、机器学习、人工智能等方面的知识,很多算法最终目的是分类,具体场景包括事件预测、图像识别、视频识别、语言识别、语义识别等。与数学模型通过已知得出已知不同,算法模型有很大的不确定性,但同时又有很多可能性。