关于产品信息管理 (PIM)的研究(1)

产品信息管理 (PIM) 是现代商业的命脉。高质量商品数据的重要性怎么强调都不为过。根据 Forrester 的数据,优先考虑数据质量的企业的在线销售额增加了 20%,产品退货率降低了 25%。商品数据需要持续维护,以确保其准确、完整和一致。这不仅可以确保满足商品数据的所有渠道要求和当地法规,还可以确保买家获得做出购买决策和提高整体满意度所需的信息。

为什么要构建产品信息库?

我是隐约地感觉到产品信息管理(PIM)在未来电商领域的重要性,从计算机模型学转向研究商品分类和商品信息模型的研究。

  • HTML 是为了人类阅读而设计的,并不适合机器读取。
  • 人们获取信息的方式发生了改变,小公司的网站已无人问津。需要有一种新的发布信息的 平台。
  • AI 的出现,也许传统的商品目录网站(Catalog)会再一次复古般兴起。就如同字符对话框又一次兴起一样。
  • 多渠道营销,产品信息追溯需要有一个统一的数据源。

商品分类

国外的商品分类并不完全适合中国消费者和商家的分类习惯,构建符合中国消费习惯的商品分类,然后映射到各种国际分类中。

  1. ISO/IEC 15459
  2. GS1
  3. ETIM
  4. ECL@SS

参照ECL@SS 的分类结构,PIM 分类分层:

  • 段(Segment)
    • 主组 main Group)
      • 组 (Group)
        • 类(Class)
          • 属性 (Attributes)

GS1 的分类

消费类商品类(Group)

  1. 服装
  2. 鞋类
  3. 个人配饰
  4. 食品
  5. 饮料
  6. 宠物
  7. 行李和旅行装备
  8. 宠物护理品和食品
  9. 厨房用具和餐具
  10. 清洁和卫生产品
  11. 家用或商用安全、保护和监控用品
  12. 家用电器
  13. 医疗保健
  14. 婴儿护理
  15. 计算机
  16. 通信设备
  17. 手机及配件
  18. 办公用品
  19. 家用或办公家具和陈设
  20. 家居产品
  21. 乐器
  22. 杂货
  23. 房屋装修
  24. 工具
  25. 家用监控设备
  26. 园艺植物
  27. 草坪和花园用品
  28. 电气用品
  29. 露营用品
  30. 美容,个人护理和卫生用品
  31. 运动设备
  32. 艺术品,工艺用品
  33. 工业用品
  34. 书籍
  35. 视听摄影用品
  36. 音乐产品
  37. 玩具和游戏
  38. 烟草
  39. 汽车零件和配件

工业分类

工业品分类可以参照ECL@SS 的分类:

  1. 电子
  2. 信息,通信和媒体技术
  3. 机械
  4. 塑料
  5. 工厂设备和工具
  6. 机器和仪器
  7. 流体动力
  8. 机器元件,固定和安装
  9. 纺织与服装
  10. 汽车工程
  11. 车辆
  12. 电气工厂,自动控制和过程控制工程
  13. 医疗设备
  14. 聚合物
  15. 半成品
  16. 建筑
  17. 植物设备和工具
  18. 电信
  19. 物流
  20. 零售
  21. 银行
  22. 园林
  23. 美容
  24. 餐饮
  25. 仓储
  26. 采矿,冶金,轧钢厂和铸造厂设备
  27. 包装材料
  28. 无机化学品
  29. 有机化学
  30. 工业管道
  31. 交通和公共设施

产品的公共信息

  • 商品分类(Class)
  • 品牌所有者(brandOwner)
  • 品牌名称 (brandName)
  • 商品系列(subBrand)
  • 商品名称 (Name)
  • 型号(model)
  • 商品描述(Description)
  • 产地(original_place)
  • 商品图片(Image)
  • 测量信息
  • 生产日期
  • 保质期
  • 价格
  • 包装
    • 包装材料
    • 包装尺寸
    • 包装重量

内容指南

分类

消费类产品分类以ECL@SS 标准为主分类,同时包含了ETIM和 GS1分类。这样安排主要是因为ECL@SS 分类层级比较细一点,同时术语比较贴切一点。

|---------|----------|-------------------|------------|
| GS1 | ETIM | ECL@SS | PIM |
| SEGMENT | Group | Segments | Segments |
| FAMILY | Class | Main Groups | Main Group |
| CLASS | | Groups | Group |
| BRICK | | Commodity classes | classes |

商品分类对象是一个数组,包含了这四个标准的分类编码和名称。

测量信息

  • 长度
  • 长,宽,高
  • 重量

产品图片

按照《GS1 商品图片规范》的要求。

视图:

0 -- 不适用

1 -- 正面

2 -- 左面

3 -- 顶面

7 -- 背面

8 -- 右面

9 -- 底面

图片尺寸:

900x900 -- 2400x2400 像素

存储格式:

JPG/PNG。

储产品的特征/属性

产品的特征/属性(Feature/Attribute)是依赖具体的产品分类决定的。

产品文档

产品信息中包含了各种文档。

  • 技术文档
    • 使用手册(PDF)
    • 规格书(PDF)
    • 2D/3D CAD 文件(pdf, edrw, eprt, igs, sldprt, stp)
  • 市场推广文档
  • 证书
    • 合格证书(PDF)
    • 安全证书(PDF)
    • 专利证书(PDF)

产品信息主数据结构

产品信息库
机构信息库
单位(unit)

产品信息管理系统的应用

  • 构建分布式商品信息网络
  • 推动数字护照的应用
  • 构建企业产品主数据
  • 推动B2B 商品推荐匹配
  • 构建新型电商平台

进一步研究方向

AI应用于信息建模

信息建模,特别是产品属性制定是非常耗费人力的工作。借助chatGPT为代表的人工智能,能够大幅度提升构建信息模型的效率。我们要构建一系列AI 工具。比如,通过大公司产品的规格书(dataSheet) 提取产品的特征和属性。然后由人工评估和修改。

AI 应用于分类数据库的检索

传统产品分类信息库的最大缺点是人工检索非常麻烦,在大公司的网站上寻找合适的产品就深有体会。需要设置一大堆参数和关键字才能够获得相关产品的信息。过程十分痛苦。

chatGPT 能够实现分类数据库的智能查找。

相关推荐
hong16168818 分钟前
大数据技术Kafka详解:消息队列(Messages Queue)
大数据·分布式·kafka
隔着天花板看星星9 小时前
Kafka-创建topic源码
大数据·分布式·中间件·kafka
goTsHgo10 小时前
在Spark Streaming中简单实现实时用户画像系统
大数据·分布式·spark
老周聊架构10 小时前
聊聊Flink:Flink中的时间语义和Watermark详解
大数据·flink
别这么骄傲10 小时前
Flink Lookup Join(维表 Join)
大数据·flink·linq
Mephisto.java11 小时前
【大数据学习 | flume】flume Sink Processors与拦截器Interceptor
大数据·sql·oracle·sqlite·json·flume
PersistJiao11 小时前
Spark RDD(弹性分布式数据集)的深度理解
大数据·分布式·spark·rdd
AIBigModel12 小时前
o1的风又吹到多模态,直接吹翻了GPT-4o-mini
大数据·人工智能·算法
Yz987612 小时前
Hive分桶超详细!!!
大数据·数据仓库·hive·hadoop·hdfs·数据库开发·big data
Francek Chen13 小时前
【大数据技术基础 | 实验十一】Hive实验:新建Hive表
大数据·数据仓库·hive·hadoop·分布式