关于产品信息管理 (PIM)的研究(1)

产品信息管理 (PIM) 是现代商业的命脉。高质量商品数据的重要性怎么强调都不为过。根据 Forrester 的数据,优先考虑数据质量的企业的在线销售额增加了 20%,产品退货率降低了 25%。商品数据需要持续维护,以确保其准确、完整和一致。这不仅可以确保满足商品数据的所有渠道要求和当地法规,还可以确保买家获得做出购买决策和提高整体满意度所需的信息。

为什么要构建产品信息库?

我是隐约地感觉到产品信息管理(PIM)在未来电商领域的重要性,从计算机模型学转向研究商品分类和商品信息模型的研究。

  • HTML 是为了人类阅读而设计的,并不适合机器读取。
  • 人们获取信息的方式发生了改变,小公司的网站已无人问津。需要有一种新的发布信息的 平台。
  • AI 的出现,也许传统的商品目录网站(Catalog)会再一次复古般兴起。就如同字符对话框又一次兴起一样。
  • 多渠道营销,产品信息追溯需要有一个统一的数据源。

商品分类

国外的商品分类并不完全适合中国消费者和商家的分类习惯,构建符合中国消费习惯的商品分类,然后映射到各种国际分类中。

  1. ISO/IEC 15459
  2. GS1
  3. ETIM
  4. ECL@SS

参照ECL@SS 的分类结构,PIM 分类分层:

  • 段(Segment)
    • 主组 main Group)
      • 组 (Group)
        • 类(Class)
          • 属性 (Attributes)

GS1 的分类

消费类商品类(Group)

  1. 服装
  2. 鞋类
  3. 个人配饰
  4. 食品
  5. 饮料
  6. 宠物
  7. 行李和旅行装备
  8. 宠物护理品和食品
  9. 厨房用具和餐具
  10. 清洁和卫生产品
  11. 家用或商用安全、保护和监控用品
  12. 家用电器
  13. 医疗保健
  14. 婴儿护理
  15. 计算机
  16. 通信设备
  17. 手机及配件
  18. 办公用品
  19. 家用或办公家具和陈设
  20. 家居产品
  21. 乐器
  22. 杂货
  23. 房屋装修
  24. 工具
  25. 家用监控设备
  26. 园艺植物
  27. 草坪和花园用品
  28. 电气用品
  29. 露营用品
  30. 美容,个人护理和卫生用品
  31. 运动设备
  32. 艺术品,工艺用品
  33. 工业用品
  34. 书籍
  35. 视听摄影用品
  36. 音乐产品
  37. 玩具和游戏
  38. 烟草
  39. 汽车零件和配件

工业分类

工业品分类可以参照ECL@SS 的分类:

  1. 电子
  2. 信息,通信和媒体技术
  3. 机械
  4. 塑料
  5. 工厂设备和工具
  6. 机器和仪器
  7. 流体动力
  8. 机器元件,固定和安装
  9. 纺织与服装
  10. 汽车工程
  11. 车辆
  12. 电气工厂,自动控制和过程控制工程
  13. 医疗设备
  14. 聚合物
  15. 半成品
  16. 建筑
  17. 植物设备和工具
  18. 电信
  19. 物流
  20. 零售
  21. 银行
  22. 园林
  23. 美容
  24. 餐饮
  25. 仓储
  26. 采矿,冶金,轧钢厂和铸造厂设备
  27. 包装材料
  28. 无机化学品
  29. 有机化学
  30. 工业管道
  31. 交通和公共设施

产品的公共信息

  • 商品分类(Class)
  • 品牌所有者(brandOwner)
  • 品牌名称 (brandName)
  • 商品系列(subBrand)
  • 商品名称 (Name)
  • 型号(model)
  • 商品描述(Description)
  • 产地(original_place)
  • 商品图片(Image)
  • 测量信息
  • 生产日期
  • 保质期
  • 价格
  • 包装
    • 包装材料
    • 包装尺寸
    • 包装重量

内容指南

分类

消费类产品分类以ECL@SS 标准为主分类,同时包含了ETIM和 GS1分类。这样安排主要是因为ECL@SS 分类层级比较细一点,同时术语比较贴切一点。

|---------|----------|-------------------|------------|
| GS1 | ETIM | ECL@SS | PIM |
| SEGMENT | Group | Segments | Segments |
| FAMILY | Class | Main Groups | Main Group |
| CLASS | | Groups | Group |
| BRICK | | Commodity classes | classes |

商品分类对象是一个数组,包含了这四个标准的分类编码和名称。

测量信息

  • 长度
  • 长,宽,高
  • 重量

产品图片

按照《GS1 商品图片规范》的要求。

视图:

0 -- 不适用

1 -- 正面

2 -- 左面

3 -- 顶面

7 -- 背面

8 -- 右面

9 -- 底面

图片尺寸:

900x900 -- 2400x2400 像素

存储格式:

JPG/PNG。

储产品的特征/属性

产品的特征/属性(Feature/Attribute)是依赖具体的产品分类决定的。

产品文档

产品信息中包含了各种文档。

  • 技术文档
    • 使用手册(PDF)
    • 规格书(PDF)
    • 2D/3D CAD 文件(pdf, edrw, eprt, igs, sldprt, stp)
  • 市场推广文档
  • 证书
    • 合格证书(PDF)
    • 安全证书(PDF)
    • 专利证书(PDF)

产品信息主数据结构

产品信息库
机构信息库
单位(unit)

产品信息管理系统的应用

  • 构建分布式商品信息网络
  • 推动数字护照的应用
  • 构建企业产品主数据
  • 推动B2B 商品推荐匹配
  • 构建新型电商平台

进一步研究方向

AI应用于信息建模

信息建模,特别是产品属性制定是非常耗费人力的工作。借助chatGPT为代表的人工智能,能够大幅度提升构建信息模型的效率。我们要构建一系列AI 工具。比如,通过大公司产品的规格书(dataSheet) 提取产品的特征和属性。然后由人工评估和修改。

AI 应用于分类数据库的检索

传统产品分类信息库的最大缺点是人工检索非常麻烦,在大公司的网站上寻找合适的产品就深有体会。需要设置一大堆参数和关键字才能够获得相关产品的信息。过程十分痛苦。

chatGPT 能够实现分类数据库的智能查找。

相关推荐
武子康15 小时前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康2 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP2 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库2 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟2 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体
B站计算机毕业设计超人2 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法
计算机程序猿学长2 天前
大数据毕业设计-基于django的音乐网站数据分析管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)
大数据·django·课程设计
B站计算机毕业设计超人2 天前
计算机毕业设计Django+Vue.js音乐推荐系统 音乐可视化 大数据毕业设计 (源码+文档+PPT+讲解)
大数据·vue.js·hadoop·python·spark·django·课程设计
十月南城2 天前
数据湖技术对比——Iceberg、Hudi、Delta的表格格式与维护策略
大数据·数据库·数据仓库·hive·hadoop·spark
中烟创新2 天前
灯塔AI智能体获评“2025-2026中国数智科技年度十大创新力产品”
大数据·人工智能·科技