
数据标签是对数据进行结构化标注、便于识别和应用的核心载体,其常见分类主要包括以下四类,各类别定位清晰、应用场景各有侧重,具体如下:
一、人口属性标签
定义:人口属性标签,又称基础属性标签,是基于人口统计学维度,对用户个体基础特征进行标准化标注的标签集合,核心作用是明确用户"是谁",是构建用户画像的基石,具有稳定性强、易采集、通用性高的特点,不随用户行为变化而轻易改变。
核心特征:稳定性(如性别、户籍)、基础性(是其他各类标签的前提)、通用性(跨行业、跨场景均可复用)。
常见枚举值:
1.性别:男、女、未知;
2.年龄:18岁以下、18-25岁、26-35岁、36-45岁、46-55岁、55岁以上;
3.学历:小学及以下、初中、高中/中专、大专、本科、硕士及以上;
4.职业:学生、企业职员、公务员/事业单位、自由职业者、退休、无业;
5.婚姻状况:未婚、已婚、离异、丧偶、未知;
6.户籍:一线省会城市、新一线城市、二线城市、三四线城市、乡镇及以下、境外;
7.收入水平:3k以下、3k-6k、6k-10k、10k-20k、20k-50k、50k以上、未知;
8.家庭结构:单身、夫妻二人、三口之家(有未成年子女)、多子女家庭、与父母同住。
使用场景:
1.人群分层与定位:如教育行业按"学历(高中/本科/硕士)+年龄(18-22岁/23-28岁)"定位考研、考公目标人群,推送对应备考资料;
2.合规性筛选:如短视频平台按"年龄(18岁以下/18岁以上)"划分内容权限,对未成年人屏蔽不适宜内容;
3.基础营销适配:如快消行业按"性别+收入水平"推送产品,向女性高收入人群推送高端美妆,向男性中等收入人群推送平价数码配件;
4.用户画像初建:任何行业搭建用户基础画像时,均需先采集人口属性标签,明确核心服务人群的基础特征。
二、行为标签
定义:行为标签,是对用户在特定产品、平台或场景下,产生的可记录、可追溯的具体操作行为进行提炼和标注的标签,核心作用是记录用户"做过什么",反映用户的行为习惯、操作频次、行为路径和参与度,具有动态性、可追溯性、场景化的特点,会随用户行为的变化实时更新。
核心特征:动态性(随用户行为实时变化)、可追溯性(可关联行为发生的时间、地点、频次)、场景化(与具体使用场景绑定)。
常见枚举值:
1.点击行为:高频点击(每日≥3次)、中频点击(每日1-2次)、低频点击(每周1-6次)、从未点击;
2.浏览行为:浏览时长≤1分钟、1-3分钟、3-5分钟、5分钟以上;浏览深度(仅首页、浏览2-3个页面、浏览4-10个页面、浏览10个页面以上);
3.消费行为:消费频次(每日≥1次、每周≥3次、每月≥3次、每月1-2次、每季度1次、每年≥1次、从未消费);消费金额(0元、1-50元、51-200元、201-500元、501-1000元、1000元以上);支付方式(支付宝、微信支付、信用卡、借记卡、其他);
4.互动行为:点赞(高频/中频/低频/从未)、评论(高频/中频/低频/从未)、分享(高频/中频/低频/从未)、收藏(高频/中频/低频/从未);
5.登录行为:登录频次(每日≥1次、每周3-6次、每周1-2次、每月1-3次、每月以下、从未登录);登录设备(手机、电脑、平板、其他);登录时段(凌晨、上午、中午、下午、晚上、深夜)。
使用场景:
1.产品体验优化:如APP按"点击行为(高频点击某一功能/从未点击某一功能)"调整界面布局,将高频点击功能放在首页,下架无人点击的冗余功能;
2.个性化内容推荐:如短视频、资讯平台按"浏览时长(某类内容浏览超5分钟)+点赞/收藏行为",持续推送同类主题内容,提升用户留存;
3.消费行为分析与转化:如电商平台按"消费频次(月消费3次以上/季度消费1次以下)+支付方式(偏好信用卡/支付宝)",对高频消费用户推送会员权益,对低频消费用户推送满减优惠券;
4.用户活跃度分层:如社群平台按"互动行为(每日评论/每周仅登录1次)"划分活跃用户、沉默用户,对活跃用户给予积分奖励,对沉默用户推送召回活动。
三、偏好标签
定义:偏好标签,是基于用户的人口属性、历史行为数据,通过算法提炼、归纳得出的,反映用户主观兴趣、需求倾向和选择偏好的标签,核心作用是明确用户"喜欢什么",是连接基础数据与个性化服务的核心,具有个性化、针对性、关联性的特点,会随用户偏好变化动态调整。
核心特征:个性化(不同用户偏好标签差异显著)、针对性(精准匹配用户主观需求)、关联性(与人口属性、行为标签高度关联)。
常见枚举值:
1.兴趣爱好:美妆护肤、数码电子、运动健身、图书绘本、影视综艺、美食烹饪、旅游出行、汽车、母婴、宠物、游戏、音乐;
2.消费偏好:价格偏好(高端、中端、低端、性价比导向);风格偏好(简约、复古、潮流、轻奢、国风、欧美);品牌偏好(国货、进口、无固定品牌、小众品牌);
3.内容偏好:内容类型(新闻、娱乐、教育、科普、财经、体育、美妆、汽车);内容形式(短视频、长视频、图文、音频、直播);
4.服务偏好:服务形式(线上咨询、线下体验、上门服务、自助服务);沟通偏好(文字沟通、语音沟通、视频沟通);配送偏好(次日达、当日达、普通配送、指定时段配送)。
使用场景:
1.精准个性化推荐:如音乐平台按"内容偏好(喜欢流行乐/古典乐)+收听行为",每日推送定制歌单;电商平台按"消费偏好(偏好简约风格/复古风格)",推送符合用户审美的商品;
2.营销内容定制:如美妆品牌按"肤质偏好(敏感肌/干皮)+品牌偏好(偏好国货/进口)",推送对应肤质的产品测评和品牌活动,提升营销转化率;
3.新品适配推送:如数码行业按"兴趣偏好(关注手机/电脑)",向关注手机的用户推送新品手机资讯,向关注电脑的用户推送笔记本新品信息;
4.用户需求挖掘:如教育平台按"内容偏好(偏好线上直播课/线下小班课)",优化课程体系,增加用户偏好的课程形式。
四、预测标签
定义:预测标签,是基于用户历史的人口属性、行为、偏好等多维度数据,通过机器学习、数据建模等技术,对用户未来的行为趋势、需求倾向、状态变化或潜在风险进行预测和标注的标签,核心作用是预判用户"未来会做什么",具有前瞻性、预测性、数据依赖性的特点,精度依赖于历史数据的完整性和建模算法的合理性。
核心特征:前瞻性(预判未来趋势)、数据依赖性(依赖多维度历史数据)、概率性(预测结果为概率性判断,非绝对)。
常见枚举值:
1.消费预测:未来7天大概率消费、未来15天大概率消费、未来30天大概率消费、未来30天大概率不消费;消费金额预判(0-50元、51-200元、201-500元、500元以上);
2.流失预测:高流失风险(未来7天大概率卸载/取消关注)、中流失风险(未来15天大概率卸载/取消关注)、低流失风险(未来30天大概率不卸载/取消关注)、无流失风险;
3.需求预测:大概率需要新品、大概率需要耗材补充、大概率需要升级服务、无明显新增需求;
4.风险预测:高风险(违约/欺诈概率≥80%)、中风险(违约/欺诈概率30%-80%)、低风险(违约/欺诈概率≤30%)、无风险;
5.其他预测:续课概率(高/中/低)、复购概率(高/中/低)、活动参与概率(高/中/低)。
使用场景:
1.流失用户召回:如APP按"流失预测(未来7天大概率卸载)",对高流失风险用户推送专属福利(如免费用时、优惠券),降低卸载率;
2.精准营销预判:如电商平台按"消费预测(未来15天大概率消费)",提前向用户推送对应品类的优惠券,刺激消费转化;
3.风险防控:如金融行业按"风险预测(交易违约风险高/低)",对高风险用户限制交易额度,对低风险用户提升服务权限;
4.运营策略优化:如零售行业按"需求预测(某类商品未来销量上涨)",提前备货,避免缺货或库存积压;教育行业按"续课预测(大概率续课/大概率不续课)",对不续课高风险用户安排专属顾问跟进。
四类标签并非孤立存在,而是相互关联、层层递进,构成完整的数据标签体系:人口属性标签是基础,为后续标签的提炼提供前提;行为标签是核心数据源,是偏好标签、预测标签的核心支撑;偏好标签是数据的提炼与升华,实现从"记录行为"到"理解需求"的跨越;预测标签是应用延伸,实现从"理解需求"到"预判未来"的升级。四类标签协同作用,支撑各行业的数据分析、用户运营、精准营销和决策优化,适配不同场景的核心需求。