用户标签
1. 概述
用户标签是对某一类特定群体或对象的某项特征进行的抽象分类和概括,其值(标签值)具备可分类性。用户标签模块支持用户基于埋点数据自定义标签规则生成新的标签,描述用户的行为特征。用户标签可以单独管理分析,也可以在分析模型中细分分析,同时可添加至看板进行日常的数据监控。
2. 位置和使用权限
功能位置:用户洞察-用户标签
使用权限:不同的项目角色操作权限如下
项目角色 | 权限 | 权限明细 |
管理员 | 新增标签、管理所有标签 | 新增标签、所有标签(修改、复制、重新计算、删除、回溯) |
分析师 | 新增标签、管理自建标签 | 新增标签、自建标签(修改、复制、重新计算、删除、回溯)、他人创建的标签(复制) |
普通用户 | 无权限 | 无权限 |
3. 页面概览
用户可以使用平台提供的标签创建方式创建新的标签,并可在主页对已有标签进行管理,查看标签的数据详情,监控用户的行为变化。
3.1 创建新的标签
若用户想要创建一个新的标签,需要完成以下的几个步骤:
第一步:点击标签管理主页的「新增」创建标签,选择好想要使用的标签创建方式后,点击进入标签配置页面。
目前平台提供以下几种标签创建方式,各种创建方式的功能说明如下:
- 数值标签:对用户的行为事件进行聚合计算,输出数值型标签。如统计用户近一年内登录的总次数。
- 自定义标签:根据若干条件筛选出满足条件的用户,自定义其标签值。如将近一年充值笔数小于10的人群定义为低价值人群,大于等于10的定义为高价值人群。
- 初末次标签:将用户初次/末次完成某件事件的日期/距今天数/属性值作为标签值。如统计用户首次登录距今天数。
- SQL标签:使用自定义的SQL查询语句为指定的用户进行标记。
- 导入标签:使用导入的标签值为指定的用户进行标记。
第二步:进行标签规则的配置,标签的配置包括三个部分,分别是标签基础信息、标签规则配置、更新与备份。
标签基础信息:填写标签名、标签显示名、标签备注等信息。
标签规则配置
- 该标签的分析主体:即标签group by统计的对象,默认为海纳ID。若以设备ID作为分析主体,则将不同设备ID的用户视作不同用户;若以账号ID作为分析主体,则将不同账号ID的用户视作不同用户。若当前下拉框中没有想要的分析主体,可至「项目管理-分析配置-分析主体」中进行相关配置。标签创建后,分析主体不可更改。
- 时间范围:默认选中动态时间「过去 7 天」,可点击选择其他静态/动态时间。
- 规则定义:配置标签的计算规则。可对事件添加筛选条件,可点击「属性筛选」添加筛选条件来筛选满足条件的用户,下拉框可以选择所选事件对应的事件属性/用户属性。
(1)若想要添加多条筛选条件:点击「属性筛选」可添加一级筛选条件,点击「添加并列条件」可添加二级筛选条件,最多只能添加到二级,筛选条件添加条数不限。
(2)添加新的条件需要设定和原条件的关联关系,点击“且/或”可切换关联关系。
- 更新与备份
- 计算时区:选择标签的计算时区,默认选择项目时区。可在「项目管理-分析配置-时区设置」中设置是否开启多时区功能。
- 更新方式: 分为定期更新和手动更新两种。定期更新即系统将在指定时间定期计算并更新标签数据,并以前一日作为计算基准日期;手动更新数据不会自动进行计算更新,用户可手动点击「更新数据」进行计算。若选择定期更新,需要进行「时间设置」和「备份方式」的设置
- 时间设置:设置标签更新的具体时间。
- 备份方式:若自动备份,将自动存储定期更新的标签数据,可至「回溯版本管理」中查看该标签的历史数据;否则仅保留最新计算的标签数据,以往的标签数据将被覆盖。
第三步:标签基础信息、标签规则配置、更新与备份均设定好以后,点击「保存并计算」按钮即可创建标签,并同步至标签管理主页。
3.2 管理已有标签
创建好的标签将同步至标签管理主页,可进行编辑、复制、重新计算、删除、查看详情等操作:
- 点击「编辑」可修改标签配置
- 点击「复制」可复制标签配置生成一个新的标签
- 点击「重新计算」会计算标签数据
- 点击「删除」可删除该标签
- 点击「标签名称」可跳转至标签详情页面
3.3 查看标签详情
标签详情页主要包括展示标签基础信息、数据可视化、回溯版本管理三个部分。
- 在页面左侧,可查看标签的配置信息、变更记录等信息。
- 提供折线图、数值堆积图、百分比堆积图、柱形图、饼图五种展示方式
- 可查看标签的数据详情,并可查看标签的用户列表。
- 对标签的回溯版本进行管理。
4. 功能结构
4.1 不同创建方式功能说明
4.1.1 数值标签
数值标签用于对用户的行为事件进行简单的聚合计算,将计算的数值结果作为标签值。如统计用户过去7天登录的总次数。
可计算内容包括:
- 某个指定事件的完成次数/天数/小时数
- 某个指定事件数值类型属性的总和/均值/中位数/最大值/最小值/去重数
- 某个指定事件布尔类型属性的为真数/为假数/为空数/不为空数/去重数
- 某个指定事件其他类型属性的去重数
计算格式:「事件」+「事件属性」+「计算算子」或「事件」+「计算算子」
选择事件:可以选择任意一个元事件/虚拟事件。若分析主体为用户自定义的分析主体且来源于事件属性,则下拉框中可选的元事件只展示包含该事件属性(分析主体)的元事件。
选择聚合算子:聚合算子根据事件属性的数据类型有所不同
- 可对事件添加筛选条件。
4.1.2 自定义标签
自定义标签根据若干条件筛选出满足条件的用户,自定义其标签值。如将近一年充值笔数小于10次的人群定义为低价值人群,大于等于10次的定义为高价值人群。定义的标签可作为分组项/筛选项用于数据分析中,如分低价值人群和高价值人群统计用户的购买行为/统计低价值人群的购买行为。
可计算内容包括:
- 用户属性筛选:
(1)某文本型用户属性等于/不等于/包括/不包括···
(2)某数值型用户属性等于/不等于/包括/不包括···
(3)某时间型用户属性位于区间/小于/大于/相对当前日期···
(4)某布尔型用户属性为真/为假/有值··· - 用户行为筛选:
(1)用户完成某个指定事件的次数/天数/小时数 等于/大于/小于···
(2)用户完成某个指定事件数值类型属性的总和/均值/中位数/最大值/最小值/去重数 等于/大于/小于···
(3)用户完成某个指定事件布尔类型属性的为真数/为假数/为空数/不为空数/去重数 等于/大于/小于···
(4)用户完成某个指定事件其他类型属性的去重数 等于/大于/小于···
(5)用户没做过某个事件
计算格式:
- 用户属性筛选:「选择用户属性」+「选择算子」+「某值」
- 用户行为筛选:「时间」+「做过」+「某事件」+「算子/事件属性.算子」+「条件判断」+「某值」
或「时间」+「没做过」+「某事件」
可对满足筛选条件的用户定义标签值。如将过去7天签到的次数大于等于5次的用户该标签的标签值为高活跃用户,大于等于3且小于5次的用户该标签的标签值为中活跃用户,大于等于1且小于3的用户该标签的标签值为低活跃用户,等于0次的用户该标签的标签值为不活跃用户。
高活跃用户配置页面如下:
可增加面板配置标签值为中活跃用户、低活跃用户、不活跃用户的规则:
注1:若分析主体为用户自定义的分析主体且来源于事件属性,则用户行为筛选的元事件选择下拉框中可选的元事件只展示包含该事件属性(分析主体)的元事件。
注2:用户(分析主体)将优先匹配至满足条件且顺序靠前的标签值中。
4.1.3 初末次标签
初末次标签将用户初次/末次完成某件事件的日期/距今天数/属性值作为标签值。如统计用户首次登录距今天数。
可计算内容包括:
- 某个指定事件初次/末次发生的具体日期/距今天数
- 某个指定事件初次/末次发生对应的某事件属性值
计算格式:「事件」+「初次发生/末次发生」+「具体时间点/距离当天日期天数/事件属性值」
- 选择事件:可以选择任意一个元事件/虚拟事件。若分析主体为用户自定义的分析主体且来源于事件属性,则下拉框中可选的元事件只展示包含该事件属性(分析主体)的元事件。
- 选择初次发生/末次发生。
- 选择分析属性:提供具体时间点、距离当天日期天数、事件对应的事件属性供选择。
- 可对事件添加筛选条件。
4.1.4 SQL标签
当已有的创建方式不能满足需求时,可以使用自定义的SQL查询语句为指定的用户进行标记。
- 查询结果需为两列。
- 第一列为不重复的分析主体ID,需与下拉框中选择的标签的分析主体保持一致。
- 第二列为对应的标签值,需与下拉框中选择的标签数据类型保持一致。
- SQL标签支持定期更新,若想统计动态时间的标签结果,请使用动态时间窗的语句。如统计最近30天,则为WHERE part_date > DATE_SUB (CURDATE (), INTERVAL 30 DAY)。
- 若想预览某个表的数据结构和内容,可以点击左侧的数据表,在「表结构」和「数据概览」中进行查看,如图所示:
4.1.5 导入标签
导入标签支持上传本地文件,对用户赋予标签值,可以选择某一用户属性作为用户的关联字段。
- 上传文件共两列,第一列为身份识别信息,第二列为标签值。
- 当选择的分析主体是预置分析主体海纳ID时,需选择关联属性(选择第一列的字段名)。若您上传的文件的第一列为省份,则在关联属性处选择省份,系统会将所有省份为上海的海纳ID赋予上海对应的标签值,省份为北京的海纳ID赋予北京对应的标签值。
- 上传文件第二列的数据类型需与下拉框中所选的标签数据类型保持一致。
- 导入标签不支持更新与备份。
4.2 聚合和筛选算子说明
- 不同数据类型的事件属性支持的聚合计算规则汇总如下:
事件 | 事件属性(数据类型) | 聚合算子 |
任意事件 | 次数、天数、小时数 | |
元事件 | 事件属性(数值型) | 总和、均值、中位数、最小值、最大值、去重数 |
元事件 | 事件属性(布尔型) | 为真数、为假数、为空数、不为空数、去重数 |
元事件 | 事件属性(其他类型) | 去重数 |
- 不同数据类型的事件属性支持的条件筛选规则汇总如下:
属性的数据类型 | 条件筛选可选项 |
文本型 | 等于、不等于、包括、不包括、有值、无值、正则匹配、正则不匹配 |
数值型 | 等于、不等于、小于、小于等于、大于、大于等于、有值、无值、区间 |
时间型 | 位于区间、小于、小于等于、大于、大于等于、相对当前日期(区间)、相对当前日期(过去)、有值、无值、等于、不等于 |
布尔型 | 为真、为假、有值、无值 |
4.3 数据可视化
在数据可视化部分,支持时间筛选、自定义区间和分组、切换展示图(折线图、数值堆积图、百分比堆积图、柱形图、饼图)、数据排列方式、数据导出等操作,可灵活设置数据的展示方式。
- 折线图
- 数值堆积图
- 百分比堆积图
- 柱形图
- 饼图
4.4 查看标签数据
数据表中会展示标签最新版本和回溯版本中的所有数据,最近一次手动/定期更新的数据将在图表中用红点标注,并以今天的日期展示该条标签数据。
- 数据表支持以分组为列/以日期为列展示
- 数据表展示每个回溯日期标签值的覆盖用户数及占比
- 点击具体的数值可以查看用户列表
4.5 查看用户列表
通过点击数据详情页面数据表中的具体数值,可链接跳转至用户列表页面,查看已选人群的更多用户属性信息:
- 用户列表支持查看用户其他属性特征,了解用户更多信息。
- 用户列表支持导出数据
- 用户列表支持将已选人群保存为结果分群,可至分群管理列表中查看。
4.6 回溯版本管理
回溯版本管理用于存储定期更新的标签每日计算的数据,并支持标签的手动回溯。
回溯版本的意义:用户的行为会随着时间发生变化,当标签计算的基准时间和事件发生的时间相差较远时,标签的实效性较差,若使用此标签来做分析可能会影响分析结果。因此标签的回溯版本旨在尽可能还原事件发生当时的情况,助力精准分析。此外,若对标签的回溯版本直接进行分析,也可以从图表上监控到用户行为在一段时间上发生的变化。
- 若标签开启了定期备份功能,则标签在定期计算时会将每日计算的标签数据存储至该标签的回溯版本管理中。
- 若想要某天标签的数据值但定期备份中没有该天的数据,可以通过手动回溯获得标签值。手动回溯主要用于补充缺失日期的标签版本、重算计算失败的标签、重算逻辑更新的标签。
- 在回溯版本管理中每天最多只有一条标签数据,即最近一次计算的数据。
- 手动回溯:用户可点击「数据回溯」按钮回溯标签数据。以所选的回溯日期作为计算基准日期,若回溯日期共选择30天,则会产生回溯标签共30个。
- 支持批量回溯,在单次操作中回溯日期范围最多可选择90天。
说明:若某标签统计的是过去7天的用户行为,则在选择的回溯日期为8月20日时,标签计算所用到的数据的日期为8月12日至8月19日;若选择的回溯日期为8月21日时,则标签计算所用到的数据的日期为8月13日至8月20日,依此类推。 - 当回溯日期已有标签数据时,提供全部标签重新计算、计算失败的标签重新计算、使用历史规则计算的标签重新计算三种方式。
- 为了尽可能还原回溯日期当天的数据情况,当标签的计算有使用到用户属性时,可以使用回溯日期当天备份的的用户属性数据做计算,若关闭则使用数据库中最新的用户属性数据做计算(默认关闭)。
说明:若开启该功能,计算耗时相对较长,可根据实际业务需求选择是否开启该功能。 - 若使用备份的用户属性数据做计算,当计算时间的数据缺失时,提供使用最新的用户属性数据替代计算、使用相对最近的数据计算两种方式。
对于已经回溯(备份)过的日期,可以点击「重新计算」按钮对该日期的数据进行计算。
如果该标签的回溯版本已经不需要了,可以点击「清理标签数据」清理回溯版本。
5 实例
5.1 描述用户行为特征
标签是描述用户历史行为的数据,相比原始数据信息,标签更有利于监控和分析。通过自定义标签,可以对用户进行分层,设置用户画像;通过数值标签,可以计算得到用户总和、均值等总体数据,方便进行日常运营监控;通过初末次标签,可以获得用户初次/末次的行为特征,有利于营销策略的制定和调整;通过SQL标签,可以自定义对用户行为构建标签,满足个性化需求;通过导入标签,可以上传已有的用户标签,补充数据维度,丰富用户画像。
5.2 在分析模型中用作筛选条件
标签可用作分析的筛选条件。如使用自定义标签创建了标签「5A人群划分」,该标签根据用户的使用深度将用户分成了A1-A5活跃人群。在分析中,若只想对A1用户进一步分析,就可以添加标签筛选条件,只查看A1人群的分析结果。
5.3 在分析模型中用作分组项
标签可用作分析中的分组项。在分析中,若想了解A1- A5的用户的行为差异,可以将5A人群划分用作分组项。
5.4 回溯版本在分析中的使用
为了尽可能还原事件发生时的数据情况,当在分析中使用标签时,如果标签有回溯版本,则需要在计算时选择使用标签的版本。
- 最新版本:使用最新的标签数据做计算,即最近一次手动/自动更新的标签数据。
- 动态匹配:使用事件发生当日的标签值做计算。若事件是8月3日发生,则寻找8月3日的标签数据版本做计算。
- 历史版本:使用用户指定的某个日期版本的标签值做计算,仅可选择有回溯版本的日期。
最后编辑:超级管理员 更新时间:2024-11-20 17:38