3.2.4 用户画像基础知识体系

用户画像基础知识体系,是企业中相对通用的用户知识体系。在企业实践中,该体系通常由负责数据统一管理的数据中台团队,与多个业务团队沟通、协作、沉淀而成。企业通常会将物联网、业务系统、企业数据仓库等不同来源的用户数据,通过数据清洗与导入、统计计算、机器学习推理、深度学习模型预测等方法,构建成用户画像,因此用户画像基础知识体系可以在用户画像标签体系的基础上扩展而成。

如图3-8所示是业内公开的用户画像标签体系。按照用户标签生产方式的不同,可以将标签分为数据清洗与导入类标签、模型标签和预测标签。

图3-8

人口属性信息是最常见的用户画像标签体系,如图3-9所示是用户画像人口基础体系。用户通常会在产品注册时留下年龄、性别等注册信息,这些注册信息是人口属性标签的重要数据来源。然而在业务实践中,受用户数据安全隐私保护、业务覆盖度、时效性等问题的影响,注册的信息会存在数据质量、数据覆盖度及业务可用性的问题。因此,人口学基础数据需要通过模型算法的进一步修正,才能初步被业务应用。为了更好地保护用户隐私,提升业务的可用性,用户画像标签体系需要融入知识图谱技术,将数据进行知识化服务。比如,将用户年龄标签通过知识抽象为某业务青年标签,就可以对用户的隐私有一定的保护,同时增强数据的可用性。

图3-9

因此,用户画像基础知识体系需要在用户画像标签体系的基础上,从企业自身的业务需求场景出发,对知识图谱的基础标签进行扩展、细化和抽象建设,示例如下。

• 母婴用户企业不仅需要关注用户自身的年龄和性别,还需要进一步了解用户孩子的年龄属性。在孩子年龄的基础上,增加年龄、月份所关联的专业母婴知识,以对知识体系进一步扩展与细化。孩子的不同发育阶段是需要不同奶粉的,因此企业可以抽象用户孩子的年龄为1段适用、2段适用,这既提高了可用性,又保护了用户隐私。用户的其他基础标签也可以通过类似的方式进行扩展。

• 教育培训企业需要细化、建设用户的学校、学历、专业等相关教育属性,并与自身行业的专业特性、商品信息关联。

• 社交产品企业需要将用户在产品上的活跃度、分享度等社交标签通过计算社会学、业务专业知识扩展、细化、抽象为游戏社群领袖等标签。

所以,用户画像标签体系需要围绕业务需求进行数据的知识化建设,才能形成用户隐私安全、业务可解释性强、业务效果好的用户画像知识图谱。

用户画像标签体系在互联网、金融等企业的营销服务领域,经过多年业务实践,已有方法论和数据积累。而知识图谱通过开放域的百科知识、企业业务垂直域的知识,对用户画像标签体系进行了细化、扩展及知识化服务。因此,开发者可以参考本节的案例与方法,将业务中的用户画像标签体系转化为用户画像基础知识体系。