3.1.1 用户数据挖掘

推荐不止涉及AI算法,其关键是数据挖掘。用户数据是一切推荐算法的根基,是一切推荐策略的依据。

数据挖掘是一种决策支持过程,基于人工智能、机器学习、模式识别、统计学、数据库、可视化等技术,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整推荐策略,降低风险,做出正确的决策。

数据挖掘涉及数据采集、标注、清洗、加工等过程,通过统计、在线分析处理、检索、机器学习和模式识别等过程,获取对构建模型更有益的高质量数据。

数据挖掘涉及打通ERP系统、核心系统、CRM系统、数据中台等多方数据源。数据源包括App、Web、小程序、客户数据、交易数据、业务数据等,如图3-3所示。

图3-3 数据源

以银行贷款平台为例,千万级的企业客户在数字融资中产生的贷款申请等数据的量极其庞大,符合大数据的特性。因此,银行可基于客户贷款行为数据进行分析,实现大数据获客、精准导流,通过智能匹配推荐符合客户需求的贷款产品。