1.3 社交网络数据挖掘的意义

在移动互联网时代,参与社交网络的人越来越多,人们乐于在网络上分享自己的相关信息、拓展自己的人脉,企业甚至可以通过社交平台直接影响客户,一切似乎都随着社交网络的出现而变得美好。然而,我们要注意社交网络的如下三个特性。

(1)网络虚假信息与真实信息同时存在。在社交网络中,这种特性尤为突出。人们既会在社交网络中表达自己的真实信息,又会发出自己臆想的信息,导致的结果是极易让谣传成为“事实”。

(2)无界。信息可以在社交网络中无限扩展,甚至影响现实生活。

(3)快速。网络信息传递的爆炸性速度可以使得用户的信息在短期内扩散。

每条发布的信息都如同石块入水时散开的涟漪,若不继续投入石块,涟漪则会逐渐淡化直至消失,这便是社交网络的自洁功能。由于存在以上三个特性,因此只依靠“自洁”是远远不够的。于是,如何找到这些信息,扩大品牌正面影响力,减少并消除负面影响力,就成为企业在社会化营销中制胜的关键,此时社交网络分析就能给企业带来帮助。

社交网络中充斥着各种可能成为“波浪”的信息,有针对某款产品的,也有针对某部电影的,还有针对某位明星的——这类信息都可从网上免费获取。这些评论信息对企业来说价值非常巨大,企业掌握这些数据后,若加以分析,则无论是对现有产品的改进还是对未来产品的趋势都是十分有益的。目前,对企业来说,社交网络分析的主要关注点是找到、分析和了解消费者,与消费者达成简洁、快速的沟通。

社交网络分析有着许多具备应用前景的研究课题,如社交网络中社区圈子的识别、社交网络中人物影响力的计算、信息在社交网络上的传播模型、虚假信息和机器人账号的识别、基于社交网络信息对股市/大选和传染病的预测等。社交网络分析和研究是一个交叉学科,研究过程中通常要利用社会学、心理学甚至医学上的基本结论和原理,通过人工智能领域中的机器学习、图论等算法,模拟与预测社交网络中的群体行为和未来的趋势。社交圈子的划分并不局限于用户主动建立的关系,还可通过其隐性圈子进行划分,如兴趣属性等。当两个人在社交网络中频繁地互动时,他们在线下是否也是真实的好友?从算法的角度来看,这是一个很难解决的问题。然而,如果两人都拥有对方的手机号,那么两人在线下是真实好友的可能性就会非常大。

通过挖掘和分析社交网络数据,企业不仅可以发现用户的活动轨迹是否在商圈覆盖范围内,掌握其消费能力、喜好及最近的购买习惯、购买产品的概率,而且可以了解竞争对手的策略,甚至可以即时监控网络中突然发布的一条可能对企业造成危机的信息,追踪其传播路径,找到其中的关键节点。舆情监测可让企业围绕某个监测领域或事件,经由科学部署与数据分析过程了解自身的口碑状况。

然而,人们对社交网络数据的挖掘和分析仍然处在相对初级的阶段,大规模、高维度数据的挖掘方法仍然在不断演化。目前来看,文本语言的情感分析等很多基础性问题仍然未得到有效解决,一定程度上限制了对社交网络的深入研究。然而,随着人工智能研究水平的不断提高,尤其是认知神经科学与人工智能技术相结合的研究,让人们看到了人工智能的新希望。