前言

近年来,信息技术的飞速发展带动了社交网络的发展,如Facebook、Twitter、新浪微博和豆瓣等社交网络。We Are Social和Hootsuite在《2020全球数字报告》中指出,普通网民平均每天要花约7小时的时间在社交网络上,社交媒体用户数更是突破38亿。近60%的世界人口已经上网,世界总人口的一半以上将使用社交媒体。例如,全球每月有11.5亿用户使用微信进行交互,产生了大量的信息。

社交网络源自网络社交,即“网络+社交”,它通过网络这一载体把人们连接起来,成为人们分享观点、见解、经验的工具与平台,不但实现了线下生活转移到线上,而且形成了一种新的商业模式,推动了互联网向现实世界无限靠近。随着 5G等技术不断取得突破,社交网络得到了迅速发展,目前已进入社交网络时代,现阶段主要包括社交网站、BBS、IM等,社交工具不断丰富。

本书致力于研究社交网络,分析开放的复杂社交系统,结合统计物理学、社会学、计算机仿真科学和认知神经科学等交叉科学的相关技术与方法,重点关注智能化社会信息的获取、分析与处理、海量社交网络信息的获取和表示、网络信息处理、动态媒体分析与媒体智能、不实信息传播、舆论传播与控制、社交网络演化和优化等。全书分为8章,具体如下。

第1章为绪论。首先,分析社交网络的定义与内涵;接着,全面阐述社交网络的发展趋势和意义;然后,分析社交网络中的常见概念,如“六度分隔”理论、弱关系/强关系、贝肯数、顿巴数等;之后,从航空、交通、社交、传染病等不同领域分析社交网络的应用范畴;再后,从信息传播、影响最大化、热点事件分析、情感分析、链路预测、社区发现等方面分析社交网络的主要研究方向;最后,给出社交网络的前沿方向,如多层网络、时序网络、网络上的动力学、图网络、自适应网络等。

第2章为社交网络分析理论。首先,介绍图的基本概念与相关理论,分析图论的用途等;接着,介绍网络基本特征,分析邻接矩阵、邻接表和边列表三种网络结构;然后,描述各种类型的图,包括零图和空图、有向图/无向图/混合图、简单图/多重图和带权图,讨论图的连通性及其相关概念,如路径、通路、回路等,介绍树和生成树的概念;再后,讨论网络中的常见统计特性——度分布、聚集系数、平均路径长度等;最后,分析网络中的统计物理方法,如平均场理论方法、自组织理论、主方程等,讨论主方程在复杂网络中的应用。

第3章为社交网络文本情感分析。首先,针对目前的相关研究只考虑属性的上下文信息而未结合句法依赖树这一现象,提出一种基于句法的图卷积情感分类模型;接着,利用双向门控制网络模型学习给定文本的上下文特征表示;然后,构建给定文本的句法依赖树结构,根据句法依赖树获取其邻接矩阵,与双向门控制网络提取的初步特征进行融合,输入图卷积神经网络进行文本的情感特征提取;再后,将得到的情感特征输入分类器进行文本情感极性分类;最后,在数据集上与主流神经网络模型进行对比。

第4章为社交网络链路预测分析。首先,提出一种改进的社交网络链路预测方法;然后,组合15个相似度指标,进一步提高链路预测的稳定性和准确性。

第5章为社交网络信息传播动力学分析,主要研究在线社交网络中信息传播微观上的随机性和无序性与宏观上的可认知和可观控之间的关系。首先,对国内外针对信息传播动力学模型进行总结,介绍基于传染病、博弈论和物理系统的三类主要模型;接着,深入分析在线社交网络上的信息传播现象,分别从时间、空间、主体、客体四个维度提取关键特征,进行客观化的定量描述;然后,采用运动学、动力学、时变系统与信号变换理论,对社交网络上的信息传播过程进行分析,构建基于时变阻尼运动的信息传播动力学模型;最后,通过数值模拟实验分析模型中参数变化的影响及个体特征分布服从的统计规律,通过仿真实验在无标度网络上模拟信息传播过程,通过实证对比实验对随机选定的不同领域的六个热点事件的传播过程进行比对分析。

第6章为社交网络不实信息传播分析。首先,针对网络垃圾信息传播研究多采用定性分析方法而难以揭示垃圾信息内在传播规律的问题,基于病毒传播的建模思想,考虑不同输入率和移出率等现实因素,提出垃圾信息的ILDR传播模型;然后,针对目前社交网络谣言传播模型研究中未同时考虑正负外部信息干扰的问题,基于传统的SEIR 模型,提出社交网络中基于正负信息干扰的SEIR谣言传播模型;最后,通过构建模拟的在线社交网络对谣言传播过程进行仿真,分析模型随时间的演化过程,以及外部信息流入率、传播率对谣言最终传播规模的影响作用。

第7章为社交网络蠕虫传播与免疫分析。首先,根据实际情况构建影响因子;接着,基于平均场理论方法建立条件触发型蠕虫传播模型及相应的免疫模型;然后,基于蠕虫的传播模型和流行病理论,推导无毒平衡点与蠕虫不会泛滥的充分条件;之后,通过大量仿真实验验证蠕虫不会泛滥的充分条件的正确性,分析不同参数因子对携带病毒文件主机和已感染主机的影响,以及不同参数因子对蠕虫传播的影响等;最后,根据仿真分析和蠕虫传播的特性提出一系列控制策略,指出蠕虫在具有免疫能力的网络中的变化趋势。

第8章为社交网络动态社区发现方法分析。首先,对典型移植分区模型引入时间维度,将整个动态网络系统中的所有状态作为变量处理,将观测方程作为变量间的约束,构造一个关于整个动态网络系统的误差函数,并对该误差函数的二次型进行最小化处理,以便较为真实地抽象网络的观测结果;然后,采用图优化策略,一次性考虑整个运动轨迹中的约束,在线性化处理过程中计算雅可比矩阵;最后,在人工网络和真实网络两种场景下,比较本章提出的模型与4种代表性模型。

本书的研究成果可为相关管理部门提供决策参考和理论指导,帮助相关企事业单位、公司优化产品和服务。

感谢为本书的完整性作出贡献的课题组成员何道兵、丁楠、李祥、吴松阳、刘加苗、唐婷、代尚宏、叶舒、马敏、张梦瑶、苗琛香、赵正阳、刘超、黄贤英等,也感谢自己对“社交网络分析”研究方向的热爱。

由于作者水平有限,书中的不足之处在所难免,望读者不吝赐教。所有关于本书的宝贵建议,请发至作者邮箱lxy3103@163.com。

刘小洋

2021年1月