2.4 智能建模理论与计算方法

2.4.1 基于案例的推理

基于案例的推理(Case Based Reasoning, CBR),由美国耶鲁大学的Roger Schank于1982年首次提出[88]。作为一种类比推理,CBR旨在通过从历史案例库中寻找和新问题相似的案例的解决方案,根据决策目标对其进行适当的修正,以期对新的问题进行求解。由于其具有易学易用、自学习、避免重复历史错误、问题求解力高等优点,近年来在人工智能领域得到了广泛关注。

CBR的问题求解过程在一定程度上模拟了最初人类解决复杂问题的思路,其使用及推理过程详见图2.9。主要分为以下五个步骤:

(1)案例表示,(2)案例检索,(3)方案重用,(4)评估修正,(5)案例学习。

图2.9 基于案例的推理过程

其中,与本书研究密切相关的两个环节为案例表示与案例检索。而案例重用功能主要是为了增强本书所研究信息架构灵活性,研究中做好了相应的铺垫工作,以增强研究工作的延续性。

(1)案例表示。

案例表示是指对某个问题及其背景、解决方法的结构化描述,案例的表示方法决定了案例索引、案例检索和案例存储方法等,并影响CBR的性能和效率[89]。这是因为CBR技术求解问题及推理的过程需要通过检索到与问题相似的其他案例为前提,而结构规范、适于检索的案例表示方法才便于实现案例的检索过程,是CBR使用中最为基础的步骤。

目前常用的案例表示方法主要有:基于逻辑思维的谓词逻辑方法、基于非逻辑思维的语义网络表达方法和框架表达法、面向对象的表示方法等[90-92]。无论哪种表达方法,一般都会由三个部分构成:问题空间描述、解决方法以及执行结果[93][94]

(2)案例检索。

案例检索是整个CBR过程中尤为关键的阶段,它通过直接或者通过与用户交互的方式抽取新案例中的特征因素,与历史案例库中的案例依次进行相似度的计算,相似度满足一定条件的便视为实现了匹配。

案例推理在本课题的研究中,将主要应用到架构各视图最小信息粒度的表示及匹配过程,如信息需求模式与信息服务模式等的表达与匹配过程,以此来定义信息架构的动态驱动机制,加强信息架构的快速响应能力。

2.4.2 灰色关联分析方法

从灰色系统理论的观点来看,人们很难去识别出现实世界中不同的系统之间以及同一系统的不同要素之间的主导以及非主导关系,因此,将这种关系定义为灰色的[95]。为进一步理清其中的主要关系,洞察主要矛盾或矛盾的主要方面,灰色系统理论中提出了关联度这一概念。灰色关联分析方法,即立足于整体的视角,对受多种因素影响的事物或现象进行综合评价的方法。评价的思路是,通过计算两个系统或者两个因素之间的关联度大小进行量化,如果关联度相对较大,那么二者之间的变化趋势会保持相对一致性。

在数字化医院信息架构的设计过程中,当我们去量化利益相关者的需求时,很难去识别众多的非正式系统元素对其需求的影响,甚至不同的需求模型中,同一目标下可能会有许多不同的任务来去满足,究竟哪种任务能够更好地支持目标的实现?全面去判断这些相关的因素是一个非常复杂的问题。针对上述情况,在本书研究中采用灰色关联分析方法,可以为需求模型的合理建立提供一种行之有效的方法和理论支撑。

令参考序列或母序列为x0={x0(1), x0(2), ...,x0(n)},比较序列或者子序列分别为xi={xi(1), xi(2), ..., xi(n)},其中i=1,2, ..., m,表示共有m个子序列,n为各个序列的长度。则对于序列x0xi中第k个数x0(k)和xi(k)的关联度分析一般采取以下步骤。

(1)原始数据无量纲处理。

对原始数据采取无量纲处理,以消除不同数据单位而带来的关联度无可比性这一问题。这主要是因为关联系数的计算主要取决于子母序列中各对应位置的数据差值。可以采用的方法有:初值化变换、均值化变换及标变换等。

(2)计算灰色关联系数。

经数据变换之后所得到的数列,便构成了真正要计算关联系数的母数列,此处,我们在标号上不做重新标记,因此,x 0(k)和xi(k)的灰色关联系数[96][97]可计算为:

式中,分辨系数ζ∈[0,1],一般取值为ζ = 0.5。|x0(k)-xi(k)|为序列x0xi中第k个数x0(k)与xi(k) 的绝对差;是指绝对值差|x0(k)-xi(k)| 按不同k值选其中最小者,称为第一层次最小差;是按不同i值再选其中最小者,称为第二层次最小差。同理,是指绝对值差|x0(k)-xi(k)|按不同k值选其中最大者,称为第一层次最大差;则是指第一层次最大差按不同i值再选其中最大者,称为第二层次最大差。

(3)计算灰色关联度。成为序列x0xi中第k点的环境参数,得到灰色关联系数γ(x0(k), xi(k)),两序列中各个点的关联系数的平均值便构成了参考序列x0与比较序列xi之间的灰色关联度,即:

对于本书中的应用而言,我们采用关联序来量化,也就是说我们关注的并不是关联度本身值的大小,而是各个因素之间关联度大小的排列顺序。通过关联序的排列,我们可以洞悉信息需求模型中那些关键的因素,从而更加准确地衡量用户的信息需求情况。

2.4.3 言语行为理论

言语行为理论(Speech act theory)最初是由Austin[98]、Searle[99]等学者针对语言的语用效果研究而创立的。他们认为我们每个自然人在说话的时候,除了实现了信息本身的交流之外,更是实施了某种言内、言外甚至是言后的行为。Flores、Ludlow[100]等学者于1981年将这种语言学理论创新性地引入到了信息系统研究领域,Winograd、Flores等学者在五年后又将其做了进一步的发展[101]

基于言语行为理论的特点,我们将其应用扩展到数字化医院内,我们可以认为组织内每一个主体(包含自然人、集体甚至是系统软件等)之间均在不断地进行着大量的信息协作与交流,这些交流是按照主体角色之间的标准化会话方式来实现的,这些会话即是一种描述外在存在的方式,同时,它们也可以看作是一种具体的活动方式,通过会话来实现信息交流双方对未来行为的一种承诺。组织内所提供的各种信息服务,换另外一种角度来看,也就是组织内各种会话活动所构成的集合。所以,这种重视语用效果的观点,对于我们研究数字化医院这一复杂组织系统以及组织内信息架构的顶层规划开创了一个独特的视角。

言语行为理论中针对组织系统和信息系统的分析设计也形成了一系列的建模方法。本课题中将要采用的方法是DEMO(Dynamic Essential Modelling of Organisations)[102]方法。它基于组织内的主观行为(会话承诺行为)和客观行为(实质行为)为基础进行研究,这两种行为之间的作用产生了状态迁移。主客观行为之间的交互模式称之为事务。这种方法,根据因果关系及条件关系实现对事务间关系的全方位建模。因果关系即某一事务导致另一事务的开始,条件关系即一个事务的完成是另一事务开始或完成的条件。通过分析各项事务以及事务之间的关系,我们可以得到如图2.10所示的DEMO建模示例。

图2.10 DEMO建模示例

图2.10中,小圆圈表示事务开始,实线圆圈表示事务,可采用数字(序号)或字母(阶段)对每一个事务进行标识。如果一个事务由多个其他事务初始点构成,可以将其符号延伸(T1/E)。因果关系采用实线箭头表示,起始点与事务之间的实线表示事务从此处开始(T2),事务与事务之间的实线表明箭头所指事务需在另一端结束时才能开始(T1/E, T1/R)。事务之间可以同时开始(T6, T7)或择其一开始(T4/O与T5)。虚线代表条件关系,表示箭头所指事务的完成需要以另一事务完成为条件(T6与T10),或者是另一事务开始的条件(T2与T3)。

此模型对于事务间的关系给与了连续的理解,对于本课题研究中信息服务间的情境感知提供了研究基础。同时,由于DEMO方法对其中的各项事务触发关系及事务执行规则的描述并不充分,因此本研究在将其应用到信息服务的情境感知方法中时,将对此不足进行改进。