- 花园幽径句行进错位的计算语言学研究
- 杜家利 于屏方
- 1933字
- 2021-03-31 00:33:01
第一节 花园幽径效应图式模型
花园幽径效应的出现涉及大脑短时记忆(或称工作记忆)的容量和认知时间的长短。所以,花园幽径现象图式会有短时记忆和长时记忆互逆传递的表示。我们构建的花园幽径效应图式包括如下成分:信息传递,词/短语瞬时匹配,外程序知识库,内程序知识库,基于内外程序知识库的推理机制,整句匹配,语法,行进式错位,提取/对照,顿悟,认知归位,语义监控,句法生成,整句输出等。
图18 花园幽径效应图式
本图式包括三种处理模式:
(1)语义和谐,成功输出。这一过程强调语法和语义的先后性,符合语法和语义,在系统处理中不会出现回溯。例如:
例32:We knew that when that snake bit you,you would die.我们知道,当蛇咬了你,你就死定了。
Tagging
We/PRP knew/VBD that/IN when/WRB that/DT
snake/NN bit/VBD you/PRP ′/′ you/PRP
would/MD die/VB ./.
词类标注中,We/PRP表示人称代词(Personal pronoun)。knew/VBD表示动词过去式(Verb,past tense)。that/IN表示介词或从属连词(Preposition/subordinating conjunction)。when/WRB表示wh副词引导的副词(wh-adverb)。that/DT表示限定词(Determiner)。snake/NN表示单数名词(Noun,singular) 。bit/VBD表示动词过去式。you/PRP表示人称代词。would/MD表示情态助动词(Modal) 。die/VB表示动词基本形式(Verb,base form)。
Parse
(ROOT
(S
(NP(PRP We))
(VP(VBD knew)
(SBAR(IN that)
(S
(SBAR
(WHADVP(WRB when))
(S
(NP(DT that)(NN snake))
(VP(VBD bit)
(NP(PRP you)))))
(,,)
(NP(PRP you))
(VP(MD would)
(VP(VB die))))))
(..)))
句法剖析中,系统认为该句是完整结构的句子。主体结构是(NP(PRP We))+(VP(VBD knew)+SBAR(IN that)...)。即人称代词we形成名词词组NP,动词过去式knew和连词that引导的从句形成动词词组VP。SBAR表示由连词引领的与主句不同的具有完整结构的从句(Clause introduced by subordinating conjunction or 0,top level labelling apart from S,usually for complete structure)。WHADVP(WRB when)表示由疑问wh-副词when(wh-adverb)引导的从句。(NP(DT that)(NN snake))表示that此处做定语修饰名词snake。
Typed dependencies
nsubj(knew-2,We-1) root(ROOT-0,knew-2) mark(die-12,that-3)
advmod(bit-7,when-4) det(snake-6,that-5) nsubj(bit-7,snake-6)
advcl(die-12,bit-7) dobj(bit-7,you-8) nsubj(die-12,you-10)
aux(die-12,would-11) ccomp(knew-2,die-12)
依存关系分析中,nsubj(knew-2,We-1)表示人称代词we是动词knew的名词性主语(nominal subject)关系。root(ROOT-0,knew-2)表示全句的根源自于动词knew。mark(die-12,that-3)表示存在于副词性修饰关系(advcl)中的标记关系(marker)。det(snake-6,that-5)表示that是snake的限定词关系。nsubj(bit-7,snake-6)表示snake是动词bit的名词性主语关系。advcl(die-12,bit-7)表示动词短语或句子的副词性从句修饰关系(adverbial clause modifer),是指用来修饰动词的附属成分,包括条件从句、时间从句等,类似的关系如“The accident happened as the night was falling”可表示为 advcl(happened,falling),“If you know who did it,you should tell the teacher”可表示为 advcl(tell,know)。dobj(bit-7,you-8)表示you是动词bit的直接宾语关系(direct object)。nsubj(die-12,you-10)表示you是die的名词性主语关系。aux(die-12,would-11)表示would与die的助动关系(auxiliary)。ccomp(knew-2,die-12)表示从句性补语关系(clausal complement),是指从句中具有内在主谓关系,整个从句充当补语,类似的关系如“He says that you like to swim” 可表示为 ccomp(says,like)。产生的依存关系如下:
图19 例32的依存关系图
(2)语义不和谐,语义环路断开,推理机制启动。系统理解重新返回到“整句匹配”,并再次接受语法和语义监控。系统提示为:不可输出。如:
例33:We knew that when you bit that snake,it would die.我们知道,当你咬了蛇,蛇就死定了。
符合语法,但因语义不符难以形成环路,只能重返进行整句匹配,直到系统提示本句是不能输出的错句。
Tagging
We/PRP knew/VBD that/IN when/WRB you/PRP bit/VBD
that/DT snake/NN ′/′ it/PRP would/MD die/VB
./.
词类标注中,例33和例32的词类标注没有区别。只是位置发生了颠倒。
Parse
(ROOT
(S
(NP(PRP We))
(VP(VBD knew)
(SBAR(IN that)
(S
(SBAR
(WHADVP(WRB when))
(S
(NP(PRP you))
(VP(VBD bit)
(NP(DT that)(NN snake)))))
(,,)
(NP(PRP it))
(VP(MD would)
(VP(VB die))))))
(..)))
句法剖析中,例33和例32的结构分析也没有区别。
Typed dependencies
nsubj(knew-2,We-1) root(ROOT-0,knew-2) mark(die-12,that-3)
advmod(bit-6,when-4) nsubj(bit-6,you-5) advcl(die-12,bit-6)
det(snake-8,that-7) dobj(bit-6,snake-8) nsubj(die-12,it-10)
aux(die-12,would-11) ccomp(knew-2,die-12)
依存关系分析中,例33和例32的依存关系也没有发生变化。形成的关系图如下:
图20 例33的依存关系图
由上分析可知,例33和例32无论在词类标注、句法剖析还是依存关系中都是一致的,也就是说产生折返的触发机制源于系统外的知识库认知知识。语义认知具有超系统的解读功能。
(3)语义不和谐且系统不能马上提示为错句。这时系统会出现回溯,产生行进式错位,即花园幽径现象。
例34:While the boy scratched the dog yawned loudly.男孩搔痒时,狗打了一个大大的哈欠。
理解在经历了一次瞬时语义环路后断开。从“信息传递”而来的语义流,在知识库监控下,完成“词/短语瞬时匹配”后进入“整句匹配”阶段,并瞬时产生临时的“句法生成式”。但在语义监控下无法生成正确的句法生成式(scratched the dog的匹配使yawned产生无主语现象)。系统回溯,并启动推理机制,重返“整句匹配”进行再处理。系统回溯后进入“行进式错位”,并提取对照潜在的认知模式。产生顿悟并带来认知归位(scratch可作为vi 和vt; scratch 和the dog的分离匹配符合认知)。
例35:While the boy scratched,the dog yawned loudly.男孩搔痒时,狗打了一个大大的哈欠。
符合语义并且产生正确的句法生成式,完成整句输出,花园幽径解读结束。