6 隐喻知识库的建造

从上述计算模型来看,隐喻表达往往涉及概念的推理关系,隐喻表达的识别、解释、提取往往需要一个或多个知识库的支撑。具有代表性的隐喻库有以下几个。

6.1 Sense-frame

Sense-frame是Fass的Met5系统中所利用的知识库,共包含500词条,词条设计如下:

图2 Sense-frame词义框架

每个词义框架包含两部分,arcs部分和node部分。arcs部分包含了该词条类属条目(一个词条和它的意义描述),语义框架所有的arcs构成了词语深层结构化的语义网络,node部分包含了被定义的语义框架的差异。Met5系统就是利用上述的知识表示实现了car drinks gasoline的隐喻解释。

6.2 Master Metaphor List(重要隐喻目录)

Master Metaphor List是加利福尼亚大学Berkeley分校在Lakoff的指导下,搜集了英语常规隐喻表达的一个在线知识库,Lakoff和他的学生们从出版的隐喻文献,加利福尼亚大学Berkeley分校的研究生论坛中收集隐喻用例,手工编辑而成,加工的词条包含了隐喻映射和每个隐喻的隐喻实现。数据库中大约有200个不同层级的隐喻。每个隐喻的词条包含了源域和目标域的描述,还有一组隐喻例句,一个简要分析。Metaphor List依照专家们的直觉分成不同的概念隐喻类别,不去考虑这些隐喻是否已经词汇化。

6.3 MetaBank知识库

Martin[33]提出了一个面向自然语言应用的经验诱导和理论驱动相结合的隐喻知识库(MetaBank)。该数据库直接继承了Metaphor List的研究成果,除此之外还包含两部分资源,一部分是UNIX文本,这是一个使用Mail处理UNIX操作系统的语料库,语料库规模大约有150000词次,另一部分就是来自Wall Street Journal的语料。

Martin指出建造隐喻知识库的两种方法。一种是基于已知隐喻的直接研究方法,另一种是基于文本的任意实例方法。已知隐喻的直接研究方法通过常用的隐喻在特定文本中的实现来发现它们在大规模文本中的情况,这种方法可以获得特定隐喻的频次信息和它们被应用领域的普遍性,同时也可能发现在语料库中不流行的其他常规隐喻的频次信息。这种研究可能直接来自Berkeley List或其他的隐喻资源。

6.4 Metalude隐喻库的设计

Metalude是一种已经词汇化的英语隐喻交互语料库[34],该语料库从词汇上考察隐喻,并非单纯的认知或知觉的研究,这一点和Berkeley的Master Metaphor List有明显的不同。目前Metalude包含9000个英语词条以及它们的字面义、隐喻义、词类、实例等属性信息。其所收的隐喻均根据概念隐喻或构成隐喻的基本类比来进行分类,因此一个词形往往有多个词条。例如:Lexical Term=fl eet(港湾)有ACTIVITY IS BOAT TRAVEL ; ORGANISATION IS SHIP ; TRAFFIC IS LIQUID/BLOOD三个根隐喻,因此设定三个词条。

上述的知识库大多为系统专门设计,具有很强的实用性,对汉语隐喻描述是很好的借鉴。除此之外还有直接利用Ontology资源进行隐喻库的建设,例如:Carina Eilts, Birte Lönneker[35]关于在线法德隐喻库Hamburg Metaphor Database的建设工作。