( A D J C ( A D不 )( i i完全 ) ) ( 2 ) A D V C:为副词组块,与宾州大学的副词短语A D J P基本保持一致。 A D J P是以副词A D 作为短语的核心词,在副词组块中除此之外, C S(句子的连接词)或者V A〔形容动词)也可以 作为它的核心词, V A作为核心词时后面经常跟着词语“地”。例如:
( A D V C
( V A
方便 ) )( V A
快捷 ) )
( D V C ( D E V地) ) ( 3 ) D N C:‘的’字组块是根据宾州树库中‘的’字短语 ( D N P )抽取出来的,在树库中D N P 是由任何一个结构 ( X P )与词性标注为D E G的“的”词共同构成的短语,但是由于“的”字在汉语语法中的复杂性, 在组块库中通常是“的”字作为单独的一个组块。即:
( D N C ( D E G的 ) ) ( 4 ) D V C:‘地’字组块与‘的’字组块的情况相似,它是根据树库中“地”字短语D V P进行抽取的,这里也通常把“ 地”作为一个单独的组块,
( D V C ( D E V地) ) ( 5 ) L C C:定位组块,由树库的定位短语L C P中提取出来,有些直接由L C P转换,例如: ( L C C ( N T去年) ( L C初 ) )当 树库中的L C P短语很长时,并由其他短语组成,我们则将其分解成多个组块。例如:
住 C P ( V P ( V V改善 ) ( N P - O B J ( N P - P N ( N R中国 ) ) ( N P ( N N出口 ) ( N N商品 ) ( N N结构 ) ) ( L C中 ) )从该短语中获取的组块如下:
( V C C ( V V改善 ) ) ( N C ( N R中国 ) )困C ( N N出口 )( N N商品 )( N N结构) )
( L C C ( L C中 ) ) 可以看出这里一个L C P短语分解出来了四个组块,“中”单独作为一个定位组块。 ( 6 ) L S T:列举组块,和宾州大学L S T短语的定义一致,一般是一个词作为一个组块。例如: ( L S T ( C D一) )
( V P ( A D不 ) ( v v怕 ) ) ( V P ( y V吃亏) ) ( O ( P U, ) ) ( L S T ( C D二) )在该句中的“一”、“二”分别组成列举组块。 ( 7 ) N C:名词组块,在树库中名词短语N P可以递归定义。名词组块实际上是基本的名词短语,内部不含有其他名词组块。因此句中最底层的名词短语为所要抽取的名词组块。例如:
创P
侧P ( D T全) ( N N国 ) ).1 1 3.