汉语组块的定义和获取 - 首页-中国计算机学会信息网(4)

2021-02-21 13:40

( A D J C ( A D不 )( i i完全 ) ) ( 2 ) A D V C:为副词组块,与宾州大学的副词短语A D J P基本保持一致。 A D J P是以副词A D 作为短语的核心词,在副词组块中除此之外, C S(句子的连接词)或者V A〔形容动词)也可以 作为它的核心词, V A作为核心词时后面经常跟着词语“地”。例如:

( A D V C

( V A

方便 ) )( V A

快捷 ) )

( D V C ( D E V地) ) ( 3 ) D N C:‘的’字组块是根据宾州树库中‘的’字短语 ( D N P )抽取出来的,在树库中D N P 是由任何一个结构 ( X P )与词性标注为D E G的“的”词共同构成的短语,但是由于“的”字在汉语语法中的复杂性, 在组块库中通常是“的”字作为单独的一个组块。即:

( D N C ( D E G的 ) ) ( 4 ) D V C:‘地’字组块与‘的’字组块的情况相似,它是根据树库中“地”字短语D V P进行抽取的,这里也通常把“ 地”作为一个单独的组块,

( D V C ( D E V地) ) ( 5 ) L C C:定位组块,由树库的定位短语L C P中提取出来,有些直接由L C P转换,例如: ( L C C ( N T去年) ( L C初 ) )当 树库中的L C P短语很长时,并由其他短语组成,我们则将其分解成多个组块。例如:

住 C P ( V P ( V V改善 ) ( N P - O B J ( N P - P N ( N R中国 ) ) ( N P ( N N出口 ) ( N N商品 ) ( N N结构 ) ) ( L C中 ) )从该短语中获取的组块如下:

( V C C ( V V改善 ) ) ( N C ( N R中国 ) )困C ( N N出口 )( N N商品 )( N N结构) )

( L C C ( L C中 ) ) 可以看出这里一个L C P短语分解出来了四个组块,“中”单独作为一个定位组块。 ( 6 ) L S T:列举组块,和宾州大学L S T短语的定义一致,一般是一个词作为一个组块。例如: ( L S T ( C D一) )

( V P ( A D不 ) ( v v怕 ) ) ( V P ( y V吃亏) ) ( O ( P U, ) ) ( L S T ( C D二) )在该句中的“一”、“二”分别组成列举组块。 ( 7 ) N C:名词组块,在树库中名词短语N P可以递归定义。名词组块实际上是基本的名词短语,内部不含有其他名词组块。因此句中最底层的名词短语为所要抽取的名词组块。例如:

创P

侧P ( D T全) ( N N国 ) ).1 1 3.


汉语组块的定义和获取 - 首页-中国计算机学会信息网(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:小学六年级跳高教案

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: