MOSES安装以及使用说明(3)

2019-03-29 09:52

--last-step -- 训练过程的最后一步 (default 7) 1.5 文件路径

--corpus-dir -- 语料库的目录 (default $ROOT/corpus) --lexical-dir -- 词汇翻译概率的目录 (default $ROOT/model) --model-dir -- 模型目录 (default $ROOT/model)

--extract-file -- 抽取的文件 (default $ROOT/model/extract) --giza-f2e -- GIZA++ 目录 (default $ROOT/giza.$F-$E) --giza-e2f -- 倒转的 GIZA++ 目录 (default $ROOT/giza.$E-$F) 1.6 对齐的启发式

--alignment -- 用于词对齐的启发式: intersect, union, grow, grow-final, grow-diag, grow-diag-final (default), grow-diag-final-and, srctotgt, tgttosrc

intersect -- 两个GIZA++算法使用后的交集。这通常产生大量被提取的短语, 因为未对齐短语产生大量自由对齐的短语。 union -- 两个GIZA++算法使用后的并集。 grow-diag-final -- 默认的启发式

grow-diag -- 同上，但是不运行FINAL()功能

grow -- 同上，但是使用不同的临近定义。现在对角相邻对齐点被排除在外。 grow -- 没有对角相邻对齐点，但是有FINAL() 1.7 最大短于长度

--max-phrase-length -- 加入短于表中的最大短于长度(default 7) 1.8 GIZA++选项

--giza-option -- GIZA++ 训练的额外选项

1.9 大型训练语料的处理

--parts -- 通过部分运行snt2cooc为GIZA++准备数据

--direction -- 仅在1、2的指导下运行训练步骤 2 (并行化的) 1.10 其他

--verbose -- 打印附加的词对齐信息

--no-lexical-weighting -- 对于短语表仅使用条件概率不使用词汇权重

共3页:

MOSES安装以及使用说明(3).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档