--last-step -- 训练过程的最后一步 (default 7) 1.5 文件路径
--corpus-dir -- 语料库的目录 (default $ROOT/corpus) --lexical-dir -- 词汇翻译概率的目录 (default $ROOT/model) --model-dir -- 模型目录 (default $ROOT/model)
--extract-file -- 抽取的文件 (default $ROOT/model/extract) --giza-f2e -- GIZA++ 目录 (default $ROOT/giza.$F-$E) --giza-e2f -- 倒转的 GIZA++ 目录 (default $ROOT/giza.$E-$F) 1.6 对齐的启发式
--alignment -- 用于词对齐的启发式: intersect, union, grow, grow-final, grow-diag, grow-diag-final (default), grow-diag-final-and, srctotgt, tgttosrc
intersect -- 两个GIZA++算法使用后的交集。这通常产生大量被提取的短语, 因为未对齐短语产生大量自由对齐的短语。 union -- 两个GIZA++算法使用后的并集。 grow-diag-final -- 默认的启发式
grow-diag -- 同上,但是不运行FINAL()功能
grow -- 同上,但是使用不同的临近定义。现在对角相邻对齐点被排除在外。 grow -- 没有对角相邻对齐点,但是有FINAL() 1.7 最大短于长度
--max-phrase-length -- 加入短于表中的最大短于长度(default 7) 1.8 GIZA++选项
--giza-option -- GIZA++ 训练的额外选项
1.9 大型训练语料的处理
--parts -- 通过部分运行snt2cooc为GIZA++准备数据
--direction -- 仅在1、2的指导下运行训练步骤 2 (并行化的) 1.10 其他
--verbose -- 打印附加的词对齐信息
--no-lexical-weighting -- 对于短语表仅使用条件概率不使用词汇权重