网络语言项目中的语音技术
机器上运行。
项目LISTEN由IERIGrant REC-9979894下的NSF和Heinz Endowments支持。自动化的领域研究通过在阅读教师中植入实验,来评价选择性的指导干预效果,这现在正被成百万的小学学生使用。
4.自然语言处理
4.1 机器/语音翻译
机器翻译是自然语言理解中的一个重要研究领域。是网络为基础的语言学习体系中克服语言障碍必不可少的工具。英汉之间的翻译应该根据网络环境中机器翻译的特点,强调语义保留问题,以便为Sino-US网络语言学习者提供高质量的多语言网络信息服务。现在最好的汉英机器翻译系统,对于日常语料库,准确程度达到70%左右。当日常语料库准确程度达到80%时,人们可以大致了解内容。因为Sino-US基于网络的语言学习产生的内容是为11到18周岁的青少年,这个程度大致等于母语的小学1-3年级水平。使用现有技术,我们可以保持翻译准确程度(语义保留程度)大于80%,这是针对那些文字语言比较规范,话题比较明确,内容比较简单的语料库。Sino-US基于网络的语言学习软件能导致汉语和英语之间的文字翻译功能,主要是对于那些简单的话题明确句子类型规范的简单句。然而,语音翻译是一个集成的综合的技术应用,是像语音识别,语言理解,字面翻译,书面语言交流,会话原型,对话管理等技术的合成。因此,在一个长期计划中考虑汉英之间的语音-语音翻译功能,这会使得基于网络的语言学习能够更好地交流。
4.2 机器翻译的困难
机器翻译目前仍不能正确理解语言,句子仍不能在更深的语义和概念层进行分类。它不能对句子进行概念解释和语义理解。这些困难基于多种因素,如目标语句的复杂性,映射类型的多样性,源语言句子中各种因素相互之间程度的不一致性等等。因为信息内容和标记之间的映射不是一个接一个相对应,标记联合意义有一系列复杂的特征,这些特征从位(bit)来看不相同,例如歧义、层级性(命名为结构化)、任意性和模糊性等,到目前为止之一来传统信息和计算理论不够的。我们必须建立新的理论来解决这样一些问题。汉英间翻译包括汉英翻译和英汉翻译,前者比后者更困难,因为汉语缺乏外在的形态标记,单词或句子的形式依靠词序和虚词来表现,但这具有不确定
性。语素组成词、短语组成句子,都使用同一套规则。除此之外,汉语动词没有时态变化。助词是汉语中一种特殊的词,汉语中还有大量的量词。
4.3 用计算机进行直接的人机对话
人机交互要把能处理语音信息的机器和设备变成语音交互对象,使他们能像人一样听、读和写,理解语音并对其作出反应,在交互式的