2017-2018年自然语言处理(NLP)
应用趋势展望报告
2017年9月出版
1
正文目录
1、自然语言处理(NLP)概述 ....................................................................................... 3 1.1、定义及流程 .............................................................................................................. 3 1.2、NLP 技术研究与断突破,商业化落地未来可期 ................................................. 5 2、应用需求与断深化与拓展,NLP 市场将持续快速发展 ........................................ 6 2.1、应用场景丰富,NLP 有望在多领域实现商业化 ................................................. 6 2.1.1、教育领域 ............................................................................................................... 7 2.1.2、医疗领域 ............................................................................................................... 7 2.1.3、金融领域 ............................................................................................................... 8 2.1.4、政务领域 ............................................................................................................... 9 2.1.5、智能设备领域 ....................................................................................................... 9 2.2、NLP 市场持续快速发展,2025 年全球市场将超220 亿美元 .......................... 9 2.3、NLP是人工智能皇冠上的明珠 ........................................................................... 11 3、重点公司分析 ........................................................................................................... 13 3.1、拓尔思:非结构化应用领导者,大数据+人工智能战略稳步推进 .................. 13 3.2、华宇软件:法检政务信息化龙头,人工智能+法律产品快速落地 .................. 17 4、发展趋势 ................................................................................................................... 18 4.1、视觉+NLP交叉将持续升温,视频理解的研究将再上一个台阶 ..................... 18 4.2、未来5年神经机器翻译会有超越 ........................................................................ 19 4.3、NLP发展面临的问题 ........................................................................................... 20 4.4、自然语言处理未来的发展方向 ............................................................................ 20
图表目录
图表 1:自然语言处理(NLP) ............................................................................................. 3 图表 2:Google 以机器学习为背景的语音识别系统英文领域的字准确率 ..................... 5 图表 3:NLP 在多个使用场景与行业领域都的广泛应用 ................................................... 6 图表 4:智慧医疗领域NLP 应用 .......................................................................................... 8 图表 5:2016-2025 年全球NLP 市场规模及预测 ............................................................ 10 图表 6:2011-2017 年中国智能语音产业规模 ................................................................. 10 图表 7:NLP、人工智能、机器学习、深度学习和神经网络之间的区别 ....................... 12 图表 8:TRS海贝大数据管理系统V8.0的功能特点 ........................................................ 14
近日,国内地平线公司同时登上自然语言推理领域三个重要数据集SNLI、MultiNLI 以及Quora Question Pair 的榜首,斩获三个世界第一。根据以上数
2
据平台公布的测评数据显示,地平线的自然语言推理准确率最高已达88.9%,这也代表了自然语言推理的世界顶尖水平。
? NLP 技术研究与断突破,商业化落地未来可期:自然语言处理作为人工智能发展最早、且率先商业化的技术,是未来人机交于的趋势,在大多数智能产品中, NLP 技术都是与可或缺的。近几年来随着深度学习技术的突破,NLP 中的语音 识别能力、浅层次的特征提取、分类等与断成熟,技术能力大幅提升,带动了商 业化探索热潮。
? 应用场景丰富,NLP 有望在多个领域实现商业化:NLP 在多个使用场景与行业领域都有广泛应用,可以分为2B 与2C 两类。C 端应用方面,主要用于智能设备,包括移动设备、智能汽车、智能家居等,改变传统的人机交互方式;B 端应用主要针对垂直行业需求,提升人工效率,传统的呼叫中心的对话系统应用外, 在教育、医疗、金融、政务等多个行业广泛应用。
? NLP 市场持续快速发展,2025 年全球市场将超220 亿美元:NLP 技术正在被广泛需求,NLP 市场将持续快速发展。Tractica 报告显示,到2025 年,NLP 领域的软硬件及服务总市场规模将达223 亿美金;我国的人工智能市场增长中, NLP 也将居于重要地位。易观智库报告显示,国内的智能语音市场从2011 年的 6.3 亿元到2016 年的59.3 亿元,复合增长率约45%,2017 年有望突破百亿元。
1、自然语言处理(NLP)概述 1.1、定义及流程
自然语言处理(NLP)是指机器理解并解释人类写作、说话方式的能力。 NLP 的目标是让计算机/机器在理解语言上像人类一样智能。最终目标是弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。
图表 1:自然语言处理(NLP)
3
有了 NLP,有可能完成自动语音、自动文本编写这样的任务。
由于大型数据(文本)的存在,我们为什么不使用计算机的能力,不知疲倦地运行算法来完成这样的任务,花费的时间也更少。
这些任务包括 NLP 的其他应用,比如自动摘要(生成给定文本的总结)和机器翻译。 NLP 流程
如果要用语音产生文本,需要完成文本转语音任务 NLP 的机制涉及两个流程: 自然语言理解 自然语言生成 自然语言理解(NLU)
NLU 是要理解给定文本的含义。文本内每个单词的特性与结构需要被理解。在理解结构上,NLU 要理解自然语言中的以下几个歧义性: 词法歧义性:单词有多重含义 句法歧义性:语句有多重解析树 语义歧义性:句子有多重含义
回指歧义性(Anaphoric Ambiguity):之前提到的短语或单词在后面句子中有不同的含义。
4