译者序
机器翻译,又称自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。机器翻译技术的发展一直与计算机技术、信息论、语言学等学科的发展密切相关。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算机计算能力的提升和多语言信息的爆发式增长,机器翻译技术也逐步成熟,并为广大用户提供实时、便捷的翻译服务。
本书旨在简要概述机器翻译的发展历程。首先介绍了在开发机器翻译系统时必须解决的主要问题。然后详细介绍了机器翻译的发展历程,其中包括从计算机出现之前的机器翻译初期到基于深度学习的最新进展。本书着重分析了自从机器翻译领域创建以来的主要方法:基于规则的方法以及 ALPAC 报告及其影响;推动该领域研究飞速发展的平行语料库、基于示例的范式;目前最主流的统计范式;基于分段的方法和目前最先进的基于深度学习的方法。另外,本书还对机器翻译的质量评价问题进行了深入讨论。最后,介绍了该领域世界范围内的主要参与者以及商业化现状。
本书作者长期从事机器翻译领域的研究和实践,对机器翻译领域的发展和问题进行了深入总结和归纳。
全书共 15 章,主要由连晓峰翻译并审校。此外,郭其豪、潘兵、刘鹏华、田恒屹、王焜、贾琦、洪兆瑞、王子天也参与了部
分翻译工作。
鉴于译者的水平有限,书中不当或错误之处在所难免,恳请各位业内专家、学者和广大读者不吝赐教。
译者