如果语言理解可以在广泛的环境中自动化,则可能会对许多专业工作产生深远的影响。使用书面文字的交流在许多人的工作生活中起着核心作用。但是,如果机器学习如何从文本中提取意义并生成报告,那么它将成为一项不那么完全的人工任务。在某些方面,非常需要这种计算机辅助。许多信息工作者都在努力处理他们希望监控和处理的信息量不断增加的情况。

“所有这些公司都有与他们自己的特定世界相关的数据:它不断增加,而且无法跟上它,”Primer的首席执行官Sean Gourley说。与其他领域相比,AI对语言世界的影响要慢一些。

机器学习的第一个重大突破,即人工智能最新进展背后的技术,是在2012年。那时深度学习系统在年度ImageNet图像识别竞赛中取得了重大进展。不久之后,计算机视觉超越了人类。像许多其他机器学习产品一样,像这样的系统可能不会完全取代人类随后是语音识别。但这只能识别一个人所说的话,而不是他们的意思。

使用相同的技术来理解人类用来交流的所谓“自然语言”,这是一个难以破解的难题。部分问题在于语言的复杂性和模糊性。最先进的机器学习系统中的神经网络使用一种模式识别形式,依靠过去的例子来理解新信息。在语言世界中,意义在很大程度上取决于语境,而且往往是人们之间的沟通关系,这种技术效果较差。

在训练神经网络来完成分析师所面临的工作类型的另一个障碍 – 从多个来源提取信息 – 是缺乏训练系统的适当数据。它需要包含源文档和最终综合的公共数据集,从而提供系统可以学习的完整图像。尽管存在这些挑战,但最近在自然语言理解(NLU)方面的飞跃使得系统更加有效,并使该技术开始进入更多业务应用程序。

如果可以破解基本技术问题,那么机器在处理语言方面的优势就很明显了。他们可以比人类更快地处理信息,而且数量更多。它们还具有更大的“维度”:它们可以同时分析许多不同参数。Sean Gourley说,其中一个结果是,计算机应该能够在大量信息中检测到比人们更重要的事实。人类使用他所谓的精确度最有效:识别一个重要的事件或事件并在其上寻找。但是,虽然找到一件值得仔细研究的事情,但他们可能会错过许多其他可能同样值得关注的事情。这就是机器可以进入的地方,抛出了许多被忽视的额外可能性,无论这些是否是新产品或恐怖主义威胁来源的潜在需求领域。像许多其他机器学习产品一样,像这样的系统可能不会完全取代人类。但他们将从根本上改变工作的本质,并要求拥有新技能和不同前景的人。它将对剩下的分析师工作总数以及工作性质的确切变化做些什么,这是一个悬而未决的问题。一种可能性是对人类投入的需求将下降。随着更多预处理信息触手可及,需要更少,更聪明的分析师来理解它。但是,语言系统的影响也可能不是在需要的分析师数量方面,而是在分析的事物数量方面。与其他信息处理领域一样,自动化一些工作将大大降低以前人类保留的两项任务的成本:阅读和写作。当某些工作不需要高薪分析师时,许多新事物将很容易被分析,这在以前是不经济的。

来源: “自然语言理解”有望改变我们的工作方式 金融时报