早在100多年前,德国心理学家William Stern就推出了IQ测试,用来测量人们的智力。从此以后,IQ测试结果就成为现代生活中判定孩子学习能力以及成年人工作能力的一种标准。
IQ测试通常包括三类问题,即逻辑问题(如图形推理)、数学问题(如发现数列规律)以及文字推理类问题,这些问题都是基于类比、分类、同义词或反义词设置。
正是文字推理类问题吸引了中国科技大学的王华正(Huazheng Wang)等以及北京微软研究院的高斌等研究人员。电脑向来不擅长文字推理类问题,在一个自然语言处理机器里输入文字推理类问题,机器的表现会很糟糕,甚至与一般人的能力相比都相距甚远。
而现在,这一切都在发生着改变。研究人员研发的深度学习机器在处理文字类推理问题方面的能力已经首次超过了一般人。
最近几年,电脑科学家通过使用数据挖掘技术分析巨大的文本语料库,以发现语料之间的联系。这尤其给王华正等科学家统计单词出现模式带来了极大的便利,比如某个特定的词在其他词前后出现的频率。这就使得在巨大的参数空间里,理清单词之间的关系成为了可能。
这样,在这个高纬度空间里就可以将单词看做一个个向量,像其他向量一样,可以使用比较、增值以及减值等数学方法进行处理。这样就会得到诸如下面的向量关系:国王—男人+女人=女王。
这个方法现在已经取得重大成功。谷歌假设相近向量代表的不同语言词序列在意思上是对等的,实现了语言自动翻译。
但是,这种方法有一个显著的缺陷,即假设中,每个单词的含义均由单一向量指代,因此单词的含义也是单一的。而文字测试倾向于使用多义词增加问题的难度。
王华正等人通过查找单词在语料库中的常见搭配解决了这一问题。接下来他们运用运算法则观察这些单词的分布。最后通过词典查出单词的不同含义,并将这些不同含义与不同分布的同一单词对应联系起来。
人类最后的防线 最新版 1.3.5 104.38 MB
下载
湘ICP备2022002427号-10湘公网安备:43070202000427号
© 2013~2019 haote.com 好特网