从Oho到Siri (语言心理学简介)

作者: Vamei, http://www.cnblogs.com/vamei。欢迎转载。也请保留此声明。

这篇是之前贴再新浪博客的文章。准备放弃新浪博客了,把文章暂时贴过来作为备份。这一篇是简介语言心理学的。语言心理学中的许多实验让我印象非常深刻,特别是下面要提到的两个。心理学的许多论点都是建立在行为学实验的基础上的,所以心理学是非常有用的科学学科。心理学和代码很远,但和人很近,希望对园子里的朋友也有用。

 

语言的意义

语言是进化赋予人类的一个重要工具。其基本功能是交流,实现信息的共享。我们利用语音和音调的变化来区分基本音节 (phoneme),再进一步组合成有意义的词。初级的语言在语法的指导下进一步组合成为复杂的句子。利用语言,人类可以以很大的信息量在个体之间交流。这样的交流促进人类的协作,大大提高了物种存活下去的机会。动物也有语言,但相对简单,比如见咆哮、嘶吼,再比如人猿泰山发出简单的"Oho"声。此外,与动物语言相比,人类语言除了结构复杂之外,还具备传递复杂情感的能力。我们可以通过文学作品体味到爱、恨、孤独乃至空虚,也可以通过向朋友叙述来让朋友了解自己的心情,这也是人类语言的一大魅力所在。这种感情功能最终促进丰富的人际关系的形成。许多语言还拥有相应的文字,从而以图形化的方式记录。文字可以保存信息,允许人类的经验和知识得到积累。

语言同样帮助个体的思维。语言实际上是一套语音或图形构成的符号系统。如果没有语言的话,大脑很难将概念抽象化。抽象化的概念对于逻辑思维和记忆都很重要。当我们进行理性思考的时,我们会用一些名词来代替我们常见的事物,比如说"大象"。如果在思考"猎人杀死大象"时候,我们都要重新定义一遍大象的形状和其他特征,就会大大加重注意力 (attention) 系统和工作记忆 (working memory) 系统的负担。语言的抽象同时也可以帮助我们记忆。比如我们常常以语言叙述的方式来组织自己的某段经历。当我们回忆的时候,语言是很好的索引。我们回忆的时候,语言信息(比如说人名、故乡的名字)快速有效的找到相关的回忆。这时,语言信息就好像提供了一套寻找记忆的目录。

 

语言实验

正因为承载着重要的社会和个体功能,人类对语言的使用也在漫长的进化过程中得到了增强。人们的语言系统是由多个脑功能合作实现的,比如听觉、视觉、运动区域、注意力和工作记忆等,但语言相关的动作往往模块化(modularity),其相关神经回路得到强化,并独立地负责语言相关的功能。模块化的功能具有反应快处理快的优势,但也容易被误导。我们可以做一个小测试,请立即说出图中出现的颜色:

尽管我们已经知道,实验要求说出真正的颜色,但相关的文字信息依然会干扰我们的判断。这被成为Stroop effect。当我们看到图片的时候,人脑实际上在执行两个任务,识别真正的颜色和读取文字。第一个任务是由注意力控制的有意识过程,这个过程相对较慢。第二个任务是快速的模块化动作,注意力还没有反应过来,信息已经被读取。尽管我们只想知道真实颜色,文字理解功能还是不断地干扰我们的有意识过程。

在听觉过程中,我们同样可以观察到类似的语言模块化功能,比如Garrett, Bever和Foder在1966年做的实验。我们给参与实验的人播放下面一个句子,并在*号处同时播放一个滴答声:

尽管国庆节让人有一个漫长的假期,但四处*的拥堵还是让人很崩溃。

但是会有许多人会报告说听到的如下:

尽管国庆节让人有一个漫长的假期,*但四处的拥堵还是让人很崩溃。

我们可以看到,滴答声被认为是出现的意义的断裂 (逗号) 处。语言的模块化让我们迅速地形成情境(schema),也就是理解了整个句子的主要意义,再自上而下地补充细节。滴答声不被看作主要意义的一部分,所以是后来补充进去的,所以很容易被放置在这样的意义断裂处。可见,人脑并不是按照先后顺序来接收并理解语言的。

 

语言的本质

现代的几种主流语言之间具有很大的相似性,它们都有很广泛的词汇,也有相当的兼容新信息的能力,这对于信息时代来说非常重要。比如“屌丝”这个词在中文中就被赋予了新的意义,并迅速被人们接受。现代语言也都符合相似的流程,比如两个人的交谈一般会围绕一个主题,不可以随意地跳跃;一个人如果问了一句,那么另一个人的接下来的话就被当作回答。现代语言的相似性曾经让语言学家误以为语种都非常类似,并都可以实现我们上面提到的功能。但是,随着对小语种,特别是封闭的海岛上土著语种的研究,语言学家发现,这些小语种可以和主流语言存在很大的差异。比如说,有的语种中没有“笑”这个概念的词,那么当地人就没有“笑”这个动作。这揭示了现代语言的许多功能都是不断进化来的,而不是一开始就存在。

传统意义上,人们认为语法是逻辑构成的系统,所以语法是理解语言的关键。在计算机时代,由于搜索和语言处理的需要,人们希望计算机能够根据语法来理解一段文字的含义。自然语言理解就是针对这一问题的研究方向。然而,研究人员逐渐发现,由于人类语言的多义性,通过语法分析得到的结果并不可靠。这种方式往往带来很多错误。后来,统计学方法被引入到自然语言的理解中。计算机先经过大量文本的训练,建立统计样本。当计算机遇到一个新的句子的时候,可以根据之前的统计经验,来“猜测”这个句子的意义。苹果公司的Siri产品就是一个获得广泛社会关注的人机语言交互的应用。自然语言理解再取得成功的同时,似乎也暗示了语言的本质:大脑可能是根据统计,而不是语法去理解语言的。具体来说,大脑随着经验建立了一个巨大的文本库,这个文本库中的句子根据其意义分组,当我们听到一个句子的时候,就去寻找这个句子最可能的意义。可以说,Siri带给人惊艳的同时,也让人思考语言的本质。

或许有一天,我们会以一种全新的方式来学习和使用语言。

时间: 2024-09-28 00:09:03

从Oho到Siri (语言心理学简介)的相关文章

《Swift iOS应用开发实战》——第1章 Swift简介

第1章 Swift简介 北京时间2014年6月3日凌晨1点,苹果公司(以下简称苹果)在美国旧金山Moscone中心举行了WWDC开发者大会开幕式,会上正式发布了iOS 8移动操作系统以及OS X Yosemite桌面操作系统.抛开Yosemite不谈,苹果在iOS 8中更新了很多内容,其中包括: 锁屏状态下直接快速删除通知. 支持发送语音信息. 输入法支持预判联想功能. 新增Healthkit健康应用. Siri支持流媒体识别,可以直接通过它购买音乐. 自带相册集成更强大的图片处理软件. 大幅改

《Java遗传算法编程》—— 第1章 简介 1.1 什么是人工智能

第1章 简介 Java遗传算法编程 数字计算机和信息时代的崛起,已经彻底改变了现代的生活方式.数字计算机的发明,使我们能够让生活的许多领域数字化.这种数字化让我们将许多繁琐的日常任务外包给计算机,而这些任务以前可能需要人来完成.这方面的一个日常例子是字处理应用程序,它们内置拼写检查功能,可以自动检查文档的拼写和语法错误. 随着计算机变得越来越快,计算能力越来越强,我们已经能够用它们来执行越来越复杂的任务,如理解人类语言,甚至比较准确地预测天气.这种不断的创新,让我们能够将越来越多的任务外包给计算

Python中title()方法的使用简介

  这篇文章主要介绍了Python中title()方法的使用简介,是Python入门中的基础知识,需要的朋友可以参考下 title()方法返回所有单词的第一个字符大写的字符串的一个副本. 语法 以下是title()方法的语法: ? 1 str.title(); 参数 NA 返回值 此方法返回其中所有单词的前几个字符都是大写的字符串的一个副本. 例子 下面的例子显示了title()方法的使用. ? 1 2 3 4 #!/usr/bin/python   str = "this is string

shiro(1)-简介

简介 apache shiro 是一个功能强大和易于使用的Java安全框架,为开发人员提供一个直观而全面的的解决方案的认证,授权,加密,会话管理. 在实际应用中,它实现了应用程序的安全管理的各个方面. shiro的功能 apache shiro能做什么? 支持认证跨一个或多个数据源(LDAP,JDBC,kerberos身份等) 执行授权,基于角色的细粒度的权限控制. 增强的缓存的支持. 支持web或者非web环境,可以在任何单点登录(SSO)或集群分布式会话中使用. 主要功能是:认证,授权,会话

Tutum公司简介

2015年10月21日,由Tutum公司的CEO Borja Burgos对外宣布,Tutum与Docker公司正式合作,大家对Tutum和Docker的合作还是很期待的.下面我简单介绍一下Tutum公司. Tutum的历史 Tutum创立的时间很难确定.Tutum(拉丁语里安全的意思)的最初构思是在2012年秋季,它是作为Borja Burgos在卡内基梅隆大学(匹兹堡)的研究生课程和在日本兵库县大学的硕士论文,Tutum是一个可以帮助企业过渡到云的安全支持系统. 在2013年初,Tutum有

在应用中加入全文检索功能——基于Java的全文索引引擎Lucene简介

全文检索|索引 内容摘要: Lucene是一个基于Java的全文索引工具包. 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切分词算法的比较 具体的安装和使用简介:系统结构介绍和演示 Hacking Lucene:简化的查询分析器,删除的实现,定制的排序,应用接口的扩展 从Lucene我们还可以学到什么 基于Java的全文索引/检索引擎--Lucene Lucene不是一个完整的全

Linux Namespace机制简介

最近Docker技术越来越受到关注,作为Docker中很重要的一项技术,Namespace也就经常在Docker的简介里面看到. 在这里总结一下它的内部机制.也解决一下自己原来的一些疑惑. Namespace是什么: C++中的Namespace: 首先,先提一下Namespace是什么.最早知道这个名词是在学习C++语言的时候.由于现在的系统越来越复杂,代码中不同的模块就可能使用相同变量,于是就出现了Namespace,来对全局作用域进行划分. 比如C++的标注库都定义在STD Namespa

ENode 2.6 架构与设计简介以及全新案例分享

前言 ENode是一个应用开发框架,为开发人员提供了一整套基于DDD+CQRS+ES+EDA架构风格的解决方案.ENode从发布1.0开始到现在的差不多两年时间,我几乎每周都在更新设计或实现代码.以至于从来没有一个稳定的版本可以提供给大家,非常惭愧.但我相信,随着时间的推移和我的努力的积累,ENode一定会越来越稳定和成熟的.我觉得我此刻很幸福,因为我有自己的兴趣且有机会在业余时间为了自己的兴趣而奋斗. ENode开源地址:https://github.com/tangxuehua/enode

linux内核符号表kallsyms简介

在使用perf排查问题时,我们经常会发现[kernel.kallsyms]这个模块.这到底是个什么东西呢? 简介: 在2.6版的内核中,为了更方便的调试内核代码,开发者考虑将内核代码中所有函数以及所有非栈变量的地址抽取出来,形成是一个简单的数据块(data blob:符号和地址对应),并将此链接进 vmlinux 中去. 在需要的时候,内核就可以将符号地址信息以及符号名称都显示出来,方便开发者对内核代码的调试.完成这一地址抽取+数据快组织封装功能的相关子系统就称之为 kallsyms. 反之,如