当前位置: > 博士毕业论文 > 39570字博士毕业论文汉语词汇识别和词汇心理表征的理论研究

39570字博士毕业论文汉语词汇识别和词汇心理表征的理论研究

论文类型:博士毕业论文
论文字数:39570字
论点:词素,表征,单词
论文概述:

语言表征系统的组织形式符合激活扩散模型的加工原理,词素激活的强弱受复合词结构的影响。词汇的通达识别,同样存在着类似特征整合的过程,即早期的词素的前注意的自动激活和其后的语

论文正文:

第一章:单词识别和单词的心理表征

 理论语言是人类特有的高级心理机能。语言是以语音和字形为物质外壳,以词汇为建筑材料,以语法为结构规律而构建的体系。词汇又叫单词,人们如何表征和加工单词,一直是认知心理学家重要的研究课题。 1单词识别的心理过程 单词是构成话语的、能够独立运用的、音义结合的基本语言单位。单词是语言的块件,单词和单词的组合表示我们所处的万千世界中林林总总的物体和事件。在日常的口语交际和书面语言中,人们自由使用的语言单位都是单词。在口语中,单词是音与义的结合体,它不仅传递声音与意义信息,还传递构词法与句法信息。在书面语言中,单词还具有图形信息。单词的作用是标志事物或对象,或传递事物的信息。词形与词音是单词存在的外在形式,词义是单词所指称的事物或现象。人们通过听觉、视觉输入词形或词音信息,在头脑中激活它所指称的事物或对象,即词义,这个过程就是单词识别的过程。单词识别不仅依赖于词音、词形的感觉输入,还依赖于人脑中已有的关于词的各种知识(心理词典),这些知识能对输入的感觉信息进行解释和预测。这就是说,单词识别是在心理词典中进行查询和搜索的过程。当人们根据词形或词音在心理词典中找到了相应词条,并获得对它的解释时,这个词也就被识别了,这就是词汇通达(lexicalaccess),即指根据词形或词音在心理词典中找到了相应条目和理解它的意义的过程。单词识别需要经历一定阶段,消耗一定时间,并完成一定的心理操作。J.I.chumbley和D.A.Balota单词的识别分为两个阶段:(l)词汇通达阶段,即将单词的视觉特征与心理词典中的一个项目进行匹配,从而达到一个词汇项目,或者说是在心理词典中找到了一个词的位置;(2)语义决定阶段,即确定词义、发音和与单词有关的其他信息。而M.s.seidenbeng则把单词识别分为3个阶段:(1)前词汇加工,即分析书面语言或口语的输入,把它确定为一个特定的词;(2)词汇通达,即激活与词典项目有联系的语义、语音、正字法和其他信息;(3)后词汇加工,即选择、精细加工和整合词汇的信息,以便理解句子和话语。在知觉的模式识别中存在着两种形式加一〔:即自下而上(Boftom一up)和自上而下(Top一Down)的加工。自下而上加卜是指由外部刺激开始的加工,通常是从较小的知觉单元进行分析,然后再转向较大的知觉单元,经过一系列连续阶段的加工,达到对知觉刺激的解释。

1.1自动搜索模型

K.1. Firth在20世纪70年代中期提出了一个单词识别的自动搜索模型。他把心理词汇比作图书馆。一个单词就像一本书。它只能放在心理词汇/图书馆的一个地方,但是它的位置可以在不同的索引目录中找到。单词有一系列的扫描方式。扫描后,在输入的感觉信息和条目之间找到合适的匹配。在该模型中,有三个可访问的文档:(1)用于识别书写字符的正交可访问文档;(2)用于识别口语的语音访问文档;(3)用于识别意义的语义/句法文档。有了这三个可访问的文档,可以在阅读、听力和口语时搜索条目。这些访问路径一次只能使用一个(就好像一次只能从一个目录中找到一本书)。也就是说,感知一次只能以一种方式使用。如果我们边听边读一个单词,存取时间是不能缩短的。当一个单词以视觉或声音显示时,可以根据单词开头的字母或声音来建立单词的完整表示,并在可访问的文件中激活。一旦一个人根据单词的提取代码(相当于图书卡框中的索引)找到单词的位置,他就可以通过指针在主文件中找到单词项,这就是心理单词。在主文件中,一个单词的条目包括其所有的语言信息(含义、拼写、发音、词性、句法、语用等)。)。主文档由许多称为“盒子”的存储单元组成。

 1.2单词发生器模型 英国心理学家J.莫顿于1969年把特雷斯曼的关于心理词典的假设发展成为一个比较完全的、清晰的单词认知模型,即单词识别的发生器模型,以后又经过几次修改。这个模型提出来后,引起了心理学家的注意,并且在70年代成为最有影响的模型。时至今日,仍然有重要的影响。单词发生器模型的基本思想是:词的提取并非靠它在心理词汇中的位置,而是靠它激活到一定阂限的程度。那么激活如何发生?是什么决定了一个词的闺限?莫顿用logogen来代表心理词典中的词条,logogen源于拉J一文fogos和genus,意思是单词和发生。他认为每一个词(或词素)都有它的logogen(词汇发生器),它的功能像一个记分板,记下词条和知觉刺激共享特征的数目,也可以说是一个特征计数器。这些特征把所有正字法的、语音的输入累加起来,以决定提取哪个词条。这个计数器对于知觉的和语义的信息都很敏感。当知觉系统的输入与相应词条一致时,它的计数就会增加;同样,当一个语义上有关的词出现时,通过在词汇网络内的交流,词条的计数也会增加。每一个logogen都有一个阐限,当计数超过闲限时,这个词就被认知了。一旦一个词被认知,相应的logogcn的闽限就会降低,这种降低会持续一个相对长的时间。由于高频词的闽限低,低频词的闽限高,所以所需要的计数也不同,对它们的反应也就不同:对高频词的反应快,对低频词的反应慢。因此logogen模型在一定程度上解释了单词的词频效应。另外,Morton的理论指出,各种方式的输入可以加在一起发生作用。这些不同来源的输入,平行地运作,相互竞争,最后提取出正确的词。词汇发生系统根据候补词和输入词的共享特征之不同以计算出其相对频率。如果几个词条都达到闽限,数目最高的“胜出”,即被“辨认”。当词汇发生器激发出相应的词,其他词汇发生器便会恢复到原来的静止状态(即特征记数器为0)。词汇发生器系统在辨认出一个单词后,又准备处理另一个词。词汇发生模型也能对启动效应和语境效应做出较好解释。 2词汇心理表征的理论 人的各种知识是相互联系、相互渗透、相互制约的。人在认知过程中,知识与知识之间彼此相关、互相联结,组成一个不可分割的系统。心理词汇是一种关于心理图式的假说。人类的知识是以越来越复杂的整合方式来结构和组织的,最简单的水平就是图式,它是能够作用于客体知识(例如单词识别)的心理表征。个体所以能够识别语音和文字,对单词做出反应,说明个体具有能够同化这些刺激的某种图式,即大脑中拥有一部能够识别单词的心理词典。所谓“心理词典”,是指“永久性储存于记忆中的词及词义的心理表征”。知识在心理词典中的表征及组织形式便成了探索单词识别心理过程中最为核心的问题之一。第一个语义表征的认知模型是由Collins&Qullian(1969,1970)提出的层次网络模型,又称作“可教的语言理解者”。该模型认为,贮存在知识系统里的信息是由单位、特征和指向连结组成的,并以分层形式构成网络。单位和特征表示概念,每一概念在网络中的位置称作“节点”(node)。一个节点只与和它有关的特征信息直接连结,当然也与它所属的范畴或它所包含的成分直接连结。但是,单位和特征分别代表不同的概念。作为单位的节点,对应于一个客体、事件或思想,所以该单位是事物的单位。作为特征的节点,用来说明一个单位的结构,相当于一个语句的谓语、形容词、副词的概念。需要指出的是,虽然单位和特征对等于句子的词,但它们指词在知识系统里的位置,而不是词本身。至于指向连结,主要指连结各个节点的连线,借此使各个节点构成网络。指向连结可以把心理词典中的某一词汇与概念中的相应单位连结起来,也可以把一个单位与另一个单位连结起来,还可以把一个单位与一个特征连结起来。在层次网络模型中,一个单位由一组指向连结排列而成,一个特征也是由一组指向连结排列而成的。同时,一个低层的单位也可以与一个高层的单位相连结,一个特征也可以与该单位的属性及其属性的量值(value)相连结。由此,语义知识便可表征为一种由相互连结的概念组成的网络。范畴大小效应(即语义距离效应)便是该模型最为有力的实验证据。但是词汇识别过程出现的熟悉效应、典型性效应和否定判断却成为了它的反例。 第二章汉字识别与多词素词的表征与加工理论 汉语是世界上使用人口最多的语言。汉字是世界上最古老的文字,也是世界上最独具特色的一种文字。汉字与其它语言文字既有相似的一面,也存在着很大不同。和拼音文字一样,汉字也是形、音、义的统一体。因此,在汉字识别中,同样存在复杂性效应、相似性效应和频率效应等。但是,汉字是方块字,属于平面型文字,每个汉字都是一个结构紧密的图形,这和拼音文字按线性方式排列有所不同。另外,汉字具有较强的表意功能,是一种典型的深层文字,不存在形一音对应或形一音转换的规则。因此,对汉字的信息加工或心理操作便呈现出独有的特性。正是这些独具特色的结构和加工过程,吸引了国际上众多心理学家的目光,使其成为当今认知心理学的研究重点和热点。开展汉语和其它语言认知的比较研究,不仅有助于揭示语言认知的普遍性,而且有助于揭示语言认知的差异性,有助于建立具有普遍意义上的语言认知心理学说。 1汉字识别的心理加工模型 由于汉字识别研究在广度和深度上都有较大发展,一些较有影响的汉字识别认知模型得以建立。了解和掌握这些认知理论,对于把握汉字识别的内在心理过程具有非常好的理论指导意义。Biedermam(1987)针对物体识别提出了经成分识别模型。这一模型来源于结构理论,该理论认为,模式识别不仅依赖于物体特征,而且依赖于特征之间的关系。一个物体的二维视像都由一些简单成分(即几何离子gcon)组成。各种不同的geon按不同关系(relation)组合起来,组成不同的物体。这一模型将物体识别分成5个阶段:(1)边界的抽取:(2)非偶然性特征的检测和对凹凸范围进行分析;(3)成分的确认;(4)将成分与物体表征进行匹配;(5)对物体的确认。Huang和Wang将RBC模型进行修改,提出了汉字识别的经成分识别模型。他们认为,汉字也是一种二维图形,与Biederman二维的物体图形有许多相似之处。因此,汉字识别与物体识别可能具有共同的心理过程:即汉字识别开始于特征抽取,然后进行非偶然性特征的搜索和分析字符范畴,其次是字成分及其关系的激活,接着是字符模型的激活,最后是汉字确认。 2多词素词的表征与加工理论 词素是音义结合体,是最小的能独立运用的造词单位。所谓“最小的”与“独立运用的”都是就造词而言的。词也是音义结合体,是最小的能够独立运用的造句单位。从词与词素的定义中,我们可以发现,除了是不同的单位外,二者其它特点都相同,它们在一定条件下可以互相转化。一个或一个以上的词素构成一个词。词素构成词有两种情况:一种是词素独立成词;一种是与其它词素组合成词。这种可以独立构成一个词的词素称为自由词素,因为它本身可以作为具有独立意义的词来使用;而“unluck”则由词素un一与luck构成。在英语中,词素un一表示否定意思,但是不能独立使用,而必须附在其他词素之前。汉语中作为构词基本部件的单字(词素),在数量上是有限的,在表义功能上是相对稳定的。并且,许多汉字都具有独立意义,即其本身可以成为一个词,有些词则有两个以上的词素所构成,称为多词素词。由于识别和理解词汇的依据是单字属性,所以单字的构词规律及表征组织形式就成为汉语信息加工中引人关注的问题。 

2.1语素访问表示模型

在前缀词识别过程的研究中,发现前缀词识别需要词缀剥离过程。他们认为单词识别是通过词干提取来实现的,并提出了词缀剥离模型。根据这一理论,单词识别经历两个层次:可访问文档和主文档,它们相当于可访问表示和语言表示。主文件存储与单词相关的语言信息;访问文件存储访问单词所需的信息。对于多语素单词,词干存储在可访问的文件中。访问文档的编码基于形状的相似性和频率,处理过程是序列搜索。塔夫特和福斯特:在词缀剥离研究的基础上,他们进一步提出了复合词表征和识别过程的语素可及表征理论。他们认为心理词典中的多语素词是由分解语素来表征的,在可及表征层面上只有不可分的语素,没有独立的词条。词以语素分解的形式存储在可及表示中,所以它们也被称为语素分解存储的可及表示理论。在识别中,整个单词的输入被分解成语素单元,语素单元被激活以达到它们各自的白色语义表示,然后它们被集成(即,可访问表示中的信息被集成并映射到语言表中)。最后,获得整个单词的含义,从而完成对整个单词的识别。因此,语素分解和表征的突出优势之一是认知经济,即大量的词可以用少量的语素单位来表征。在汉字方面,张碧音等人(1992)发现双字词的语素结构在字词的认知中起着一定的作用,并在此基础上提出了双字词的分解和储存理论。他们认为,在心理词典中,两个字的表征是以分解的形式存储的,即以词(语素)表征为存储单位,两个词表征之间存在不同的联系,从而形成一个网络。语素结构决定了单词表征之间的关系。语素结构信息包括词的类别、词的语法类别、心理词典中两个词之间的距离和联系强度等。然而,许多复音词,如派生词和复合词,其意义不能简单地从语素的意义中推导出来。在汉语中,也有大量语义不透明的词。所谓语义透明是指复合词的语义能够从构成语素的语义中推断出的程度。它的操作定义是整个单词与其语素语义相关的程度。例如,不透明单词“粗心”和“老虎”的语素意义不能整合整个单词“粗心”的意思。因此,对于语义不透明的词,要准确地从可访问表示映射到相应的语言表示,必须有独立的可访问表示。即使对于语义透明的词,它们的语义也不是两个语素语义的简单叠加。因此,有必要引入全词表示法。

2.2整词通达表征模型 整词通达表征理论认为,多词素词在心理词典中以整词形式表征,即在通达表征中存储的都是整词,每一个词都有独立的词条,没有单独的词素表征。单词识别的过程是由刺激输入直接激活相应的单词表征。当然,整词通达表征模型并不否认词素在其中所起的作用。它认为单词的词素关系可通过某种方式蕴藏在通达表征层次的结构之中。Lukatela(1980)等人提出了关于名词表征的卫星模型。该模型认为,名词的每一个词尾变化形式都有各自的词条。而没有词尾变化的那个单词(另外还有一些由此单词通过词尾变化派生的)独具有优势,并作为核心与家族其它成员相连,犹如宇宙天体与卫星的联系。Cole(l990)等人发现,后缀词的词汇识别时间受词根累积频率影响,但前缀词却无此效应。同一词素家族(即词根相同)的派生后缀词的词汇识别时间受整词频率影响。由此他们认为,前、后缀词在心理词典中以整词形式存储,这些词素的结构受它们家族组织的影响。家族成员通过编码词缀词的词素、句法、语音等特质,使到它们之间相互联系。词根就成为词素家族的核心。词汇就是通过这个词根核心通达的。家族成员是按频率高低进行搜索的。前、后缀词在加工上表现了一定的差异:在后缀词加工过程中,由于从左到右的加工原则,词根先被通达,从而使词根频率对词汇识别产生了影响;由于前缀词的词根并没有优先于整词加工,所以,它的词根频率也就没有影响。 第二章汉字识别与多词素词的表征与加工理论...........161汉字识别心理过程加工模型...........162汉语多词素词的表征与加工理论...........18第三章汉语多词素词实验研究的范式和结果...........221重复启动的范式...........222语义启动的范式...........24第四章本研究的理论假设和研究范式...........271以往研究的局限...........272本研究的理论假设...........283本研究的实验范式...........29 结论 在语义不透明词的识别中,整词的激活相对就要晚些。而且,随着激活过程进行,词素激活和整词激活就会出现“此消彼长”的现象。在加工早期,主要是词素激活,在加工晚期,主要是整词激活。这样,就能在nC模型的基础上,较好地解决词素与整词的动态关系,特别是能较好地说明了在语义不透明词的加工中,整词的意义提取是如何进行的,以及为什么会出现词素和整词激活的相互抑制和此消彼长的现象。当然,这一模型只是我们的一个初步的设想,要证实它尚需要进一步的研究。
 参考文献 1彭聊龄.语言理解.当代心理学研究.北京大学出版社,1993,107一1752桂诗春.新编心理语言学.上海外语教育出版社,2000,250一2983李维.认知心理学研究.浙江人民出版社,1998,52一%4朱曼殊等.心理语言学.华东师范大学出版社,1990,184一2045王苏汪安圣.认知心理学.北京大学出版社,1992,30一786傅爱平.汉语信息处理中单字的构词方式与合成词的识别和理解.语言文字应用,2003,4,25一337吴景文,皇甫恩.启动效应与知觉表征系统.心理学动态.1994,01,47一518喻柏林,曹河析.笔画数配置对汉字认知的影响.心理科学,1992,4,5一109谭力海,彭耽龄:关于语境与汉语单字词特征分析之间关系的实验研究.心理学动态,1988,2,5一1010谭力海,彭腆龄.快速呈现条件下语境与词频对中文语词识别的影响.心理科学通讯,1989,2,1一6