> 硕士毕业论文 > 38650字硕士毕业论文基于第二语言教学的当代汉语核心词综述

38650字硕士毕业论文基于第二语言教学的当代汉语核心词综述

论文类型:硕士毕业论文
论文字数:38650字
论点:核心,语言,汉语
论文概述:

语言研究的大量事实早己证明,以意义为标准很多时候是不可靠的。意义没有直观性,比较抽象空灵,意义标准存在不好把握,不便操作的问题。所以借助意义的联想有时候难免主观,最多只能

论文正文:

目前,国内语言学界对核心词的研究兴趣日益浓厚,其中最值得注意的是南京师范大学的李嘉宝先生的研究。 李嘉宝(2002)从宏观角度描述了汉语元语言系统,指出语言元语言包括三层含义:用于语言交流的最小日常词汇,用于词典编纂和语言教学的释义元语言,以及用于语义特征分析的语义元语言 源自不同类型研究的元语言单位是不同的。 其中,概念层面是“语言交流的最低日常词汇”?它基本上等同于我们正在讨论的核心词,并大致概括了词汇元语言系统的构建。 本研究从宏观角度出发,通过对比分析,从三个平衡语料库中提取现代汉语中的常用词,并根据标准化和概括性原则删除核心词。 在此基础上,从微观层面进行删除和选择,并在最小语义场中安排分词类,使核心词的优化以证据为基础,从而最大限度地保证第二语言教学核心词的科学性和客观性。 语义范畴框架的建立也使得核心词的语义分布一目了然,使得核心词的研究更深入到微观层面。 第一章是核心词的定义。第一部分是关于核心词的概念。核心词汇是西方语言学家提出的一个概念。 虽然许多语言学家和语言教师认为核心词的概念是合理的和无可争议的 然而,事实上,不同的研究者从不同的角度对核心词有不同的理解。一般来说,核心词主要有以下七种。1.核心词是整个语言系统中最常用的词 由于书面语言中的单词总是更容易计算和研究,这一定义实际上在很长一段时间内被默认为“书面语言中最常用的单词”。 例如,M. West) 1953年英语词汇是基于包含500万单词的书面英语材料的统计。 这里的核心词是指具有关键点的最常见单词的原始统计数据,例如词汇中的前850个单词、前1000个单词、前2000个单词或前3500个单词。 2.核心词是在任何领域和风格中使用最广泛的词。 卡罗尔、戴维斯和里奇曼(1971)认为,从统计学的角度来看,核心词在各种文本中有非常广泛的分布率。 从这个意义上说,“核心”是由语言的统计背景决定的。这些词在最广泛的语域中经常使用。 (2)这一定义是对“有用性”或“价值”一词的衡量 从计算语言学的角度来看,这些词可以不受限制地用于非常广泛的风格和语境中。 这是一个“在任何时候”的词,而不是“在某些时候,在某些情况下,为了某些目的” 3.核心词是特定文体中最常用的词 持这种观点的学者认为,口语和书面语的核心词汇是不同的。 从整个语言中提取的词汇,无论是口语还是书面语,都没有实际意义和价值。 核心词在口语和书面语中有自己不同的表达方式,典型的口语和书面语应该正确标注。 1995年版的《朗曼当代英语词典》清楚地标记了口语和书面语中单词的不同用法,标记了3000个口语和书面语中最常用的高频单词,这在以前的学习词典中是前所未有的。 有些条目分别表示口语和书面语的使用频率。 此外,一些只在口语中使用而不在书面语中使用的单词在条目旁边标有“嘴”。 核心词的定义是从第二语言习得的角度出发的 《牛津英语词典》导言指出,英语词汇不是“一个有明确界限的固定数字”,而是“一个有清晰核心的模糊块,像影子一样向四面八方分散,直到看似无穷无尽的边缘” 从文体角度来看,书面语、文本语、口语和口语都不属于词汇的核心。从来源来看,外来词和方言词不属于核心词的范畴。从语域的角度来看,科学术语和技术术语等专业术语不在核心词的范围之内 我们可以用索绪尔对语言和言语的划分来理解这个概念。现代汉语词汇系统有两个层次,内层是语言词汇,外层是言语词汇 核心词是语言词的主干,占据中心地位。 正是口语词、方言词、外来词、书面语词、特殊术语和贸易词与之毗邻,相互渗透力强。 这些单词是围绕中心部分的核心单词构建的。中间部分和四个边不明显,但有一个广阔的重叠区域。 这一层次的词本质上是语言性的,具有静态和稳定的特征。它们越依赖中间部分,这一特征就越突出 人、地方、组织和数字的名字构成了单词的层次,单词漂浮在语言层次的外围。 它们漂浮的原因是它们不够稳定,大多数活跃在特定的环境中,没有进入整个社会的一般范围。 核心词和非核心词之间没有明显的界限。它们之间有一个中间状态。整个词汇系统逐渐从核心词过渡到非核心词 因此,核心词可以分为典型类和边缘类。更准确地说,一个词更接近词汇的核心水平,或者用程度来描述核心词。 第二,核心词和释义元语言在过去十年的词汇研究中,释义元语言研究已经成为汉语核心词研究领域的热点话题 解释元语言是一种用于解释词典中收集的词的定义语言,其数量有限。 相关词表的提取是第二语言教学中核心词和释义元语言研究中最基础的工作。 从所使用的语言材料来看,释义元语言是词典中排除例句的释义语言。大多数词典使用权威的《现代汉语词典》。第二语言的核心词是从自然语言中提取的。 从词典模式的要求来看,释义元语言强调选词的规范化,追求文体上的浅层文体,避免使用口语色彩的词语。然而,第二语言教学的核心词汇追求词汇的普遍性和易学性,不包含古雅书面语言色彩的词汇。 从语义构成的角度来看,释义元语言强调各个方面,不能过轻或过重。 《今汉》第五版包含10500多项科技,占16项。书中65,000项中的15%? 因此,除了特殊的释义术语之外,释义元语言还包括相当多的百科术语 例如,在从苏新春提取的4000种中文释义元语言中,约有70种特殊释义术语和500种百科术语。 然而,基础阶段第二语言教学的特点决定了第二语言教学的核心词汇以日常生活为中心,注重词汇的生活性,注重食物、衣服、住房和交通,百科全书式的词汇只占很小的比例。 第二章核心词的标准和选择方法第一章核心词标准1。共性是衡量核心词最基本的标准,而另外两个标准是基于共同标准,是对共同标准的进一步补充和限制。 没有常用,核心词的科学性和实用性就无从谈起。 衡量单词是否被普遍使用的客观标准是单词在语言中使用的频率。 频率(Frequency)一般指在一定时间和范围内单词出现的次数。频率是指在一定时间内和一定范围内出现的字数与总次数之比。 如果一个单词在文本中出现的次数越多,出现的频率就会越高。如果出现次数少,频率低。 词频显示了一个词的社会使用密度和人们的熟悉程度,这是词语普遍使用的一个重要标志。 然而,常用是现代汉语核心词的必要条件,但这并不是充分条件,频率标准也是有限的。 因为频率指数的可靠性是相对的 假设10种词汇大致相等的语言材料中有8个单词和2个单词B,单词A的出现频率略高于单词B,但单词A只出现在一种语言材料中,而单词B出现在所有10种语言材料中。显然,单词B比单词A更有用。虽然单词B的出现频率比单词A低,但它在语言材料中的分布比单词A广得多 显然,频率有时会掩盖语言事实的真相。 第二,平衡标准是对常用标准的补充。 核心词必须是语言中的高频词,但它们必须同时均匀分布在最广泛的语料库中。 不同类别、风格和主题的比例会影响语言材料的统计结果,因此我们不能仅用频率作为判断同一种语言是否被普遍使用的唯一标准。 词汇统计中的分布率是指词汇出现的文本数量与统计的文本总数之比。 正如法国学者缪勒所说:“如果频率的概念没有立即与分布的概念结合起来,那么频率的概念的价值就不高。” 第三,稳定性和稳定性是对共同标准的进一步限制,是时间分布均衡的体现。因此,核心词不包含来去匆匆的社交热门词。 核心词是语言的核心,在时间上无疑是稳定的。 稳定性是一个相对的概念。用语言描述的社会正在发展。核心词不能是常数,稳定性也不是固定的。 核心词的稳定性是一个整体,不是一成不变的。 核心词的主要部分是稳定的,但它不排除局部的“新陈代谢” 平衡和稳定的标准要求必须选择一个有代表性的平衡语料库来提取核心词,以使词汇中所选的词相对科学和客观。 第二节核心词数量的计算我们将首先考察现代汉语词汇的分布,从理论上计算和论证现代汉语中的核心词数量,并在此基础上,充分考虑初级阶段第二语言习得的规律,辅以第二语言教学的经验来论证第二语言教学中的核心词数量。 首先,共同核心词的数量首先分别考察小语料库和大语料库中词的分布。 《现代汉语频率词典》(1985)选取了四种不同主题和体裁的语言作品,共计180万字。 统计数据显示,175个单词可以覆盖180万单词语料库的49%。1230字可以覆盖76%;3000字可以覆盖86%;5000字可以覆盖91%;8000个单词可以覆盖95%的语料库。 《中国语言与生活状况报告(2005)》中的统计数据显示,在9亿字的语料库中,只有627个字能够覆盖50%。4000字以上可以覆盖80%;11,000个条目可以覆盖90% 随着语料库的增加,统计覆盖率会略有下降,因为海量语料库中的大量异常词部分淹没了统计结果。 然而,词覆盖的分布仍然突出了高频词集中的特点。 苏新春(2007)对现代汉语通用语料库分布的统计显示,共有48066个专名,分为人名、地名、组织机构名和数字名四个典型类别,占所有词的31.7%。人名、地名和组织名是典型的词语。十多个数字可以简单地类比,可以被视为数字短语,这些数字短语不在我们的研究范围之内。 如果排除近30%的这类词,中文词的覆盖率明显高于上述统计结果。 《朗曼当代英语词典》的作者指出,除了3000个常用词之外,选择其他词没有严格的客观性。 例如,当词频在4000到8000之间时,即使对于母语是汉语的人来说,也很难区分哪个词比哪个词更重要。 在这个阶段,任何频率的差异与其说是汉语相对词频的真实反映,不如说是语料库中包含的单个文本的反映。 在任何语料库的后半部分的词汇中,一个词与其相邻词之间的频率差异将完全消失。 这是因为无论语料库有多大,低于这一点的单词只出现一次。 第二,第二语言教学的核心词数量主要是针对汉语初学者的。在调查普通核心词数量的基础上,还要充分考虑初级阶段语文学习的具体任务。 第二语言教学的初级阶段主要侧重于基本语言技能的培养和日常生活交际能力的培养,在内容上侧重于“衣食住行”和娱乐。 我们可以看到第五十课的主题都集中在日常生活上。语言的使用环境主要局限于个人生活领域,较少涉及经济、政治、法律和科技等公共社会内容。 与整个现代汉语词汇的分布规律相比,高频词在口语生活语料库中的覆盖面更广。 《现代汉语频率词典》选择反映日常生活方方面面的剧本和名著、相声和歌谣,此外还随机(以书面形式)收集了一些关于特定主题的口语材料,共计201,892个单词 统计数据显示,前100个单词的累计频率是52。5891%,前1000个单词的累积频率为84。7863%,前2000个单词的累计频率为91。6520%,前3000个单词的累积频率为94。8356% 使用频率最高的前2000个词的覆盖率已经达到相当高的水平。 根据王慧(2011)对从新加坡国立大学“汉语口语对话语料库”中随机选取的204份录音材料的统计,在83万字的汉语口语语料库中,2550字的文本覆盖率达到95% 这意味着掌握大约2500个核心单词可以开始与母语为汉语的人进行广泛的日常对话。 虽然分析材料是新加坡中文,但统计结果仍值得借鉴。 目标语言国家的正式课堂语言教学有严格的时间限制。基础阶段通常为一年,有效教学时间约为800小时。 根据几十年对外汉语教学的实践经验,在第一年的初始阶段,第一阶段的前3-4个月的词汇量接近1000个。过去4-5个月的第二阶段词汇接近1500个 邱军和李宁(1999)查阅了各种小学语文教科书,并征求了一些有20多年对外汉语教学经验的老教师的意见。初步结论是,小学阶段3000个词汇的标准稍高,只有少数亚洲学生能达到,2600到2800个词汇是相对合适的。 杨继洲(2003)指出,从理论上讲,初级阶段的对外汉语教学是一种短期的、快速的教学,在谈及初级阶段汉语教材的编写时,把词汇量控制在2500个更合适——这是需要注意的问题。 (3)由此可以推断,用于第二语言教学的汉语核心词的数量应少于3000个,约为2500至2800个 第二章核心词的标准和筛选方法……28第一节核心词标准……281,普通……282,平衡……28第三章现代汉语常用词的提取……51第一节基于语料库的常用词提取……511,……512,……53,第四章,现代汉语常用核心词的选择,……71,第一节,现代汉语常用核心词的选择,……711,……712,通用词汇的非通用组成部分,常用同义词库的标准化……71第二节非常用词的筛选……71 .结论核心词是初级阶段语言学习的重点,这并不意味着其他词根本不需要掌握 核心词的范围应该是灵活的和相对的,而不是僵化的。 一方面,任何类别都分为典型成员和非典型成员,整个词汇系统是从核心词到非核心词的逐步过渡 另一方面,词汇发展的科学性总是相对的。 语言符号的随机性决定了语料库统计永远不可能有“标准答案”,而只能有“一般情况” 初级阶段语文教学的任务是规范口语,中级和高级阶段逐渐向书面语倾斜。 相应地,初级阶段和中级阶段在汉语教学词汇发展中所使用的语料库应该是不同的。 初级阶段汉语学习的特点应该是建立一个真正符合其特点、主体平衡的标准口语语料库,而不是一般意义上的平衡语料库。 从内容的角度来看,超出中国学习者生活视野的文本,如那些极端意识形态化的、地方性的或远离时代的文本,应该被仔细收集。 参考[一世]曹晖。《现代汉语口语和书面语差异初探》,[著。语言教学与研究,2003,(06)。[2]崔建新,张文显。不同文体中连接词用法的统计与分析[。第七届中国语文教学国际研讨会论文选编([)。北京:北京大学出版社,2004。[[3]崔锡良。张宝林。《全球汉语学习者语料库建设方案》,[。语言应用,2011 (02)。[4]戴夏青,苗东霞。《第二语言(汉语)教学中的难点》,[。《语文学习》,2008(05)。[5]段叶辉。语气副词的分布与汉语学习的语用功能。1995(04)。[6]冯胜利。论汉语词汇的多维性[。当代语言学。2001(03)。[7]冯胜利。论中国书面形式风格的特点及教学[。《世界汉语教学》,2006(04)。[8]冯志伟。《中国语料库研究的历史与现状》,[,2002年。[9]冯志伟。[应用语言学语料库导论。北京:世界图书出版公司,2006。[10]冯志伟。论语言符号的八大特征[。暨南大学中国学院学报,2007(01)。