语料库利用的两个问题课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《语料库利用的两个问题课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语料库 利用 两个 问题 课件
- 资源描述:
-
1、关于汉语作为第二语言教学研究中关于汉语作为第二语言教学研究中语料库利用的两个问题语料库利用的两个问题福建师范大学 沙平第1页,共55页。一、语料库与语料库语言学1.1 语料库(语料库(corpus/corpora):):是存储语料的数据库,是以电子文本或其它电子介质形式存贮在计算机中的、借助计算机软件进行管理并可以通过计算机软件进行查询、检索、统计的一定数量的语言材料的集合,是进行语言研究的一种普遍资源。第2页,共55页。一、语料库与语料库语言学1.2 语料库语言学语料库语言学(corpus linguistics):包含两个方面:(1)语料库建设,包括对自然语料进行加工、标注;(2)语料库应
2、用,用已经标注好的语料进行语言研究和应用开发。是以现实生活中人们运用语言的实例为基础进行的语言研究,可以在研究中发现某些语言规律,也可以对语言假说进行验证。第3页,共55页。一、语料库与语料库语言学1.3 汉语中介语语料库建设汉语中介语语料库建设 汉语中介语语料库的建设是在国内外语料库语言学和母语语料库建设的影响下开始的。国外第一代计算机语料库(196070年代):小规模(百万词级),以语言研究为导向,词法级。Brown、LOB、London-Lund Corpus。第4页,共55页。一、语料库与语料库语言学 第二代计算机语料库(1980年代):大规模(千万词级),词典编纂应用导向,句法级。B
3、ank of English、Longman、ICE(The International corpus of English)。第5页,共55页。一、语料库与语料库语言学 第三代计算机语料库(1990年代):超大规模(上亿词级),标准编码体系深度标注/多语种NLP应用,语义和语用级。BNC(The British National corpus)、LDC(Linguistic data Consortium,语言学资料共享计划)、法兰西语料库、俄语国家语料库、NERC(Network of European Reference Corpora,欧洲参考资料语料库网/欧洲语料库网(Europea
4、n Corpora Network)。第6页,共55页。一、语料库与语料库语言学 第四代语料库:互联网作为语料库。可以把不断发展的因特网作为虚拟语料库。第7页,共55页。一、语料库与语料库语言学 中国大陆的语料库建设中国大陆的语料库建设:始于80 年代初期,发展迅速。例如:“汉语词频统计语料库”为200万字次;“现代汉语语料库”为7000万字次;“中文五地区共时语料库”每年收入的语料达6亿至8亿多字次;“面向语言教学研究的汉语语料检索系统CCRL”为8亿多字次。第8页,共55页。一、语料库与语料库语言学 在这种背景下,从上世纪90年代开始,中国大陆开始建设外国人学习汉语的中介语语料库。经过10
5、多年的发展,汉语中介语语料库建设已初具规模,并在汉语作为第二语言教学与习得等研究领域发挥了重要的作用。第9页,共55页。一、语料库与语料库语言学1.4 已建成的主要汉语中介语语料库已建成的主要汉语中介语语料库 北京语言大学:汉语中介语语料库系统(1995)、HSK动态作文语料库(2006)、首都外国留学生汉语文本语料库(2010)、汉语学习者口语语料库(2007)南京师范大学:外国学生汉语中介语偏误信息语料库 中山大学:留学生中介语语料库 暨南大学华文学院:留学生汉语中介语语料库第10页,共55页。一、语料库与语料库语言学 上海交通大学、厦门大学、北京大学、中国人民大学、北京师范大学、鲁东大学
6、、苏州大学、四川外国语学院、华中师范大学等,也都已经建成或正在建设自己的汉语语料库。但是,现有的语料库绝大多数都是书面语语料库,口语语料库很少,多模态语料库尚无建成者。第11页,共55页。一、语料库与语料库语言学 1.5 作用与成果作用与成果 通过对语料库中较大规模真实语料的考察,研究者发现了前人未曾发现的一些汉语中介语现象。语料库为定量分析奠定了坚实的基础,研究者可以把定性研究与定量研究相结合,从而使得出的研究结论具有较强的客观性、普遍性和科学性,这在一定程度上改变了汉语教学与习得研究的模式,极大地提高了汉语作为第二语言教学研究的水平。第12页,共55页。一、语料库与语料库语言学 研究案例一
7、:关于汉语补语的习得难度与研究案例一:关于汉语补语的习得难度与习得顺序习得顺序 一般认为有复杂的补语系统是汉语语法的一个特点,也是外国学习者习得汉语的一个难点。但是,北京语言大学的课题组利用“汉语中介语语料库”对带“得”字补语句的习得状况进行了考察,发现学习者习得“得”字补语句的偏误率没有人们想象的那么高。(见下表)。第13页,共55页。“得”字程度补语句的习得状况形形 式式词词 次次正误比正误比 +得得+多多3228/4 +得得+很很1712/5 +得得+不得了不得了87/1 +得得+厉害厉害22/0 +得得+慌慌22/0 +得得+要命要命11/0 +得得+远远11/0第14页,共55页。“
8、得”字情状补语句的习得状况一级一级二级二级三级三级四级四级五级五级六级六级合计合计正413140311922184误614764239 (孙德金2002,赵金铭 2008)第15页,共55页。一、语料库与语料库语言学 这一研究结果促使研究者利用相同语料库对不带“得”字补语句(如趋向补语)的习得情况进行考察,结果发现学习者习得不带“得”字补语句偏误率整体高于带“得”补语句。通过进一步的深入考察,研究者大体构拟出了英、日、韩(朝)等母语学习者对汉语不同类型补语的习得顺序。(杨德峰2003、2008)第16页,共55页。一、语料库与语料库语言学 中国大陆近年来基于语料库的具有代表中国大陆近年来基于语
9、料库的具有代表性的研究成果:性的研究成果:赵金铭教授:“基于中介语语料库的汉语句法研究”(2008)张博教授:“基于中介语语料库的汉语词汇专题研究”(2008)肖奚强教授:“外国学生汉语句式学习难度及分级排序研究”(2009)第17页,共55页。二、关于语料库利用的两个问题 2.1 利用语料库已经成为汉语作为第二语言利用语料库已经成为汉语作为第二语言教学研究的教学研究的主流方法主流方法 语料库以其语料的充分性、客观性、可验证性、使用的便捷性,正在使语言学的研究与应用产生量与质的飞跃。语料库语言学将数据收集与理论论述有机地结合在一起,使我们对语言的理解发生了质的变化.(Halliday1991)
10、基于语料库的研究方法,已经成为当代语基于语料库的研究方法,已经成为当代语言学和应用语言学研究中的一种言学和应用语言学研究中的一种主流方法。主流方法。(王建新2005)第18页,共55页。二、关于语料库利用的两个问题 语料库的使用,为语言学的研究提供了一种新的思维角度,辅助人们的语言“直觉”和“内省”判断,从而克服研究者本人的主观性和片面性,逐渐成为语言学研究的主流方法。从某种意义上说,语料库的使用,是语言学研究语料库的使用,是语言学研究的一次革命性的进步。的一次革命性的进步。(冯志伟2006:14)第19页,共55页。二、关于语料库利用的两个问题 以北语开发的以北语开发的“HSK动态作文语料库
11、动态作文语料库”为为例例 为海内外众多硕士生、博士生所使用,为他们的研究及论文写作提供帮助。学术期刊、学术会议及网上可以看到众多利用该语料库的研究成果。注册用户众多,一旦发生故障会引起全球性反应。但是,我们发现在利用语料库进行汉语习得和教学的研究中,有两个问题值得我们有两个问题值得我们注意。注意。第20页,共55页。二、关于语料库利用的两个问题2.2 要注意研究对象的要注意研究对象的“同质同质”性性 欧美现代语言学之父、瑞士语言学家费尔迪南德索绪尔索绪尔(ferdinand de saussure 1857-1913)十分重视语言研究的“同质”问题。他提出了区分语言/言语、历时/共时、能指/所
12、指、组合关系/聚合关系等一系列二分的语言学概念,就是为了确保语言研究对象和语言研究的同质性。第21页,共55页。二、关于语料库利用的两个问题 研究案例二:关于汉语形容词的语法分布研究案例二:关于汉语形容词的语法分布 在英语中,修饰名词作定语是形容词的专利;但在汉语中,对形容词修饰名词作定语的语法功能却有着截然相反的论述,对形容词充当谓语也有不同的看法:第22页,共55页。二、关于语料库利用的两个问题 “形容词能作谓语或谓语中心语和定语,多数能够直接修饰名词。”(黄伯荣、廖序东主编现代汉语,高等教育出版社,2004年。已发行500多万册)“在不带的的格式里,形容词和名词的配合受到限制,比如可以说
13、白纸、白头发,但是不说或不太说白手、白家具。”(朱德熙语法讲义,商务印书馆,1982年。)第23页,共55页。二、关于语料库利用的两个问题 “性质形容词单独作谓语也有一定的限制,一般只能用于对照、比较的情况。在没有比较意味的句子里,一般要在前面加上程度副词很。”(刘月华等主编实用现代汉语语法,商务印书馆,2002年。)有学者利用语料库对汉语形容词在书面语和口语中的分布进行了统计(张宝林2011):第24页,共55页。二、关于语料库利用的两个问题 形容词的主要语法功能:定语说形容词的主要语法功能:定语说+谓语说。谓语说。语料语料形容词形容词谓语谓语频率频率定语定语频率频率口语50429859.1
14、%10821.4%书面语61110717.5%38563.0%口+书111540536.3%49344.2%第25页,共55页。二、关于语料库利用的两个问题 口语和书面语是不同质的研究对象,基本义相同的口语词和书面语词经常不能替换:如“帮”、“帮助”、“帮忙”基本意义相同,“你帮我买张票”,不说“帮助”和“帮忙”;“他欺骗我的感情”、“他骗我的钱”,“欺骗”和“骗”也不能互换。这和书面语与口语有关,也和汉语的节律有关。结论:对汉语形容词语法分布的论述应区结论:对汉语形容词语法分布的论述应区分口语体与书面语体。分口语体与书面语体。第26页,共55页。二、关于语料库利用的两个问题研究案例三:研究案
15、例三:“把把”字句习得的字句习得的“回避回避”说与说与“不回避不回避”说说 量词的用法、形容词谓语句、无标记的被动句、带各种补语的句子、“把把”字句(多数学生难点中的难字句(多数学生难点中的难点点)、“了”“着”“过”的用法(“了”也是难点中的难点)、比较句、方位词的用法、长定语、三位数以上的大数目。怎么知道什么是难点,什么不是难点呢?一是通过语言语言对比对比研究来发现,二是靠教学经验。到底什么到底什么是真正的难点,最终还要靠教学经验来检验。是真正的难点,最终还要靠教学经验来检验。(吕必松1992:110)第27页,共55页。二、关于语料库利用的两个问题 如以英语为母语的学习者的语法难点有:形
16、容词谓语句、无标记被动句、带各种补语的句子、“把把”字句字句、“是的”句、比较句以及“了”“着”“过”的用法、量词用法、方位词用法、长定语、大数目称数法以及话语连接等。其中的大部分,对任何母语背景的学习者来说也都是难点。通过语言对比突出语法的重点和难点通过语言对比突出语法的重点和难点。对外汉语语法教学的一大特点是学习者会受到其第一语言迁移作用的影响。作为第二语言的汉语对所有学习者都有共同的难点,对不同母语背景的学习者又有特殊的难点。(刘珣2000:366)第28页,共55页。二、关于语料库利用的两个问题 对欧美学生来说,受事主语句、存现句、主谓谓语句,以及时间、地点状语的位置,始终是学习的难点
展开阅读全文