书签 分享 收藏 举报 版权申诉 / 39
上传文档赚钱

类型COCA语料库操作演示.ppt教程课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2494016
  • 上传时间:2022-04-25
  • 格式:PPT
  • 页数:39
  • 大小:1.93MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《COCA语料库操作演示.ppt教程课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    COCA 语料库 操作 演示 ppt 教程 课件
    资源描述:

    1、杨百翰大学COCA语料库使用说明1. 杨百翰大学COCA语料库简介 Corpus of Contemporary American English (1990-2012)能在线免费提供 400+ million 词,在线网址为:http:/corpus.byu.edu/coca/ 但需要用电子邮箱注册才能使用,对不同使用者有不同层次的要求,对最低层的使用者,每天可检索100次,共10000个KWIC 行。 通过这个网址: http:/corpus.byu.edu 还可以搜索到以下语料库:图1.1 COCA界面简介1. 显示方式显示方式2. 关键词输入栏关键词输入栏3. 子语料库子语料库4. 最

    2、小匹配最小匹配5. 结果栏结果栏6. KWIC 栏栏2. 主要搜索功能 2.1 搜索搜索words、phrases、lemmas、wildcards和其他更加复杂的字词和其他更加复杂的字词 2.1.1 输入单词“mysterious” (图2.1.1-1): 得到相关结果(图2.1.1-2):在各子库中的频率,每百万词使用的频率 若对图2中的相应条块进行点击,那么就可以看到KWIC,如图2.1.1-3 (以点Fiction的条块为例):图2.1.1-1图2.1.1-2使用chart 显示图2.1.1-3 2.1.2 输入词组输入词组“white+名词名词” (图2.1.2-1) 得到的结果都是

    3、white后面跟的名词短语 (图2.1.2-2),检索表达式为:white n*图2.1.2-1注意:选注意:选LIST 规则:规则:输入名词的话用正则表达式: n*;动词: v*; 形容词: aj*; 副词: av* . 既可以直接输入,也可以从POS LIST 栏选择 对于“n*”,可选择 “noun. All+”图2.1.2-2 White+名词的短语 2.1.3 输入通配符输入通配符(wildcards),如分别输入un*ly和r?n*,结果如图2.1.3-1和.2.1.3-2图2.1.3-1 图2.1.3-2 2.1.4 输入输入lemma(即一个单词的单复数单复数、时态时态等所有形

    4、式),若要得到sing这个单词的所有形式,可以如下图所示(图2.1.4-1) 图2.1.4-1规则:若要得到某个单词的所有单复数和时态形式,那么就要在输入时,在这个单词外加 。图2.1.4-2形容词early的原形,比较级和最高级三种形式一次性检索出来检索 2.1.5 输入某种词性且部分带有某些字母的命令输入某种词性且部分带有某些字母的命令,如要得到以un-开头、-ed结尾的所有形容词的所有形式(见图2.1.5-1)和得到动词+任何词+ground的所有词组(见图2.1.5-2): 规则:若要得到某种词性且词中带有部分带有某些字母的形式时,如要得到以un-开头、-ed结尾的所有形容词的所有形式

    5、,那么输入: un*ed.aj*;若要得到动词+任何词+ground的所有词组,那么输入: vv*ground即可。前者用来研究词汇,后者用来查询特定词性的搭配。图2.1.5-1 图2.1.5-2 动词+任何词+ground的所有词组 2.2 搜索搭配词和出现的频率搜索搭配词和出现的频率 如 “thick后跟的名词” (图2.2-1)图2.2-1 规则规则:在COLLOCATES里输入n* 后选择4,表示在thick后面(4跨距范围内)出现的任何名词 如跟在 “smile前面的形容词” (图2.2-2)规则:在WORDS里输入: smile.n*,表示作为名词smile; 在COLLOCTES

    6、里输入: j*表示其前后出现形容词的语境。Confidence前使用的常用形容词 图2.2-3 2.3 搜索在子语料库搜索在子语料库(register)内内(或之间或之间)出出现的频率现的频率(或比较或比较)(不同语域中的用法不同语域中的用法) 如在Fiction和Spoken子数据库中passionate后面可以跟任何名词的词及频率,分别如两图(2.3-1和2.3-2)图2.3-1 图2.3-2 图2.3-2 但是也可以之间对两者子语料库中它们出现频率的对比,操作:分别选择section 1&2,如下图(图2.3-3): 图2.3-3 2.4 进行语义倾向比较进行语义倾向比较 2.4.1 比

    7、较近义词 如:近义形容词hot和warm后面所跟名词的区别(如图2.4.1):图2.4.1 规则:首先选择 COMPARE 显示。然后在WORDS的方格里分别输入hot和warm,再在COLLOCATES方框里输入n*,表示后面所跟任何名词。当然也可以比较在某个子语料库中出现的频率比较。 2.4.2 比较反义词 如:woman和man前面所跟的形容词的区别(如图2.4.2)图2.4.2规则:在WORDS的方格里分别输入woman和man,再在COLLOCATES方框里输入j*,选在左3,表示前面3个跨距内所有的形容词。当然也可以比较在某个子语料库中出现的频率比较。 2.4.3 搜索近义词搜索近义词 如:搜索beautiful的所有近义词(如图2.4.3-1)规则:在WORDS的方格里输入=beautiful,表示和beautiful语义相近的所有形容词。 再如:搜索动词clean的所有近义词,如下图:图2.4.3-2 当然可以进一步搜索与clean语义相近的动词+the+名词的词组,=clean.v* the n* 如下图:图2.4.3-3 思考: 1)如何查询多义词特定的词性的KWIC,如for 作连词或介词等? 2)如何查询某个词前/或者后面特定词性的若干搭配词, 如confidence 前的形容词? 3)词性附码应放置在什么位置?

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:COCA语料库操作演示.ppt教程课件.ppt
    链接地址:https://www.163wenku.com/p-2494016.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库