常见语料库使用入门课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《常见语料库使用入门课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常见 语料库 使用 入门 课件
- 资源描述:
-
1、常见语料库使用入门PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 主要部分第一节 语料库及其分类第二节公共语料库检索第三节 个人语料库创建0第一节语料库及其分类语料库及其分类1语料库(corpus):存放语言材料的仓库。现代的语料库是指存放在计算机里的原始语料文本或经过加工后带有语言学信息标注的语料文本的汇集。三点基本认识:A.必须是实际使用中真实出现过的语言材料;B.须以计算机为必要载体;C.材料分析加工后
2、才有用。语料库及其分类2语料库及其分类3第二节公共语料库检索公共语料库检索4统计频率 查找例句验证分析参数设置带着问题收集证据基于检索公共语料库检索5我国21个知名语料库01.中央研究院近代汉语标记语料:http:/www.sinica.edu.tw/Early_Mandarin/ 02.中央研究院汉籍电子文献:http:/www.sinica.edu.tw/ftms-bin/ftmsw3 03.国家现代汉语语料库:http:/124.207.106.21:8080/04.国家语委现代汉语语料库:http:/ 13.闽南语典藏:http:/southernmin.sinica.edu.tw/1
3、4.香港城市大学LIVAC共时语料库:http:/www.livac.org/search.php公共语料库检索7我国21个知名语料库15.浙江师范大学的历史文献语库:http:/ (ICE):http: /www.ucl.ac.uk/english-usage/ice/htm02.美国国家语料库(ANC):http:/www.anc.org/03.美国当代英语语料库(COCA):http:/www.americancorpus.org/04.美国近当代英语语料库(COHA):http:/corpus.byu.edu/coha/05.英国国家语料库(BNC):http:/corpus.byu.
4、edu/bnc/06.柯林斯英语语料库(BOE):http:/ /www.ucl.ac.uk/english-usage/08.澳大利亚英语语料库(ACE):http: /khnt.hit.uib.no/icame/manuals/ 09.新规范语料库(NMC):http: /www.sketchengine.co.uk/公共语料库检索9国外18个知名英语语料库10.LLC口语语料库: http:/khnt.hit.uib.no/icame/manuals/11.COBUILD语料库:http:/www.collins.co.uk/Corpus/CorpusSearch.aspx12.ICE东
5、非等分库:http:/www.ucl.ac.uk/english-usage/ice/avail. htm13.ARCHER语料库:http:/www.cal.nau.edu/english/degree_programs. asp14.CEECS语料库:http:/www.eng.helsinki.fi/varieng/main/corporal.htm15.SCTS语料库:http: /www.scottishcorpus.ac.uk/16.VOICE语料库:http: /www.univie.ac.at/Anglistik/voice/17.ELFA语料库:http: /www.uta.
6、fi/laitokset/kielet/engf/research/elfa/18.朗曼语料库:http: /www.long- 一种语言现象我们至少得收集多少条语料呢?徐杰教授认为,语料多多益善,至少应收集500条。大数定律(Law of Large Numbers): 指在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。公共语料库检索11由收集验证到实证分析需要学点统计学抽样与调查离散与连续频率与分布描述与图示样本与总体估计与检验统计统计置信区间T检验公共语料库检索12由收集验证到实证分析需要学点统计学集中趋势的特征数:平均数、众数、中位数、
7、调和平均数、几何平均数变异程度的特征数:极差、四分位差、平均差、方差、标准差参数估计与假设检验以样本对总体的推断一般步骤(1)明确问题(2)收集信息(3)提出假设(4)构建模型(5)模型求解(6)分析检测公共语料库检索13由收集验证到实证分析需要学点统计学在自然现象和社会现象中,大量的随机变量都服从或近似地服从正态分布。大部分参数检验,比如t检验,方差分析,回归分析等,要求数据符合正态分布。三个基本点:三个基本点:1)呈钟形,形态如左图;2)两个参数,均值和标准差;3)图象大致表示:平均数周围的属性值在总体上占到大多数。正态分布正态分布公共语料库检索14公共语料库的检索说明以BCC语料库为例初
展开阅读全文