书签 分享 收藏 举报 版权申诉 / 36
上传文档赚钱

类型信息检索综合课程设计课程介绍课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4530992
  • 上传时间:2022-12-17
  • 格式:PPT
  • 页数:36
  • 大小:2.96MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《信息检索综合课程设计课程介绍课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    信息 检索 综合 课程设计 课程 介绍 课件
    资源描述:

    1、信息检索综合课程设计课程介绍主讲人:李正华苏州大学计算机学院2016年2月29日主要参考陈文亮老师课件自我介绍 姓名:李正华 电子邮件: 个人主页:http:/ 课程主页:http:/ 研究方向:自然语言处理、人工智能学生情况调查 修过哪些编程课?这学期修什么课程?C+中的string;vector;map等会很方便;Java中也有类似的东西 有的编程作业直接用C实现稍微复杂一些 写过多大规模的程序?学习目的 学习信息检索基础知识 动手构建一些小系统(编程实践)拿到本门课学分计分方式5 实验作业:70分(可能会酌情调整)小作业3个*10分=30分 大作业2个*20分=40分 平时出勤、回答问题

    2、等:10分 不能迟到、早退,特殊情况必须请假,并带辅导员签字的假条;点名时,如果发现名单上没有你的名字,及时提出;(选修课的名单有时候会变)作业完成非常好的同学可以告诉我,特殊对待。期末小测验:20分 考察课程相关的基础知识提纲6l 什么是信息检索?什么是信息检索?l 为什么要学习信息检索?为什么要学习信息检索?提纲7l 什么是信息检索?什么是信息检索?l 为什么要学习信息检索?为什么要学习信息检索?什么是信息检索 现场问答 来几个互联网应用例子8 你们来之前什么是信息检索?我得先调查一下,免得被蒙了。接着信息检索挺有趣的哈!先整件衣服吧,有点冷!接着其实我还缺个女朋友!中科院研究生院2011

    3、年度秋季课程16什么是信息检索?提问(随机点名系统)17三个应用例子的共同特征 给定需求(或者是对象),从信息库中找出与之最匹配的信息(或对象)Google/百度的例子:需求“信息检索”淘宝的例子:对象 “男士西服”世纪佳缘网的例子:对象“女朋友”!18信息检索的一些官方定义 给定用户需求,返回满足该需求的信息的一门学科。通常涉及信息的获取、存储、组织和访问。从大规模非结构化数据的集合中找出满足用户信息需求的资料的过程。非结构化数据通常指文本 什么是结构化数据?(提问)19本课程的内容 主要关注面向文本数据 几部分内容:爬虫(Crawler),得到网页(wget可以递归爬取静态网页html)网

    4、页正文提取(html文件的处理),得到文档 中文分词 文档存储(倒排;快速查询)用户query分词 检索:找到相关文档 相关文档简单排序20本课程不涉及内容 非文本数据 Query深度分析和扩展 网页链接分析(PageRank)等复杂排序方法.2122完整的搜索系统示意图22信息检索技术的应用23信息检索应用系统 搜索系统 Web搜索引擎 IBM Waston问答系统 推荐系统 淘宝网 豆瓣网 当当网24从信息规模上分类 个人信息检索:个人相关信息的组织、整理、搜索等。桌面搜索(Desktop Search)、个人信息管理(PIM=Personal Information Management

    5、)、个人数字记忆(Personal Digital Memory)企业级信息检索:在企业内容文档的组织、管理、搜索等。内容管理(Content Management)Web信息检索:在超大规模数据集上的检索。25提纲中科院研究生院2011年度秋季课程26l 什么是信息检索?什么是信息检索?l 为什么要学习信息检索?为什么要学习信息检索?l 课程情况课程情况直接经济效益-能赚钱啊!世界级牛公司 很多互联网的公司:Google,baidu,高市值公司 软件工程师 年薪高市场发展的需求 用户需要信息检索技术:互联网的信息量太大、噪音太多,寻找所需要的信息非常不容易 公司需要信息检索技术:搜索引擎改变

    6、了很多传统的生活方式,Yahoo、Google、Baidu,还有一些公司如Microsoft、Sina、Sohu、Tecent、Netease都加入到这个搜索技术的竞争。不只是搜索引擎才需要信息检索技术,电子商务(如亚马逊网站、阿里巴巴)、社交网(微博、Facebook、twitter、校内网)、数字图书馆、大规模数据分析等都需要信息检索技术 人才的竞争:搜索相关人才人数出现缺口,他们非常抢手,待遇如日中天 是不是泡沫:2000年左右出现的网络泡沫和现在的互联网有什么不同,搜索引擎在其中占什么位置?28几个应用需求 移动搜索 产品搜索 专利搜索 广告推荐 消费行为分析 网络评论分析 SEO营销 29对相关专业学生的基本要求 信息检索技术是内容应用特别是互联网内容应用的核心技术,可以说在这些应用中无处不在 信息检索将会成为一门计算机专业的基础学科 搜索(狭义的信息检索)的三个层次30中科院研究生院2011年度秋季课程31应用层次:搜索是一项非常重要的应用!中科院研究生院2011年度秋季课程32中间层次:搜索是极其重要的API中科院研究生院2011年度秋季课程33www.G中科院研究生院2011年度秋季课程34介绍一本有趣的书!中科院研究生院2011年度秋季课程35核心层次:搜索是未来操作系统的重要组成部分!Q&A 有什么问题?

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:信息检索综合课程设计课程介绍课件.ppt
    链接地址:https://www.163wenku.com/p-4530992.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库