管理信息学第6章课件.ppt

上传人（卖家）：晟晟文业

文档编号：4353547

上传时间：2022-12-01

格式：PPT

页数：42

大小：511KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

25 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《管理信息学第6章课件.ppt》由用户（晟晟文业）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 管理信息学课件

资源描述：: 1、2022-12-1u 6.3.1 多元数据的相关分析多元数据的相关分析u 6.3.2 聚类分析聚类分析u 6.3.3 判别分析判别分析u 6.3.4 回归分析回归分析u 6.3.5 时间序列分析时间序列分析 6.3 6.3 信息处理的统计学方法信息处理的统计学方法2022-12-1 信息处理是使用适当的信息处理方法从样本数据集中自信息处理是使用适当的信息处理方法从样本数据集中自动抽取有用的规则（知识）。动抽取有用的规则（知识）。针对不同的处理目标，支持信息处理的方法概括起来可分针对不同的处理目标，支持信息处理的方法概括起来可分为：为：统计学方法、人工智能方法、数据库技术及可视化技术统计学方法、
2、人工智能方法、数据库技术及可视化技术等几类。等几类。在实际应用中，信息处理方法往往是集成多项技术。在实际应用中，信息处理方法往往是集成多项技术。6.3 6.3 信息处理的统计学方法信息处理的统计学方法2022-12-1信息加工的统计学方法2022-12-1多元数据的相关分析多元数据的相关分析多元数据是指含有多个随机变量多元数据是指含有多个随机变量(常对应信息系常对应信息系统中的属性统中的属性)的一组数据，多元数据的相关性分析就的一组数据，多元数据的相关性分析就是找出各随机变量之间的关联关系。是找出各随机变量之间的关联关系。6.3.1 多元数据相关分析多元数据相关分析一切客观事物都是相互联系
3、的，任一事物的变一切客观事物都是相互联系的，任一事物的变化都与其周围的其他事物相互联系和相互影响。化都与其周围的其他事物相互联系和相互影响。客观现象之间的相互联系，可以通过一定的数量客观现象之间的相互联系，可以通过一定的数量关系反映出来。关系反映出来。现象之间的关系形态有两种类型：函数关系现象之间的关系形态有两种类型：函数关系和统计相关关系。和统计相关关系。多元数据相关分析多元数据相关分析统计相关关系是变量之间存在的不完全确定性的关系。统计相关关系是变量之间存在的不完全确定性的关系。在实际在实际问题中，许多变量之间的关系并不是完全确定的，例如居民家庭消问题中，许多变量之间的关系并不是完全确定
4、的，例如居民家庭消费与居民家庭收入这两个变量的关系就不是完全确定的。费与居民家庭收入这两个变量的关系就不是完全确定的。多元数据相关分析多元数据相关分析相关的种类相关的种类2022-12-1 聚类分析聚类分析聚类分析是把研究对象按照一定的规则分成若干类别，并使聚类分析是把研究对象按照一定的规则分成若干类别，并使类之间的差别尽可能地大，类内的差别尽可能地小，类之间的差别尽可能地大，类内的差别尽可能地小，换句话说，换句话说，使类间的相似性最小、而类内的相似性最大。使类间的相似性最小、而类内的相似性最大。聚类方法的核心问题是样本间的相似性度量，通常用距离来聚类方法的核心问题是样本间的相似性度量，通常
5、用距离来度量。度量。6.3.2 6.3.2 聚类分析聚类分析2022-12-1聚类分析中的常用距离聚类分析中的常用距离(1)欧氏欧氏(Euclidean)距离距离(2)绝对距离绝对距离(3)Minkowski距离距离显然当显然当m=1时就是绝对距离，时就是绝对距离，m=2时就是欧氏距离。时就是欧氏距离。在实际应用时常分析两个样本之间的相对距离，这时需要对在实际应用时常分析两个样本之间的相对距离，这时需要对样品数据进行标准化处理，然后用标准化数据计算距离。样品数据进行标准化处理，然后用标准化数据计算距离。2112)(),(pkjkikjixxxxdpkjkikjixxxxd1|),()1(|),
6、(11mxxxxdmpkmjkikji聚类分析聚类分析2022-12-1谱系聚类法谱系聚类法谱系聚类法是根据给定数据集产生一个层次结构。其基本谱系聚类法是根据给定数据集产生一个层次结构。其基本过程是：过程是：开始每个样品各成一类，然后相继将两个最近的类开始每个样品各成一类，然后相继将两个最近的类合并成一个新类，直到所有的样品成为一个总类，从而得到合并成一个新类，直到所有的样品成为一个总类，从而得到一个按相似性大小聚集起来的一个谱系图。一个按相似性大小聚集起来的一个谱系图。聚类分析聚类分析2022-12-1聚类分析聚类分析2022-12-1动态聚类法动态聚类法动态聚类法是对于给定的动态聚类法
7、是对于给定的 n 个样本，先粗略地形成个样本，先粗略地形成 k(kn)个类、每个类至少有一个样本并且每个样本精确地属于一个个类、每个类至少有一个样本并且每个样本精确地属于一个类，然后按照某种原则进行修正，直至分类比较合理为止。类，然后按照某种原则进行修正，直至分类比较合理为止。聚类分析聚类分析不合理不合理修改分类修改分类初始分类初始分类最终分类最终分类合理合理分类是否合理分类是否合理选择聚点选择聚点2022-12-1动态聚类演示动态聚类演示聚类分析聚类分析2022-12-1 聚类分析的方法可以应用在很多领域，尤其在商业领域中正在聚类分析的方法可以应用在很多领域，尤其在商业领域中正在越来越多地
8、使用该方法。例如越来越多地使用该方法。例如在销售业企业，聚类分析可被用来发在销售业企业，聚类分析可被用来发现不同的客户群，现不同的客户群，并且通过购买模式刻画不同的客户群的特征。消并且通过购买模式刻画不同的客户群的特征。消费同一种类的商品或服务时，不同的客户群有不同的消费特点，通费同一种类的商品或服务时，不同的客户群有不同的消费特点，通过研究这些特点，企业可以制定出不同的营销组合，从而获取最大过研究这些特点，企业可以制定出不同的营销组合，从而获取最大的消费者剩余，这就是客户细分的主要目的。的消费者剩余，这就是客户细分的主要目的。聚类分析是细分市场的有效工具，同时也可用于研究消费者行聚类分析是细
9、分市场的有效工具，同时也可用于研究消费者行为，寻找新的潜在市场、选择实验的市场等。为，寻找新的潜在市场、选择实验的市场等。聚类分析聚类分析2022-12-1 判别分析判别分析(分类分类)判别分析或分类是指在得到一个新的样本数据时，判别该样本判别分析或分类是指在得到一个新的样本数据时，判别该样本所属的类别。所属的类别。距离判别方法距离判别方法朴素贝叶斯朴素贝叶斯(Bayes)判别方法：朴素（判别方法：朴素（naive）贝叶斯判别法是依）贝叶斯判别法是依据数据点属于各类的可能性大小对数据点进行分类，采用的准则据数据点属于各类的可能性大小对数据点进行分类，采用的准则是把数据点分到可能性最大的类。是
10、把数据点分到可能性最大的类。训练数据集训练数据集分类器分类器分类结果分类结果新数据新数据（或检验数据集）（或检验数据集）6.3.3 6.3.3 判别分析判别分析2022-12-1回归分析回归分析回归分析是应用极其广泛的数据分析方法，它基于样本数回归分析是应用极其广泛的数据分析方法，它基于样本数据建立变量间适当的依赖关系，以分析数据的内在规律。据建立变量间适当的依赖关系，以分析数据的内在规律。线性回归模型和非线性回归模型等。线性回归模型和非线性回归模型等。6.3.4 6.3.4 回归分析回归分析2022-12-1 回归分析研究一个或多个随机变量回归分析研究一个或多个随机变量Y1,Y2,Yi 与
11、另一些变量与另一些变量X1,X2,Xk 之间的依赖关系。通常称之间的依赖关系。通常称Y1,Y2,Yi 为因变量，为因变量，X1,X2,Xk 为为自变量。自变量。当因变量和自变量为线性关系时，它是一种特殊的线性模型。最简当因变量和自变量为线性关系时，它是一种特殊的线性模型。最简单的情形是一个自变量和一个因变量，这叫单的情形是一个自变量和一个因变量，这叫一元线性回归，一元线性回归，即模型为即模型为Y=a+bX+，这里这里 X 是自变量，是自变量，Y 是因变量，是因变量，是随机误差，是随机误差，回归分析回归分析2022-12-11001201401601802006007008009001000进食
12、量(g)增重(g)图图大白鼠的进食量与增加体重回归直线大白鼠的进食量与增加体重回归直线回归分析回归分析2022-12-1回归分析在管理决策中的应用主要体现在以下两个方面：回归分析在管理决策中的应用主要体现在以下两个方面：（1 1）因素分析。）因素分析。在现实生活中，某一项结果的产生，可能是很多个在现实生活中，某一项结果的产生，可能是很多个因素共同作用的结果。例如在医学研究中因素共同作用的结果。例如在医学研究中,有关生存与死亡有关生存与死亡,发病与未发病与未发病发病,阴性与阳性等结果的产生可能与病人的年龄、性别、生活习惯、阴性与阳性等结果的产生可能与病人的年龄、性别、生活习惯、遗传、病史等许
13、多因素有关。使用回归分析，我们可以发现到底是哪些遗传、病史等许多因素有关。使用回归分析，我们可以发现到底是哪些因素对结果产生了影响，从而帮助我们做出正确的判断。因素对结果产生了影响，从而帮助我们做出正确的判断。（2 2）预测。）预测。预测经常取决于对两个或更多个变量的分析。其中，两预测经常取决于对两个或更多个变量的分析。其中，两个变量之间的回归分析称为一元回归，三个或三个以上变量之间的回归个变量之间的回归分析称为一元回归，三个或三个以上变量之间的回归分析称为多元回归。例如，广告费和销售收入之间的关系是一元回归，分析称为多元回归。例如，广告费和销售收入之间的关系是一元回归，而消费支出与收入及商品
14、价格之间的关系则是多元回归。而消费支出与收入及商品价格之间的关系则是多元回归。回归分析回归分析2022-12-1时间序列分析时间序列分析时间序列是按时间序列排列的、时间序列是按时间序列排列的、随时间变化且相互关联的数据序随时间变化且相互关联的数据序列列(趋势性、季节性、随机性趋势性、季节性、随机性)时间序列时间序列(上证指数三日走势上证指数三日走势)P1(t)P2(t)P3(t)t 时间序列分析就是通过对时间序列样本进行分析，构造时间序列分析就是通过对时间序列样本进行分析，构造事件发生的数学模型，从而达到认识事物、了解其变化规律事件发生的数学模型，从而达到认识事物、了解其变化规律的目的。当模
15、型建立完成后就能根据模型对事件进行预测或的目的。当模型建立完成后就能根据模型对事件进行预测或控制。控制。6.3.5 6.3.5 时间序列分析时间序列分析2022-12-12022-12-1时间序列分析方法时间序列分析方法算术平均法算术平均法设长度为设长度为 n 的时间序列样本为的时间序列样本为x1,x2,xn。则下一个时间。则下一个时间点的预测值为：点的预测值为：这种方法只适合时间序列比较稳定的情况，它不能反映时这种方法只适合时间序列比较稳定的情况，它不能反映时间序列的变化趋势和季节变动。间序列的变化趋势和季节变动。nxxxxnn.211时序分析2022-12-1移动平均法移动平均法移动平均
16、法基于假设未来的序列与近期的序列有关，移动平均法基于假设未来的序列与近期的序列有关，而与过去较远的序列关系不大。移动平均法的分析思路是而与过去较远的序列关系不大。移动平均法的分析思路是每完成一次预测，就要舍弃最旧的一个数据而补充最新的每完成一次预测，就要舍弃最旧的一个数据而补充最新的一个数据。一个数据。时序分析12.ttt ntxxxxn2022-12-12022-12-1加权移动平均法加权移动平均法在实际数据中，有些时间序列具有一定的周期性或单在实际数据中，有些时间序列具有一定的周期性或单调性，不同时间的数据影响不同，这时就可以用权重加调性，不同时间的数据影响不同，这时就可以用权重加以衡量
17、。以衡量。指数滑动平均法指数滑动平均法借助于加权因子，用当前的实际值（新信息）去修正借助于加权因子，用当前的实际值（新信息）去修正上次的预测值，来得到下次的值。上次的预测值，来得到下次的值。时序分析2022-12-1季节性影响因子季节性影响因子时间序列除了趋势性、相关性、随机性以外，还常常具有时间序列除了趋势性、相关性、随机性以外，还常常具有周期性和季节性。把季节性因素作为分量对时间序列进行周期性和季节性。把季节性因素作为分量对时间序列进行分解。季节性应理解为同期中具有相同特征的对应时间段。分解。季节性应理解为同期中具有相同特征的对应时间段。时序分析2022-12-1 例例：我们考虑表中的数
18、据。这些数据是某个汽油批发商我们考虑表中的数据。这些数据是某个汽油批发商在过去在过去1212周的汽油销售量。根据表中的汽油销售量时间序列，周的汽油销售量。根据表中的汽油销售量时间序列，用指数滑动平均法进行预测。用指数滑动平均法进行预测。时序分析周周销售量（千公升）销售量（千公升）周周销售量（千公升）销售量（千公升）1177202218183199224231020518111561612222022-12-1 机器学习的主要任务是从模拟人类的学习行为出发，研究客机器学习的主要任务是从模拟人类的学习行为出发，研究客观世界和获取各种知识与技能的一些基本方法，并借助于计算机观世界和获取各种知识与技能
19、的一些基本方法，并借助于计算机科学与技术原理建立各种学习模型，从根本上提高计算机智能和科学与技术原理建立各种学习模型，从根本上提高计算机智能和学习能力。学习能力。研究内容包括根据生理学、认知科学对人类学习机理的了解，研究内容包括根据生理学、认知科学对人类学习机理的了解，建立人类学习的计算模型或认知模型；发展各种学习理论和学习建立人类学习的计算模型或认知模型；发展各种学习理论和学习方法，研究通用的学习算法并进行理论上的分析；建立面向任务方法，研究通用的学习算法并进行理论上的分析；建立面向任务且具有特定应用的学习系统等。且具有特定应用的学习系统等。6.4 6.4 信息处理的机器学习方法信息处理的机
20、器学习方法2022-12-1信息加工的机器学习方法信息加工的机器学习方法上图表示学习系统的基本结构。环境向系统的学习部分上图表示学习系统的基本结构。环境向系统的学习部分提供某些信息，学习部分利用这些信息修改知识库，以增进提供某些信息，学习部分利用这些信息修改知识库，以增进系统执行部分完成任务的效能，执行部分根据知识库完成任系统执行部分完成任务的效能，执行部分根据知识库完成任务，同时把获得的信息反馈给学习部分。务，同时把获得的信息反馈给学习部分。2022-12-1 机器学习使用的学习方法主要是机器学习使用的学习方法主要是归纳法和演绎法归纳法和演绎法等。等。归纳法归纳法主要基于观察对象来形成一般
21、性知识，主要基于观察对象来形成一般性知识，提取事物提取事物的一般规律的一般规律；它它是一种从个别到一般的推理，是一种从个别到一般的推理，产生的知识是先前知产生的知识是先前知识库中所没有的；识库中所没有的；演绎法演绎法是用知识库中已有的知识来形成新的知识，如基于解释是用知识库中已有的知识来形成新的知识，如基于解释的学习是利用先前的知识来解释新的事件，然后简化该解释并存放的学习是利用先前的知识来解释新的事件，然后简化该解释并存放于知识库中。于知识库中。信息加工的机器学习方法信息加工的机器学习方法2022-12-1决策树方法决策树方法年龄年龄病情病情手术手术心血管心血管类别类别年龄年龄病情病情手术手
22、术心血管心血管类别类别中年中年急急否否心悸心悸A高龄高龄危危否否心绞痛心绞痛A中年中年急急是是心绞痛心绞痛A高龄高龄急急否否心绞痛心绞痛A中年中年急急否否心律不齐心律不齐A中年中年急急是是心律不齐心律不齐B老年老年急急是是心悸心悸A老年老年危危否否心悸心悸B老年老年危危是是心绞痛心绞痛A老年老年危危是是心律不齐心律不齐B老年老年急急否否心律不齐心律不齐A高龄高龄危危否否心悸心悸B老年老年危危否否心律不齐心律不齐A高龄高龄危危是是心悸心悸B 决策表样本数据集决策表样本数据集2022-12-1 所谓决策树是一个类似流程图所谓决策树是一个类似流程图的树结构，其中树的每个结点对应的树结构，其中树的每个
23、结点对应一个特征（属性）变量值的检验，一个特征（属性）变量值的检验，每个分枝表示检验结果，树枝上的每个分枝表示检验结果，树枝上的叶结点代表所关心的因变量的取值，叶结点代表所关心的因变量的取值，最顶端的结点称为根结点。最顶端的结点称为根结点。从根结点到每个叶结点都有唯从根结点到每个叶结点都有唯一的一条路径，这条路径就是一条一的一条路径，这条路径就是一条决策决策“规则规则”。如果每个内结点都如果每个内结点都恰好有两个分枝，则称为二叉树。恰好有两个分枝，则称为二叉树。决策树方法决策树方法心血管心血管手术手术病情病情ABAAB心悸心悸心绞痛心绞痛心律不齐心律不齐是是危危否否急急2022-12-1决策树
24、方法决策树方法图图示决策树是一示决策树是一个信用卡公司用来决个信用卡公司用来决定是否向客户发出办定是否向客户发出办卡的邀请，树中从根卡的邀请，树中从根节点到每个叶子节点节点到每个叶子节点的路径，都可以转化的路径，都可以转化成一条成一条IFTHEN规规则。则。2022-12-1 在管理中经常面对一些不确定信息。在管理中经常面对一些不确定信息。不确定性来自人类不确定性来自人类主观认识与客观实际之间存在的差异。主观认识与客观实际之间存在的差异。事物发生的随机性、事物发生的随机性、人类知识的不完全、不可靠、不精确和不一致以及自然语言人类知识的不完全、不可靠、不精确和不一致以及自然语言中存在的模糊性和
25、歧义性，都反映了这种差异，都会带来不中存在的模糊性和歧义性，都反映了这种差异，都会带来不确定性。确定性。不确定性造成了具有相同描述信息的对象可能属于不同的不确定性造成了具有相同描述信息的对象可能属于不同的概念。概念。提高处理不确定性信息的有效性，对帮助决策具有重提高处理不确定性信息的有效性，对帮助决策具有重要意义。要意义。6.5 6.5 不确定信息的处理方法不确定信息的处理方法2022-12-1模糊集理论模糊集理论2 2、模糊集理论、模糊集理论模糊信息本身是确定性的模糊信息本身是确定性的,但其特征无法用精确数学工但其特征无法用精确数学工具描述和刻划具描述和刻划(属性值确定，概念模糊属性值确定，
26、概念模糊)。模糊信息的特征。模糊信息的特征用模糊集刻划，它给出了总体中的元素与所刻划的特征之用模糊集刻划，它给出了总体中的元素与所刻划的特征之间的隶属程度。间的隶属程度。(隶属函数隶属函数)1 1、概率论、概率论任何一个模式任何一个模式 X 的出现具有随机性的出现具有随机性,用概率用概率 P(X)去决定去决定X 发生的可能性大小发生的可能性大小,从而决定从而决定 X 的分类。的分类。2022-12-1 设设ai表示属性表示属性“年龄年龄”，当，当ai的值域是离散的且为的值域是离散的且为幼儿幼儿,儿儿童童,少年少年,青年青年,中年中年,老年老年时，某对象是否是中年由属性时，某对象是否是中年由属性
27、ai的值的值完全确定，此时只有当完全确定，此时只有当ai(xj)“中年中年”时，隶属度为时，隶属度为1，其余，其余为为0；当；当ai的值域是连续区间的值域是连续区间(0,120)时，若中年的概念是精确时，若中年的概念是精确地定义在地定义在40,50年龄段，则隶属函数是分段函数：年龄段，则隶属函数是分段函数：若中年的概念是模糊的，如大约若中年的概念是模糊的，如大约45左右，则隶属函数可能左右，则隶属函数可能是某种正态分布。是某种正态分布。1()40,500()ijaxija x 其其它它中中年年模糊集理论模糊集理论2022-12-13、灰集理论、灰集理论灰信息所刻划的对象是指部份信息已知灰信息所
28、刻划的对象是指部份信息已知,部份信息未知。灰部份信息未知。灰信息处理的目标是把未知信息变为已知信息的过程信息处理的目标是把未知信息变为已知信息的过程,即信息即信息白化。它用上下隶属度函数将灰集中的未知信息约束在两个白化。它用上下隶属度函数将灰集中的未知信息约束在两个模糊集之间。模糊集之间。4、未确知有理数、未确知有理数未确知理论是用来处理一类客观上是确定的但主观上无法未确知理论是用来处理一类客观上是确定的但主观上无法获得的一类信息，如获得的一类信息，如“某建筑物的重量是多少某建筑物的重量是多少”。利用置信。利用置信度模型分析未确知信息度模型分析未确知信息(x是确知成份是确知成份a的置信度的置信
29、度)灰集理论与未确知有理数灰集理论与未确知有理数2022-12-15 5、集对理论、集对理论集对分析用联系度统一处理模糊、随机、信息不完全所导集对分析用联系度统一处理模糊、随机、信息不完全所导致的系统不确定性。其基本思想是系统中不只存在某个单纯致的系统不确定性。其基本思想是系统中不只存在某个单纯的不确定性信息的不确定性信息,而是多种不确定性都存在。而是多种不确定性都存在。6 6、证据理论、证据理论证据是指我们的经验、知识以及对问题的观察和研究的结证据是指我们的经验、知识以及对问题的观察和研究的结果，用基本可信度分配来描述。证据理论引入信度函数描述果，用基本可信度分配来描述。证据理论引入信度函数
30、描述事物处于某种状态的可能性。它无需准确知道事物状态变化事物处于某种状态的可能性。它无需准确知道事物状态变化的概率。的概率。集对理论与证据理论集对理论与证据理论2022-12-17、粗糙集理论、粗糙集理论模糊集理论处理的是因为概念的模糊而导致的对象分类模糊集理论处理的是因为概念的模糊而导致的对象分类模糊，粗糙集方法处理的是由于属性值模糊引起的对象分类模糊，粗糙集方法处理的是由于属性值模糊引起的对象分类模糊。模糊。粗糙集理论反映了人们以不完全信息或知识去处理一些粗糙集理论反映了人们以不完全信息或知识去处理一些不可分辨现象的能力，或依据观察、度量到某些不精确的结不可分辨现象的能力，或依据观察、度
31、量到某些不精确的结果而进行分类数据的能力。果而进行分类数据的能力。粗糙集理论的基本思想：粗糙集理论的基本思想：(1)知识是主体对论域中的客体进行分类的能力，分类能力知识是主体对论域中的客体进行分类的能力，分类能力越强，主体所具备知识的可靠度越高；越强，主体所具备知识的可靠度越高；粗糙集理论粗糙集理论2022-12-1(2)分类能力受主体分辨能力的影响，因此分类具有近似性；分类能力受主体分辨能力的影响，因此分类具有近似性；(3)影响分类能力的因素影响分类能力的因素(在信息系统中常描述为属性在信息系统中常描述为属性)很多，很多，不同的因素重要程度不同，其中某些因素起决定性作用；不同的因素重要程度不
32、同，其中某些因素起决定性作用；(4)具有相同属性的实体，属性取值的不同对分类能力也产生具有相同属性的实体，属性取值的不同对分类能力也产生影响；影响；(5)属性之间存在某种依赖关系。属性之间存在某种依赖关系。粗糙集方法能够解决的基本问题：粗糙集方法能够解决的基本问题：(1)根据属性值表征对象集；根据属性值表征对象集；(2)发现属性间的发现属性间的(完全或部分完全或部分)依赖；依赖；(3)冗余属性冗余属性(数据数据)的简化；的简化；(4)发现最重要的属性发现最重要的属性(核核)；(5)生成决策规则。生成决策规则。粗糙集理论粗糙集理论2022-12-1 贝叶斯网络（贝叶斯网络（Bayesian ne
33、tworks）是以贝叶斯方法为基础的）是以贝叶斯方法为基础的一种图形模式，它具有直观的问题表达能力和强大的推理能力，一种图形模式，它具有直观的问题表达能力和强大的推理能力，是描述不确定问题的优秀工具，近年来在专家系统、模式识别、是描述不确定问题的优秀工具，近年来在专家系统、模式识别、决策支持系统等领域取得了成功的应用。决策支持系统等领域取得了成功的应用。关于一组变量关于一组变量的贝叶斯网络由两部分组成：的贝叶斯网络由两部分组成：（1）一个有向无环图）一个有向无环图S，图中的节点与，图中的节点与U中的变量一一对应，图中的变量一一对应，图中的有向边表达了变量之间的统计相关性。（中的有向边表达了变量之间的统计相关性。（2）与每一个变量）与每一个变量相联系的条件概率分布相联系的条件概率分布P。S 和和P 定义了定义了U的联合概率分布。的联合概率分布。贝叶斯网络贝叶斯网络12,nUx xx2022-12-1贝叶斯网络贝叶斯网络

展开阅读全文

163文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：管理信息学第6章课件.ppt
链接地址：https://www.163wenku.com/p-4353547.html

晟晟文业

内容提供者

实名认证

联系作者