稀疏总体抽样方法讲课-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《稀疏总体抽样方法讲课-课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 稀疏 总体 抽样 方法 讲课 课件
- 资源描述:
-
1、稀疏资源调查抽样设计和估计稀疏资源调查抽样设计和估计森林资源抽样技术 n性质:抽样调查是获取统计资料的重要手段,在社会、经济、科研等领域有着广泛的应用。抽样技术是统计学研究中的一个重要分支。主要介绍抽样技术的基本理论,是统计学专业的一门专业必修课。n内容:介绍一些基本的概率抽样方法,包括简单随机抽样、分层抽样、整群抽样、多阶抽样、等距抽样及不等概率抽样等,着重讨论其中统计推断、抽样设计的理论。对非抽样误差、调查实务(例如问卷设计、调查报告撰写等)作简要介绍。n要求:了解抽样技术的统计理论;掌握六种基本抽样方法的原理、统计推断方法及抽样设计技术,并能举一反三,灵活应用;对抽样调查的实际应用、调查
2、实务有所了解。稀疏总体调查n稀疏总体调查包括:生物多样性的调查、森林中病虫害发生分布的调查、林下非木质资源(non-timber)调查、森林中的倒木和珍贵濒危树种分布的调查、林外的群立木、簇立木或林外的散生木的调查等等n空间分布特点:稀疏(rare)、群团状(cluster)、散生状(spread)和条状(strip)等自然分布 抽样方法比较n传统抽样方法(如简单随机抽样、分层抽样和系统抽样等等):1.调查总体观察值总和均值前要确定样地单元总数 2.不依赖于抽样总体分布,即选择概率函数是非零的或者是常数,与总体单元内观察值的大小无关3.以郁闭的森林资源的林地为主要调查目标4.对稀疏总体的估计是
3、有偏估计n传统抽样方法没有考虑稀疏总体明显存在的空间分布差异,缺乏针对性,将必然导致调查成本大幅攀升和/或估计结果出现显著偏差 抽样方法比较n针对稀疏、簇生和聚集分布总体的抽样方法(如线截法、带抽样、样线法、适应性群团抽样等)较传统的抽样方法有更多的优点:1.在相同抽样工作量情况下估计量方差将会更小,获得更多的信息量,抽样估计是无偏的2.抽样设计灵活3.能够提高具有稀少且群聚特征总体的抽样效率,弥补了传统抽样方法失效、最终样本中观测目标信息几乎为零的缺点n在森林资源调查目标由传统的林木资源调查向森林多资源调查方向转变和发展 的形势下,研究针对稀疏总体的抽样方法是很有意义的,这里主要介绍近年来研
4、究应用较多的三种方法:1.线截法(Line intersect sampling)2.带抽样(strip sampling)3.样线法(Line transect sampling)4.适应性群团方法(Adaptive cluster sampling)一、线截法n线截抽样(Line intersect sampling,简称LIS),由Canfield提出并在1960s得到发展应用n适用于稀疏总体,抽样调查 伐倒木和薪才总量估计公路长度关于生物多样性的调查(如倒木数量的估计)线截法估计方法线截法估计方法 n设某区域内一条线,则与该线相交的所有目标入样,每棵树的概率取决于入样线长度L和树的有效
5、长度 ,如果将树看成一条线,则可直接根据其与抽样线所成的夹角 计算,l=sin()l l ll样线调查目标线截法估计方法线截法估计方法n树i的有效长度的平均值为 每单元面积A的目标变量总数,依据Horwitz-Thompson estimator估计为:(1)式中:2()iilE l2()()nniiiillE l11()nilyTLl (数量/面积A)00sin()cos()(cos()cos(0)(1)1)2E()E(sin()E(sin()dllllllll 线截法估计方法线截法估计方法则每平方米总量的估计值为:(2)式中:L为线(m个)的总长度(米)、li为树i的长度(米)、yi是第i
6、单元目标变(如蓄积、质量、长度)、m为观测单元数量。12miliyTLl (数量/平方米)线截法估计方法线截法估计方法n若森林蓄积用Hubers公式定义为 ,式中di是第i棵树的直径(cm),则前面公式(2)可改为 ;若要估计倒木长度,利用(2)即可,若估计其它值如每公顷倒木数量,则还需测得树的长度。nLIS估计量的方差可由线间方差算得:式中n为线数、为线j的每公顷总蓄积、为研究区域的每公顷蓄积、Lj为线j长度。22iiidvl1nijLjTT1(1)njjnL ()2/()Var T jTT2218milTdL (立方米/公顷)二、带抽样n带抽样(strip sampling)可以看成样地面
7、积很大的样地抽样调查,根据计算,最简单情况是将研究区域分成N个非交叠样带,从中随机抽选n个样带。样带可以间隔一定距离抽选,也可以重叠(部分)抽选。n特点及适用情况:特点及适用情况:1.带抽样经常用于稀疏总体调查2.相对于点抽样,既然该法相对于普通样地调查典型地覆盖了大面积区域,则意味着用于活立木调查时工作量很大3.由于某方位两带状样地自相关性很大,该法对于活立木调查效果很低。虽然稀少总体的观测值分离很远,但自相关性并不成问题,当包含稀少总体时可用带抽样方法。样带布设n将调查总体面积分成N条非重叠的样带,用简单随机方法随机抽取n条样带。n也可以用一定的宽度确定样带,这样可能有重叠。n测量带内的目
8、标带抽样估计n总体蓄积(或其他目标变量):式中Vi为第i条样带的总蓄积、Ai是第i条样带的面积、AT为总面积,如果目标为平均每公顷蓄积,那么可估计比率尽可为:RT11niiTTniiVRAAA11niiniiVRA平均值 (m3/hm2)带抽样估计n比率的方差为:式中:为样带平均面积、N为调查区域样带总数、n为抽取的样带。n总蓄积估计值方差:21()xSNnVar RnNTxAN ()/(),2S21niiV221niiRA12niiiRAV1n()RVar T2()TVar R Ag221TxSNnAnN三、样线法三、样线法 n样线法(Line transect sampling,简称LTS
9、)是以观测目标所在的样线为基础的,样线可以是在地面设桩,或者是在图像上和其他方式。调查人员可以徒步或乘车和空中飞行。这种方法主要用于估计野生动植物总体密度。设目标随机分布在区域内,设观察目标i的概率取决于距线的距离,如距离越长观测概率越小。n样线调查方法的内容一般都要包括样线布设、数量调查和密度计算样线抽样图解样线抽样图解样线法样线布设样线法样线布设n样地布设1.随机布设2.系统布设n估计方法1.窄带法2.目视修正法3.参数法4.非参数法核函数估计富利叶级数法L00B随机抽样L00B系统抽样样线抽样估计方法样线抽样估计方法1.窄带法(Narrow-Strip method):密度为单位面积的个
10、体数目,即条带内动物数量除以条带面积 (1)式中,D为野生动物种群密度;y0为条带内探测到的野生动物数量;L为样线总长度;w0为单侧样线宽度(米)。窄带法是最为常用的传统方法,简单易行,但是单侧样线w0宽度需要根据生境和野生动物的特点以及调查人员的实际观察能力进行经验估计。002yDLw (数量/m2)(一)窄带法n例:样线长L100米,有18个目标(如鸟和病虫害树木等)分别在距离样线0,0,1,3,7,11,11,12,15,15,18,19,21,23,28,33,34,44米。如何使用(1)式估计目标值密度(株/每公顷)。首先画以10米间隔的目标探测直方图;找到以直方图显著变化的距离所对
11、应的目标探测数量,就为带宽w0的值。密度值为:图图1120.003220 100D样线距离1086420 10 20 30 40 50探测目标数目即30个/公顷(一)窄带法n特点:a)计算简单,但并不完全满意因为所有观察目标没有被用到估计;b)带宽w的确定有点强制性;c)探测目标率是随着样带宽度逐渐减少。n目视修正法(目视修正法(Smooth-by-eye method):为了使窄带法的直方图接近概率密度函数f,首先选择间隔宽度,然后用下面表达式确定一定距离x的直方图高 n特点:引入探测密度函数概念;因为间隔宽和目视探测密度的选择带有主观,所以不同人估计的结果不同。建立在相同概念,后面的参数方
12、法能够克服这些不足。(二)目视修正法00()yxywf x在间隔距离内的观察数总观察数 间隔宽度(二)目视修正法n根据上面图1柱状图,第一个10米间段探测到5个目标,即5/(1810)=0.028;第二个10米间段探测到7个目标,值为7/(1810)=0.039;同样地后三个间段值分别为0.017、0.011和0.006,据此画出直方图,如图2n由概率密度表达式,种群密度可以表达为图图20.080.060.040.020.00 10 20 30 40 50样线距离探测密度(0)2y fDL (数量/m2)(三)参数法n由上面两种方法,得知关键是对f(0)和带宽w的估计,假设它们之间的关系为:,
13、由上式知道其中之一,则可估计f(0)或w。n假如n个被观察到的调查对象的垂直距离x1,x2,xn 满足相互独立性。这些从样线到调查对象的垂直距离x被给出时,我们把调查对象被观测到的条件概率定义为探测函数g(x),g(x)是x的单调减少函数,当调查对象在样线上时,概率是1(g(0)=1)。被发现的调查对象的距离x的概率密度函数f(x)可以通过探测函数g(x)和带宽w来表示:f(x)=g(x)/w n为了估计f(x),使用最大似然估计方法估计探测函数的未知参数,就可得到f(0)或w的估计值为 或 。(0)f1(0)fw w(三)参数法n广泛应用的探测函数为指数指数函数函数形式,即g(x)=exp(
14、-x/w)。最大似然估计为 ,即探测目标距离的平均值。n拟合的指数曲线为图2曲线n依据上面的例子可以计算探测函数为指数形式的密度估计为:22yyDLwLx =18/2(16.39)(100)=0.0055=55(数量/公顷)w x0.080.060.040.020.00 10 20 30 40 50样线距离探测密度g(x)(三)参数法n探测函数为指数曲线的估计特点:1、简单容易估计 2、对种群总体估计不理想(曲线可看出)所以人们一般选择“肩形”探测曲线加以修正。n如果假设探测函数为半正态函数g(x)=exp(-3.14x2/4w2),参数w的最大似然估计为:以上面为例计算结果为:=25.61,
15、则 拟合的半正态函数曲线见图3。图图323.1421yiyiwx wD=18/2(25.61)(100)=0.0035=35(数量/公顷)0.080.060.040.020.00 10 20 30 40 50样线距离探测密度g(x)(四)非参数法n为了避免参数函数未知的探测函数的曲线形状,可以使用非参数函数估计方法,也就是直接估计概率密度函数f(0)。有两种方法估计f(0):1、核函数方法估计(Kernel method)2、富利叶级数方法(Fourier series method)1 核函数方法 式中:h是带宽,xj是第j个观察目标值,K是核函数(这里假设为对称核函数)从式中可以知道关键是
16、估计h,Silverman(1986)给出了h的计算公式:式中a=min(s,Q/1.34),s为x抽样样本目标观察值距样线的距离的标准差,Q是所有调查目标距离沿样线距离的中位值。依据上面案例,中位值为15,计算的s12.56,得到a=min(12.56,15/1.34=11.19)则窗宽h=0.9(11.19)(18)(-1/5)=5.65,核函数f(0)的估计为:调查目标的密度:2(1/2)(/)221211(0)()jjyyxx hyhhyhjjfKe1/50.9hay22220/2(5.65)44/2(5.65)218(5.65)2(0).0.0376fee(0)18(0.0376)0
17、.003422(100)yfDL2(数量/m)2 富利叶级数法 n富利叶级数方法估计f(0)式中:Ak是参数,f(0)为当垂直距离为0时发现目标个体的概率的密度函数;k依次取1、2、3、4、5等自然数;M为k的上限临界值,一般=C,在最初样点上增加样方;否则,不增加包含概率包含概率(Inclusion probability):理解为网络Ai所包含单元的概率(不能从抽样数据中计算,实际计算中用偏边缘包含概率(PIP)代替)。非常重要的参数,是计算Horvitz-Thompson估计值的主要参数,计算式为:yi1/11kkNxNnnN-总的取样单元数,xk-在网络Ak中总的单元数,n1-最初取样
18、点数选择概率选择概率(Selective probability):是计算Hansen-Hurwitz估计值的主要参数()!11!1!NNnnNn骣=-桫案例案例(1)SRS2)ACS?=1/3(2+54+38)=31.3 ACS方法均值和方差估计方法方法均值和方差估计方法目前目前ACSACS有三种方法计算平均值和方差有三种方法计算平均值和方差(1)(1)Hansen-Hurwitz Estimator(HH)Hansen-Hurwitz Estimator(HH)(2)(2)基于网络内均值基于网络内均值wiwi,不考虑边缘单元不考虑边缘单元(2)(2)Horvitz-Thompson Est
19、imator(HT)Horvitz-Thompson Estimator(HT)yk*为第k个网络内观察值和k为最初抽样入样第k个网络的包含概率jk表示最初抽样单元在第j个网络和第k个网络同时入样的包含概率 不考虑边缘单元是因为边缘单元不确定1jjkkjkNxNxxNxnnnNn(3)(3)RaoRao-Blackwell-Blackwell EsimatorEsimator(RB)(RB)lTen networks sampledlNetwork totals(yk*)lNine 0s and one network with an 11lIntersection probabilities
展开阅读全文