您的位置: 主页 > 参数 >

统计学(参数臆度)

  第三章 参数估计 【引例】灯泡的使用寿命 ◆想要知道的信息是:A、B两种品牌灯泡的 平均使用寿命?两种灯泡平均使用寿命的差值是 多少?(这些都是总体的参数) ◆已知的信息是:8只A品牌灯泡的使用寿命, 10只B品牌灯泡的使用寿命。(这些都是样本信 息) 因此,为了得到想要的答案,我们能做的就 是:利用抽样得到的样本信息来估计总体的信息。 在现实经济社会中,我们通常会面临两种 情况: 1、掌握了所研究总体的全部数据,那么 只需要做一些简单的统计描述,就可以得到有 关总体的数量特征。 2、有些现象的范围比较广,或者有些总 体的单位数很多,不可能也没有必要进行一一 测定。这就需要从总体中抽取一部分单位进行 调查,进而利用样本提供的信息来推断总体的 数量特征。 推断统计学是当代统计学的主要内容。统 计推断分为抽样估计、假设检验、统计预测三 个部分。 抽样估计——是指用样本提供的信息对总 体相应的数量特征所进行的估计或推断。具体 来说,就是用样本统计量去估计相应的总体参 数。 从数理统计的理论来看,抽样估计包括: 参数估计和非参数估计。 ◆非参数估计 非参数估计——是指对总体的分布形式一 无所知,不仅要对总体的分布类型,还要对部 分或全部总体参数一一作出估计和推断。 非参数估计是非常复杂的,不在我们讨论 的范围之内。 ◆参数估计 参数估计——是指在抽样和抽样分布的基 础上,根据样本信息对总体的未知参数进行的 估计。 比如,用样本均值估计总体均值;用样本 比率估计总体比率;用样本方差估计总体方差 等。 ◆参数估计包括:点估计和区间估计两种 具体的估计形式。 ?假设检验 ? ?非参数估计 ? ? ? 推断统计?抽样估计? ?点估计 ? ?参数估计?区间估计 ? ? ? ? ?统计预测 3.1 点估计 一、点估计 点估计——又称为定值估计,是指直接用一 个样本统计量的值作为总体参数的估计值。 【例】要估计一批产品的合格率,根据随机 抽出的一个样本可以计算出合格率为96%,若将 96%直接作为这批产品合格率的估计值,就是一 个点估计。 ◆用于点估计的主要方法:矩估计法、最 大似然估计法。 1、矩估计法 矩估计法是英国统计学家皮尔逊于1900年 提出的一种估计方法,它源于替换原理。 矩估计法——是指根据替换原理,用样本 矩去替换相应的总体矩,用样本矩的函数去替 换相应总体矩的函数,求得估计量的方法。 相应地,用矩估计法求得的估计量称为矩 估计量。 ◆矩估计的求法 设总体 X 的分布函数(或密度函数)中含有 k 个未知参数, 即 ? ? (?1 , ,?k ) ,假定总体的 k 阶原点矩 ? k 存在,则所有 j 阶原点 矩 ? j ? E( x j ) ( j ? 1, 1 n j , k ) 存在,记样本的 j 阶原点矩为 Aj ? ? xi ,令 n i ?1 Aj ? ? j (?1, ,?k ), j ? 1, ,k 可得 k 个含有未知参数 (?1 , ,?k ) 的方程,解此方程组可得 ? j 的 ? ? (? ? , ,? ? )。 矩估计 ??j , ( j ? 1, , k ) ,从而得 ? 的矩估计 ? 1 k 矩估计法的统计思想非常简单,使用也很 方便,其实质是用样本矩去替换总体矩,从而 求得总体参数的估计,是一种应用广泛的点估 计方法。 ◆需要注意的是,用矩估计法得出的估计 值可能不是唯一的。 2、最大似然法 最大似然法是在1821年首先由德国数学家 高斯提出的,后英国统计学家费雪研究了这种 方法的性质。 最大似然估计法——就是从参数空间中寻 找一个参数值,这个参数值对已经出现的样本 观测值是最可能的,即把令样本观测值出现的 可能性最大的参数值作为参数的估计。 相应地,用最大似然法求得的估计量称 为最大似然估计量,简记为MLE。 ◆最大似然估计的求法 设总体 X 是离散型随机变量, 其概率函数是 P( X ? x) ? p( x;? ) 其 中 ? 是未知参数, ( x1 , 测值出现的概率为 P( x1 , , xn ;? ) ? ? p( xi ;? ) i ?1 n , xn ) 是一组样本观测值,这组样本观 (3.1) 记 L(? ) ? P( x, , xn ;? ) ,称之为似然函数 , xn ) 出现的可能性的大小。 它度量了样本观测值 ( x1 , 如果总体 X 是连续型随机变量,其概率密度函数是 f ( x;? ) , 则相应的似然函数为 L(? ) ? ? f ( xi ;? ) i ?1 n (3.2) ? ?? ?( x , 按照最大似然法的思想,如果统计量? 1 ?) ? max L(? ) L(? ? ?? , xn ) 满足 (3.3) 则称 ?? 是 ? 的最大似然估计。 3、矩法和最大似然法的比较 ◆矩估计法是采用样本矩替换总体矩来估 计参数,相当于使用了分布函数的部分信息; ◆最大似然估计法是采用似然函数来求得 参数的估计,理论上相当于使用了分布函数的 全部信息; 在已知总体分布的前提下,采用最大似然 估计法的理由更充分,而在总体分布函数未知 但有关的总体矩已知的情况下,采用矩估计法 更合适。 3.2 点估计的评价标准 从上面的介绍可以看出,对于同一个总体 参数,采用不同的估计方法,可能会得到不同 的估计量。 那么,究竟用样本的哪种估计量作为总体 参数的估计最好?什么样的估计量才算是一个 好的估计量?这就需要有一定的评价标准。 而且对同一估计量使用不同的评价标准可 能得到不同的结论,因此评价某个估计量的好 坏一定要说明是在哪一个标准之下。常用的评 价标准有三个:无偏性、有效性、一致性。 一、无偏性 无偏性——是指样本估计量抽样分布的均 值等于被估总体参数的真实值。 ?) E(? ?? 无偏性实际是指:不同的样本,会有不同 的估计值。虽然从某一个具体样本来看,估计 值有时会大于θ,有时会小于θ,有误差。但 从所有可能样本的角度来看,估计值的平均水 平等于总体参数的真实值,即平均说来,估计 是无偏的。 二、有效性 参数的无偏估计量可能有很多个,那么该 如何考察这些估计量哪个更好呢?这时可以比 较它们有效性的大小。 有效性——又称为最小方差性,是指在若 干个无偏估计量中,方差最小的那个无偏估计 量就是有效估计量。 可见,一个有效的估计量,首先必须是无 偏的。 【例】现要通过抽样考察某班同学统计学测验 平均成绩,而且已知样本均值和中位数是两个 总体参数的无偏估计量,问应该用哪个统计量 作为总体参数的估计呢? 【解】可以考察两个统计量的有效性来决定。 若D( x ) ? D(M e ),则说明均值比中位数更有效 若D( x ) ? D(M e ),则说明中位数比均值更有效 三、一致性 一致性——又称为相合性,它说明当样本 容量n趋近于无穷大∞时,样本估计量依概率收 敛于总体参数的真实值θ。即随着样本容量的 增大,点估计量的值越来越接近被估计总体参 数的真值。 换言之,一个大样本给出的估计量要比一 个小样本给出的估计量更接近总体参数的真实 值。 四、几个重要的结论 ◆样本均值、样本方差和样本比率,分别 是总体均值、总体方差和总体比率的无偏、有 效和一致的优良估计量; ◆无偏估计有时可能不存在,有时也可能 不唯一; ◆除了无偏性、有效性、一致性,评价一 个点估计量的好坏时,还可以用均方误差MSE 的概念。 3.3 区间估计的概念 一、区间估计的概念 用点估计值代表总体参数值时,只给出了 未知参数的一个具体数值,但没有回答估计的 精度。也就是说,除了具体的估计值,我们还 想知道这个估计值和真实值接近的程度是怎样 的,这时就必须进行区间估计。 通常可以认为,区间估计是在点估计的基 础上,给出未知总体参数的一个取值范围,及 这个范围的可靠程度。 区间估计——就是用一个区间去估计未知 总体参数,把未知总体参数值界定在两个数值 之间。即根据样本估计量,以一定的置信度估 计和推断总体参数的区间范围。 ◆总体参数的估计区间,通常是由样本统 计量加减抽样极限误差而得到的。 二、区间估计的数学表达式 设总体X的分布密度函数F(x,θ)中含有一个 未知参数θ,而x1,…,xn是来自X的一个样本,对 于给定的α(0α1),若能找到两个统计量θ1和 θ2,使得: P{θ1≤θ≤θ2}=1-α 则称区间[θ1,θ2]为θ的置信度为1-α的 置信区间。α为显著性水平;1-α为区间估计 的置信度或置信水平。 置信区间图示 f ?x ? 置信区间 ? 1?? 2 ? 0 2 ??1 ? ? ? ? 2 x 置信下限 点估计值 置信上限 三、区间估计的基本原理 如果我们作多次同样的抽样,将会得到多个 置信区间,那么其中有的置信区间包含了总体参 数的真值;而有的置信区间却未包含总体参数的 真值。 置信度——包含总体参数真值的次数在所有 置信区间中所占的比率。 【例如】置信度为95%表明:如果抽取100个随机样 本来估计总体的均值,那么由100个样本所构造的 100个置信区间中,有95个区间包含了总体参数的 线个区间则不包含。 四、常用的置信度 在构造置信区间时,我们可以用所希望的值 作为置信水平。比较常用的置信水平及临界值如 下表: 置信水平 1?? 显著性水平 ? Z? 2 90% 95% 99% 0.10 0.05 0.01 1.645 1.96 2.58 但要特别注意:查“标准正态分布表” 时,由于 Z ? ? Z 1?? 2 2 通常不直接查 而是查 Z? 具体地,从表中先找到与 2 Z 1?? 1?? 最接近的数 2 2 2 值,该数值对应的x值,就是 Z? 值。 五、影响置信区间宽度的因素 ①当样本容量n确定时,置信区间的宽度随 着置信水平1-α的增大而增大。从直觉上说, 置信区间比较宽时,才会使这一区间有更大的 可能性包含总体参数的线-α固定时,置信区间的宽 度随着样本容量n的增大而变窄。即置信水平不 变时,样本容量n越大,抽样误差越小,估计的 精度越高,则置信区间就越窄。 六、理解置信区间必须注意的问题 ◆若在所有区间中,有95%的区间包含总 体参数的线%的区间不包含,则这个区 间就称为置信水平为95%的置信区间。 这样表述置信区间的理由是:总体参数真 值是固定的、未知的,而用样本构造的区间随 样本不同而不同,因此置信区间是一个随机区 间,它不仅因样本的不同而不同,且不是所有 的区间都包含总体参数的线-α这个概率,不能用来描述 某个特定的区间包含总体参数真值的可能性。 只能知道在多次抽样得到的区间中,大概有多 少个区间包含了总体参数的真值。 一个特定的区间包不包含总体参数的真值 是绝对的,不存在可能或不可能包含的问题。 【例如】在99%的置信度下,得到某班学生身高 的置信区间为(155,175),若该班平均身高 的线,则绝对 不包含。 区间估计 一个正态总体参数 的区间估计 两个正态总体参数 的区间估计 均值 比率 方差 均值 之差 比率 之差 方差 之比 3.4 一个正态总体参数的区间估计 一、总体均值的区间估计 在对正态总体的均值进行区间估计时,需 要考虑以下几个方面的内容: ◆总体的方差是否已知; ◆用于构造估计量的样本是大样本还是小 样本等。 1、总体方差σ2已知时 当总体服从正态分布,又已知总体方差 σ2时,无论样本为大样本或小样本,经过标 准化后,样本均值都服从标准正态分布,因 此总体均值? 在1–α的置信水平下,置信区间 为: x ? Z? ? 2 n ? ? ? x ? Z? ? 2 n 在第八章将介绍,抽样平均误差为 ? x ? ? 而抽样极限误差=临界值×抽样平均误差 ? n ? x ? Z? ? 2 ? x ? Z? ? 2 n 因此,置信区间可以简写成“点估计值± 抽样极限误差” x ? ?x ? ? ? x ? ?x 【例1】一家企业每天生产化肥的产量为8000袋 左右,按规定每袋的重量应为100克。为分析 每袋重量是否符合要求,质检部门从某天生产 的一批化肥中随机抽取了25袋,测得平均每袋 的重量为105.36克,已知产品重量的分布服从 正态分布,且总体的方差为100。 要求以95%的置信度,估计该批产品平均 重量的置信区间。 【解】依题意得,零件长度方差已知,又n=25, σ=10,查表得 Zα/2=1.96, x ? 105 .36 而抽样极限误差为: ? 10 ? x ? Z? / 2 n ? 1.96 ? 25 ? 3.92 所以在95%的置信水平下该种零件的平均长度的置 信区间为: x ? ? ? ? ? x ? ? x x ? 105.36 ? 3.92 ? ? ? 105.36 ? 3.92 ? 101.44 ? ? ? 109.28 表明在95%的置信水平下,该批产品的平均重量在 101.44至109.28克之间。 【练习1】某种零件的长度服从正态分布,现从 该产品中随机抽取9件,测得其平均长度为 21.4厘米。根据以往的经验,该批产品的总体 标准差σ=0.15厘米。 要求以95%的置信度估计该种零件平均长 度的置信区间。 【解】依题意得,零件长度方差已知,又n=9, σ=0.15,Zα/2=1.96 x ? 21 .4 而抽样极限误差为: ? 0.15 ? x ? Z? / 2 n ? 1.96 ? 9 ? 0.098 所以在95%的置信水平下该种零件的平均长度的 置信区间为: x ? ?x ? ? ? x ? ?x ? 21.4 ? 0.098 ? ? ? 21.4 ? 0.098 ? 21.302 ? ? ? 21.498 表明在95%的置信水平下该种零件的平均长度在 21.302至21.498厘米之间。 2、总体方差未知,但大样本时 若总体方差未知,但在大样本的情况下, 样本均值仍然可以用正态分布近似,只是要用 样本方差代替总体方差,此时总体均值的置信 区间为: x ? Z? s 2 n ? ? ? x ? Z? s 2 n 【例2】一家保险公司收集到由36个投保人组成 的一个随机样本,并计算得到这个样本的平均 年龄为39.5岁,标准差为7.77岁。 试在90%的置信水平下,建立投保人年龄的 置信区间。 【解】本题的总体方差未知,但属于大样本 x ? 39.5,s ? 7.77,? ? 0.10 Z 抽样极限误差为: ? 2 ? 1.645 ?x ? Z ? 2 s 7.77 ? 1.645 ? ? 2.13 n 36 所以,在90%的置信水平下,置信区间为: x ? ?x ? ? ? x ? ?x ? 39.5 ? 2.13 ? ? ? 39.5 ? 2.13 ? 37.37 ? ? ? 41.63 表明在90%的置信水平下,投保人的平均年龄在 37.37至41.63岁之间。 【练习2】在大兴安岭林区,随机抽取了100块面 积为1公顷的样地,根据调查测量求得每公顷林 地平均出材量为88m3,标准差为10m3。 试分别在99%和95%的置信水平下,估计大 兴安岭林区每公顷地平均出材量的置信区间。 【解】本题的总体方差未知,但属于大样本 x ? 88,s ? 10,? ? 0.01 Z ? ? 2.58 2 抽样极限误差为: ?x ? Z ? 2 s 10 ? 2.58 ? ? 2.58 n 100 所以,在99%的置信水平下,置信区间为: ? 88 ? 2.58 ? ? ? 88 ? 2.58 ? 85.42 ? ? ? 90.58 x ? ?x ? ? ? x ? ?x 表明在99%的置信水平下,大兴安岭林区每公顷 地平均出材量在85.42至90.58之间。 当1-α=0.95,查表得Zα/2=1.96,又已知抽样平均 误差σ=1,于是,抽样极限误差 ? ? Z ? ?? x 2 x ? 1.96 ?1 ? 1.96 则置信区间为 ? 88 ? 1.96 ? ? ? 88 ? 1.96 ? 86.04 ? ? ? 89.96 x ? ?x ? ? ? x ? ?x 显然,95%比99%的置信区间缩小了。 由此可见:置信度越大,抽样极限误差越 大,置信区间就越宽。反之,置信度越小,抽 样极限误差越小,置信区间就越窄。 3、总体方差未知且小样本时 根据小样本分布定理可知,在小样本条 件下,如果总体是正态分布、总体方差未知 的情况,那么随机变量服从自由度为n-1的t 分布。此时在给定的置信水平1-α下,总体 均值? 的置信区间为 S S x ? t? ?n ? 1? ? ? ? x ? t? (n ? 1) 2 2 n n 【例3】已知某种灯泡的寿命服从正态分布,现 从一批灯泡中随机抽取16只,测得其平均使用 寿命为1490小时,标准差为24.77小时。 试以95%的置信度,估计该批灯泡平均使 用寿命的置信区间。 【解】n=16属于小样本且总体方差σ2未知, 又已知α=0.05, x ? 1490,s ? 24.77 t? / 2 (n ?1) ? 2.131 于是,抽样极限误差为: s 24.77 ?x ? t? 2 ?n ? 1? n ? 2.131? 16 ? 13.2 所以在95%的置信度下,置信区间为: x ? ?x ? ? ? x ? ?x ? 1490 ? 13.2 ? ? ? 1490 ? 13.2 ? 1476.8 ? ? ? 1503.2 计算结果表明:在95%的置信度下,该种灯泡平 均使用寿命在1476.8至1503.2小时之间。 【练习3】设某上市公司的股票价格服从正态分 布,为了掌握该上市公司股票的平均价格情况, 现随机抽取了25天的交易价格进行调查,测得 平均价格为35元,方差为4。 试以98%的置信度,估计该上市公司股票 平均交易价格的置信区间。 【解】本题n=25属于小样本且总体方差未知, 又已知1-α=0.98, x ? 35 ,s 2 ? 4 t? / 2 (n ?1) ? 2.492 于是,抽样极限误差为: s 2 ?x ? t? 2 ?n ? 1? n ? 2.492 ? 25 ? 0.997 所以在98%的置信度下,该公司股票交易价格的 置信区间为: x ? ?x ? ? ? x ? ?x ? 35 ? 0.997 ? ? ? 35 ? 0.997 ? 34.003 ? ? ? 35.997 计算结果表明:在98%的置信度下该上市公司股 票交易的平均价格在34.00至36.00元之间。 单个正态总体均值的区间估计小结 样本大小 总体 方差 已知 总体 方差 未知 大样本 小样本 重复抽样 ? x ? Z? ? 2 n x ? Z? ? 2 大样本 s n s n 小样本 x ? t? ?n ? 1? ? 2 二、总体比率的区间估计 我们只讨论大样本情况下,总体比率的区 间估计。 在大样本条件下,样本比率服从正态分布。 标准化后,它服从标准正态分布。因此总体比 率在1-α的置信水平下的置信区间为: p ? Z? 2 p(1 ? p) p(1 ? p) ? P ? p ? Z? n n 2 【例5】为了控制某生产线的废品率,现随机从 产品中抽取60件进行调查,结果发现有9件废 品。 试以98%的置信水平,估计该生产线产品 废品率的置信区间。 【解】n=60属于大样本,1-α=0.98,Zα/2=2.33, p=0.15,抽样极限误差为 ?? p? ? Z? 2 p(1 ? p) 0.15 ? 0.85 ? 2.33 ? ? 0.1074 n 60 所以在98%的置信度下,该生产线产品废品率 的置信区间为: p ? ?p ? P ? p ? ?p ? 0.15 ? 0.1074 ? P ? 0.15 ? 0.1074 ? 0.0426 ? P ? 0.2574 计算结果表明:在98%的置信度下,该生产线】为了研究某小学的学生拥有手机的比 例,随机抽选100名学生,调查发现其中31名 拥有手机。 试求该小学全校学生拥有手机比例的置信 度为90%的置信区间。 【解】已知n=100属于大样本,有1-α=0.90, Zα/2=1.65,p=0.31,故抽样极限误差为 ?? p? ? Z? 2 p(1 ? p) 0.31? 0.69 ? 1.65 ? ? 0.076 n 100 所以在90%的置信度下,该小学全体学生拥有 手机比例的置信区间为: p ? ?p ? P ? p ? ?p ? 0.31 ? 0.076 ? P ? 0.31 ? 0.076 ? 0.234 ? P ? 0.386 计算结果表明:在90%的置信度下,该小学全 体学生拥有手机的比例在23.4%至38.6%之间。 三、总体方差的区间估计 样本方差服从自由度为n-1的Χ2分布。 因此,对于给定的置信度1-α,总体方差的 置信区间为: ?n ? 1? S 2 ? 2 ?? ? 2 ?n ? 1? S 2 ? 2 ? 2 1?? 2 【例4】某自动车床加工的某种零件长度X近似 服从正态分布,现随机抽查16个零件,测得 其方差为0.00244。 试以95%的置信度,估计该种零件方差的 置信区间。 【解】已知S2=0.00244,1-α=0.95,α=0.05, 查χ2分布表得: χ20.025(16-1)=χ20.025(15)=27.488 χ21-0.025(16-1)=χ20.975(15)=6.262 在95%的置信度下,总体方差的置信区间为: ? 27.488 ? 0.00133 ? ? 2 ? 0.00584 2 ?16 ? 1?? 0.00244 ? ? 16 ? 1?? 0.00244 ? 6.262 计算结果表明:该自动车床加工的零件长度方差 在0.00133至0.00584之间。 【练习4】某机械厂的某种器械使用寿命X近似 服从正态分布,现质检部门的有关人员随机 抽查了25台这种器械,测得该样本的方差为 2350。 试以99%的置信度,估计该种器械方差的 置信区间。 【解】已知S2=2350,1-α=0.99,α=0.01, 查χ2分布表得: χ20.005(25-1)=χ20.005(24)=45.5585 χ21-0.005(25-1)=χ20.995(24)=9.886 在99%的置信度下,总体方差的置信区间为: ? 45.5585 9.886 ? 1237.97 ? ? 2 ? 5705.04 2 ?25 ? 1?? 2350 ? ? 25 ? 1?? 2350 ? 计算结果表明:该机械厂生产的器械使用寿命 的方差在1237.97至5705.04之间。 3.5 两个正态总体参数的区间估计 一、两个总体均值之差的区间估计 对于两个正态总体均值之差的估计,必须 考虑以下几个问题: ◆两个总体的方差是否已知; ◆两个总体的方差是否相等; ◆样本容量是大样本还是小样本; 1、两个总体的方差都已知 当两个总体都是正态总体时,两个样本 均值之差经标准化后服从标准正态分布。则 两个总体均值之差在1-α置信水平下的置信 区间为: ?x ? x ? ? Z 1 2 ? 2 ? ?? 2 1 2 2 2 n 1 n 【例1】为了调查甲、乙两家银行的户均存款 额,从两家银行各抽选一个由25个储户组成的 随机样本。两个样本均值分别为4500元和3250 元,两个总体标准差分别为920元和960元。 根据经验,知道两个总体均服从正态分布, 试求两个总体均值之差的置信度为90%的置信 区间。 【解】两个总体均服从正态分布,且总体方差 都已知,因此两个总体均值之差的90%的置信 区间为 ?x ? x ? ? Z 1 2 ? ? 12 2 n ? 2 ?2 1 n 2 920 2 960 2 ? ?4500 ? 3250 ? ? 1.65 ? ? 25 25 ? 1250 ? 439 即置信区间为(811,1689),表明在90%的 置信水平下两个银行户均存款额之差在811元 至1689元之间。 【练习1】某厂有两台生产金属棒的机器,由 经验可知它们生产的金属棒的长度都服从正态 分布,且两个总体的标准差分别为0.063厘米 和0.059厘米。现各抽取一个随机样本来检验 两台机器是否运转正常,一个样本由机器甲生 产的11根金属棒组成,其均值为8.06厘米,另 一个样本由机器乙生产的21根金属棒组成,其 均值为7.74厘米, 试求两个总体均值之差的置信度为95%的 置信区间。 【解】两个总体均服从正态分布,且总体方差 都已知,因此两个总体均值之差的95%的置信 区间为 ?x ? x ? ? Z 1 2 ? ? 12 2 1 n n ? 2 ?2 2 0.0632 0.059 2 ? ?8.06 ? 7.74? ? 1.96 ? ? 11 21 ? 0.32 ? 0.045 即置信区间为(0.275,0.365),表明在95% 的置信水平下两个银行户均存款额之差在 0.275厘米至0.365厘米之间。 2、两个总体方差未知,但都是大样本 对于正态总体,虽然方差是未知的,但 在大样本情况下,两个样本均值之差经标准 化后仍服从标准正态分布,因此可用两个样 本方差来代替总体方差。故两个总体均值之 差在1-α置信水平下的置信区间为: ?x ? x ? ? Z 1 2 ? 2 s ?s n n 1 1 2 2 2 2 【例2】某地区教育委员会想估计两所中学的 学生高考时的英语平均分之差,为此在两所中 学独立地抽取了两个随机样本,得到有关数据 如下: 中学1:样本容量为46,平均分为86分, 标准差为5.8分; 中学2:样本容量为33,平均分为78分, 标准差为7.2分。 试以95%的置信水平估计两个中学高考英 语平均分之差的置信区间。 【解】依题意两个总体都未知,但有以下条件 n1 ? 46 ? 30 属于大样本,且 x1 ? 86 s1 ? 5.8 n2 ? 33 ? 30 也属于大样本,且 x 2 ? 78 s 2 ? 7.2 于是在95%的置信水平下两个中学高考英 语平均分之差的置信区间为: ?x ? x ? ? Z 1 2 ? 2 s ?s n n 1 1 2 2 2 2 5.82 7.2 2 ? ?86 ? 78? ? 1.96 ? ? 46 33 ? 8 ? 2.97 即置信区间为(5.03,10.97),表明在 95%的置信水平下两个中学高考英语平均分之 差在5.03分至10.97分之间。 【练习2】某乡为了估计两个村小麦平均亩产 之差,在这两个村种植小麦的地块中分别抽取 一个随机样本,得到有关数据如下: 甲村:样本容量为40,平均亩产为520千 克,标准差为25千克; 乙村:样本容量为45,平均亩产为460千 克,标准差为28千克。 试以95%的置信水平估计两个村平均亩产 之差的置信区间。 【解】依题意两个总体都未知,但有以下条件 n1 ? 40 ? 30 属于大样本,且 x1 ? 520 s1 ? 252 ? 625 2 n2 ? 45 ? 30 也属于大样本,且 x 2 ? 460 2 s2 ? 28 ? 784 2 于是在95%的置信水平下两个村小麦平均 亩产量的置信区间为: ?x ? x ? ? Z 1 2 ? 2 s ?s n n 1 1 2 2 2 2 625 784 ? ?520 ? 460? ? 1.96 ? ? 40 45 ? 60 ? 5.75 即置信区间为(54.25,65.75),表明在 95%的置信水平下两个村小麦平均亩产之差在 54.25千克至65.75千克之间。 3、两个总体方差未知,但相等 当两个总体方差未知但相等时,需要用两 个样本的方差来估计,此时必须将两个样本的 数据组合在一起,以给出总体方差的合并估计 量,计算公式为: sw 2 2 2 ? n1 ? 1?s1 ? ?n2 ? 1?s2 ? n1 ? n2 ? 2 这时,两个样本均值之差经过标准化以后 服从t分布,即 1 1 ?x1 ? x2 ? ? t? / 2 ?n1 ? n2 ? 2?sw ? n1 n2 【例3】为了估计两种方法组装产品所需时间的 差异,分别对两种不同的组装方法各随机的安 排12个工人,得到有关数据如下: 方法1:平均时间为32.5分钟,方差为15.996 方法2:平均时间为28.8分钟,方差为19.358 假定两种方法组装产品的时间服从正态分 布,且方差相等。试以95%的置信水平建立两种 方法组装产品所需平均时间差值的置信区间。 【解】依题意两个总体方差都未知,但相等的 情况下 首先,总体方差的合并估计量为 sw 2 ? n1 ? 1?s1 ? ?n2 ? 1?s2 ? 2 2 n1 ? n2 ? 2 (12 ? 1) ?15.996 ? (12 ? 1) ?19.358 ? 12 ? 12 ? 2 ? 17.677 于是在95%的置信水平下,两个总体均值 之差的置信区间为: ?x ? x ? ? t 1 2 ? 2 sw ( 2 1 1 n n ? 1 2 ) 1 1 ? ?32.5 ? 28.8? ? 2.074 ? 17.677 ? ( ? ) 12 12 ? 3.7 ? 3.56 即(0.14,7.26),表明两种方法组装产 品所需平均时间之差的置信区间为0.14至7.26 分钟。 【练习3】一所大学的保健医生想了解大一和大 二两个年级学生戴眼镜时间长短的差异,随机 在两个年级的所有学生中各抽取15名学生,得 到有关数据如下: 大一生:平均时间为1028天,方差为77.4 大二生:平均时间为984天,方差为62.1 假定两组学生配戴眼镜的时间服从正态分 布,且方差相等。试以98%的置信水平建立两个 年级学生配戴眼镜平均时间差值的置信区间。 【解】依题意两个总体方差都未知,但相等的 情况下 首先,总体方差的合并估计量为 sw 2 ? n1 ? 1?s1 ? ?n2 ? 1?s2 ? 2 2 n1 ? n2 ? 2 (15 ? 1) ? 77.4 ? (15 ? 1) ? 62.1 ? 15 ? 15 ? 2 ? 69.75 于是在98%的置信水平下,两个总体均值 之差的置信区间为: ?x ? x ? ? t 1 2 ? 2 sw ( 2 1 1 n n ? 1 2 ) 1 1 ? ?1028 ? 984? ? 2.4671? 69.75 ? ( ? ) 15 15 ? 44 ? 7.52 即(36.48,51.52),表明两个年级学生 配戴眼镜的平均时间之差的置信区间为36.48 天至51.52天。 二、两个总体方差之比的区间估计 由于两个样本方差之比的抽样分布服从F 分布,因此我们用F分布来构造两个总体方差 之比的置信区间。 2 2 2 2 ? ? ? ? s1 s2 , s1 s2 ? ? F ? (n1 ? 1, n2 ? 1) F 1?? (n1 ? 1, n2 ? 1) ? ? 2 ? 2 ? 【例4】已知A、B两种品牌袋装大米的重量服从 正态分布,为了研究它们重量的差异,现随机 抽取了13袋A品牌和16袋B品牌大米,得到有关 数据如下: A品牌:方差为0.23 B品牌:方差为0.15 试给出两个总体方差之比的90%的置信区间。 【解】由于两个样本方差之比的抽样分布服从F 分布,根据公式可得90%置信水平下的置信区 间为 2 2 2 2 ? ? ? ? s1 s2 s 1 s2 , ? ? F ? (n1 ? 1, n2 ? 1) F 1?? (n1 ? 1, n2 ? 1) ? ? 2 2 ? ? 0.23 / 0.15 0.23 / 0.15 ?[ , ] 2.48 0.382 ? [0.62, 4.02] 【练习4】为了研究男女学生在生活费支出上的 差异,在某大学各随机抽取了25名男生和25名 女生,得到有关数据如下: 男生:平均生活费为520元,方差为260 女生:平均生活费为480元,方差为280 试以90%的置信水平估计男生和女生生活费 支出方差之比的置信区间。 【解】由于两个样本方差之比的抽样分布服从F 分布,根据公式可得90%置信水平下的置信区 间为 2 2 2 2 ? ? ? ? s1 s2 s 1 s2 , ? ? F ? (n1 ? 1, n2 ? 1) F 1?? (n1 ? 1, n2 ? 1) ? ? 2 2 ? ? 260 / 280 260 / 280 ?[ , ] 1.98 0.505 ? [0.47,1.84] 三、两个总体比率之差的区间估计 在估计两个总体比率之差时,我们通常 会假定两个总体近似服从正态分布来,且两 个样本是独立的。此时,两个总体比率之差 ?1-?2在1-? 置信水平下的置信区间为 ? p1 ? p2 ? ? z? 2 p1 (1 ? p1 ) p 2 (1 ? p 2 ) ? n1 n2 【例5】在某个电视节目的收视率调查中,农 村随机调查了 500 人,有 45% 的人收看了该节 目;城市随机调查了 400 人,有 32% 的人收看 了该节目。 试以95%的置信水平估计城市与农村收视 率差别的置信区间 【解】已知n1=500,n2=400,p1=45%,p2=32%, 1-? =95%, z?/2=1.96 则?1-?2置信度为95%的置信区间为 45% ? (1 ? 45%) 32% ? (1 ? 32%) ?45% ? 32%? ? 1.96 ? ? 500 400 ? 13% ? 6.32% ? ?6.68% , 19.32% ? 即城市与农村收视率差值的置信区间为 (6.68%,19.32%) 【练习5】在某大学进行某个网络游戏的使用 调查中,对男生随机调查了 500 人,发现有 72%的人正在使用或曾经使用过该游戏;对女 生随机调查了 500 人,发现有 55% 的人正在使 用或曾经使用过该游戏。 试以90%的置信水平估计男生和女生使用 该游戏比率之差的置信区间 【解】已知n1=500,n2=500,p1=72%,p2=55%, 1-? =90%, z?/2=1.65 则?1-?2置信度为90%的置信区间为 72% ? (1 ? 72%) 55% ? (1 ? 55%) ?72% ? 55%? ? 1.65 ? ? 500 500 ? 17% ? 3% ? ?14% , 20% ? 即男生与女生使用该游戏比率之差的置 信区间为(14%,20%) 课堂练习 【练习1】某企业从长期实践得知,其产品直径X是 一随机变量,服从方差为0.05的正态分布。从某日 产品中随机抽取9个,测得其直径分别为14.8、 15.3、15.1、15.0、14.7、15.1、14.9、15.5、 15.7厘米。在95%的置信度下,试求该产品直径的均 值的置信区间。 【练习2】某商场从一批袋装食品中随机抽取16袋, 测得每袋重量分别为789、780、794、762、802、 813、770、785、810、806、799、822、819、767、 784、793克,要求以98%的置信度,估计这批食品 的平均每袋重量的区间范围。 课堂练习二 【练习1】某居民小区共有居民500户,小区管理者 准备采取一项新的供水设施,想了解居民是否赞成。 随机抽取了50户,其中有32户赞成,18户反对。求 总体比率置信度为95%的置信区间。 【练习2】从两个正态总体中分别抽取两个独立的随 机样本,它们的均值和标准差如下: 样本1:样本容量14,均值53.2,方差96.8 样本2:样本容量7,均值43.4,方差102 求两个总体均值之差的置信度为90%的置信区间。

本站文章于2019-10-09 03:28,互联网采集,如有侵权请发邮件联系我们,我们在第一时间删除。 转载请注明:统计学(参数臆度)

Tag: 参数


标志 > 德天电子

原理| 电子| 设计| 程序| 开关| 设计| 数据| 参数|

网站备案号: Copyright © 2002-2017 DEDECMS. 织梦科技 版权所有版权所有:德天电子

Tag标签 网站地图

家电维修|北京赛车pk10

Copyright 2015 Enterprise Management Training Center All Rights Reserved.