第八章参数估计
第八章 参数估计 §8.1 估计量的优劣标准 §8.2 获得估计量的方法点估计 §8.3 区间估计 研究参数估计,要解决两个方面的问题 1.怎样估计参数,即用什么样的办法对参数进行估计; 2.对估计出的参数值用什么标准衡量其优劣程度。 参数估计的概念 定义 设总体X的分布函数Fx; 的形式为已 知, 。其中为未知参数, 为参数空间, X1, , Xn是总体X的一个样本,若统计 量 fX1, , Xn可作为的一个估计,则称其为 的 一个估计量,记为 注X的分布函数Fx;也可用分布律或密度函数代替. 若x1, , xn是样本的一个观测值。 在不致混淆的情况下统称估计量与估计值为估计 §8.1 估计量的优劣标准 (一) 一致估计 定义 8.1 一致性是对于极限性质而言的,它只在样本 容量较大时才起作用。 (二)无偏估计 例1 从总体ξ中 取一样本( X1, ,Xn ),Eξ μ , Dξ σ2 , 试证样本平均数 分别是μ及σ2的无偏估计。 证 ∴样本均值X是μ的无偏估计 。 ∴S2是σ2的无偏估计 如果从总体中随机取出两个相互独立的样本( X11 , ,X1n1 )及(X21 , ,X2n2),则可以证明 分别是总体中μ和σ2的无偏估计量。其中, 对总体的某一参数的无偏估计量往往不止一个,而 且无偏性仅仅表明θ所有可能取的值按概率平均等 于θ,可能它取的值大部分与θ相差很大。为保证 θ的取值能集中与θ附近,自然要求θ的方差越小 越好。 (三)有效估计 由定义可知,一个无偏估计量取的值是在可能范围内最密 集与未知参数的真值 θ附近摆动。 定义8.3 设θ和θ’都是θ的无偏估计,若样本容量为 n, θ的方差小于θ’的方差,则称θ是比θ’有效的估计量 。如果在θ的一切无偏估计量中, θ的方差达到最小 ,则θ称为θ的有效估计量。 实际上,样本平均数X是总体期望值μ的有效估计量。 例2 比较总体期望值μ的两个无偏估计的有效性。 解 μ 利用不等式 §8.2 获得估计量的方法点估计 点估计就是以样本的某一函数值作为 总体中未知参数的估计值的一种估计方法 若x1, , xn是样本的一个观测值。 由于f x1, , xn 是实数域上的一个点, 现用它来估计, 故称这种估计为点估计。 点估计的经典方法是矩估计法与极大似然估 计法。 一)矩估计法(简称“矩法”) 关键点1.用样本矩作为总体同阶矩的估计,即 2.约定若 是未知参数的矩估计,则f的矩 估计为f , 矩法是求估计量的最古老的方法。 具体的做法是以样本矩作为相应的总体矩的估计, 以样本矩的函数作为相应的总体矩的同一函数的估计。 常用的是用样本平均数 估计总体期望值 。 例1 某灯泡厂某天生产了一大批灯泡,从中抽取了10 个进行寿命实验,得数据如下(单位小时)问该天生 产的灯泡平均寿命是多少 矩法比较直观,求估计量有时也比较直接,但它 产生的估计量往往不够理想。 10501100108011201200 12501040113013001200 解 计算出X﹦1147,以此作为总体期望值μ的估计。 (二)最大似然估计法 1、最大似然思想 有两个射手,一人的命中率为0.9,另一人的 命中率为0.2,现在他们中的一个向目标射击了一 发,结果命中了,估计是谁射击的 一般说,事件A发生的概率与参数有关,取值 不同,则PA也不同。因而应记事件A发生的概率 为PA|.若A发生了,则认为此时的值应是在中 使PA| 达到最大的那一个。这就是最大似然思 想 最大似然法是要选取这样的θ,当它作为θ 的估 计值时,使观察结果出现的可能性最大。 设ξ为连续性随机变量,它的分布函数是Fx;θ,概 率密度是 其中θ是未知参数,可以是 一个值,也可以是一个向量。由于样本的独立性,则 样本 对于连续型的随机变量就是估计概率密度中的θ。 对于离散型的随机变量就是估计概率函数中的参数θ; 的联合概率密度是 对每一个取定的样本值 是常数 ,L是参数θ 的函数,称L为样本的似然函数 (如果 是一个向量,则L 是多元函数)。 设ξ为离散型随机变量,有概率函数 则似然函数 定义8.4 如果 在 θ处达到最大值,则称θ是 θ的最大似然 估计。 式子右边的θ表示函数关系。问题是如何把θ的最大似 然估计θ求出来,由于㏑ L与L同时达到最大值,故 只需求㏑ L的最大值点即可。 θ与样本有关,它是样本的函数,即 如果θ是一个向量,即 一般情况下, ㏑ L在最大值点 的一阶偏导数等于0,即 是 上面方程组的解。要求最大似然估计,首先要解这个 似然方程组。 考虑方程组 1.设总体X为离散型随机变量,它的分布律为 现有样本观察值x1,x2,xn,,其中xi取值于{xi, i1,2} 问根据极大似然思想,如何用x1,x2,xn估计 例5.设X1, , Xn为取自参数为的泊松分 布总体的样本,求的极大似然估计 2.设总体X为连续型随机变量,概率密度φx; θ 现有样本观察值x1,x2,,xn, 问根据极大似然思想,如何用x1,x2,xn估计 2、似然函数与极大似然估计 为该总体的似然函数。 定义若有使得 则称 为的极大似然估计.记为 3、求极大似然估计的步骤 1 做似然函数 2 做对数似然函数 3 求导数,列似然方程 若该方程有解,则其解就是θ的最大似然估计。 4 解似然方程 注1若概率函数中含有多个未知参数,则可 解方程组 例6设X1, , Xn为取自 Nμ,σ2 总 体的样本,求参数 μ,σ2 的极大似然估计。 注2极大似然估计具有下述性质 若 是未知参数的极大似然估计, g是的严格 单调函数,则g的矩极大似然估计为g , 例7设X1, , Xn为取自参数为的指数分布 总体的样本,a0为一给定实数。 求pP{X0未知,求参数 的极大似然估计。 例2 已知 为ξ 的一组样本观察值,求θ的最大似然估计。 解 似然函数 解似然方程 x 就是 的最大似然估计。 例3 某电子管的使用寿命(从开始使用到初次失效为 止)服从指数分布(概率密度见例2),今抽取一组样本 ,其具体数据如下;问如何估计 16295068100130140270280 3404104505206201902108001100 解 根据例2的结果,参数θ用样本平均数估计 为θ的估计值。 为ξ的一组样本观察值,用最大似然估计法估计 的值。 解 例4 已知ξ服从正态 分布 解似然方程组 解似然方程组 §8.3 区间估计 一、概念 定义 设总体X的分布函数Fx;含有未知参 数,对于给定值(0 1,若由样本X1, , Xn 确定的两个统计量 使 则称随机区间 为的置信度为1的置信区间 注Fx;也可换成概率密度或分布律。 估计未知参数所在的范围 的方法称为区间估计 单正态总体参数的区间估计 1、2已知,估计μ /2 /2 1- 可取 1- 1- 的置信度为1的置信区间为 注的1置信区间不唯一。 都是的1置信区间.但可以证明1/2时区间长最短. 1根据实际问题构造样本的函数,要求仅含 待估参数且分布已知; 2令该函数落在由分位点确定的区间里的概率 为给定的置信度1,要求区间按几何对称或概率 对称; 3解不等式得随机的置信区间; 4由观测值及值查表计算得所求置信区间。 求正态总体参数置信区间的解题步骤 例2 若灯泡寿命服从正态分布ξ~N μ,8,从中抽取 了10个进行寿命实验,得数据如下(单位小时)试估 计平均寿命所在范围(a0.05). 10501100108011201200 12501040113013001200 解已知总体方差σ2,估计总体期望 μ 对于给定的α,查表确定 解已知总体方差σ2,估计总体期望 μ 对于给定的α=0.05,查表确定 根据样本值计算 ∴μ的置信度为1- α=0.95的置信区间 是 (1145.25, 1148.75) 例3 已知某炼铁厂的铁水中含碳量在正常情况下服从 正态分布,其方差σ2 0.1082 .现在测定了9炉铁水,其 平均含碳量为4.484.按此资料计算该厂铁水平均含碳量 的置信区间,并要求有95 的可靠性。 解已知总体方差σ2,估计总体期望 μ 对于给定的置信系数1-α=0.95,查表确定 根据样本值计算 ∴μ的置信系数为1- α=0.95的置信区 间是(4.413,4.555) 2、总体方差2未知,估计期望μ 的1置信区间为 1- 即得 /2 /2 例4 假定初生婴儿(男孩)的体重服从正态分布 ,随机抽取12名婴儿,测其体重为3100,2520, 3000,3600,3160,3560,3320,2880,2600, 3400,2540。试以0.95的置信系数估计新生婴儿的 平均体重(单位g) 解 方差 σ2未知,估计μ 的置信区间 对于给定的α,查表确定 ∴μ的置信度为0.95置信区间是 根据样本值计算 对于给定的置信系数1-α=0.95,查表确定 3、单正态总体方差的置信区间 假定未知,估计σ2 2的置信度为1的置信区间为 例5 根据例4测的数据对新生男婴儿体重的方差进行区 间估计(α0.05). 解 μ未知,估计方差 σ2的置信区间 对于给定的α=0.05,查表确定 则2的置信度为1的置信区间为(70752,405620) 4、双正态总体均值差的置信区间 可解得1- 2 的置信区间 5、双正态总体方差比的置信区间 假定1,2未知 一、点估计 1.矩法估计 2.最大似然估计 二、区间估计 1.已知总体方差σ2 ,估期望μ 2.未知总体方差σ2 ,估期望μ 3.未知总体期望μ,估方差σ2 4、双正态总体均值差的置信区间 5、双正态总体方差比的置信区间 小结