本文以数理统计及概率论的基础理论为基础,分析了正在起草中的IEC PAS《普通照明用LED模块性能要求》中模块功率和光通量两个参数所使用的用样本推断总体的数理统计原理,从而揭示出该IEC PAS利用样本均值为总体均值的无偏估计,实现对LED模块功率和光通量总体均值的考核的同时,给出了相应均值所在的置信区间与置信水平。
IEC正在制订PAS《普通照明用LED模块的性能要求》,其中的模块功率与光通量两个试验项目的样本大小均为20只,除对单个LED模块相应质量进行判断以外,还用相应样本的平均值进行判断,并且给出了样本平均值所在的置信区间与置信水平,以便对总体进行合格判断。这在以往的IEC标准中很少出现。为什么可以用样本均值来推断总体,这些涉及数理统计及概率论等理论。为此,本文通过介绍数理统计方面的基础知识,以诠释该PAS所涉及的统计技术。
1、 数理统计的几个基本概念
a) 总体与样本
通常,我们把所研究的对象的全体称为总体,把每个研究的对象称为个体。例如,一批LED模块构成总体,其中每一个LED模块则是该总体中的个体。每个LED有一个或几个质量指标,如模块功率、光通量等。为了研究总体,我们按一定规则从总体中抽出了若干个个体,这些个体就称之为样本(或称子样),样本中所含的个体数目称为样本大小(或样本容量),样本中的每个个体称为样品。
对总体来说,我们关心的并不是组成总体的各个个体本身,而主要考察与它们相联系的某个特征以及这个特征的分布状况。例如,研究LED模块的质量,关心的是其功率或光通量而不是LED模块本身。由于任一个LED模块的功率或光通量是不能确定的,而每个LED模块都确实对应着一个功率或光通量,所以我们可以认为LED模块的功率或光通量是个随机变量,而我们关心的正是这个随机变量的概率分布。一般来说,我们都可以认为所考察的总体是用一个随机变量来代表的,这样一来,我们就可以用精确的语言来描述了:总体就是一个确定概率分布的随机变量,而一个个体则是随机变量的一次观测值。因此,总体F(x)或总体X,其含义就是一个以F(x)为分布函数的随机变量X。
在给定总体以精确定义后,也就可以精确地描述样本了。由于样本中所包含的每一个样品的取值都可以看成为一个随机变量,因此,样本大小为n的样本可以认为是一个n维随机向量(X1,X2,…,Xn)。为了使样本更具有代表性并且使计算尽量简化,我们很自然地提出下列两条要求:一是要求每一个Xi(i=1,…,n)都与总体X有相同的分布F(x);二是各个Xi之间皆相互独立,我们称满足这两条要求的样本为简单随机样本。
b) 经验分布与理论分布
总体X的分布函数F(x),即总体的分布函数,称为理论分布或总体分布。一个大小为n的样本的分数函数Fn(X)则称为经验分布或样本分布。
由于总体中有大量的个体,实际上不可能或很困难把每个个体的指标都具体测出。因此,总体分布是客观存在但未知的。例如已知总体分布是正态分布,但它的期望μ及方差σ2未知,但往往知道标志着总体分布的参数是属于某个已知的集合的。
格利汶科Glivenko定理:经验分布Fn(X)以概率1关于x一致收敛于F(x),即:
Glivenko定理告诉我们,当n充分大时,Fn(X)与F(x)可以足够地接近,它们差别的最大值也会随n的增大而趋于0,这样的结局是以概率1(必然事件)发生的。因而,当n足够大时,就可以用Fn(X)来近似代替F(x)。这就是用样本来推断总体的最基本的理论依据。
a) 统计量
样本来自总体并且代表和反映总体。在抽取样本后得到的样本值是个n维向量,直接利用这n个观测值并不方便,应该对它进行一番加工、提炼,把样本中有关信息集中起来。针对不同问题构造样本的各种不同函数,这种函数在数理统计中被称为统计量。这些统计量有:样本均值 (见公式1.1),它可以表示样本的位置特征。样本方差 (见公式1.2),它可以表示样本的离散性特征。
中国照明网论文频道现向广大业内朋友征集稿件。稿件内容要求具有技术性、可读性。欢迎研究机构、院校、企业进行投稿。
投稿信箱:edit@lightingchina.com.cn
联系电话:0086-020-85530605-5029
(投稿时请注明作者姓名、单位、邮编和地址及电话、E-mail;以便通知审核结果,如发稿七日内无通知请来电查询。)
广东中照网传媒有限公司 版权所有 增值电信业务经营许可证:粤B2-20050039 粤ICP备06007496号
传真:020-85548112 E-mail:Service@lightingchina.com.cn 中国照明网