版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、3. 少量次测量数据的统计处理少量次测量数据的统计处理 分析测试工作中,通过样本研究总体,分析测试工作中,通过样本研究总体,由于测量次数有限,由于测量次数有限, 和和无从知道,如无从知道,如何处理和评价少量次数测定结果的数据何处理和评价少量次数测定结果的数据?而对多次测定的结果平均值又如何评价而对多次测定的结果平均值又如何评价?在前面己讨论的基础上,讨论下面的问在前面己讨论的基础上,讨论下面的问题:题:几个基本概念几个基本概念 (1统计量统计量t值值 (2t 分布曲线分布曲线 (3平均值的标准偏差平均值的标准偏差 (4平均值标准偏差与测量次数的关系平均值标准偏差与测量次数的关系 (5平均值的置
2、信区间平均值的置信区间 (6置信度与置信水平置信度与置信水平(1统计量统计量t 分析化学中通过样本研究总体,由于测量次分析化学中通过样本研究总体,由于测量次数有限,数有限, 和和无从知道。英国统计学与化无从知道。英国统计学与化学家学家Gosset提出用提出用t分布解决了这一问题。使分布解决了这一问题。使不致因为用不致因为用 s 代替代替而引起对正态分布的偏而引起对正态分布的偏离。离。 (1) t分布和分布和t分布曲线分布曲线,统计量统计量t,定义为:,定义为: sxxt(2t 分布曲线分布曲线 f=1,5,英国的统计学兼化英国的统计学兼化学家学家Gosset用笔名用笔名“Student发表论发
3、表论文提出文提出t分布,故分布,故得名。得名。 t分布曲线展示:分布曲线展示:T 分布曲线随自由分布曲线随自由度度 f 变化;变化;当当 f =时,时,t 分布分布则为正态分布则为正态分布,t 分布曲线分布曲线t 分布曲线与横坐标分布曲线与横坐标 t 某区间所夹面积,某区间所夹面积,与正态分布曲线一样,表示测量值落在与正态分布曲线一样,表示测量值落在该区间的概率。显然,若选定某一概率该区间的概率。显然,若选定某一概率和一定的自由度和一定的自由度f,那么,那么 t 值也就一定。值也就一定。由于由于t 值与置信度及自由度有关,故其值与置信度及自由度有关,故其表示为:表示为:t,f 。t值表双边)值
4、表双边)f=n-1 置信度P,显著性水准 f=n-1置信度P,显著性水准P=0.90=0 .10P=0.95=0.05P=0.99 =0.01P=0.90=0 .10P=0.95=0.05P=0.99=0.01 16.3112.7163.66 71.902.363.50 22.924.309.92 81.862.313.36 32.353.185.84 91.832.263.25 42.132.784.60 101.812.233.17 52.022.574.03 201.722.092.84 61.942.453.71 1.641.962.58t 值表的意义 前表为最常用的前表为最常用的 t
5、 值表。表中的值表。表中的 P 称为置信称为置信度,表示随机测定值落在度,表示随机测定值落在(ts)区间内的概区间内的概率,称为显著性水准,用率,称为显著性水准,用 表示,即表示,即=1-P。应用表时须加脚注,注明显著性水准和自应用表时须加脚注,注明显著性水准和自由度,例如:由度,例如:t0.05, 9是指:置信度为是指:置信度为95%(显著性水准为(显著性水准为0.05),自由度为),自由度为9时的时的 t 值。值。 称为平均值的标准偏差平均值称为平均值的标准偏差平均值 与总体与总体平均值平均值相符的程度),相符的程度), 与样本容量与样本容量n有关,即:有关,即:平均值的标准偏差平均值的标
6、准偏差 sxnssxsxxt统计量统计量 t的表达式中:的表达式中:(3)Xsx(4)平均值标准偏差与测量次数的关系平均值标准偏差与测量次数的关系sx从图中可见,当测从图中可见,当测定次数定次数n10时,时, 的值降低己不明显。的值降低己不明显。所以,一般的测定所以,一般的测定平行做平行做34次,要次,要求较高的求较高的56次,次,要求更高的要求更高的 测定测定做做1012次也足够次也足够了。了。(5)平均值与真值的关系平均值与真值的关系平均值的置信区间平均值的置信区间 用样本研究总体时,样本均值用样本研究总体时,样本均值x并不等于总体并不等于总体均值均值,但可以肯定,只要消除了系统误差,但可
7、以肯定,只要消除了系统误差,在某一置信度下,一定存在着一个以样本均值在某一置信度下,一定存在着一个以样本均值x为中心,包括总体均值为中心,包括总体均值 在内的某一范围在内的某一范围,称称为平均值的置信区间。由为平均值的置信区间。由t的定义式得:的定义式得:ntsX 置信区间置信区间nts式中式中 称为置信区间,其大小称为置信区间,其大小取决于测定的标准偏差、测定次数和置信取决于测定的标准偏差、测定次数和置信度的选择,置信区间愈小平均值度的选择,置信区间愈小平均值 愈接愈接近总体平均值近总体平均值 。(。( )XX(6置信度与显著水平置信度与显著水平 例:对某一钢样含磷量平行测定了四次,例:对某
8、一钢样含磷量平行测定了四次,平均值为平均值为0.0087%。己知标准误差。己知标准误差=0.0022,下面有三种结果报告,第一,下面有三种结果报告,第一种报告:种报告:(%)0011. 00087. 040022. 010087. 0(%)表示的意义:有表示的意义:有68.3%把握认为本钢样磷含把握认为本钢样磷含量的真值落在量的真值落在0.00870.0011(%)范围内。)范围内。例:磷含量的第二种报告例:磷含量的第二种报告(%)0022. 00087. 040022. 020087. 0(%)同理,但本式的表示的意义为:有同理,但本式的表示的意义为:有95.5%把握认为本钢样磷含量的真值落
9、把握认为本钢样磷含量的真值落在在0.00870.0022(%)范围内。)范围内。例:磷含量的第三种报告例:磷含量的第三种报告(%)0033. 00087. 040022. 030087. 0(%)同理,但本式的表示的意义为:有同理,但本式的表示的意义为:有99.7%把握认为本钢样磷含量的真值落把握认为本钢样磷含量的真值落在在0.00870.0033(%)范围内。)范围内。三种结果报告式的小结三种结果报告式的小结三种表达式区别在:三种表达式区别在:平均值平均值1标准误差标准误差平均值平均值2标准误差标准误差平均值平均值3标准误差标准误差2、两个概念:置信度与显著水平、两个概念:置信度与显著水平置
10、信度置信度P):例中有):例中有68.3%把握、把握、95.5%把握和把握和99.7%把握称为置信度把握称为置信度也称置信水平;也称置信水平;显著性水平(显著性水平( ):在上面三个区间外):在上面三个区间外的概率称为显者性水平。的概率称为显者性水平。置信度置信度P与显著性水平与显著性水平的关系的关系 两者的关系为:两者的关系为:1P 例:例:显著性水平)显著性水平)= 0.05时,时, 那么那么 p置信度)置信度)=1-0.05=0.95 即等于即等于 95% 置信度的选择应合适,一般的判断若有置信度的选择应合适,一般的判断若有90%或或95%把握,则以为这种判断基本正确。在把握,则以为这种
11、判断基本正确。在统计学中通常取统计学中通常取95%置信度。处理分析测试置信度。处理分析测试的数据时,也取的数据时,也取95%的置信度。的置信度。 当然并非绝对,根据具体的情况有时也取当然并非绝对,根据具体的情况有时也取90%或或99%。4、可疑数据的取舍、可疑数据的取舍 一组数据中,可能有个别数据与其他数据一组数据中,可能有个别数据与其他数据差异较大,称为可疑值。除确定是由于过差异较大,称为可疑值。除确定是由于过失所造成的可疑值可以舍弃外,可疑值是失所造成的可疑值可以舍弃外,可疑值是否要保留否要保留,应用统计学的方法来判断,不能应用统计学的方法来判断,不能任凭主观意愿决定取舍。常用的可疑值取任
12、凭主观意愿决定取舍。常用的可疑值取舍方法有:舍方法有: 4 法法 Q检验法检验法 格鲁布斯法格鲁布斯法d 若一总体服从正态分布,若一总体服从正态分布,x- 大于大于3 的测的测量值出现的概率很小,其误差往往不是随机量值出现的概率很小,其误差往往不是随机误差所致误差所致,应舍去。当然,其条件是在校正了应舍去。当然,其条件是在校正了系统误差之后。又总体的标准偏差系统误差之后。又总体的标准偏差与总体与总体平均偏差平均偏差 两者的关系是两者的关系是0.8 ,用样本平均用样本平均偏差偏差 代替代替,那么,那么 3 。 这样,这样, 便可将可疑值与便可将可疑值与 之差是否大于之差是否大于 作为可疑值取舍的
13、根据。作为可疑值取舍的根据。d_xd4d4检验法检验法d44 d检验法d4xdxd4运用运用 法时,可先把可疑值除外法时,可先把可疑值除外,求出余求出余下测量值的下测量值的 和和 ,若可疑值与,若可疑值与 之差之差的绝对值大于的绝对值大于 ,可疑值舍弃,否则保,可疑值舍弃,否则保留。留。Q检验法检验法 此法是将数据从小到大排列,如:此法是将数据从小到大排列,如:)(,1121xxxxxxnnnnxxxxnnnQ11nx设设 为可疑值,按下式求统计量为可疑值,按下式求统计量Q,Q称为舍弃商。称为舍弃商。Q检验法检验法xxxxnQ112Q表 值与置信度和测量次数有关,如表所示。值与置信度和测量次数
14、有关,如表所示。QQ表xnx1Q表上式的分母是极差,分子是可疑值与最临近上式的分母是极差,分子是可疑值与最临近值之差,值之差,Q与与 值比较,假设值比较,假设 ,可疑值可疑值 应舍弃,否则保留,假设应舍弃,否则保留,假设 是是可疑值,可疑值,Q从下式求出:从下式求出:Q检验法检验法Q 值 表 测定次数n345678910置信度90%( ) 0.94 0.76 0.64 0.56 0.510.47 0.44 0.4196%( ) 0.98 0.85 0.73 0.64 0.590.54 0.51 0.4899%( )0.99 0.93 0.82 0.74 0.680.63 0.60 0.57Q9
15、0.0Q96.0Q99.0格鲁布斯法 该法用到正态分布中反映测量值集中与该法用到正态分布中反映测量值集中与波动的两数波动的两数 和和 S,因而可靠性较高。,因而可靠性较高。应用此法时,在计算了应用此法时,在计算了 和和S后,将测量后,将测量值从小到大排列,同值从小到大排列,同Q检验法一样,应检验法一样,应按测量次数多少,确定检验按测量次数多少,确定检验 或或 ,若,若两个都做检验,设两个都做检验,设X1为可疑值,由下式为可疑值,由下式求统计量求统计量T:XX1XnSXTX1X格鲁布斯法 把把T与与 表值比较,假设表值比较,假设 ,可疑,可疑值舍弃,否则保留,假设值舍弃,否则保留,假设 为可疑值,为可疑值,T由下式求出:由下式求出: 值与测定次数和显著性水准有关,如值与测定次数和显著性水准有关,如表所示。表所示。XnTna,SXTX1TTna,Xn格鲁布斯法格鲁布斯法 值表测定次数, n显著性水平测定次数, n显著性水平0.05 0.025 0.010.05 0.025 0.01 31.151.15 1.15 82.032.132.22 41.461.48 1.49 92.112.212.32 51.671.71 1.75 102.182.292.41 61.821.89 1.94 152.412.552.71 71.942.02 2.10 202.562.712.88Tn,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国多肽药物行业发展环境分析及投资战略研究报告
- 2024-2030年中国地坪行业发展态势与投资建议分析报告
- 小学班主任工作考核方案
- 2024年环保节能厂房分租服务合同模板下载3篇
- 2024年版:数字音乐版权许可合同(许可范围、使用方式及许可费用)
- 2024年区二手房买卖交易安全协议范本2篇
- 2024年生态旅游度假区开发与运营合同
- 马鞍山师范高等专科学校《新生专业导读课程》2023-2024学年第一学期期末试卷
- 2024年度财富传承代客理财专项协议3篇
- 2025电脑销售合同样本
- 民办学校教职工入职背景审查制度
- 2024年新人教版四年级数学上册《教材练习21练习二十一(附答案)》教学课件
- 2024年湛江市农业发展集团有限公司招聘笔试冲刺题(带答案解析)
- 商业伦理与社会责任智慧树知到期末考试答案2024年
- MOOC 创新思维与创业实验-东南大学 中国大学慕课答案
- 二级公立医院绩效考核三级手术目录(2020版)
- 6人小品《没有学习的人不伤心》台词完整版
- GB/T 16865-1997变形铝、镁及其合金加工制品拉伸试验用试样
- 自闭症儿童行为检核表学前版
- 五年级上册数学专项练习高的画法 全国通用
- 民警个人季度小结范文(3篇)
评论
0/150
提交评论