发布时间:2023-10-07 15:40:31
导语:想要提升您的写作水平,创作出令人难忘的文章?我们精心为您整理的13篇统计学变量类型范例,将为您的写作提供有力的支持和灵感!
1.1根据资料类型初步确定方法
临床研究中产生的各种不同原始资料,而不同数据资料类型采用的统计分析方法也不同。定量资料常用的方法有t检验、方差分析、非参数检验、线性相关与回归分析等。定性资料可用的方法有χ2检验、对数线性模型、logistic回归等,影像医师可根据不同需要选用不同统计方法。值得一提的是有些资料类型确定后,统计方法的选用对其有序性有相应要求;而多种方法联合应用或者使用部分少见的分析方法时还需要在选定统计方法后,利用统计软件(如SAS、SPSS)对应的不同命令进行初步分析试验。
1.2根据研究目的选择方法
1.2.1差异性研究
差异性分析是指评价比较组间均数、频数、比率等的差异。根据研究需要可选用的方法有χ2检验、t检验、方差分析、非参数检验等。临床上研究两组、多组样本比率或构成比之间的差别关系时最常用χ2检验,也是针对计数资料进行假设检验的一种常用的统计学方法,而对两组定量资料分析常用t检验和秩和检验,多组资料分析则常用方差分析;Fisher精确概率法主要适用于总体样本频数小于40或四格表中最小格子T值<1。虽然Fisher精确检验不属于χ2检验,但仍可以作为有效的补充,而也有人认为在统计软件普遍易得的当下,Fisher精确概率法也同样适用于大样本四格表的资料。如彭泽华等[6]在探讨冠状窦-左心房肌连接的双源CT冠状动脉成像(DSCTCA)形态特征时针对冠状窦-左心房肌连接的类型在两组类别变量采用联表的χ2检验,结果差异无统计学意义(χ2=0.115,P=0.944)。Teefey等[7]在研究超声表现及白细胞计数预测急性胆囊炎坏疽变化关系时使用Fisher精确分析。t检验适用于两组定量资料分析且资料满足方差齐性和正态性两个基本条件;同样t检验适用于完全随机设计的单因素两水平的资料,在选用t检验时应注意对资料进行相应的变量变换,若资料不能满足基本条件则选用适合分析偏态分布的非参数检验(如:秩和检验)进行分析。如Wang等[8]在研究不同侵袭性的前列腺癌组织和正常前列腺组织以及外周带前列腺癌Gleason评分与肿瘤信号对比时采用t检验。Kung等[9]在研究化脓性髋关节炎的临床和放射学预测指标时也使用t检验分析。秩和检验包括基本秩和检验(Wilcoxon等级检验、Mann-WhitneyU-检验)和高级秩和检验(Kruskal-Wallis、Friedmantests、Kolmogorov-Smirnov拟合检验)。当研究资料为两方差齐且呈正态分布的总体,而总体分布类型未知或者不满足参数检验的条件时,采用t检验对样本进行比较;但若无需比较总体参数只比较总置的分布是否相同且总体资料分布类型未知时需要采用非参数的Wilcoxon秩和检验进行比较。针对两组或多组样本的定性资料使用秩和检验比较时,需要混合两样本数据、编秩(从小到大)、计量T值、查表或计算求得P值。如Saindane等[10]在对“空蝶鞍”的临床意义判定因素研究中针对颅内压增高和偶然发现空蝶鞍患者两组资料对比时采用Wilcoxon秩和检验。Filippi等[11]在研究DTI测量儿童Ι型神经纤维瘤病胼胝体派生指标时运用Wilcoxon秩和检验。事实上在影像资料分析中经常见到多重组间比较的情况,方差分析(analysisofvariance,ANOVA)就是用来推断两个或者多个总体之间是否有差别的检验,又称F检验。多重组间比较不能单纯选用两样本均数比较的t检验,但是可以根据资料类型选用ANOVA检验。若来自两个随机样本资料呈正态分布且方差齐性同的定量资料,应采用两因素(处理、配伍)方差分析(two-wayANOVA)或配对t检验。通过F检验可以比较可能由某因素所至的变异或随机误差,同时可了解该因素对测定结果有无影响。当不满足方差分析和t检验条件时,可对数据进行变换或采用随机区组设计资料的FriedmanM检验。Obdeijn等[12]在研究乳腺术前MRI能减少术中切缘和乳腺保守术后再次手术,使用ANOVA分析两组资料,结果对照组(29.3%)相比术前MRI病例组(15.8%)有效减少切缘和再次手术(P<0.01)。
1.2.2相关性分析
相关性分析不等同因果性,也不是简单的个性化相比,其涵盖的范围和领域较为广泛。统计学意义中的相关性分析包含相关性系数的计算,其过程为:每个变量转化为标准单位后,乘积的平均数即为相关系数。相关性分析可以用直观地用散点图表示两个或者多个变量的离散,当其紧密地靠近于一条直线时,即变量间存在很强的相关性。相关分析常用的方法有Pearson相关性分析、Spearman等级相关分析和卡方检验。临床中对两个或者多个均为定量变量的资料,且变量均呈正态分布时可选用Pearson相关分析,但多数情况下Pearson相关分析适用于两组资料的相关性分析。判断两变量之间线性关系的密切程度主要用Pearson积差相关系数,其范围为-1~+1。若相关系数的绝对值越接近1,即两变量间相关性越密切;反之,相关系数的绝对值越接近0,其相关性越差。实际上在高质量期刊论文中使用Spearman等级相关分析的研究也很常见,其通过相关系数进行变量间线性关系分析来判定两个变量间相关性的密切程度。而密切程度的量化指标则通过计算样本相关系数r,根据实际计算r绝对值所属范围来推断两个来自总体变量的线性相关程度,从而推断总体的相关性。根据实际分析需要,将相关关系密切程度分为6等:当IrI=0时,说明两变量完全不相关:当0<IrI<0.3时,说明两变量不相关;当0.3<IrI<0.5时,说明两变量低度相关;当0.5<IrI<0.8时,说明两变量显著相关;当0.8<IrI<1说明两变量高度相关:当IrI=l时,说明两个变量完全相关。王效春等[13]在研究磁敏感加权成像与动态磁敏感加权对比增强MR灌注加权成像联合应用在脑星形细胞瘤分级中的价值一文应用Spearman等级相关分析,结果显示肿瘤内磁敏感信号与相对血容量最大值和病理分级呈正相关(IrI分别为0.72、0.89,P值均<0.01),相对血容量与病理分级呈显著正相关(r=0.78,P<0.01)。又如Lederlin等[14]在比较几何参数、相关功能与组织学特性在哮喘患者的支气管壁CT衰减性关系中同时使用Pearson相关分析和Spearman等级相关分析,其r=0.39~0.43,表明与对照组相比常规CT衰减参数在哮喘患者平常支气管的CT参数、气道壁衰减方面更好的区分哮喘患者,同时也更好地区分气道梗阻。值得提及的是对资料有序或无序无法作出初步判定,且明确资料类型为定性资料时还可以选择使用卡方检验和Spearman等级相关分析。
1.2.3影响性分析
由于事物之间的联系是多种多样的,而某一结局可能受到来自其他多个方面的影响,此时为分析某一结局发生的影响因素可采用的资料分析方法有线性回归(一元或多元)、logistic回归、Cox比例风险回归模型(生存分析)等。在影像资料分析中一元线性回归是将影像资料中一个最主要影响因素作为自变量来解释因变量的变化。多元回归定义为某一因变量的变化受多个重要因素的影响,而此时需要用两个或多个影响因素作为自变量来解释因变量的变化,且多个自变量与因变量之间是线性关系(多个因变量之间相互独立)。实际研究中多元线性回归模型在影像资料分析应用较为广泛。Langkammer等[15]在磁敏感系数绘图在多发性硬化中应用研究中使用多元线性分析,结果显示各种影响因素中年龄是预测磁化率影响最强的因素。Logistic回归是研究二分类和多分类观察结果与某些影响因素自己建关系的一种多变化分析方法,其经常需要分析疾病与各影像指标之间的定量关系,同时又需要排除一些混杂因素影响。Logistic回归在统计学上属于概率型非线性回归,其分析思路与线性回归大致相同,能有效解决过高或过低水平因素以及分析因素少而样本量大等问题。相比多元线性回归,Logistic回归在处理分类反应数据方面更为常用,且适用于结局为定性影像资料。如Lee等[16]研究高分辨率CT在发现小蜂窝样特发性间质肺炎纤维化的连续变化和预后应用中使用logistic回归分析,结果表明高分辨率CT在网状和磨玻璃状范围内评价普通肺炎与非特异性纤维化肺炎之间差别明显(P<0.01)。在临床实际工作中常常需要分析生存时间与影像资料之间的关系,Kaplan-Meier法就是常用的一种分析方法,其又称乘积极限法,对大小样本资料分析均适用。实践中习惯上以时间为横轴、生存率为纵轴回执的阶梯状图称为Kaplan-Meier生存曲线(survivalcurve),也称K-M曲线。Cox比例风险回归模型是另一种生存分析方法,包括参数与半参数模型两类,其主要是进行多因素生存分析的一种方法,同时可分析众多变量对生存时间和生存结局的影响。Saad等[17]在经颈静脉肝内门体静脉分流术在肝移植受者的技术分析和临床评估研究中比较成功施行肝移植与非移植病人开展门体分流术(transjugularintrahepaticportosystemicshunt,TIPS)后的临床疗效评估,使用了Kaplan-Meier法,结果显示6~12个月、12~24个月、24个月以上,移植成活率分别为43%、32%和22%。生存期大于1年的晚期肝脏疾病模型存活评分低于17分、等于17分或大于17分的存活率分别为54%和8%(P<0.05)。
2其他适用方法
2.1ROC曲线
ROC(receiveroperatingcharacteristic)曲线是欧美影像学期刊中应用较为常见的统计学方法,国内期刊应用相对较少。ROC曲线根据一系列不同的分界值以真阳性率(灵敏性)为纵坐标,假阳性率(特异性)为横坐标绘制的曲线。ROC曲线分析结合灵敏度(sensitivity)和特异度(specificity)广泛应用于医学诊断,也应用于影像诊断及人群筛查。ROC曲线根据曲线下面积(areaundertheROCcurve,AUC)的大小对诊断试验作定量分析。理论上,AUC值在0~1间。根据实际情况将诊断分为不符合诊断(AUC<0.5)、无诊断价值(AUC=0.5)、低准确性(0.5<AUC<0.7)、一定准确性(0.7<AUC<0.9)、较高准确性(0.9<AUC<1),AUC越接近于1,表明诊断准确性越高。Hyodo等[18]在研究乏血管少结节的慢性肝脏疾病患者发展成富血管性肝细胞癌风险因素一文中使用ROC曲线分析,结果显示后续发展成血管性结节平均增长率明显高于非血管过渡性结节。
2.2Kappa检验
Kappa检验主要用于评价不同资料间一致性程度,常用Kappa值评价一致程度。Kappa系数适用于两项和多项无序分类变量资料。在影像学试验中常需要判断多名医师测量同一研究对象或者同一医师多次测量同一对象的一致性,Kappa一致性检验便是最佳选择。Kappa检验还可通过计算Kappa值对两种非金标准的诊断方法进行诊断结果一致性分析。一般而言,评价Kappa一致性需要计算Kappa系数,但在研究考察新的诊断试验方法是否优于金标准,或者检验是否与金标准一致时,还需要计算特异度、灵敏度、阳性预测值和阴性预测值等指标。目前公认的Kappa系数分为六个区段即一致性极差(Kappa值<0),一致性微弱(Kappa值0~0.2),一致性弱(Kappa值0.21~0.40),中度一致Kappa值(0.41~0.60),高度一致(Kappa值0.61~0.80),一致性极强(Kappa值0.81~1.00)。
一、引言
数据对于当今天的商务活动具有重大的意义。数据是关于这个世界的事实,它能够说明问题、提示事实、隐含规律。一些商业机构正是通过“挖掘”数据来发现事物之间的关联性,并从中获取利润。如果人们躲避数据,就可能由于盲目接受他人对数据的概括总结而上当受骗,也可能完全依赖“感觉”来做决策,从而不利于做出正确的决策。因此,作为一门研究如何处理和分析数据的课程——统计学越来越受到各方重视。在高校中,绝大部分商科专业把统计学或商务统计作为专业必修课列入到人才培养方案中。如何学好、用好统计学成为当前许多人需要迫切解决的一个问题。美国著名的统计学家莱文(Levine)等在其撰写的统计学教科书中首次提出了DCOVA框架,用于指导学生或相关从业者如何有效学习和使用统计学。
二、基本术语
统计学是把数据转化为信息用于决策的方法或工具。例如,为了研究青年人喜欢网上购物的主要原因,可以通过调查来收集原始数据,再制作总结表来整理数据从中获得数据中隐藏的有用信息(最主要的原因是网上购物价格便宜),最后根据所获得的信息进行决策,即网店价格要比实体店便宜才能吸引青年消费者。从调查数据到总表结,就是把数据转化为信息的方法。统计方法是把数据转化信息的方法,包括统计描述方法和统计推断方法。统计描述方法主要包括收集、整理、可视化和概括数据;统计推断方法是指用样本数据得出总体结论,包括对总体参数的置信区间估计和假设检验。为了学习和使用统计学的方法,可以应用DCOVA框架。DCOVA框架包括定义数据(D)、收集数据(C)、整理数据(O)、可视化数据(V)和分析数据(A)等5个阶段(图1)。例如,为了研究一所高校学生的努力学习程度,根据DCOVA框架,首要定义数据,即找什么样的数据能够代表学生的努力学习程度,为此需要对努力学习程度开发一个可操作定义,比如用每天平均学习时长(小时)来代表一个学生的努力学习程度。其次要收集数据,可以通过问卷调查的形式收集数据。再次是整理和可视化数据,比如制作频数分布表来整理数据,从而可以查看学习时长的分布情况,制作直方图来可视化学习时长数据,从而直观形象地显现数据的分布特征,从中判断学习时长是否服从正态分布等。最后是分析数据,比如可以分析不同专业、不同性别、不同年级的学生每天学习时长均值的差异,或者估计全校学生每天平均学习时长等。DCOVA框架较好地囊括了统计学教学中主要的知识体系。
三、定义数据(D)
定义数据主要是解释收集什么数据的问题,它与一项研究的目的及其所涉及的变量相关。研究目标决定研究中所涉及的变量,相关变量决定需要收集的数据(图2)。在上述的例子中,研究目标是“研究一所高校学生的努力学习程度”,其中“努力学习程度”就是研究中需要涉及的变量。由于该变量没有直接的数据对应,需要开发一个相应的可操作定义——如每天平均学习时长,最后去收集学生每天平均学习时长的数据。
可操作定义指对所有与该分析相关的人而言很显明是普遍接受的定义,是对某个抽象变量的一种清晰、精确的表述,是对该变量意义的共同理解。努力学习程度是一个抽象变量,在收集數据时会遇到麻烦,因此需要一个可操作定义。每天平均学习时长可以作为努力学习程度的一个可操作定义,因为大家普遍认为一名学生在学习上花费的时间越多,说明该生学生越努力,并有每天平均学习时长是一种清晰、精确的表述,从而方便研究者收集相关的数据。
定义数据还包括确定所需数据的类型。数据是变量的取值,变量类型与其所对的数据类型一致。变量可以分为属性变量(如性别)和数值变量,数值变量又进一步区分为离散数值变量(如家庭人数)和连续数值变量(如身高)。相应的,数据可以分为属性数据(如男、女)和数值数据,数值数据又进一步区分为离散数值数据(如2人、3人)和连续数值数据(如1.75m、1.68m)。在SPSS中,变量的测量尺度(类型)分为名义(图标为三个小圈)和有序(图标为阶梯),这两类都属于属性数据;还有一类为标度(图标为尺子),这类属于数值数据。
四、收集数据(C)
在明确了需要什么数据的前提下,就需要进入收集数据阶段。收集数据(C)主要是解决数据的来源问题。数据的来源有原始数据来源和二手数据来源。原始数据来源主要通过调查、观察和实验获得数据;二手数据来源主要是指其他组织或个人已公布的数据。由于获得原始数据比较麻烦,所以二手数据是首选的数据来源。
在经济管理研究领域,原始数据来源主要依靠调查。由普查涉及面广、成本高、耗时长和难度大,所以一般不常用,对许多研究者来说,主要通过抽样调查来获得原始数据。因此,如何抽样就成了一个无法逃避的问题。调查数据的质量直接影响研究的价值,如果数据本身严重存在错误、偏见,不管采用什么数据分析方法,都很难得出可信的分析结果。为了从一种总体中找到一个样本,并对样本采集数据,首先要做的工作是抽样。不同的抽样方法生成不同的样本类型,如简单随机抽样方法生产简单随机样本,抽样方法与形成的样本类型一致。抽样方法分为非概率抽样和概率抽样两大类。非概率抽样包括便利抽样和判断抽样,其优点是便利、快速、低成本,可以用于前期或试探性分析,其缺点是样本的代表性一般较差,不能用于统计推断。概率抽样包括简单随机抽样、系统抽样、分层抽样和群抽样,其中简单随机抽样和系统抽样的优点是简单易行,但无法保证样本的代表性;分层抽样过程比较繁琐,但能够确保样本的代表性,并能对每个层进行分析,得出每层的结果;群抽样的优点是调查成本低,但有效性相对较差,需要增加样本容量才能达到其他抽样方法的效果。
五、整理数据(O)和可视化数据(V)
在培养目标上,两类硕士差距就更加明显了。学术型硕士要求可以进行基本的专业理论研究,有继续进行高等理论研究的素质和潜力,其中的一部分人可以继续攻读本专业及相关金融、管理、经济等相关专业的博士学位,学术性的硕士生更强调理论学习和理论基础的训练。专业学位硕士则要求较好的专业知识实用能力,了解掌握常用统计方法的思想和软件应用,实践能力强,具有分析解决带复杂数据分析背景的实际问题的潜力,强调的是学生对实际问题的处理能力,各种统计方法的综合运用及实战能力。在国外发达国家,目前均有应用统计专业学位博士,就是说将来在我们国家,优秀的应用统计专业学位硕士可以进一步攻读专业学位博士,这类博士应该对实际问题有敏锐的眼光,对各种实用的统计方法有全面的了解,知晓其长处与不足,可以解决复杂的实际数据分析问题,因此应用统计专业学位硕士的概率理论基础训练应更加倾向于实际,倾向于在统计学中大量用到的概率论知识。这就决定了对两类硕士在概率论基础知识要求方面有很大不同。在概率论基础方面,由于两类生源的本科知识体系中都是以《概率论与数理统计》课程为起点,概率论部分基本相同,内容是:概率基础及公式,随机变量及分布,随机向量及分布,数字特征及计算。在硕士生阶段应在此基础上考虑两类硕士的培养目标的差异,分别在概率基础课程中安排不一样的教学内容和重点。
科研设计包括专业设计和统计研究设计。专业设计主要包括基本常识和专业知识的正确、全面、巧妙地运用;而统计研究设计包括实验设计、临床试验设计和调查设计。值得注意的是:在很多科研人员所做的科研课题中,不仅严重忽视统计研究设计,就连专业设计也有严重错误,主要表现在犯了基本常识错误和违背专业知识错误。这类错误所发生的频率还相当高,是一种不能容忍的不正常现象!
在统计研究设计所包含的3种研究设计中,实验设计是最重要的,因为很多关键性的内容都包含在其中,其核心内容是“三要素”、“四原则”和“设计类型”。所谓“三要素”就是受试对象(或调查对象)、影响因素(包括试验因素和重要的非试验因素)和实验效应(通过具体的观测指标来体现);所谓“四原则”就是随机、对照、重复和均衡原则,它们在选取和分配受试对象、控制重要非试验因素对观测结果的干扰和影响、提高组间均衡性、提高结论的可靠性和说服力等方面将起到“保驾护航”的作用;所谓“设计类型”就是实验中因素及其水平如何合理搭配而形成的一种结构,它决定了能否多快好省且又经济可靠地实现研究目标。科研人员若对重要非试验因素考虑不周到、对照组选择不合理、设计类型选择不当或辨别不清,导致科研课题的科研设计千疮百孔、数据分析滥竽充数、结果解释稀里糊涂、结论陈述啼笑皆非。下面笔者就“实验设计”环节存在的问题辨析如下。
1 在分析定量资料前未明确交代所对应的实验设计类型
人们在处理定量资料前未明确交代定量资料所对应的实验设计,对数千篇稿件进行审阅后发现,大多数人都是盲目套用统计分析方法,其结论的正确性如何是可想而知的。这是一条出现非常频繁的错误,应当引起广大科研工作者的高度重视。
2 临床试验设计中一个极易被忽视的问题——按重要非试验因素进行分层随机化
例1:原文题目为《气管舒合剂治疗支气管哮喘的临床观察》。原作者写到:“全部病例均来源于本院呼吸专科门诊和普通门诊,随机分为治疗组40例和对照组30例。其中治疗组男21例,女19例;年龄21~55岁,平均(36.28±9.36)岁;病程2~23年,平均(10.31±17.48)年;病情轻度者16例,中度24例。对照组30例,男16例,女14例;年龄20~53岁,平均(35.78±9.53)岁;病程3~24年,平均(11.05±6.47)年;病情轻度者13例,中度者17例。两组间情况差异无显著性,具有可比性。”请问这样随机化,其组间具有可比性吗?
对差错的辨析与释疑:显然,研究者在试验设计时未对重要非试验因素采用分层随机保证各组之间的可比性。这条错误的严重程度为不可逆,出现不可逆错误意味着原作者的试验设计具有无法改正的错误,必须重做实验!究其原因,主要是原作者未理解统计学上随机的概念。统计学上随机化的目的是尽可能去掉人为因素对观测结果的干扰和影响,让重要的非试验因素在组间达到平衡。稍微留意一下原作者随机化分组,明显带有人为的痕迹,治疗组40人比对照组30人多出10人;治疗组病程的标准差17.48是对照组病程的标准差6.47的近3倍。笔者很疑惑怎样的随机化才能达到如此的不平衡?事实上随机化有4种:子总体内随机、完全随机、分层随机和按不平衡指数最小原则所进行的随机,原文条件下应当选用分层随机,即以两个重要的非试验因素(性别和病情)水平组合形成4个小组(男轻,女轻,男中,女中),然后把每个小组内的患者再随机均分到治疗组和对照组中去,这样分层随机的最终结果一定是治疗组和对照组各35人,且使2组间非试验因素的影响达到尽可能的平衡,从而可大大提高组间的可比性。在本例中,若“病程”对观测结果有重要影响,在进行分层随机化时,在按“性别”和“病情”分组的基础上,还应再按“病程”(设分为短、中、长)分组,即共形成12个小组,将每个小组中的患者随机均分入治疗组与对照组中去,这是使“性别、病情、病程”3个重要非试验因素对观测结果的影响在治疗组与对照组之间达到平衡的重要举措,也是所有临床试验研究成败与否的最关键环节!
3 实验设计类型判断错误
例2:某作者欲观察甘草酸、泼尼松对慢性马兜铃酸肾病(AAN)肾损害的干预作用,于是,进行了实验,数据见表1。原作者经过用甘草酸和泼尼松分别与同期正常对照组和模型组比较,一个P<0.05,另一个P<0.01,于是得到甘草酸、泼尼松对慢性AAN肾损害具有一定程度的保护作用,且泼尼松的效果更佳。请问原作者的结论可信吗?表1 各组大鼠血BUN及SCr变化比较(略)注:与正常对照组同期比较,*P<0.05,**P<0.01;与模型组同期比较,P<0.05,P<0.01
对差错的辨析与释疑:本例错误极为典型,通常科研工作者欲观察某种药物是否有效,习惯上会建立正常对照组、模型组(即该药物拟治疗的病态组)和在模型组基础上的用药组(如本例中甘草酸组和泼尼松组)。这样的设计本身并没有错,但这仅仅是专业上的“实验安排(可称为多因素非平衡组合实验[1])”,而并非是统计学中所说的某种标准实验设计类型。写在“组别”之下的4个组,并非是一个因素的4个水平,而是2个因素水平的部分组合。这2个因素分别是“是否建模(即正常与模型2个水平)”和“用药种类[即不用药(相当于安慰剂)、用甘草酸和用泼尼松3个水平]”。2个因素共有6种水平组合,即“组别”之下缺少了“正常基础上用甘草酸”和“正常基础上用泼尼松”。这样设计的实验才可能反映出“是否建模”与“用药种类”2个因素之间是否存在交互作用。
在本课题研究中,由于未在实验前作出正确的实验设计,处理数据时错误就悄然产生了。具体到本例,从原作者在表1的注解中可以看出,通过单因素方差分析分别比较同期(即相同观测时间点)的甘草酸组和泼尼松组与正常对照组和模型组之间的差别是否有统计学意义。这样的做法有3个严重错误:第一,严格地说,在模型组基础上的用药组是不适合直接与正常对照组相比较的,因为这样的比较解释不清到底是药物的作用还是由于模型未建成功而造成的假象;第二,将各个时间点割裂开分别比较破坏了原先的整体设计,数据利用率降低,误差估计不准确,导致结论的可信度降低。将一个重复测量实验的各个时间点割裂开来考察,就等于在各个片段上估计实验误差、作出统计推断,好像盲人摸象一样,摸出来的结果差别何其之大;第三,要想说明两种药物哪个效果更佳,在得出差别具有统计学意义的基础上,衡量的标准是应看组间平均值的差量的大小而不应看P值是否足够地小,不能说P<0.01时就比P<0.05时更有效,这种忽视实验误差、忽视绝对数量和脱离专业知识的想法和做法都是不妥当的。
如何正确处理表1中的实验资料呢?关键要正确判定该定量资料所对应的是什么实验设计类型。由前面的分析可知,表1定量资料对应的是“多因素非平衡组合实验”,而不是某种标准的多因素实验设计类型。明智的做法是对“组别”进行合理拆分,即根据专业知识和统计学知识,对“组别”之下的所有组重新进行组合,应使每种组合对应着一个标准的实验设计类型。正确地拆分结果分别见表2和表3。表2 正常对照组与模型组大鼠血BUN及SCr变化的测定结果(略)表3 模型组和2个用药组大鼠血BUN及SCr变化的测定结果(略)
事实上,由科研习惯形成的这一套实验方案笔者形象地称之为多因素非平衡的组合实验,或者说,它是实验设计的表现型。通常可以进行统计分析的都必须是标准型(即统计学上所说的某种实验设计类型),因此需要能看出代表表现型本质的原型(本例中组别之下应该有6个组,这6个组构成一个2×3析因设计结构,但原作者少设计了2个组)。通常需要将表现型或/和原型拆分成标准型后再选择合适的统计分析方法进行数据分析。本例根据原作者的意图,可以将表1拆分成2个标准型,形成2个具有一个重复测量的两因素设计定量资料,见表2和表3。相应的统计分析方法就是具有一个重复测量的两因素设计定量资料的方差分析。此处请读者注意:第一,具有一个重复测量的两因素设计定量资料的方差分析和一般的方差分析虽然都叫方差分析,但它们的计算公式却有本质区别,绝不可混用;第二,重复测量因素(本例中为时间)不要与实验分组因素(表2中叫“是否建模”;表3中叫“药物种类”)同时列入左边,它们是本质不同的两种因素,一般应该把“重复测量因素”放到表头横线下方。
通过本例可以看出,在实验前明确实验设计是多么重要的一件事情。试想,若让本例原作者写明他的实验设计类型,他必然就会对基本的实验设计类型作一番调查和学习,自然就能发现他所“设计”的实验并不是统计学上相应的实验设计。那么通过咨询相关人士必能做出比较正确的实验设计,不仅可以提高科研设计水平,而且可以大大提高科研课题和论文质量。
例3:原文题目为《土荆芥-水团花对胃溃疡大鼠黏膜保护作用的研究》。原作者使用单因素多水平设计定量资料方差分析处理表4中的数据。请问原作者这样做对吗?表4 各组黏膜肌层宽度、再生黏膜厚度变化(略)注:与正常组比较,aP<0.05;与NS组比较,bP<0.05;与CP 10 mg·kg-1 组比较,cP<0.05
对差错的辨析与释疑:本例涉及到统计学三型理论[1]中的一些概念,简单地说就是可以直接进行统计分析的来自标准设计的数据表叫标准型,反映问题本质但并非是标准型的数据表叫原型,而掩盖了原型信息的数据表叫表现型。“组别”之下的6个组,似乎是某个因素的6个水平,其实不然!这6个组涉及到多个试验因素,应对“组别”拆分重新组合后,再分别判定各种组合所对应的实验设计类型,并选用相应的统计分析方法。组合1:空白对照组(正常)、阴性对照组(NS),这是单因素两水平设计(简称为成组设计)。由于正常组无实验数据,故该组合无法进行统计分析;组合2:NS组、RA组、CP(20/mg·kg-1)组,这是单因素3水平设计,因素的名称叫“药物种类”;组合3:NS组、CP(10/mg·kg-1)组、CP(15/mg·kg-1)组、CP(20/mg·kg-1)组,这是单因素4水平设计,因素名称叫CP的剂量(其中,NS组可视为CP的剂量为0)。
对于组合2和组合3,若定量资料满足参数检验的前提条件,可选用相应设计定量资料的方差分析,否则,需要改用相应设计定量资料的秩和检验。
4 人为改变设计类型且数据利用不全
例4:某作者使用表5中的数据进行分析,欲比较治疗组和对照组在治疗后的各个时间点的疗效情况,使用的分析方法为一般卡方检验,请问原作者这样做对吗?
对差错的辨析与释疑:从给出的统计表可以看出,该作者有意或者无意之间收集了一类相当复杂的实验设计类型下的定性资料,结果变量为多值有序变量的具有一个重复测量的两因素设计定性资料,处理这个设计下收集的定性资料要使用相应设计定性资料的统计模型分析法。由于上述方法过于复杂,因此,通常在实际运用中,实际工作者将重复测量因素武断地视为实验分组因素,从而使该资料变为结果变量为多值有序变量的三维列联表资料。在已经出错的前提下,原本应当使用CMH校正的秩和检验或者有序变量的多重logistic回归分析处理资料。然而,该作者显然在此基础上进一步合并了数据,将结果变量变成二值变量(有效、无效),也就是说,原作者实际使用的仅仅是最后一列数据(即总有效率),并且最为严重的错误是将三维列联表资料强行降维成二维列联表资料,使用一般χ2检验进行分析。经过一系列的简化与错误合并,最后结论的可信度还剩下多少呢?表5 原作者对2组疗效比较的试验设计及数据表达(略)注:与对照组同期比较,*P<0.05
由于篇幅所限,这类错误笔者只给出1例,实际上此类例子在很多杂志中普遍存在。这说明在进行实验设计时,很多研究人员并未做到心中有数;分析数据时,按自己熟悉的简单统计分析方法所能解决的数据结构强硬地改造数据,严格地说,在用表格表达实验资料的那一刹那就已人为改变了资料所对应的实验设计类型,这种做法的科学性和得出结论的正确性都将受到质疑[2]。
5 正交设计及数据处理方面的错误
人们在进行正交设计和对正交设计定量资料进行统计分析时,常存在下列3个误区:很多人过分强调用正交设计可以大大减少实验次数,因此,无论各实验条件(正交表中的每一行)下的实验结果波动有多大,都不做重复实验,这是第1个误区;将正交表各列上都排满试验因素,用对实验结果影响最小的试验因素所对应的标准误作为分析其他因素是否具有统计学意义的误差项,导致误差项的自由度较小,结论的可信度较低,这是第2个误区;在对正交设计定量资料进行方差分析后,即使存在多个无统计学意义的因素,仍对少数几个有统计学意义的因素进行解释,未将无统计学意义的因素合并到误差项中去重新估计实验误差,以获得具有较大自由度的误差项,这是第3个误区。
中图分类号:F713.55文献标识码:A文章编号:1001-8409(2013)01-0074-06
“生态消费”作为可持续消费、绿色消费、适度消费等术语的同义语,其所倡导的理念及行动准则已成为包括我国在内的世界各国和地区的核心政策目标,而实现这一目标在实践上的具体要求就是提高居民的生态消费水平。寻找一个真正有效的提高生态消费水平的办法,首先要做的基础工作是将消费者进行识别分类,研究哪些消费者更趋向于进行生态消费,并对各类消费者的社会人口统计学特征、心理学特征、社会价值观和环境价值观、家庭内部生活习惯等各方面特征加以对比分析,找出其差异性,才能有针对性地提出对策建议,有效地提高居民生态消费的整体水平。
一、文献回顾
学术界对生态消费的关注源于对环境主义者消费模式的研究,这一领域的研究主要是从消费者的环境和社会价值观、社会人口统计学特征及心理学变量等方面因素对消费模式的影响展开的[1,2]。长期以来,国内外许多学者从社会人口统计学特征对生态消费行为做过大量的研究,包括年龄、性别、收入、教育、职业等变量[3~5]。尽管研究所得出的结论不同,但社会人口统计学特征却是研究并识别生态消费者的重要变量之一[6]。已有的研究多侧重于对消费者生态消费行为的影响因素进行实证研究,而鲜有对生态消费者的识别及其特征进行系统研究。本文研究的主题是城市居民生态消费者的识别。利用对哈尔滨市居民的问卷调查获得的数据,本文分3个步骤开展研究:第一步,通过因子分析确定生态消费行为识别的依据;第二步,通过聚类分析对消费者进行分类并识别生态消费者;第三步,分别从社会人口统计学特征、社会和环境价值观、心理学特征3个方面分析不同类型消费者的特征。
二、数据来源
实际上,统计方法在应用于具体问题的时候,需要许多环节,其中最重要的是需要学生动手来推算该具体问题中涉及到的分布密度――特别是联合密度、边际密度与条件密度,演算方法应用中的变量变换及相应的分布密度,计算变量的数字特征,这些都是统计方法应用的基本环节,如果计算推演这一环节没有经过扎实地训练,那么在这一环节上经常会出错,统计结论就可能是错的。
上面的错误归结起来并不是同学的统计学没有学好,而是他(她)的概率论基本训练没有到位,因此有必要突出强调应用统计类课程所需要的重要知识点,在讲授概率基础课程时候加以特别强化训练。最重要的知识点主要有:
1.列出基于已知分布密度推导各种特殊数据类型的广义概率密度的相应方法。在实践中最常用的数据类型主要有:一元连续型、多元连续型(常见且基本),一元离散型、多元离散型(常见且基本),同时具有离散型与连续型分量的多元数据(常见但不基本),右删失数据(工程与生物领域常见但不基本)、左截断数据(不常用又不基本),具有缺失分量的多元数据(常见但不基本),都可以给出相应的方法求广义概率密度。
2.概率基本公式应用与条件分布的演算。教会学生正确地写出三大概率基本公式所需的各个要素,特别是关于条件概率及其密度的演算。重中之重有两处:一是会求离散变量关于连续变量的广义条件密度(十分常用),二是会利用广义条件密度及广义边际密度求离散变量与连续变量的广义联合密度(十分常用)。
人际信任是个体将他人的言词、承诺以及口头或者书面的陈述认为可靠的一种概括化的期望。人际信任对大学生人际交往有一定的影响,比如大学生人际信任的高低,会影响大学生与同伴交谈,生活中的交际和交友,体现在与人接触的能力。良好的人际信任对大学生的成长有促进作用,对心理健康发展也有帮助。为了解大学生人际信任在职务、生源地和家庭类型上的差异现状,调查研究情况如下。
一、对象与方法
(1)对象。 随机抽取190名大学生进行调查, 获得有效样本190份,回收率100%。其中,职务:担任班级职务的大学生56人,没有担任班级职务的大学生134人;平均年龄21.04±1.40岁;生源地:来自城市的大学生29人,来自农村的大学生161人;家庭类型:属于独生子女家庭的有27人,非独生子女家庭的有170人。调查时间为2014年10月。
(2)方法。采用自行设计调查表,调查基本情况,包括职务、生源地和家庭类型。采用Rotter编制的人际信任(ITS)量表调查,并做相应访谈。
(3)统计学处理。采用SPSS16.0进行描述统计分析和独立样本t检验。
二、结果
(一)不同职务、生源地、家庭类型大学生人际信任差异比较(表1)
表1 不同职务、生源地、家庭类型大学生人际信任评分结果比较(x±s)
注:*代表p(双侧)< 0.05,**代表p(双侧)< 0.01,下同
表1所示,从职务自变量上看,大学生人际信任在特殊信任因子、普遍信任因子及人际信任总分上的得分,没有统计学意义上的差异(p>0.05)。从生源地自变量上看,大学生人际信任在普遍信任因子及人际信任总分上的得分,差异有统计学意义(p0.05)。从家庭类型自变量上看,大学生人际信任总分上的得分,差异有统计学意义(p0.05)。
三、讨论
(1)班级职务差异。研究发现,是否担任班级职务,大学生人际信任的特殊信任、普遍信任因子及信任总分,没有显著差异。通过访谈发现,原因是班干部和非班干部是同龄人,他们和父母、同伴的交流方式有90后的时代特点,渴望情亲和友情,但是相处中矛盾较多,等等的时代共同点和受教育环境的相似,故差异不显著。
(2)生源地差异。研究发现,来自城市的大学生,人际信任在普遍信任因子及人际信任总分显著高于来自农村的大学生。通过访谈发现,原因是城市大学生大都是独生子女,是每个公寓的唯一孩子,父辈和祖辈给予的爱和关注更多,成长环境更安逸,在与人相处中更容易信任陌生人,故城市大学生人际信任的总体得分也较高。
(3)家庭类型差异分析。研究发现,独生子女家庭的大学生,人际信任总分显著高于非独生子女家庭的大学生。访谈发现,独生子女大学生,父母给予他们的期望和爱较多,在成长过程中,指导和保护也较多,独生子女大学生他们的社会实践参与的较少,对人的评价也较多的往积极方面考虑,故他们的人际信任总得分较高。
四、建议
社会方面,社会大环境中,弘扬正气,法制健全,提高整体国民素质水平,社会的整体人际信任高,在这样的安全的环境下,大学生的人际信任会得到全面发展,特殊信任和普遍信任都会有所提高。学校方面,可以多让大学生参加集体活动,在理论教育的同时,让大学生有更多的参加生活实践的机会,增加独生子女和非独生子女的互动交流,让大学生与朋友家人和睦相处的同时,也能结交更多的新同学新朋友,为其步入社会的人际信任发展打下基础。家庭方面,家长首先认识到大学生已经是成年人,可以独立承担家庭一部分责任,并且有能力;其次,给大学生与人交流交往的机会和信任,家庭有重大决定可以和其商量,然后共同决定;最后,父母的交流互动模式是大学生人际信任发展的第一课堂,父母在生活中有良好的互动方式是有必要的。个人方面,大学生认识到自己已经长大成人,自己有主动与人交往交流的能力,能人际信任发展的能力,不仅能与家人和睦相处,在生活中也能和陌生人打交道。
上海是我国老年人口比例最高,人口老龄化发展速度较快的城市,早在1978年就跨入了老年型结构城市,与此相应的老年性疾病的预防与控制越来越受到社会的重视。肺炎球菌是引发肺炎、脑膜炎和中耳炎的主要病因,由于肺炎球菌对抗菌药物的耐药性增加,以及耐药菌株在世界范围内的传播,除使用疫苗预防外,目前尚无其他有效的公共干预措施[1]。上海市从1998年开始使用23价肺炎球菌疫苗(肺炎疫苗),但至今老年人群的接种率仍然很低。为做好老年人群中肺炎疫苗的接种工作,我们对长宁区社区老年人接种肺炎疫苗的影响因素进行了调查分析。
1对象与方法
1.1对象
以2004年1月1日至2005年12月31日在长宁区9个免疫门诊接种过肺炎疫苗的≥60岁老年人为接种组调查对象。共登记接种肺炎疫苗的老年人122人,实际调查100人,失访的主要原因为已搬迁、地址有误等。
以长宁区社区未接种过肺炎疫苗的≥60岁老年人为未接种组调查对象。2005年长宁区辖196个居委,依据按容量比例概率抽样(PPS抽样)的方法,根据每个居委老年人数的比例,抽取20个居委,每个居委调查20名老年人,共计400名老年人。
1.2方法
根据知情同意原则,由统一培训的调查员采用自拟的《老年人群肺炎疫苗知晓及接种情况调查表》入户调查,调查内容包括老年人一般情况、健康状况、对肺炎疫苗的认知、态度和利用等。
1.3统计分析
用Epidata 3.1建立数据库录入调查表数据,用SPSS 11.5进行χ2检验、方差分析和多因素Logistic回归分析。
2结果
2.1基本情况
2.1.1性别年龄接种组100名老年人中,男41名(41.0%),女59名(59.0%);未接种组400名老年人中,男163名(40.8%),女237名(59.2%),两组性别之间差异无统计学意义(χ2=0.002,P>0.05)。
所有被调查的老年人年龄为60~92岁,接种组平均年龄为(72.62±7.97)岁,未接种组平均年龄为(72.53±6.90)岁,两组年龄之间差异无统计学意义(F=0.01,P>0.05)。
2.1.2文化程度接种组文化程度以大专及以上(42.0%)、高中(24.0%)和初中(16.0%)为主,未接种组文化程度以初中(23.8%)、文盲半文盲(23.3%)和高中(19.3%)为主,两组文化程度之间的差异有统计学意义(χ2=43.13,P
2.1.3目前或退休前职业接种组职业以工人(25.0%)、科技人员(16.0%)和教育(12.0%)为主,未接种组职业以工人(55.5%)、企业管理人员(11.3%)和教育(6.5%)为主,两组职业之间的差异有统计学意义(χ2=54.97,P
2.1.4家庭类型两组老年人的家庭类型均以“和老伴生活在一起”为主,其次为“和子女或儿孙生活在一起”,“独居”和“其他类型”的构成比最小,两组家庭类型之间的差异无统计学意义(2.1.5家庭人均月收入接种组老年人家庭人均月收入≥1 000元的占91.0%,而未接种组为46.8%,两组家庭人均月收入之间的差异有统计学意义(2.2肺炎疫苗接种影响因素的多因素Logistic回归分析
以是否接种肺炎疫苗为应变量,以问卷中设计的10个影响因素为自变量,进行多因素Logistic逐步回归(变量进入方程的概率α= 0.05,变量从方程中剔除的概率β= 0. 1) 。应变量赋值情况:未接种肺炎疫苗为0;接种肺炎疫苗为1,自变量设置取值为“0、1”的哑变量。
影响老年人肺炎疫苗接种的因素按影响大小依次为是否接种过流感疫苗、是否患过肺炎或老慢支等呼吸系统疾病、家庭人均月收入、3个有关肺炎疫苗认知的问题和是否患有其他慢性病(表1)。
2.3未接种组老年人肺炎疫苗未种原因分析
在被问及“肺炎疫苗未种原因”时,400名未接种组老年人未种原因及构成比(%)依次为:不知道有这种疫苗的192人次(40.9%),目前不需要接种疫苗的172人次(36.7%),认为疫苗价格太贵了,不能承受的73人次(15.6%),不知道在哪里接种疫苗的14人次(3.0%),有禁忌证不能接种的7人次(1.5%),其他原因11人次(2.3%)。
3讨论
长宁区生命统计数据显示,2002―2004年,本区60岁及以上老年人的死因中分别有14.3%、14.8%和17.8%与肺炎有关,但是我区及上海市老年人群每年肺炎疫苗的接种率都不到1%。国外有研究结果表明,医务人员是影响肺炎疫苗接种的重要因素。Tammy等[2]总结1981―2000年有关肺炎球菌多糖疫苗的文献后发现,对医生而言,难于确定这种疫苗的作用,也缺乏有关疫苗重复接种的知识,是影响疫苗使用的主要因素;对病人而言,不知道有这种疫苗,医生没有告知这种疫苗是主要的影响因素。Nichol等[3]对1 874名医师进行了肺炎球菌疫苗的应用知识和态度的调查,发现多数医师缺乏对该疫苗重要性的认识,青霉素能有效控制肺炎球菌性疾病的观念仍普遍存在,而且许多国家并没有把肺炎疫苗作为公费医疗报销范畴成为影响肺炎疫苗接种的主要因素。
本研究显示,社区老年人接种肺炎疫苗受多个因素的影响。接种过流感疫苗的老年人可能会更多地从医护人员处了解到肺炎疫苗或受到医护人员的推荐而接种肺炎疫苗。在本次调查中也发现,接种组老年人有50%是从医务人员的途径获知肺炎疫苗的,医务人员对老年人接种疫苗起着至关重要的作用。
患过肺炎、老慢支等呼吸系统疾病的老年人可能更关注呼吸道疾病的预防而倾向于接种肺炎疫苗,目前尚患有其他慢性病如高血压、糖尿病与接种肺炎疫苗呈负相关,这部分老年人可能更关注于对其他慢性病的预防,或更多的医疗费用投入到其他慢性病的控制而不愿意接种肺炎疫苗。
由于目前上海市提供的进口肺炎疫苗的价格是进口流感疫苗的近3倍,且未纳入医保范围,因此家庭收入水平成为影响肺炎疫苗接种的因素之一。
对肺炎及肺炎疫苗的认知情况也是影响肺炎疫苗接种的重要因素。那些认为肺炎是老年人的一种常见病或认为目前的抗生素并不能有效根治肺炎、老慢支等的反复发作的老年人更倾向于接种肺炎疫苗来预防呼吸系统疾病。认为“儿童才需要打疫苗,包括肺炎疫苗,年纪大的人不需要接种疫苗”的老年人也不愿意接种肺炎疫苗。
二、地质统计学在矿山储量分析当中的应用
地质统计学是以研究区域化变量为基础的,以变异函数为研究工具,研究在空间上具有随机性和结构性的自然现象的科学。地质统计学在矿山储量分析当中的应用中的原理大致分为以下几种:1.区域化变量区域化变量是地质统计学理论体系的核心基础,在实践中,钻孔的位置。在绝大多数情况下是不随机的。当两个样品在空间的距离很小时,样品间会存在较强的相似性,而当距离很大时,相似性就会减弱或不存在。也就是说,样品之间存在着某种联系,这种联系的强弱是与样品的相对位置有关的,样品之间的联系在空间上既具有随机性又具有位置之间的联系。2.半变异函数的数学模型通常情况下样品由于取样、化验误差和矿化作用在短距离内的变化,在绝大多数情况下半变异函数在原点不等于零。也就是会存在块金效应。但是地质统计学在矿山储量分析当中的应用在实际工作中区域化变量的变化性很复杂,通常要计算几个具有代表性的方向,然后通过结构分析,得到一个能代表其空间变异性的模型函数,由于区域化变量往往存在各向异性,不同方向上的半变异函数具有不同的变程,影响范围是一椭球体,即各向异性椭球体。在确定空间搜索椭球体时,不仅需要指出块金常数、基台、变程,还需要指定一些参数:圆锥体的容差角、容差限、滞后距等,各个参数的意义用几何图形表示。当然应用地质统计学法对矿山储量分析,被大部分人认为是一种较好的品位估值方法,尤其适用于品位变化大,矿岩界线由品位控制的矿床。在估值计算过程中,当有了足够的地质钻孔数据时,对矿床进行正式可行性评价时,选用地质统计学法是一种较好的方法,而在对矿床进行初步评价或是数据量不足时,就要首选较简单的方法。基于地质统计学原理和矿体三维可视化建模技术的DIMINE矿业软件,实现了按照不同的边界品位动态圈定矿体,能够以市场经济为向导,快速计算出矿体范围内的矿石量,并进行储量分级,在此过程中所得到的各中间参数,可以为投资决策和日常管理提供必要的参考依据。
三、地质统计学在勘探网度优化方面的应用
地质统计学在勘探网度优化中的应用主要要注意以下的两个个因素,其一是:构造复杂程度;二是煤层的稳定性。当勘探区的构造已经经过,详细的勘探,构造问题基本解决之后,勘探网度优化主要的问题就是煤层的稳定性。当一个煤田有两种或者是两种以上的煤层稳定结构时、应该按照储量和厚度占有优势的那一个煤层类型选择勘探网度的优化。应用地质统计学的方法对露天的在勘探网度进行优化,主要要分为两个步骤:其一是建立地质变量的最佳理论变差函数;其二是应用地质变量的估计方差评价勘探过程对矿床的控制程度。
【中图分类号】 R 641 G 478.2 【文献标识码】 A 【文章编号】 1000-9817(2008)09-0782-03
伤害严重威胁着人类的生命和健康,近年来已成为主要的公共卫生问题之一,并已被列为单独的一类疾病[1]。我国每年约有70万人死于伤害,伤害已成为中小学生的首位死因[2],给人们的身心健康和国家的经济造成了极大负担[3]。随着社会经济的发展和教育体制的改革,寄宿制学校越来越多[4]。通过调查研究,人们逐渐认识到寄宿生特有的生活方式,使他们在心理、体质等很多问题上与普通学校的学生存在差异[5-7],对这一群体的管理和教育方式也应有所侧重。为进一步了解安徽省农村寄宿制学校学生的伤害发生情况,笔者于2007年12月到2008年5月对安徽省5个县农村寄宿制学校的部分学生进行了问卷调查。
1 对象与方法
1.1 对象 采取分层整群抽样法,在安徽省抽取长丰、绩溪、全椒、濉溪和岳西5个县作为调查点,每个县抽取寄宿制学校5所,共计25所。每所学校从符合条件的年级抽取1~3个班,对其所有学生进行调查。共发出调查问卷5 624份,回收并审核后的有效调查问卷5 556份,问卷合格率达98.79%。学生年龄范围9~21岁,平均年龄为(14.97±2.07)岁;其中长丰县958人(17.2%),绩溪县1 008人(18.1%),全椒县1 019人(18.3%),濉溪县1 722人(31.0%),岳西县849人(15.3%);男生3 241名(58.3%),女生2 315名(41.7%);住校生2 607人(46.9%),住家学生2 133人(38.4%),住亲戚朋友家334人(6.0%),租房住者482人(8.7%);小学生721名(五年级377名,六年级344名),初中生3 201名(初一1 011名,初二1 288名,初三902名),高中生1 634名(高一528名,高二490名,高三616名)。
1.2 调查变量与方法
1.2.1 社会人口统计变量 包括性别、独生子女情况、学习阶段(小学、初中和高中)、体型(很瘦、偏瘦、中等、偏胖和很胖)、地区(长丰县、绩溪县、全椒县、濉溪县和岳西县)、住宿类型(住校、住亲朋家、租房住和住家)、自评家庭经济状况(下等、中下、中等、中上等和上等)和父、母文化程度(无父/母、未上或小学未毕业、小学毕业、初中、高中、中专大专及以上)等。
1.2.2 伤害发生情况 问卷中列出10种常见伤害类型,要求学生填写自己在最近1 a的发生情况。调查员到各学校以班级为单位进行现场调查,学生集中填写问卷并当场收回。伤害发生率=(1 a中至少发生过1次伤害的人数/调查总人数)×100%。
1.2.3 伤害的分类及判断标准 参考ICD-10损伤、中毒外因分类,将伤害分为扭伤、跌伤或坠落伤、烧伤或烫伤、溺水、交通事故、刀(或锐器)割伤或刺伤、动物咬伤、中毒、爆炸伤、电击伤和窒息等共10种。凡有以下情况之一者判定为伤害:(1)到校医室或医院处理过;(2)由教师或家长做过紧急处理;(3)因伤缺课0.5 d以上。
1.3 统计方法 用EpiData 3.0建立数据库,SPSS 13.0进行统计分析。用描述性统计分析方法分析一般情况,χ2检验用于分析学生的伤害发生率有无差异。分别以住校和住家2种住宿类型学生总的伤害发生情况为因变量,对单因素Logistic回归分析有统计学意义的因素进行多因素Logistic回归,探讨这2种住宿类型学生伤害发生的主要危险因素。
2 结果
2.1 农村寄宿制学校学生伤害发生情况 被调查者在过去1 a内至少发生1次伤害者2 891人,伤害发生率为52.0%。各类伤害累计发生次数为9 582次,伤害者平均伤害发生频率为1.72次/人。由表1可见,住校、住亲朋家、租房住和住家这4种住宿类型的学生伤害总体发生率差异有统计学意义(χ2=8.44,P<0.05),不同住宿类型学生在交通事故和动物咬伤这2种类型伤害发生率间的差异均有统计学意义。经两两比较可知:住家学生伤害总发生率和交通事故发生率均高于住校生,OR值分别为1.18和1.80,P值均<0.05;住家学生交通事故发生率亦高于住亲戚朋友家的学生(OR=2.63,P<0.05);住家学生动物咬伤发生率高于其他3种住宿类型学生,OR值分别为1.37,2.16和1.53, P值均<0.05。
2.2 农村寄宿制学校学生伤害的分布特征
2.2.1 不同性别学生伤害发生情况 由表2可见,男生伤害总发生率为56.7%,女生为45.5%,差异有统计学意义(χ2=67.28,P<0.01)。在不同类型的伤害发生率上的性别差异均有统计学意义。
2.2.2 不同学习阶段学生伤害发生情况 由表3可见,伤害总发生率在不同学习阶段之间的差异有统计学意义(χ2=66.15,P<0.01),其中初中生伤害发生率(55.9%)和小学生伤害发生率(54.1%)均高于高中生(43.6%)。具体类型中,扭伤、跌伤或坠落伤、烧伤或烫伤、刀(锐器)割伤或刺伤的发生率以初中生最高,而溺水、交通事故和动物咬伤的发生率以小学生最高。
2.2.3 不同地区学生伤害发生情况 由表4可见,不同地区学生伤害总体发生率差异有统计学意义(χ2=95.07,P<0.01)。多种伤害类型发生率的地区间差异均有统计学意义。
2.3 不同住宿类型学生伤害危险因素分析 由表5可见,按α=0.05的标准选取,进入住校生和住家生伤害回归模型的变量相同,分别是地区、学习阶段和性别;将各变量进行赋值,地区(岳西县为对照)、学习阶段(高中为对照)和性别(赋值为男1女2),经多因素非条件Logistic分析(Forward:LR法,纳入、剔除标准分别取0.05和0.10)可知,影响住校生伤害发生率的因素有地区(绩溪县和长丰县高于岳西县)、学习阶段(初中生高于高中生)和性别(男生高于女生),而影响住家学生伤害发生率的因素有性别(男生高于女生)、学龄阶段(初中生高于小学生和高中生)和地区(长丰县高于岳西县)。
3 讨论
许多研究显示,青少年是伤害的高发人群[8-9]。我国中小学生每年发生伤害达4 250万人次,因伤害缺课达2.38亿天,不仅对学生本身的身心健康和学业造成了不良影响,给家庭和社会带来的负担亦是巨大的。调查结果显示,安徽省农村寄宿制学校学生在过去1 a里总的伤害发生率为52.0%,伤害者平均伤害发生频率为1.72次,这一结果高于胡佳等[10]的报道,低于阳本华等[11]的报道结果,可能与所调查的伤害类型和资料来源不同有关,也有可能与调查对象地域差异有关。
本次调查的学校是寄宿制学校,被调查的学生以住校和住家2种居多。调查结果显示,4种住宿类型的伤害发生率存在明显差异,其中住校生的烧烫伤和交通事故发生率均明显低于非住校生,这可能与住校生接触这2类危险的机会较少有关。有关资料显示,交通伤害已成为中小学生伤亡最主要原因之一[12]。因此,对于非住校生,应加强他们的交通安全意识,教育他们养成遵守交通规则的好习惯,以减少交通事故的发生率。虽然减少伤害相关行为的发生是降低伤害发生率的有效手段,但随着年龄增长,从事家务劳动是一个必然趋势,学生在使用煤气、电器的同时,需注意避免烧烫伤、电击伤、中毒等伤害的发生,这就需要教师和家长积极引导和提醒以去除伤害的隐患。另外,地区也是影响伤害发生的一个主要因素,这与他们的地理位置、气候特征以及生活习惯等差异有关,不同地区的有关部门应当根据自身特点制定伤害防范和管理措施。
伤害的发生与性别因素有关,与刘慧慧等[13]多数报道结果一致。调查中女生的伤害发生率大都低于男生,这可能与她们独有的性格、运动强度小、活动范围小有关,并且在日常生活中,社会各方面对男女生的保护和教育方式也不相同,今后应加以注意,降低男生伤害的发生率;伤害的发生在不同的学习阶段之间存在差异。初中生伤害的总体发生率高于小学生和高中生,且跌伤、烧烫伤、刀割伤的发生率也最高,可能与这个年龄段的孩子活动的机会多、强度大,喜欢新鲜和刺激的游戏有关;而小学生溺水、交通事故和动物咬伤的发生率最高,尤其是住校的小学生,是住校生中伤害发生的高危人群,自理能力较弱,心理尚处于未完全成熟阶段,应加强教育以促进他们尽快摆脱幼稚,并做好防范与管理工作;尽管高中生可能由于学业的压力使其伤害发生率最低,但仍然不能放松警惕,缓解压力,促进他们身心健康是必不可少的。此次调查发现,有8.7%的学生在外租房住宿,他们的安全系数大幅度降低,对于这部份学生的身心健康的关注和安全管理也不容忽视。
伤害预防要根据不同的年龄和群体制定有效的安全措施[14]。通过开展各种教育活动提高学生的自理能力、自我保护意识和自我救治技能,以减少伤害的发生和避免不良结局的产生。除此之外,学生的安全问题仅靠学校单方面的努力是不够的,家庭的配合和社会的关注必不可少[15]。只有社会各界共同行动,才能有效减少和预防学生意外伤害的发生。
(致谢:本课题得到安徽省学校体育卫生协会的大力支持,特此感谢!)
4 参考文献
[1] 王春灵,王云霞.766例儿童意外伤害原因分析及预防.华北煤炭医学院学报,2008,10(1):91-92.
[2] 季成叶,陶芳标.儿童青少年非故意伤害预防.中国公共卫生,2005,21(9):1 150-1 152.
[3] 王声.我国伤害流行病学研究亟需开展.中华流行病学杂志,1997,18(3):131-133.
[4] 李士凯.寄宿学生的疾病预防与管理.现代预防医学,2005,32(2):156.
[5] 刘朝军,田素英,寻广磊,等.寄宿制和非寄宿制学校高中生心理健康状况比较.中国临床康复,2004,8(27):5 782-5 784.
[6] 蔡亮亮.寄宿小学生610名健康状况调查.中国学校卫生,2003,24(6):640.
[7] 赵红深,陈雄新,李健芝,等.不同住宿方式学生体质状况比较分析.中国学校卫生,2008,29(4):366-367.
[8] 吴晓红,陈建华,杨楚春,等.黄石市小学生伤害流行病学调查.疾病控制杂志,2004,12(8):519-522.
[9] MACKENZIE SG, PLESS IB. CHIRPP: Canada's principal injury surveillance program. Inj Prev, 1999,5(3):208-213.
[10]胡佳,刘莉,毛军,等.上海浦东新区2003学年中小学生伤害发生情况.中国学校卫生,2005,26(11):976-977.
[11]阳本华,李军,肖和平,等.郴州市中小学生伤害流行病学调查分析.现代预防医学,2001,28(2):152-154.
[12]王声.校园安全与中小学生伤害现况.中国学校卫生,2006,27(2):96-98.
[13]刘慧慧,郝加虎,张国庆,等.宿州市农村中小学生伤害影响因素分析.中国学校卫生,2005,26(6):464-465.
[中图分类号] G451 [文献标识码] A [文章编号] 2095-3437(2013)15-0027-03
教师职业倦怠是教育研究中值得关注的一个问题。“教师是一个高压力的职业,社会赋予教师的高度期望、繁重的工作量、学生行为问题、学生考试成绩和课程与教学改革等都是教师压力的主要来源。”[1]“过高的工作压力和职业倦怠会导致教师工作绩效下降、缺勤、离职,对教师的身心健康造成不利影响,并对学生产生直接、消极的影响,甚至波及整个社会。”[2]教师职业倦怠也因此成为教师专业发展的阻力和教师职业生涯中的危机。
一、职业倦怠的概念界定
对于职业倦怠的概念,不同学者从不同的角度提出了不同的看法,概括起来,不外乎两大类,即侧重揭示职业倦怠最终状态的静态定义和侧重描述职业倦怠动态发展过程的动态定义。
(一)职业倦怠的静态定义
Maslach认为,“职业倦怠是指那些需要连续不断地与他人互动的人际服务业者在经历长期压力下的一种行为反应,它由情感衰竭(emotional exhaustion)、非人性化(depersonalization)和低个人成就感(reduced personal accomplishment)三个成分组成”。[3]
在众多职业倦怠静态定义中,得到学术界广泛认同的当属Maslach对职业倦怠的界定。由于Maslach及其同事所编制的职业倦怠量表――MBI的普遍使用,使这一定义成为目前最常用的职业倦怠标准化操作性定义。
(二)职业倦怠的动态定义
与Maslach不同,Cherniss则从职业倦怠动态发展过程的角度界定职业倦怠,并给出了职业倦怠的定义,这一定义属于职业倦怠的动态定义。Cherniss认为,“职业倦怠是个体面对工作疲劳(strain)在态度和行为上消极变化的过程,可分为三个阶段:第一阶段为资源和需求的不平衡,即压力阶段;第二阶段为即刻、短时的情绪紧张、疲劳和耗尽,即疲劳阶段;第三阶段包括一系列态度和行为的改变(如以疏离、机械的方式对待工作对象),即防御性应对(defensive coping)阶段”。[4]
职业倦怠的静态定义和动态定义并不是相互排斥的,相反,在一定意义上,两类定义是互补关系,动态定义所描述的是静态定义的前一个阶段,静态定义所描述的是动态定义的最后阶段。
Schaufeli和Enzmann在研究了职业倦怠的诸多定义之后,最为全面地概括了职业倦怠现象的本质:“职业倦怠是一般个体所经验的、一种与工作有关的持续、消极的心理状态,它主要以精疲力竭为基本特征。职业倦怠表现为负性压力(distress)、低效能感、动机下降以及态度和行为的消极改变。这一心理状况是逐渐形成的,但却在很长一段时间内不被个体所觉知。它起因于工作中目的与现实的互不协调。职业倦怠因其实质上是一种不适当的应对策略,往往会持续存在”。[5]这一定义首先将职业倦怠的诸多症状概括为一个核心特征――精疲力竭和四种一般表现,即负性压力、低效能感、动机下降以及态度和行为的消极改变。其次,它强调未能实现的目标和不适当的应对策略是职业倦怠产生的前提条件。最后,它指出职业倦怠是一个逐步发展的过程。显然,这一概念和其他诸多概念相比,明显的优势在于不仅描述了职业倦怠的一般症状表现、产生原因及发生范围,而且具体指出了职业倦怠的核心特征和四个常见的伴随特征。此外,该定义还强调了职业倦怠是一个逐渐发展的过程,并指出应对策略,在职业倦怠形成过程中具有重要的作用。
二、教师职业倦怠的影响因素
影响教师职业倦怠的因素众多,概括起来主要分为人口统计学变量、个性变量和组织变量三大类。
(一)人口统计学变量
已有研究考察的人口统计学变量主要包括年龄与工作经验、性别、学生级别、教育程度和婚姻状况等。这些变量也与职业倦怠或多或少存在一定的相关。例如,多数研究表明,教师的年龄和工作经验与职业倦怠呈负相关,所以,在教师职业生涯初期,容易出现职业倦怠;就性别而言,较为一致的结论是男教师的非人性化程度明显高于女教师;从学生级别来看,多数研究显示中学教师的职业倦怠程度要高于小学教师;有关婚姻状况与职业倦怠关系的研究出现两种结果:一种结果表明,已婚教师的职业倦怠水平低于未婚教师,而另一种结果则显示,结婚与否和职业倦怠的相关性并不显著。其他一些人口统计学变量,如教师职称、任教科目、学校级别等与教师职业倦怠的关系,较难取得一致结论。
总之,人口统计学变量与教师职业倦怠的相关性较低,研究结果也不十分一致,有些研究并未发现显著的相关关系,甚至还得出与多数研究相反的结论。由此可以看出,人口统计学变量虽然是影响教师职业倦怠的因素,但并不是主要的因素。
(二)个性因素
影响教师职业倦怠的个性因素主要有心理控制源、A型人格、大五人格、工作期望、应对策略、自我概念、自尊和自信、自我效能、人生意义等。通过对这些因素的研究,可以解释为什么在相同或相似的工作环境和压力下,个体经验的职业倦怠程度会有所不同。
研究表明,心理控制源是职业倦怠的有效预测变量,外控教师因其将事件和成就归因于他人或机遇,因而其职业倦怠程度要高于内控教师;A型人格的人由于个性争强好胜,具有时间紧迫感和充满成功的理想等特点,通常认为更容易产生职业倦怠;研究表明,大五人格中的神经质与职业倦怠的关系最为显著;个体对组织、工作以及自身过高的期望也会影响其职业倦怠程度,过高的期望会增加职业倦怠的程度;研究表明,个体的自我概念、自尊和自信都与职业倦怠呈显著的负相关;Leiter认为,职业倦怠是由于自我效能感出现危机所致,实证研究也证明了这一点;职业倦怠的存在主义理论认为,职业倦怠是由于个体在生活和工作中寻求存在意义的需要未能实现所致,有关人生意义与职业倦怠关系的量化研究也充分支持了这一观点。
三、组织因素
组织因素成为影响教师职业倦怠的原因是职业倦怠是一个与工作有关的概念。工作压力源以及其他组织水平上的变量是产生职业倦怠的可能原因,因此,这应该是我们重点关注的因素。
(一)学生问题行为
学生是教师工作的对象,学生的行为表现是影响教师压力和职业倦怠的重要因素。很多实证研究均表明,学生在课堂的问题行为、不遵守纪律、态度冷漠是教师主要的压力源,学生问题行为与教师职业倦怠呈正相关。Hoerr和West将学生问题行为分为两类:一类是一般问题行为,即较常见的、可以被教师预知的、经常出现的行为;另一类是危机问题行为。他们发现,学生一般问题行为与情感衰竭、非人性化存在高相关,而学生的危机问题行为则只与非人性化维度相关。Friedman的研究结果表明,学生的不尊重(指学生不尊重老师和其他同学)和不用心(指学生学习考试不及格)等学生问题行为会增加教师的职业倦怠感。
(二)学校文化
教师的主要工作场所是学校,所以学校文化也是影响教师职业倦怠的因素之一。Leithwood、Menzies、Jantzi等人认为,如果学校的目标明确,学校给予教师一个不断学习的环境,学校文化是合作、团结的,教师的职业倦怠水平就低;相反,在组织僵硬的学校里,教师的职业倦怠水平就高。因此,学校应形成一个团结、合作、不断学习和相互支持的良好氛围,学校管理应该人性化。
(三)工作负担
大量研究表明,合理的工作量有利于降低教师的职业倦怠水平,相反,工作超负荷则会提高教师的职业倦怠水平。工作超负荷有质和量两方面的含义。从量的方面来看,工作超负荷是指有过多的工作要求,而用太少的时间去完成任务。如繁重的备课、批改任务,过多的学生数量等。从质的方面来看,工作超负荷是指工作的复杂和困难程度大,例如学校要求教师的教学成绩要在本地区排名第一。
(四)教师的自
以往的实证研究显示,教师参与的自也是影响教师职业倦怠的一个重要因素。当教师在教学和学校管理等事务中拥有更大的参与自,教师的职业倦怠水平就低,而缺乏参与自会使教师的士气、自尊和工作满意度下降,进而提高职业倦怠水平。
(五)角色冲突和角色模糊
角色冲突和角色模糊也是影响教师职业倦怠的重要组织变量。当个体面对两种冲突情境而又被期望做出角色行为时,角色冲突就会出现。当个体对其职业的权利、义务和责任缺乏明晰、一致的认识而感到无法胜任工作,或者面对不断增加的复杂工作和较大的组织变革时,角色模糊就会产生。
大量的实证研究表明,角色冲突与情感衰竭、非人性化呈正相关,与个人成就感呈负相关,其中,角色模糊与个人成就感的关系最为密切。总之,角色冲突和角色模糊与教师职业倦怠都有较高的相关,但比较而言,角色冲突对教师职业倦怠的解释能力相对较强。
(六)社会支持
社会支持通常从来源和类型两个方面进行划分。依据来源,社会支持可分为校内支持(包括同事支持、校长支持等)和校外支持(包括学生支持、朋友支持、配偶支持等)。依据类型,社会支持可分为信息支持、实际支持和情感支持三类。
一般而言,社会支持作为个体的一种应对方式,良好的社会支持能有效降低教师职业倦怠的程度,但因社会支持的结构较为复杂,不同类型的社会支持对教师职业倦怠的影响有所不同。例如,多数实证研究结果显示,校内支持与教师职业倦怠的关系比较密切,其对教师职业倦怠各成分均有负向预测作用,而校外支持与教师职业倦怠的相关性并不显著;情感支持能有效降低情感衰竭、非人性化;实际支持可以增强教师的个人成就感;教师的时间支持高,则情感衰竭和非人性化程度低。
个别学者的研究甚至得出相反的结论。例如Burke和Greenglass的一项研究结果显示,社会支持对教师职业倦怠的影响并不显著。Byrne认为,这可能是由社会支持理论结构的多维性和统计方法的多样性造成的。
除以上因素之外,工作需求、工作资源、工作控制以及付出与回报不成比例等也是影响教师职业倦怠的因素。而在以上各组织因素中,学生的行为问题、角色冲突与角色模糊、教师的自主性、工作负担是教师压力的主要来源。
综上所述,与教师职业倦怠有关的因素主要有人口统计学变量、个性变量和组织变量三类。其中,人口统计学变量相对比较稳定,它们与教师职业倦怠虽有相关关系,但不与教师职业倦怠有因果联系。个性变量则比较主观、多变,它们对教师职业倦怠的影响也比人口统计学变量要大。组织因素是属于微系统或中系统层面,其与教师职业倦怠的相关程度也最高。
[ 参 考 文 献 ]
[1] 周晓晔,秦巍.中学教师职业压力调查分析[J].辽宁师范大学学报(社会科学版),2004,(3):69-71.
[2] Farber,B.A.Stress and burnout in the American teacher[M].San Francisco,CA:Jossey?鄄Bass,1991.
[3] Maslach,C.Burnout: A social psychological analysis.In J.W.Jone(Ed.),The burnout syndrome:Current research,theory,investigations[M].Park Ridge,IL:London House Press,1982.
[4] Cherniss,C..Professional bournout in human service organiz?鄄
ations[M].New York:Praeger,1980.
ReceivedOctober9,2008;accptedDecember1,2008;publishedonlineJanuary15,2009.
Indexed/abstractedinandfulltextlinkoutatPubMed.JournaltitleinPubMed:ZhongXiYiJieHeXueBao.
Freefulltext(HTMLandPDF).
ForwardlinkingandreferencelinkingviaCrossRef.
DOI:10.3736/jcim20090112OpenAccess
Howtoidentifystatisticaldata
ChunyanHU,LiangpingHU
ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China
Keywords:statistics;medicine;dataanalysis,statistical
统计资料是统计分析的对象,正确识别统计资料是合理运用统计分析方法处理统计资料的首要前提;而科学完善的实验设计又是获得准确而又可靠统计资料的基本保证。
1何为统计资料
1.1数据不等于统计资料某研究者提交了如下内容。请问:它们是否叫统计资料?
6.55.16.13.93.57.72.11.99.67.97.67.84.66.16.42.87.62.54.68.14.86.95.12.06.46.04.58.08.08.66.44.96.46.84.73.47.71.22.80.52.63.26.57.63.55.75.42.37.42.74.26.46.97.26.76.54.07.31.14.92.52.91.93.61.42.54.42.5
它们不叫统计资料,因为这些数据代表什么含义并不清楚,数据的单位是什么不清楚,能派什么用场也不清楚,它们只能叫68个数据而已。
1.2仅有度量衡单位的数据仍不能称为统计资料假定前面给出的68个数据的单位是ng/ml,是否可称其为统计资料呢?仍然不可以!因为还缺少数据的名称,即数据的专业含义是什么,必须交代清楚,对其进行分析和讨论才能有的放矢,否则,只能是玩弄数字游戏。
1.3仅有变量名及其取值的数据仍不能称为统计资料表1中有很多数据,其中的每一列都能被称为统计资料吗?
有些似乎可以,有些则不可以。因为有些列仅有变量名,其专业含义并不清楚,如“G”代表什么,其下方的“1”与“2”又分别代表什么,“X1”的含义可通过其下方的“男”、“女”得知其代表“性别”,但“X3~X13”的含义都不清楚,“X14”代表联合用药情况。
1.4有指标名称又有度量衡单位的数据是否一定就可称为统计资料假定前面给出的68个数据所代表的指标为神经元特异性烯醇化酶(neuronspecificenolase,NSE)的含量,其单位是ng/ml,此时,它们是否就能叫统计资料?若要求不高,基本上可以称其为统计资料;若要求严格,还不能这样称呼。因为它们测自什么样的受试者并不清楚!比如有的测自正常人,有的测自不同疾病患者,甚至有的测自动物。表1冠心病人与正常人多项指标的观测结果
1.5统计资料应具备4个基本要素应当说,指标(或变量)名称、度量衡单位和具体取值是统计资料的3个基本要素。仅有这些基本要素可能还达不到特定的研究目的,也就是说,统计资料还应包括实现特定研究目的所对应的特定条件。比如说,前面给出的68个数据是某年从某地区18~60岁全部正常成年人中随机抽取的68人血液NSE酶的具体数值,而且,在获得这些数据时,测定的时间、地点、方法、仪器设备和测定者等都相同。这样条件下测得的NSE酶含量(ng/ml)所得的统计资料,运用适当的统计分析方法,才可以推测该年该地区18~60岁全部正常成年人血中NSE酶含量的(1-α)100%容许区间(医学上习惯称为正常值范围)和NSE酶含量总体平均值的(1-α)100%置信区间(也有人称为可信区间)。概括起来说,统计资料应具备4个要素:影响因素(测定条件)、有明确专业含义的指标名称、度量衡单位和具体取值。由此可见,统计资料通常是复合型,一般至少含有2个变量,一个称为影响因素,另一个称为观测指标及其取值。前面举的例子中,影响因素是受试者类型,仅测定了正常人,隐含的另一个水平是除这里定义的正常人以外的其他人,要使两组人具有较好的可比性,与其可形成对照的是某年从某地区18~60岁全部非正常成年人中随机抽取的68人。下面的表2中,若给X5~X11加上相应的度量衡单位,就是一个比较正规且可达到一定研究目的的复合型统计资料。表2103例冠心病人与100例正常人多项指标的观测结果
2统计资料的分类
2.1定性与定量资料任何一个有一定实用价值的统计资料通常都是复合型统计资料,即至少有两类性质的资料,一类叫定性资料,另一类叫定量资料。通常影响因素是定性资料,而观测结果是定量资料,但有时影响因素和观测结果都可包含定性与定量两类资料。
2.2资料类型的两种划分方法资料类型的划分方法有传统与现代两种。现将这两种划分方法作一扼要介绍,并对其加以比较。
2.2.1资料类型的传统划分方法资料类型的传统划分方法是将资料分为计量资料、计数资料和等级资料3类。其定义如下。
计量资料:测定每个观察单位某项指标量的大小,所得的资料称为计量资料。例如测得正常成年男子身高(cm)、体质量(kg)、血红蛋白(g/L)和总铁结合力(μmol/L)等所得的资料。
计数资料:将观测单位按某种属性或类别分组计数,得到各组观察单位数称为计数资料。例如某单位全体员工按ABO血型系统划分所得A型、B型、AB型、O型血的人数分别为1598、2032、641、1823人;又例如某小学1年级至6年级的学生人数分别为90、100、86、95、112、96人。
等级资料:将观测单位按某种属性的不同程度分组计数,得到各组观察单位数称为等级资料或半定量资料或有序资料。例如用某种治疗方法医治100名某病患者,最后清点治愈、显效、好转、无效和死亡的人数分别为10、30、40、15和5人;又例如某医院检测1029例患者,其中眼晶状体混浊程度为+、++、+++的分别有494、296、239人。
2.2.2资料类型的现代划分方法资料类型的现代划分方法是将资料先粗分为定量资料和定性资料两大类,然后,再将定量资料划分为计量资料和计数资料两小类;将定性资料划分为名义资料和有序资料两小类。其定义如下。
定量资料:测定每个观察单位某项指标量的大小,所得的资料称为定量资料。
计量资料:指标的取值可以带度量衡单位,甚至可以带小数(标志测量的精度)的定量资料,就叫计量资料。例如测得正常成年男子身高(cm)、体质量(kg)、血红蛋白(g/L)和总铁结合力(μmol/L)等所得的资料,它们首先是定量资料,进一步细分,它们还是计量资料。
计数资料:在定量资料中,若指标的取值可以带度量衡单位,但不可以带小数(只能取整数,通常为正整数)的定量资料,就叫计数资料。例如测得正常成年男子脉搏数(次/min)和引体向上的次数(次/min)。
定性资料:观测每个观察单位某项指标质的状况,所得的资料称为定性资料。
名义资料:在定性资料中,若指标质的不同状况之间在本质上无数量大小或质量好坏之分或先后顺序之分的定性资料,就叫名义资料。例如某单位全体员工按ABO血型系统(A型、B型、AB型、O型)来记录每个人的情况所得的资料;又例如某市全体员工按职业(工人、农民、知识分子、军人……)来记录每个人的情况所得的资料。
有序资料:指标质的不同状况(状态个数≥3)之间在本质上有数量大小或质量好坏或有先后顺序之分的定性资料,就叫有序资料。例如某病患者按治疗后的疗效(治愈、显效、好转、无效、死亡)来划分所得的资料;又例如矽肺病患者按肺门密度级别(+、++、++
+)来划分所得的资料。
若用一张表将资料类型的现代划分方法表示出来,则一目了然。见表3。表3统计资料类型的现代划分方法
2.2.3资料类型两种划分方法的比较资料类型的传统划分方法是从资料的收集方式角度来定义,也可以说是就“形式”而言;而资料类型的现代划分方法是从资料的性质角度来定义,也可以说是就“本质”而言。
事实上,当人们看到一个记号“1”时,人们无法知道这个“1”究竟代表的是什么含义。因为它可以代表1个人的年龄为1天或1个月或1岁,可以代表某定量指标的一个具体取值,也可以代表某组个体中具有某种阳性反应的人数是1人(频数为1),还可以代表受试者的一个特定性别(如用“1”代表男性,用“0”代表女性)。这说明仅从事物的表面看问题,很难准确地获知事物的本质特征。要想准确地揭示统计资料的性质,只需给出资料所对应的指标名称(变量名,通常隐含专业意义,若含义不明,应明确给出)和具体取值,而不必将调查对象分组后数出各组的调查单位数。例如在表3的前4行中,任何一行的任何一个数据或符号都应叫做其表头上相应指标的具体取值,“25”是“年龄X1”的一个具体取值,“农民”是“职业X4”的一个具体取值,同理,“+”是“尿糖X7”的一个具体取值。对于资料类型的现代划分方法而言,可以说出表3中任何一列的资料类型;而对于资料类型的传统划分方法而言,就不便说出表3中后4列的资料类型,它需要先分组,然后,用每个指标的所有不同标志及其对应组内的个体数两部分结合在一起,才叫计数资料或等级资料。而在多变量回归分析中,需要直接利用后4列资料,此时,资料类型的传统划分方法就显得“心有余而力不足”了。
3误判资料类型的案例
例1原文题目:美泰宁对睡眠作用的影响。原作者研究美泰宁对戊巴比妥钠诱导的小鼠睡眠的影响,选用40只体质量相近的雄性小鼠,随机分为溶剂对照组和3个剂量组,根据0、12.5、25.0和75.0mg/kg体质量,用蒸馏水配成所需浓度,每天灌胃。第7天灌胃15min后,各组动物按28mg/kg体质量腹腔注射戊巴比妥钠,以小鼠翻正反射消失达1min以上作为入睡判断标准,观察腹腔注射戊巴比妥钠25min内各组动物发生睡眠的动物数。经统计学处理,中、高剂量组与溶剂对照组比较,差异有统计学意义(P<0.01)。见表4。表4美泰宁对阈下剂量戊巴比妥钠诱导雄性小鼠睡眠发生率的影响
对差错的辨析与释疑统计资料常常分为定量资料和定性资料两大类,所谓定量资料是指每个观察单位用计量方法测量某项指标数值大小;而定性资料是指记录每个观察单位的某一方面的特征和性质。本资料观察的是动物的入睡情况,原作者把每组入睡的每只动物记为1,不睡的动物记为0,这样第一组有2个1,8个0,第2组有5个1,5个0,第1组和第2组各10个数据进行t检验,得t=1.406,P<0.05(经验算,就计算本身而言,原作者的计算结果是正确的)。但实际上这里的1并不代表真正的数值,它只是代表一种状态,即入睡,而0则代表没有入睡,因而本资料从性质上说应属于定性资料。但原作者却错误地将其判断为定量资料,表的标题后括号内写了x±s的形式,但实际上表中并没有表示平均数和标准差的数据,反而误导读者该资料为定量资料。一般来说,t检验仅适于分析定量资料,用分析定量资料的方法去分析定性资料显然是错误的。
正确判定统计资料属于定量资料还是定性资料是选用统计分析方法的首要前提。本资料属于定性资料,应根据分析目的,合理选用适合此类资料的分析方法如Fisher精确检验进行统计分析。
例2原文题目:小儿皮肤血管瘤雌、孕激素受体的研究。原作者意在探讨雌激素受体(estrogenreceptor,ER)和孕激素受体(progesteronereceptor,PR)在血管瘤发生、发展中的意义。采用免疫组化方法对毛细血管瘤、混合型血管瘤、海绵状血管瘤、淋巴管瘤及正常皮肤组织的ER和PR进行检测。全部标本经10%福尔马林固定,常规石蜡包埋。每例选一典型蜡块,4~6μm切片,进行免疫组化染色,高倍镜下每例肿瘤区内计数500个细胞,计数ER和PR阳性细胞百分率,统计方法用χ2检验。结果见表5。表5血管瘤和淋巴管瘤中ER和PR检测结果
对差错的辨析与释疑正确判别统计资料的设计类型是合理选择统计分析方法的重要前提。根据统计指标的性质,统计资料一般分为定量资料和定性资料两大类。所谓定量资料,是指每个观察单位(针对此资料,其观察单位是病例标本)测得的指标是用具体的数值表示,其又细分为计量资料和计数资料;所谓定性资料,是指每个观察单位测得的指标仅反映某一方面的性质,并不能用具体的数值表示,其又细分为名义资料和有序资料。对于本资料来说,测量细胞的结果是“阳性”或“阴性”,且一般认为带有“率”的资料就是定性资料,似应判为定性资料。然而问题的关键在于,原作者的观察单位并不是细胞本身,而是每一个病例标本。原作者关心的是4种疾病病例标本和一组正常人标本的ER和PR阳性细胞率之均值是否相同,从每一个病例标本中得到的是ER和PR阳性细胞率,是一具体的数值,因而应属于定量资料。如果仅从资料的表面现象(有“率”)进行判断,而不考虑每一个数值的实际含义,没有从资料的本质上进行判断,很容易判断错误。
本资料的受试对象为病例标本,测量指标为“阳性细胞百分率”,因而应为定量资料,其涉及一个实验因素,即样品类别,有5个水平,即毛细血管瘤、混合型血管瘤、海绵状血管瘤、淋巴管瘤和正常皮肤。对于百分率的定量指标,一般根据经验,宜做平方根反正弦变换,使资料检验满足正态性和方差齐性的前提条件后,按单因素五水平设计资料进行方差分析,如变量变换后仍不满足前提条件,则用非参数检验。
例3有人对103例冠心病患者(G=1)和100例正常对照者(G=2)进行了多项指标的观测,资料见表2。若以X5~X11为定量的结果变量,分别以“组别、性别、年龄、高血压史、吸烟史、基因型”为影响因素,有人说此表中的资料类型为定性资料,也有人认为是定量资料。请问:此表中的统计资料究竟是什么资料[1]。
对差错的辨析与释疑将此表中的资料说成是定性资料或定量资料都不对,因为此表中有很多列,各列资料的性质不尽相同。若笼统地说,此表中的资料为混合型统计资料;具体地说,应根据各列变量、取值及其专业含义,区别对待。
第1列“编号”不属于统计资料,仅起一个标识作用,若一定要问该变量的性质是什么,可叫它为“多值有序变量”。
第2列“组别(区分正常人和冠心病病人)”、第3列“性别”、第5列“是否有高血压史”和第6列“是否抽烟”都是定性资料,其变量性质应叫做“二值名义变量”。
第7列~第13列都是“血脂指标”,它们都是定量资料,具体应叫做计量资料。
第14列和第15列分别是两种“基因型”(通常有3种表现:-/-、-/+、+/+),它们都是定性资料,其变量性质应叫做“三值名义变量”。
第16列是“服药情况”,其变量性质应叫做“多值名义变量”。
4小结
本文从正反两个方面介绍了什么是统计资料、统计资料的分类以及统计资料识别中常犯的错误。按现代划分方法来命名统计资料,有利于抓住问题的实质。科研设计的质量好坏和实施过程中的质量控制水平
1.1实验的偏倚和控制
偏倚是在研究中从设计到实验实施和结果分析的各环节存在一些人为的、有系统倾向的非随机误差,它不是由于抽样造成的,而是某种偏性使得实验结果偏离它的真值。从所选择的生物医学问题到研究方案的制订与实施、实验的完成过程、实验的分析与解释,乃至实验结果的发表,均可能存在各式各样的偏倚[2]。这种偏倚常常表现为系统误差。偏倚的大小取决于研究的方法和具体的实验条件。常见的偏倚主要有选择性偏倚、观察性偏倚和混杂性偏倚。必须认识实验过程的偏倚,从实验设计起直到整个研究过程结束均要加以控制。正确的实验设计可控制选择性的偏倚,事前人为控制和采取相应的措施可避免和减少观察性的偏倚。对于混杂性偏倚,可将重要的混杂因素在设计阶段进行分层随机设计,使混杂因素在组间分布均衡;在统计分析阶段将混杂因素作为分层因素或采用有协变量分析方法,以消除混杂因素的影响。只有有效地控制或消除偏倚,方可减少结果的假阳性或假阴性。
1.2减少偶然性的潜在影响
偶然性因素的作用可以减少,但不能完全排除。因为即使是在精心实施的研究中,接受同样处理的动物,其反应也不可能完全一样。适当的统计分析可使实验人员评估出现假阳性的概率,即根本不存在处理效应的情况下观察到差异的概率。这种概率越小,实验者发现真实效应的可能性就越大。为了更有把握地检测出真实效应,有必要减少偶然性的作用,并通过实验设计确保能在“噪声”之上识别真正的“信号”。
1.3实验设计的要素
要消除生物医学实验中潜在的偏倚,减少偶然性,就应对实验对象、处理因素和实验效应这三个实验设计要素,按照对照、重复、随机化和均衡四项原则进行周到的设计与控制[3]。1.3.1实验对象实验中处理因素所作用的对象称为实验对象。不同性质的实验研究需要选取不同种类的实验对象,一个完整的实验设计中所需实验对象的总数称为样本含量。生物医学试验中考虑动物实验对象时应关注以下几个方面:①动物种属的选择:选择实验动物的种属与品系时,尤其需要注意其背景反应的水平。为了将反应“信号”水平最大化,常常意味着应避免选择那些背景反应水平极低的动物种属或品系,但如果采用过度反应的动物种属或品系也同样会出现问题。动物物种选择中的其他问题,无论是实际问题(寿命、体型、易得性、对动物学特征的了解情况)或是理论问题(生化、生理或解剖结构与人的相似性),都需要从专业的角度认真加以考虑和权衡。②动物的数量:虽然从统计设计角度考虑可得出某项实验所需的动物数(样本含量),但所得出的数值往往很大。因此,虽然样本含量估计是保证结论可靠性(精度和检验效能)的前提,但基于实验的可操作性及经济原则方面的考虑,应结合统计学的计算结果与以往的生物医学研究经验予以确定。③动物的体重与年龄:为确保实验对象的同质性,实验中所使用的动物体重与年龄应尽可能相近;动物体重的标准差不应超出平均值的10%;啮齿类等小动物年龄相差不应超出1周,大动物年龄相差不应超出1个月。④动物的分层:为了准确检测一种处理因素引起的差别,各处理组在可能影响实验结果的其他非处理因素方面应尽可能具有同质性。当存在动物亚系间的差别时,有两种方法可得到更为准确的结论。一是在结果分析阶段将亚系作为一个“分层变量”处理,包括对两个亚系的结果进行单独分析,然后将结果综合,得出处理效应的总结论;二是将亚系作为实验设计的“区组因素”,这种情况下可使对照组与处理组中每个亚系动物数量相等。除以上所讨论的“亚系”之外,其他的非处理因素,如性别、窝别、体重段等也可作为分层变量进行局部控制,并据此进行分层随机化分组。1.3.2处理因素设计实验研究时,要明确研究中的处理因素和影响实验效应的非处理因素。研究者希望通过对研究设计进行有计划的安排,从而能科学地考察其效应大小的因素称为处理因素或实验因素;研究者往往忽略对评价实验因素作用大小有一定干扰的重要的非处理因素或非实验因素(如动物的窝别、体重等);其他未加控制的许多因素的综合作用统称为实验误差。实验结果是处理因素和非处理因素共同作用而产生的实验效应,因此如何控制和排除非处理因素的干扰,正确显示处理的效应,是实验设计的基本任务。1.3.3实验效应实验效应是处理因素作用于受试对象的反应和结果,是反映实验因素作用强弱的标志,它通过观察指标(统计学常将指标称为变量)来体现。如果指标选择不当,未能准确反映处理因素的作用,获得的研究结果就缺乏科学性,因此选择好观察指标是关系整个研究成败的重要环节。指标的观察应避免带有偏性或偏倚,要结合专业知识,尽可能多地选用客观性强的指标,在仪器和试剂允许的条件下,应尽可能多选用特异性强、灵敏度高、准确可靠的客观指标。对一些半客观(如尿液pH试纸读数值)或主观指标(行为测量、病理观察),一定要事先规定读取数值的严格标准,只有这样才能准确地分析实验结果,从而提高实验结果的可信度。
1.4实验设计的原则
为了防止结果的偏倚,保证实验结果的准确性和最大化的表达,在进行生物医学实验设计时必须遵循统计学设计的对照、重复、随机化和均衡四个基本原则。生物医学实验中对照组的设置必须具备三个条件:①对等原则,即惟一差别原则,除处理因素外,对照组具备与实验组对等的非处理因素。在相互比较的各组间,除了给予的处理因素不同外,其他方面应与实验组具有一致性,如相同的实验单位来源(动物种属、体重等)和相同的实验条件、操作方式和喂养环境等。②同步原则,对照组与实验组设立之后,在整个研究进程中始终处于同一空间和同一时间。③专设原则,任何一个对照组都是为相应的实验组专门设立的。不得借用文献上的记载或以往结果或其他研究资料作为本研究之对照。
1.5生物医学中常用的实验设计类型
如果需要在同一实验中同时评价几种不同的效应,实验者应该安排能区别各自效应差别的实验设计方法。生物医学中常用的实验设计有以下几项。1.5.1完全随机设计完全随机设计是生物医学动物实验中最为常用的一种实验设计方法,它是一种单因素有k个水平(k≥2)组的实验设计。即实验设计可设置一个对照或多个剂量组的实验方案。本设计保证每个实验动物都有相同机会接受任何一种处理,而不受实验人员主观倾向的影响。本设计应用了重复和随机化两个原则,因此能使实验结果受非处理因素的影响基本一致,真实反映出实验的处理效应。1.5.2随机区组设计随机化完全区组设计,简称随机区组设计,又称配伍组设计,是配对设计的扩展,它将几个条件相同的受试者划分在同一个区组或配伍组,然后再按随机的原则,将同一配伍组的受试者随机分配到各实验组。该设计方法的优点是每个区组内的k个实验单位有较好的同质性,比完全随机设计更容易察觉处理间的差别。这种方法须特别注意的是要求区组内实验单位数与处理数相同,实验结果中若有缺失值,统计分析将损失部分信息。1.5.3拉丁方设计拉丁方设计从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成区组,是比随机区组设计多一个区组因素的设计。在拉丁方设计中,每一行或每一列都成为一个完全区组,而每一处理在每一行或每一列都只出现一次,也就是说,在拉丁方设计中,实验处理数=横行区组数=直列区组数=实验处理的重复数。1.5.4析因设计析因实验设计又称全因子实验设计,属于多因素、多水平单效应的设计。它不仅可以检验每一因素各水平之间的效应差异,而且可以检验各因素之间的交互作用。交互作用是指一个因素不同水平间的效应差受另一因素的影响,包括协同交互作用和拮抗交互作用。析因实验主要用于分析交互作用,当因素及水平数过多时,所需的实验对象数、处理组数和实验次数大幅度增加,故一般采用较简单的析因实验。含有较多因素和水平的实验一般采用正交实验设计[5]。
2生物医学动物实验的描述统计学
2.1生物医学实验资料的类型
生物医学实验对实验对象(动物)进行干预后测定的观测指标通常有以下类型:①连续性数据:测定结果表现为有数字大小和单位的数据,统计上称定量资料,如生理、生化指标,体重值,器官重量等。②分类数据:测定结果表现为按某属性划分的定性类别,统计上称为定性资料,具体又可以分为二值资料、多值名义资料和多值有序资料。如某反应为出现或不出现,死亡或未死亡,有畸形或无畸形;病理损害的严重程度(无、轻度、中度、重度)等。
2.2统计描述指标
描述性统计学(或归纳统计学)是对样本观察/测量数据频率分布的定量研究,描述性统计的目的在于:①对测量值或观察值进行归纳浓缩,用统计量、统计图或统计表的形式表现;②估计总体分布的参数。2.2.1资料的整理与探索对于某一测量指标,一般应从文献资料中了解其分布类型。如果没有判断概率分布的理论基础,应重复以大样本测定,绘制样本的频数分布图(理论上样本量要大于100),并经统计学检验拟合其分布。2.2.2数据的描述统计量①连续性数据的频数分布:通过对样本资料编制频数分布表或做茎叶图,以确定资料分布的类型、频数分布的集中趋势和离散趋势、估计总体参数,也便于发现离群值。②中心位置的描述统计量:描述数据分布的集中趋势,常用指标为算术均数、中位数、众数、几何均数等。③离散程度的描述统计量:描述数据分布的离散趋势,常用指标为标准差和方差、极差和四分位数间距、变异系数和离散系数等。④统计学图表:统计图包括连续性数据分布的直方图、茎叶图,表示数据中心位置和离散程度的点杆图(做图时表示均数和标准差)和盒须图(做图时表示中位数、极差、四分位数间距),描述构成比数据资料的百分条图、饼图,描述经时变化趋势的线图,以及预测和检验分布类型的概率-概率图(P-P图)等[6]。统计表具有简单、明了、易于理解、便于比较的优点。编制统计表时原则上应当重点突出、层次分明、避免层次过多或结构混乱。一般的统计表应为三线表,表中只有横线,无竖线和斜线。统计表的标目应层次清楚,不宜过于复杂。
3生物医学动物实验的假设检验
生物医学动物实验中最常见的情况是给予不同受试物后进行组间比较,通过统计学中的假设检验,说明受试物的作用。假设检验时应注意以下问题。
3.1检验方法的选用依据
3.1.1资料的类型和变量的数目不同类型的资料(定量、定性)的组间比较应采用不同的统计检验方法。单变量、多变量的统计检验方法也各不相同。3.1.2实验设计类型应该根据实验设计的具体类型选择对应的统计检验方法,以便得到处理组效应的真实结论。3.1.3检验方法的前提条件选用假设检验方法前,应了解所分析的数据资料是否满足相应检验方法的前提条件,如t检验和方差分析等参数检验方法要求数据满足正态性和方差齐性,χ2检验要求样本含量大于40且理论频数大于5。
3.2正态性检验及拟合优度检验
统计学假设检验须判定样本的频数分布是否符合某一理论分布,如符合要求就可按此理论分布来进行统计学处理。对正态分布可采用正态性检验,其他分布可用拟合优度检验。通常可通过查阅文献,了解实验参数符合何种理论分布。
3.3方差齐性检验
连续性数据未达到参数法统计分析前提的第二种原因即为方差不齐。一般而言,数值愈大,其固有的变异性也愈大。例如,若某组动物的平均反应值为100,其数值范围可能为80~120;而另一组动物的平均反应值为300,其数值范围可能会扩大至240~360。解决方差不齐的措施是进行数据转换。若数据的标准差与平均值成正比,在统计分析前宜将数据转换为对数值之后再进行分析,据此,不仅数据的变异度与平均值大小无关,同时还可确保其更符合正态分布。若数据变异度增加幅度与平均值的关系不太明显,采用平方根转换则更易使数据的变异度与平均值大小无关。某些数据经对数或平方根转换后可能仍存在方差不齐,此时宜采用非参数检验。
3.4单侧检验与双侧检验
检验假设选择单侧检验或双侧检验,应事先根据专业知识做出选择。一般而言,若研究目的仅须了解是否存在组间差异、实验者无法预测组间变化的方向以及实验者希望获得正负两方面的结果时,应采用双侧检验。若事先可预测组间差异的变化方向,实验者仅对某一方面的重要性感兴趣,实验者仅希望了解与对照组差异或正或负一个方向,则应采用单侧检验。此外,剂量设计预试验中应采用双侧检验,正式试验在了解相关信息后可采用单侧检验。
3.5多重比较及多重性问题
生物医学实验经常在处理组和对照组之间做多个变量的比较。即使不存在真正的实验效应,也有可能纯粹由于偶然性而有一个或多个变量在5%检验水平出现显著性差别。除了上述均数多重比较导致Ⅰ类错误概率增加的多重性问题之外,其他的多重性问题还包括多次的中期分析、关注多个结局、亚组间的多重比较。处理多重性问题的原则包括:①预先计划进行多重比较;②限制比较的次数;③多重比较时采用更严格的界值标准;④多重比较具有生物学方面的依据。
3.6观察值或实验对象的独立性
许多统计检验方法要求比较的观察值或实验对象相互独立,如二项分布的率检验、t检验和方差分析等。但是,有的生物医学实验中观察单位并不独立。例如,生殖和发育研究中就存在窝效应:由于遗传因素、宫内的发育环境和药物的代谢环境相似,与异窝胎仔相比,同窝胎仔之间对毒性效应的反应概率趋于系统,即同窝内数据为聚集性数据,这就是一种常见的非独立数据。在统计学分析时,忽略数据的窝内相关性具有潜在的风险;因同窝母鼠所产k个胎仔的观察值存在共性,其所提供的信息不及k个独立的来自不同母鼠所产胎仔所提供的信息;窝内相关性愈大,其信息量愈少。聚集性数据的均数标准误小于独立的数据,因此,若基于观察值独立的统计分析方法,就会增加犯Ⅰ类错误的概率,即假阳性的风险增加,降低实验的有效性。
3.7历史对照数据的应用
某些情况下,尤其是在发生率较低的情况下,单项研究可能提示处理可影响肿瘤发生率,但无法得出明确的结论。可能想到的分析办法之一是将处理组的数据与来自其他研究的对照组动物相比较。虽然历史对照数据具有重要意义,但值得强调的是,众多原因可导致不同研究之间的变异度大于研究之内的变异度。动物来源、饲料及饲养条件,研究期限,研究中的动物死亡率、读片的病理学家等均可能影响最终的肿瘤发生率。故此,忽视这些差异,将处理组的肿瘤发生率与合并的对照组发生率相比较,可能得出严重错误的结果,并进而明显夸大统计显著性水平。Tarone[4]曾对历史对照组的比率数据分析进行过综述。