发布时间:2023-09-18 16:30:43
导语:想要提升您的写作水平,创作出令人难忘的文章?我们精心为您整理的13篇统计学经典理论范例,将为您的写作提供有力的支持和灵感!
贝叶斯方法是由英国学者Bayes在其发表的论文《论有关的机遇问题的求解》中提出来的,并且在和经典学派的争论中发展起来。经典统计在发展成熟的同时也逐渐暴露出了一些问题,而不少学者对两统计学派的比较研究中发现,相比于经典统计方法,贝叶斯统计方法在直观性、易于理解等很多方面更具有优势。
一、 基本理论的差异
1.概率的解释不同
一直以来,经典统计学派对贝叶斯统计的主要批评在于贝叶斯统计在概率理解上的“主观性”。经典统计学认为概率必须是“客观的”,这可以用大量重复试验之后的频率去解释,而不能主观臆断。贝叶斯统计是完全同意概率公理化,但认为概率也可以用经验确定,一些事件的概率在大量重复试验中去获得是不现实的,而我们可以根据对此事件的了解和积累的经验做出此事件发生可能性的判断。
2.统计推断利用的信息不同
贝叶斯统计与经典统计在统计推断最主要的不同在于贝叶斯统计运用先验信息。经典统计学的统计推断是基于总体信息和样本信息。总体信息即总体分布或总体所属分布族中包含的信息,包括总体认识、参数范围、变量的方式和特征等;样本信息是从总体中抽取的样本中所包含的信息,这是最“新鲜”的信息。而贝叶斯统计方法在此基础上还利用了先验信息,先验信息主要来源于经验和历史资料。
3.样本和总体参数的利用与认识不同
经典统计中把样本看作来自具有一定概率分布的总体,而总体中的参数是普通的未知变量;相反,贝叶斯统计把任何一个未知的参数都看作是随机变量,都有不确定性,用一个概率分布去描述这个未知的参数,在统计推断中只利用已经出现的数据,即样本信息,这就是贝叶斯统计中的“条件观点”,即只靠考已经出现的数据(样本观测值),而认为未出现的数据与推断无关。基于在样本利用方式上的差异,使得贝叶斯统计不承认经典统计中的“无偏性”这一评判标准。
三、点估计与区间估计
1.贝叶斯定理与似然函数
贝叶斯定理是贝叶斯统计学的理论基础,贝叶斯公式的密度函数表示形式为:
θ为模型的参数向量,x表示为数据向量,即样本观察值,其中,函数 p(x |θ )集中了总体信息和样本信息,被称为似然函数,它是未知参数θ 的函数。
在似然函数上,经典学派和贝叶斯学派的观点是一样的。我们强调似然函数是θ 的函数,而样本x 在似然函数中是一组观察值,所有与试验有关的θ的信息都被包含在似然函数之中,使似然函数值达到最大的θ 值有比其他θ 值更大的说服力,此θ 值即为经典统计中的最大似然估计;而我们可以证明,在贝叶斯统计中,当在“无信息 ”的条件下, θ 的最大后验估计就是经典统计中的最大似然估计。
在上述情况下,我们可以认为,经典统计中的最大似然估计是贝叶斯统计中的最大后验估计的特例。而在贝叶斯统计中,我们可以看出,在有合理的先验信息时,贝叶斯统计可以利用更多的信息,以达到更好的估计效果。
2.置信区间
在置信区间的解释和处理上,贝叶斯统计具有含意清晰,处理方便的特点,而经典统计则经常被统计工作者所误用而受到批评。例如,一家电生产企业为估计其产品的平均寿命的可信区间。贝叶斯统计中的可信区间由后验分布求得,参数被认为是随机变量,因此我们可以说,平均寿命θ 落入最终区间的概率是90%。而在经典统计中,参数θ 是一个常量,而求出的置信区间要么包含平均寿命 θ ,要么θ 在此区间之外,很多人在实际应用经典统计的过程中,误把置信区间理解为平均寿命θ 落入某个区间的概率是90%,而事实上,我们只能说重复做100 次此实验,大约有90 次求出的置信区间能使之包括真实的产品寿命θ ,而这对于只做一两次实验的人来说是毫无意义的。
相反,贝叶斯统计的方法清晰明了,而且在置信区间的寻求和计算上也简单得多。在条件方法下,对给定的样本x和可信水平1-α通过后验分布可求的具体的可信区间,计算方便。而在经典统计中寻求置信区间有时是困难的,要构造一个枢轴量(含有被估参数的随机变量),使它的分布不含有未知数。这是一项技术很强的工作,比求可信区间复杂的多。
四、假设检验
1.基本检验思想的比较
经典统计学中,因参数被认为是常数,因而不存在H0和H1的概率大小,其判定标准是若H0 为真时,小概率事件发生,则拒绝原假设H0。即判定的是P(X|H0 为真),X 是样本向量。
而在贝叶斯统计中,可以直接求得在样本X 给定的条件下,参数的后验概率,因而得出H0 和H1 和后验概率,即判定的是P(H0 为真|X)和P(H0 为假|X)。这是两种检验方法间的根本区别。
2.先验选择与显著性水平的“主观性”
经典统计学派攻击贝叶斯学派很重要的一点就是贝叶斯统计中先验分布选择的主观性。在贝叶斯统计的检验中,先验信息的分布和参数的变化可以引起拒
一、引言
经典统计学派和贝叶斯统计学派是在统计学的历史上逐渐发展起来的两大主要学派。贝叶斯方法是由英国学者Bayes在其论文中首先提出来的,并在和经典学派的争论中逐渐发展起来,目前被越来越多的统计工作者所研究和广泛应用。经典统计在发展成熟的同时也逐渐暴露出了一些问题,而不少学者对两个统计学派的比较研究中发现,二者在其基本思想以及统计推断时不尽相同,与此同时,二者也都有自己的优点与缺点。正确理解这些不同,对于我们今后正确地运用统计方法分析实际问题起着举足轻重的作用。因此,本文对这两种统计方法的基本思想作了对比,分析了各自的优势及缺点,并说明了他们在用于统计推断时表现的差别,有助于我们进一步理解这两种基本的统计分析方法。
二、基本思想的对比
1.区别一
经典统计学认为概率必须符合科学的要求,是“客观的”,这可以用大量重复试验之后的频率去解释,而不能主观臆断。而贝叶斯统计认为一些事件的概率在大量重复试验中去获得是不现实的,而我们可以根据对此事件的了解和积累的经验做出此事件发生可能性的判断。
2.区别二
经典学派很注重利用已经出现的样本观察值,没观察到的样本不予考虑。贝叶斯学派很注重先验信息的收集、挖掘和加工,使他们数量化成先验分布,参加到统计推断中,以此提高统计推断的质量。
3.区别三
经典统计中把样本看作来自具有一定概率分布的总体,而总体中的参数是普通的未知变量;相反,贝叶斯统计把任何一个未知的参数都看作是随机变量,都有不确定性,用一个概率分布去描述这个未知的参数,在统计推断中只利用已经出现的数据,即样本信息,这就是贝叶斯统计中的“条件观点”。
4.区别四
经典统计学派判断方法是让检验统计量与临界值进行比较。贝叶斯的判断方法是在获得后验分布之后,可分别计算原假设H0和备择假设H1的后验概率。
5.总结
贝叶斯统计学派与经典统计学派在很多问题上都有分歧但是它们最根本的分歧是:第一,是否利用先验信息。由于产品的设计、生产都有一定的继承性,这样就存在许多相关产品的信息以及先验信息可以利用,贝叶斯统计学派认为利用这些先验信息不仅可以减少样本容量,而且在很多情况还可以提高统计精度;而经典统计学派忽略了这些信息。第二,是否将参数e看成随机变量。贝叶斯统计学派的最基本的观点是任一未知量e都可以看成随机变量,可以用一个概率分布去描述,这个分布就是先验分布。因为任一未知量都具有不确定性,而在表述不确定性时,概率与概率分布是最好的语言;相反,经典统计学派却把未知量e就简单看成一个未知参数,来对它进行统计推断。
三、两种统计方法的优缺点
1.贝叶斯统计的优点与缺点
贝叶斯统计以从经验中学习为目标,将历史信息与样本似然函数结合在一起,使之形成一套比经典统计更加灵活,更加直观,更加易于理解的统计方法,在计量模型中正在受到越来越广泛的应用。特别是在小样本的情况下,点估计和区间估计可以有比经典统计更加精确的结果;其次,在用贝叶斯后验分布进行推断后,可以将第一类、第二类错误所造成的损失考虑在内,因而比经典统计更加实用;另外,在处理多余参数的问题上,贝叶斯统计可以直接在后验密度中将多余的参数积分掉,这又比经典统计方法方便得多。
贝叶斯统计在很多方面比经典统计有明显的优势,然而,仍然有许多本身存在的问题和缺陷制约和阻碍着它的发展。例如,先验分布的确定是近几十年来研究的主要问题;其次,我们一般只知道后验分布的核,计算后验密度函数的推导与计算具有非常大的难度,也没有可以广泛应用各种模型的软件和程序。
2.经典统计的优点及缺点
经典统计学作为统计学的根基,有着它自身所无法比拟的优点。首先,它用于推断过程的数据是样本数据,排除经常很难量化的先验知识。其次,它对于方法的评估有一系列的准则。只要可能,就能找到最优方法。
但与此同时,它的缺点也比较显著:首先,在小样本的情况下,点估计和区间估计没有贝叶斯的结果精确;其次,它不能将第一类、第二类错误所造成的损失考虑在内;最后,在处理多余参数的问题上,没有贝叶斯统计方法方便。
3.总结
贝叶斯统计学派与经典统计学派虽然有很大区别,但是它们各有优缺点,各有其适用的范围,我们要具体问题具体分析,以获得一种更适合解决实际问题的方法。而且,在很多情况下,二者得出的结论在形式上是相同的。
四、两种统计方法在统计推断时的差别
1.在点估计与区间估计方面的区别
贝叶斯定理是贝叶斯统计学的理论基础,函数p(x|θ)集中了总体信息和样本信息,被称为似然函数,它是未知参数θ的函数。在经典统计中同样承认似然函数,在这一点的理解上,经典学派和贝叶斯学派的观点是一样的。我们强调似然函数是θ的函数,而样本x在似然函数中是一组观察值,使似然函数值达到最大的θ值有比其他θ值更大的说服力,此θ值即为经典统计中的最大似然估计而我们可以证明,在贝叶斯统计中,当在“无信息”的条件下,θ的最大后验估计就是经典统计中的最大似然估计。在上述情况下,我们可以认为,经典统计中的最大似然估计是贝叶斯统计中的最大后验估计的特例。而在贝叶斯统计中,我们可以看出,在有合理的先验信息时,贝叶斯统计可以利用更多的信息,以达到更好的估计效果。
在置信区间的解释和处理上,贝叶斯统计具有含意清晰,处理方便的特点,而经典统计则经常被统计工作者所误用而受到批评。
2.在假设检验方面的区别
经典统计学中,因参数被认为是常数,因而不存在H0和H1的概率大小,其判定标准是若H0为真时,小概率事件发生,则拒绝原假设H0。即判定的是P(x|H0为真),x是样本向量。而在贝叶斯统计中,可以直接求得在样本X给定的条件下,参数的后验概率,因而得出H0和H1和后验概率,即判定的是P(H0为真| x)和P(H0为假|x)。这是两种检验方法间的根本区别。
在贝叶斯统计的检验中,先验信息的分布和参数的变化可以引起拒绝域的变化,而贝叶斯统计在后验均值估计中的最基本特征是伸缩性。
贝叶斯统计在检验问题中的一个优势在于多重检验问题,这是经典统计所办不到的。例如:在一次企业对两种生产方法的比较检验中,我们将假设设为:H0:θ=0;H1:θ0,H0表示两种方法无显著差别,H1表示方法一优于方法二,H2表示方法二优于方法一。贝叶斯统计在后验概率中计算H1和H2的概率,而经典统计方法则很难去处理此类
问题。
五、实例分析
下面我们通过一个例子对两种思想进行一些比较。例:以随机变量θ代表某人群中个体的智商真值,θ i为第i个个体的智商真值,随机变量Xi代表第i个个体的智商测验得分,若该人群的期望智商为υ,则第i个个体在一次智商测验中的得分可以表示为:Xij=υ+ei+eij其中ei为第i个个体的自然变异,eij为第i个个体第j次测量的测量误差。根据以往积累的资料,已知在某年龄的儿童的智商真值θ~N(100,225),个体智商测验得分x~N(θ*,100)。现在一名该年龄的儿童智商测验得分为115,问:(1)该儿童智商真值是否高于同龄儿童的平均水平?(2)若取θ*在(a,b)为正常,问该儿童智商是否属于正常?
1.用经典统计方法解答
对第一问,建立检验问题:H0:θ*100,按照经典统计学方法,若取。α=0.05,则拒绝域为{x:x>=116.45}尚不能认为该儿童智商高于平均水平。
对第二问,经典方法需要进行两次分别针对a、b的单侧检验。过程与第一问相似,这里不再叙述。
2.用贝叶斯方法解答
在贝叶斯学派中,当θ i未知时,将其看作随机变量,与0具有相同的分布,这是贝叶斯学派与经典学派的一个重大区别。根据贝叶斯理论,θ的先验分布是N(100,225),测验结果x*~N(0,100),儿童智商的后验分布为正态分布N(110.38,69.23)。
对第一问,同样设H0:0‘100,查正态分布表可以得到P(H0lX=115)=0,106,P(H1lx=115)=0,894,根据风险最小原则拒绝H0,接受H1。
对第二问,设H0:a
由此可以看出:按贝叶斯的观点,多重假设检验的情形并不比两个假设的检验更困难,因为它只需要多算几个后验概率即可;它同时利用了样本和
【Abstract】 Objective To discuss differences between classical and Bayesian testing thoughts.Methods First these two thoughts are summarized’and then they are compared through an example.Results It is pointed out that these two thoughts are united on Bayes’s Theorem’that they are equal on given occasions’and that Bayesian testing approaches have more advantages than classical approaches in using prior information’indicating the hazard of testing’considering the loss’and dealing with the problem of multi-hypotheses.Conclusion Great attention should be paid to Bayesian theory.
【Key words】 hypothesis test Classical school Bayesian school
假设检验问题是统计学的传统问题,对于该问题,经典统计学派与贝叶斯学派有不同的处理思想。目前,经典统计方法占据着统计学的主导地位,但是,贝叶斯方法正在国外迅速发展并得到日益广泛的应用,我们有必要给以足够的重视。本文结合一个例子,对两大学派的假设检验思想进行初步比较,以揭示两种思想的区别与联系,并着重探讨贝叶斯方法的优势。
两种假设检验思想
一、经典统计学派的假设检验思想
经典统计学派运用反证的思想进行推断,即:在认定一次实验中小概率事件不会出现的前提下,若观察到的事件是H0为真时不合理的小概率事件,则拒绝H0。
上述思想可以用如下决策函数表示:
其中x代表样本信息。Φ(x)取值为0时即为通常的“拒绝H0”。
二、贝叶斯学派的假设检验思想
贝叶斯学派直接讨论H0和H1的后验概率,依据后验概率的大小进行推断。
其基本的解决方案是:在先验分布π下,有决策函数
Φ(x)取值为0时即“拒绝H0”。很明显,它选择了后验概率较大的假设。
三、两种思想的联系与分歧
在经典统计学中,参数被看作未知常数,不存在参数空间,因而不存在H0和H1的概率,给出的是P(x|H0真),其中x代表样本信息。在贝叶斯方法中,参数被看成随机变量,在参数空间内直接讨论样本x下H0和H1的后验概率,给出的是P(H0真|x)和P(H0不真|x)。
事实上,两个学派的方法在一定程度上统一于贝叶斯公式。
由贝叶斯公式容易得到:
因此,当P(H0)=P(H1),即H0与H1居于平等地位时,经典学派与贝叶斯学派的结果是一致的。
然而,H0与H1地位往往不一致,H0常居于将被否定的位置,因而上述一致性并不总能成立。贝叶斯学派对此进行了深入的探讨,他们的结果很有意义。
对于正态分布前提下的单侧检验:X~N(θ,1),H0:θ≤0 H1:θ>0,经典方法得到的P值与贝叶斯方法在无信息先验分布下的后验概率相等,此结论可以推广到正态分布前提下其他类似的单侧检验。
对于形如H0:θ=0,H1:θ>0,(或H1:θ<0)的单侧检验,情况则不同,与下述的双侧检验有类似结果。
对于形如H0∶θ=0, H1:θ≠0的双侧检验,经典方法得到的P值与贝叶斯方法的后验概率大不相同。在Berger和Sellke 1987年对正态分布前提下二者的比较研究中,当经典方法得到的P在0.01~0.1之间时,贝叶斯方法得到H0为真的后验概率大于P,因而此时拒绝H0所承担的实际风险大于P,而这个区间对于经典方法下结论是非常重要的。Hwang和Pematle 1994年提出,对这类双侧检验,类似结果始终存在,因而P值应该由其他判断标准来替代。但他们还没有找到这种标准。
两种思想的应用
下面我们通过一个例子对两种假设检验思想进行一些比较。
例:以随机变量θ代表某人群中个体的智商真值,θi为第i个个体的智商真值,随机变量Xi代表第i个个体的智商测验得分,若该人群的期望智商为μ,则第i个个体在一次智商测验中的得分可以表示为:xij=θi+eij=μ+ei+eij,其中ei为第i个个体的自然变异,eij为第i个个体第j次测量的测量误差。根据以往积累的资料,已知在某年龄儿童的智商真值θ~N(μ’τ2),其中μ=100’τ=15,个体智商测验得分Xi~N(θi’σ2),其中σ=10。现在一名该年龄儿童智商测验得分为115,问:(1)该儿童智商真值是否高于同龄儿童的平均水平(即θi>100)?(2)若取θi在(a’b)为正常,问该儿童智商是否属于正常? 转贴于
一、用经典统计方法解答
对第一问,设H0:θi≤100 H1:θi>100,按照经典统计学方法,若H0成立,则有:
因此,α水平下的拒绝域为{x:x>100+σ・u1-α}
已知σi=10,若取α=0.05,有u0.95=1.645,100+10×1.645=116.45。
现有x=115,因此,在0.05水平尚不能认为该儿童智商高于平均水平。
对第二问,经典方法需要进行两次分别针对a、b的单侧检验。过程与第一问相似,这里不再叙述。
二、用贝叶斯方法解答
在贝叶斯学派中,当θi未知时,将其看作随机变量,与θ具有相同的分布,这是贝叶斯学派与经典学派的一个重大区别。
根据贝叶斯理论,若X~N(θ,σ2),其中σ2已知,θ未知,但已知θ的先验分布是N(μ,τ2),其中μ和τ2均已知,则给定x后θ的后验分布为N(μ(x)’ρ-1,)其中(证明参见文献[1])。
由此得到,本例中该儿童智商θi的后验分布为N(110.38,69.23)。
对第一问,同样设H0:θi≤100 H1:θi>100,查正态分布表可以得到:
P(H0:θi≤100|x=115)=0.106,
P(H1:θi>100|x=115)=0.894
根据风险最小原则拒绝H0,接受H1。
对第二问,设H0:a<θi<b H1:θi<a或θi>b,查正态分布表可以分别得到P{H0:a<θi<b|x=115}和P{H1:θi<a或θi>b|x=115},类似第一问,依据风险最小原则作出推断。
讨 论
由上述分析和例子,我们可以看出,用贝叶斯方法处理假设检验问题至少在下述几方面具有明显优势。
一、先验信息利用的充分性和风险的直观性
从前述问题的处理,我们清楚地看到,经典方法只使用了Xi的已有信息(贝叶斯学派称之为先验信息),而贝叶斯方法则同时利用了Xi和θ的先验信息。因而在第二问的解决上,贝叶斯方法较经典方法少进行一次假设检验。
在贝叶斯方法中,由于导出了样本x下的后验分布,可以对风险给出正面的回答,因而较经典方法下的间接判断更直观。
二、可以将后续问题纳入考虑范围
如果推断错误在后续问题的解决过程中会造成一定损失,贝叶斯方法在进行推断时可将这一损失考虑在内。如:
在假设H0∶θ∈Θ0,H1∶θ∈Θ1(Θ0、Θ1是参数空间内两个互补子集)下,有:
Φ等于0,1分别代表拒绝、接受H0,a0、a1分别代表了第一、第二类错误造成的损失,这时,贝叶斯方法给出如下决策函数:
由于可以将假设检验结果带来的损失纳入检验考虑的范畴之内,因而对问题的回答更接近实用。
三、多重假设的处理不存在困难
对多重假设,如将前例第二问改为:若θi∈(a’b)为智力正常,θi<a为智力低下,θi≥b为智力超常,问该儿童智力属何种类型?
1研究背景
统计是一个以问题解决为导向,系统收集数据,并基于数据回答问题的过程。由于实际问题的复杂性,造成反映实际问题的数据在问题表示的充分性、代表性和分布的单一性方面与传统的统计应用要求不匹配,于是催生了对数据分布假定宽松的非参数统计的发展。基于大量数据探索数据分布特点的数据分析方法成为非参数统计的主要内容。经典的非参数统计是数理统计的一个分支,因此,教学内容多是基本概念引入、原理的证明、例题解析等。传统的非参数统计在教学过程中最突出的问题是理论证明太多,枯燥且难懂,部分学生对该门课程的学习积极性与主动性比较低,但是非参数统计课程又是统计专业的必修专业课程,对广义类型的数据进行分析是统计专业学生必备的能力,因此,非参数统计从教学的深度与广度来讲都不能降低标准。非参数统计的教学改革也是适应统计专业“厚基础、宽口径、重应用、强能力”培养目标的需要。由美国哈佛商学院(HarvardBusinessSchool)所倡导的案例教学法,由于其独特的教学方式,既利于培养和发展学生主动参与课堂讨论的能力,又能激发学生的学习兴趣,在教育界实施之后,颇具绩效。在《二十一世纪的教师》(ANationPrepared:Teachersforthe2lstCentury)的报告书中将案例教学法作为一种相当有效的教学模式,并特别推荐案例教学法应在教学过程中加以使用。本论文探索如何紧扣非参数统计教学内容和统计能力培养实施教学过程,重点在于结合教授内容设计教学案例。案例设计遵循“重应用、强能力”的原则,分析问题源于热点或经典社会、经济问题,分析方法紧扣相关的非参数方法,同时涉猎到其它专业知识或其它统计分析。所以,教学案例与课程的学习过程一致,但是最终要求的能力却要高于课本分析的要求,引导学生从实际问题解决入手,理清分析数据的背景,分析可能需要解决的问题,寻求可能的研究方法,分析方法的实现及报告的撰写,实现从理论到实际问题解决的一般性的统计过程,培养学生问题导向的统计思维能力。
2教学内容的认识
2.1课程的重要性
非参数统计是数理统计学科中的一个分支。基于大量数据探索数据分布特点的数据分析方法成为非参数统计的主要内容。随着数据科学的兴起,现代非参数统计方法在复杂甚至是大数据分析中起着举足轻重的作用。因此,掌握非参数统计基本思想,并应用非参数方法解决实际问题是统计专业学生具备的一项技能。《非参数统计》是面向统计专业的学生开设的专业课程,是学习非参数统计和了解统计前沿的基本课程。本科的教材有很多,但主要包括基本的经典的非参数方法,即单一样本位置的检验,两个独立样本位置、尺度的比较检验,多个独立样本位置的检验,单变量分布的密度估计,非参数回归等内容。通过本课程的学习既能对加深对经典数理统计的理解,又能拓展统计的视野。
2.2专业培养目标
经济统计专业遵循“实基础、重应用、强技能”的人才培养目标,旨在培养服务地方经济和社会发展的应用型高级专门人才。系统掌握统计学、经济学和计算机理论与应用等方面的知识,能熟练运用统计软件处理分析复杂数据;具有发现问题、分析问题的能力,运用所学的统计方法解决实际的经济社会问题;具有从事统计调查、社会调查、市场预测和经济现象分析的社会实践能力。因此培养方案要求构建以就业为导向,以专业知识与实践能力培养为核心的模块化课程体系,改革教学方法和考核方式,将学生专业学习能力、社会实践能力和创新创业能力作为评价人才培养质量的主要指标。因此各专业课的教学必须紧紧围绕培养目标开展,必须对传统教学模式进行改革。
2.3课程的特点
根据统计专业培养培养目标和要求,结合我院学科发展的需要,将非参数统计课程作为经济统计专业的专业必修课。该课程是学生专业素养培养的一个重要环节,是数理统计、多元统计、应用回归分析课程的后续课程,在专业建设和课程体系中占据重要的地位和作用。非参数统计属于数理统计分支,知识框架与经典数理统计类似,主要研究内容就是参数估计与假设检验及变量间关系模型构建,如果仅用传统的教学模式,学生仅限于理论的部分掌握,教学效果不会太好。
2.4教学方法的改进
结合统计专业目标培养要求和学生的现状,探索理论性课程的教学模式是统计专业教学模式创新的必由之路,既要培养学生统计思维的能力,又要培养学生实际的统计技能。学生能力的培养在于他的学习过程中,就一门课而言,在授课期间,学生的课前准备、课堂讨论和课后实践都应该有效的监督中,做到课前收集将要介绍的理论方法应用的背景知识,包括文献、数据等,课堂中能结合课前预习积极参与讨论,课后能灵活运用到实际问题中,并能撰写相应的分析报告。因此,在教学过程中,必须合理监督学生,做好每一环节工作。教师首先合理设计教学案例,将统计方法的学习,实际问题能力解决,报告撰写思路融入教学过程,培养学生统计分析技能。
3教学设计及教学过程
非参数统计主要采用分组式,并融入案例教学的混合模式。第一次上课有两项任务安排:一是按照自愿组合和学生成绩将学生每组4-5人分组,安排每组的负责人;二是介绍本课程授课的模式,课前资料收集与预习的要求,课堂分组讨论的要求,课后实践作业的完成与汇报。
3.1案例设计
本部分以单一样本位置的检验为例,介绍非参数案例设计的思路与流程。本案例将紧贴非参数单一样本检验原理及应用进行设计,同时关注培养学生解决实际问题的统计思维。主要从数据背景介绍,数据变量的描述统计分析,研究问题及方法原理的阐述,数据的实证过程及软件实现,报告撰写要求等方面进行设计。
3.2教学过程
非参数统计的教学内容是以一系列经典非参数统计方法的理论与应用传授为主线的,每一种统计方法都传递着一定的统计思想,有着一定的应用背景和应用前提。教学过程的效果取决于课前准备、课堂教学和课后实践各环节的衔接。只有将教学环节有机结合起来,培养学生良好的专业学习习惯,从而有效提升教与学的质量,以下是非参数统计课程教学过程如下:第一,按照学生分组安排每一章节课前准备收集的资料。第二,课堂讲授该方法的统计原理及软件实现。第三,分组讨论学生收集的资料。第四,介绍案例的数据背景、拟解决的问题、拟采用的统计方法、各方法的比较、分析结论。第五,讨论安排各组将要解决的问题。第六,安排时间由其中一个小组汇报自己的分析报告。
4结语
在课程学习中,充分发挥学生的主动性,培养学生面向实际问题,搜集数据,并进行统计综合分析的能力,不仅使学生获得新的统计分析技能,而且能激发学生的学习兴趣,切实达到“厚基础、宽口径、重应用、强能力”的培养目标。通过非参数统计课程创新型教学改革的实施,不仅有利于非参数统计教学效果的改善,也有利于自身课程资源建设,为统计专业创新性教学过程积累经验。使原本抽象、枯燥难懂的理论课程变得实际而有用。课堂教学效果得以实质性的提高,有效地激发了学生的求知欲望,提高了教育教学质量。
参考文献
[1]王星,褚挺进.非参数统计[M].北京:中国人民大学出版社,2012.
[2]田爱国,田地.传统教学与案例教学比较研究———基于《统计学》教学的思考[J].金融教育研究,2013,26(1):73-77.
[3]白日荣,苏永明.非统计专业统计学教学的改革与创新[J].统计教育,2007,(12):25-26.
doi:10.14033/ki.cfmr.2016.32.066 文献标识码 B 文章编号 1674-6805(2016)32-0118-02
A Comparative Study of the Treatment of Alginate Wound Accessories and Carbohydrate Wound Accessories in Wound Infection after Appendectomy/MU Teng.//Chinese and Foreign Medical Research,2016,14(32):118-119
【Abstract】 Objective:To compare the efficacy of Alginate Wound Accessories and Carbohydrate Wound Accessories in the treatment of wound infection after appendectomy.Method:The study was conducted in 158 patients with incision infection who were from our hospital from 2011 to 2015.The patients were randomly divided into two groups.One group using Alginate Wound Accessories,the other one using Carbohydrate Wound Accessories.Then compared the average healing time of the two groups.Result:The average healing time for the group of Alginate Wound Accessories was (22.3±1.5)d,the average healing time for the group of Carbohydrate Wound Accessories (19.2±1.1)d,there was significant difference in two groups(P
【Key words】 Wound infection; Alginate Wound Accessories; Carbohydrate Wound Accessories
First-author’s address:North Hospital of Beijing Fengtai Hospital,Beijing 100071,China
急性@尾炎是外科常见腹腔感染性疾病,其主要的治疗方案为手术切除。但由于其为腹腔内感染性疾病,切口以Ⅱ、Ⅲ类切口为主,其术后最常见并发症为切口感染。目前大多数研究主要是针对阑尾切除术后伤口感染的相关因素。随着伤口敷料的不断发展,目前应用于伤口感染的敷料层出不穷。本文针对藻酸盐敷料及糖类敷料在阑尾切除术后伤口感染的疗效进行对比分析。
1 资料与方法
1.1 一般资料
选取2011-2015年行经典的阑尾切除术,即经右下腹麦氏切口行阑尾切除术后3~5 d发生伤口感染的患者158例,男80例,女78例。随机分为藻酸盐敷料组和糖类敷料组,各79例。藻酸盐敷料组男40例,女39例,年龄5~70岁,平均(45.2±3.1)岁。糖类敷料组男40例,女39例。年龄5~70岁,平均(16.3±2.9)岁,两组患者性别、年龄比较差异无统计学意义(P>0.05),有可比性。
1.2 方法
藻酸盐敷料组采用藻酸盐敷料,具体方法为:采用经典换药方法,伤口开放处应用藻酸盐敷料填塞。糖类敷料组采用糖类敷料,具体方法为:同样采用经典换药方法,但伤口开放处应用糖类敷料填塞。
1.3 统计学处理
所得数据应用SPSS 13.0处理,计量资料以(x±s)表示,采用t检验,计数资料以率(%)表示,采用字2检验,P
2 结果
糖类敷料组的平均愈合时间为(22.3±1.5)d,藻酸盐敷料组为(19.2±1.1)d,两组平均愈合时间比较差异有统计学意义(P
3 讨论
Winter博士早在1962年已明确了湿润伤口愈合理论[1],现今在湿性伤口愈合理论的指引下,伤口敷料有了突飞猛进的发展。
患者伤口出现红肿渗出后,予以拆除缝线开放伤口,换药方法均应用传统消毒方法并结合湿润伤口愈合理论。首先应用碘酊以伤口为中心,半径5 cm范围进行消毒后,应用酒精脱碘。换药者均为研究者本人,遂排除了不同换药者差异对研究结果的干扰。按照分组不同,对研究对象开放伤口处理方法分别为:应用藻酸盐敷料及糖类敷料进行填塞,外敷料均采用医用纱布。藻酸盐敷料为常用的湿性敷料之一,兼顾高吸收性、止血功能、帮助伤口愈合等优点[2]。已被广泛应用于临床。藻酸盐辅料与伤口渗液结合,形成水合物(性状接近凝胶状),可以结合自身重量20倍的水分[3],其在结合水分的同事体积明显增大,相当于在创面上覆盖了一层柔软、富含水分、胶体样物质,可起到隔离伤口的作用,加快新生微血管增生速度,同时保持创面水分含量,增加表皮细胞的再生能力、加快表皮细胞增值、加快创面愈合[4]。另外,其与渗液结合的同事可释放钙离子,其具有一定止血功能[5]。糖类敷料具有较强的抗菌作用,其机制为:高渗作用:在吸收伤口渗液的同事致使细菌缺水而自溶[6];酸性作用:可使伤口环境保持在弱酸酸性[7];过氧化作用:葡萄糖氧化酶,可放出过氧化氢[8]。高渗透作用可以诱导淋巴细胞、吞噬细胞。使其积聚于伤口处,其起到抗炎作用[6]。糖与水结合后产生粘性,粘可连脱落组织,但对正常组织毫无损伤。糖可于伤口内生成糖蛋白及蛋白聚糖等物质,能够加快细胞增殖、分化,从而促进组织愈合。高渗性,使小血管扩张,促进局部组织吸收营养[8]。本次研究所应用的糖类敷料均为,经50%葡萄糖溶液浸泡过的纱布。
通^对两组患者分别应用藻酸盐及糖类敷料对伤口分别进行换药治疗。应用藻酸盐的患者伤口平均愈合时间,大于应用糖类敷料的患者。这说明糖类敷料对于阑尾术后感染伤口的治疗效果,要优于藻酸盐。这可能源于糖类敷料在满足湿性愈合理论的同时,兼顾有抗菌、抗炎、清理坏死组织、加快组织愈合等作用。而藻酸盐敷料仅有吸收渗出、隔绝伤口、止血作用。本次研究所采用的糖类敷料成本,远远低于藻酸盐敷料,所以糖类敷料既兼顾疗效,同时又降低了医疗成本的优势。
参考文献
[1] Winter G D.Formation of the scab and the rate of epithelization of superficial wounds in the skin of the young domestic pig[J].Nature,1962,193(20):293-294.
[2]李建全,陶荣,王欢,等.海藻酸医用敷料的制备与开发[J].非织造 布,2013,21(6):92-94.
[3]林晓华,黄宗海,俞金龙.海藻酸纤维的研究发展及生物医学应用[J].中国组织工程研究,2013,17(12):2218-2224.
[4] Lee K Y,Mooneya D J.Alginate:Propertiesandbiomedicalapplications[J].Prog Polym Sci,2012,37(1):106-126.
[5]王清华,钟文菲,何盟.藻酸盐敷料的临床应用:与传统材料特征 的比较[J].中国组织工程研究与临床康复,2010,14(3):533-536.
[6] Mphande A N G,Killow C,Phalira S,et al.Effect of honey and sugar dressing on wound healing[J].J Wound Care,2007,16(7):317-319.
一、引言
最早提出大数据时代到来的机构是全球知名的麦肯锡咨询公司,该公司在一份研究报告中指出:“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来”。
大数据是随着互联网技术的广泛应用带来的数据量和数据类型激增而衍生出来的一种现象,但大数据一词不仅指规模大、种类多的数据集,还包括对这种数据集进行采集、处理与分析以提取有价值信息和直接创造价值的技术构架和技术过程。大数据的第一个特征是数据量巨大。截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。第二个特征是数据类型繁多、异构性突出,包括网络日志、音频、视频、图片、地理位置信息等等。第三个特征是数据价值密度较低,数据中存在大量重复性和无价值性信息或噪声。如何通过强大的计算技术和统计分析等方法迅速完成数据的价值提纯,是大数据时代亟待解决的难题。第四个特征是处理速度快、时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。
目前,不同的学科领域对大数据概念有着不尽相同的解释,但各种解释中大致可以从两个方面去理解。首先,大数据概念体现在数据量的巨大、种类的众多及产生速度的飞快,同时产生的数据集极有可能包含着各种半结构化和非结构化数据;其次,大数据概念还体现在对数据进行处理的手段和流程方面,由于数据量的庞大和类型复杂,利用常规的统计软件已经无法对当今的数据进行及时有效的存储、分析及处理。因此,所谓的大数据并不是单纯指数据流量的巨大,还指其结构的复杂和种类的多样,在数据处理和分析上需要采用高端计算平台或高级统计软件,以及海量数据中存在着可挖掘的潜在的大量价值信息与知识。
近年来,随着高速计算机的应用、信息技术的快速发展,特别是云计算技术的发展,使大数据的存储和分析技术得到迅速发展,目前的核心技术有MapReduce、GFS、BigTable、Hadoop,以及数据可视化等。在数据搜集上,可方便地通过在线互联网数据库获取二手数据或一手实时数据。在数据分析上,传统统计学方法采取的是基于统计模型的样本数据分析,而大数据分析技术则是通过高端计算平台,对大数据中的信息进行挖掘。
统计学作为对数据进行处理和分析的科学,必然受到大数据的影响。在大数据时代,统计学教育必须与时俱进,跟上时展步伐。近年来,有不少文献讨论了大数据环境下我国统计学教育的改革问题(例如[1]-[5]),本文在分析大数据时代特征的前提下,进一步讨论我国统计学教育的现状与挑战、统计学教育改革的内容、方法、借鉴和适应时代要求的变革问题。
二、统计学教育的现状与挑战
2013年,教育部对我国统计学专业设置进行一次新的调整,将原来的既可授予理学学位,也可授予经济学学位的统计学专业划分为统计学、应用统计学和经济统计学三个本科专业[6]。根据教育部高等学校统计类专业教学指导委员会2013年11月公布的数据,当时全国有194所高校开设了统计学专业,156所高校开设了应用统计学专业,164所高校开设了经济统计学专业[6]。目前,全国开设这三个统计学专业的高校个数和在校学生人数与2013年相比都有不少的增加。
面对大数据时代,我们目前的统计学教育无论在培养目标和教学内容上,还是在教育方式和人才培养模式上,都存在着亟待解决的挑战性问题。例如,在专业培养目标和人才培养过程中,我们比较重视课程层面上的评价,比较轻视专业层面上的整体评价,缺乏对学生综合能力的反馈机制。
关于教学内容,目前三个统计学专业在统计理论和应用统计两个方面有不同的侧重。统计理论主要包括:抽样理论、实验设计、估汁理论、假设险验、决策理论、贝叶斯统计、半参数和非参数统计、序贯分析、多元统计分析、时间序列分析、小样本理论和大样本理论等。在数据分析中,现今的统计方法基本以结构化数据为主要处理对象,而对非结构化和半结构化数据的分析和工具涉及较少。因此,现今统计学课程及内容已不能满足从事非结构型和半结构型的大数据研究和商业应用对人才培养的需要,必须进行必要的改革。
对于教育方式,鉴于大数据时代要求,统计分析人员需要具备较高的数学和现代统计学基础,具有较高的软件操作能力,掌握一定的大数据收集、整理、分析、处理和挖掘数据的技能。日本学者城田真琴认为:“数据科学家要有计算机科学专业背景,数学、统计方面的素养和使用数据挖掘软件的技能,善于利用数据可视化的手法展现晦涩难懂的信息,而且具备相应的专业知识、眼界和视野,具有适应社会发展和创造价值的能力”。现今的统计学教育方式还不能很好适应大数据时代数据科学人才培养需要,必须进行必要及时的调整和变革。
对人才培养模式,大数据时代不仅要求培养具有数据处理和分析所需的基本素质与技能,更重视培养从海量数据中发现和挖掘价值信息、把握市场机遇、创造利润的潜在能力。面对大数据时代的诸多挑战,现代统计技术、数据挖掘方法、计算机信息技术、软件工具和理念的日新月异,培养统计人才的教育模式也需要相应变化,统计学教育只有与时俱进,主动做出全面的调整和变革才能适应新时代知识进步和激烈人才市场竞争的需要,积极迎接大数据时代的挑战。
大数据时代对统计学教师有更高的要求,统计学教师需要与时俱进,跟上时代步伐。随着互联网、物联网、云计算等信息技术的发展,对数据的分析和处理的技术也随之要求更高,统计学教师固有的知识体系已不能满足培养现代统计人才的需要,必须进一步深化和更新原有的统计学理论知识,而且还需要学习掌握计算机技术、互联网、数据库和信息科学等有关知识和技术,同时还要熟悉处理非结构型和半结构型数据的知识和技能,以适应现代统计学教育对教师的知识结构和基本素质的要求。
大数据时代对统计专业的学生也提出了更高的要求,他们不仅需要掌握现代统计理论、统计方法和专业统计软件,还要学会如何分析、处理来自互联网或各种实际问题中的海量数据,如何利用统计软件和互联网技术进行数据操作,如何借助软件技术和统计准则判断数据质量,如何进行模型选择和评价模型方法的有效性,如何准确清晰地呈现统计分析结果和结论,等等。
2014年11月,美国统计学会了统计学本科专业指导性教学纲要 [7],该教学纲要对统计学专业提出四个方面的要求:(1)具有扎实的数学和统计学基础、强大的统计计算和编程能力,熟练使用统计软件和数据库;(2)分析来自现实问题的真实数据,真实数据是统计专业教育的重要组成部分;(3)掌握多样化的统计模型方法;(4)具有通过语言、图表和动画等方式解释数据分析结果的能力。美国是统计学教育和人才培养最先进的国家之一,该指导性教学纲要代表着美国统计学专业培养人才的基本要求和发展方向,对我国统计教育的改革具有重要的参考价值。以该指导性教学纲要为参考依据,对照我国目前的统计学本科专业教育,无论是在培养目标和课程设置方面,还是在教学内容和教学方法方面,都存在着亟待解决的挑战性问题。
三、统计学教育的改革
大数据时代的统计学教育不仅是各种统计方法、数据挖掘方法和信息技术手段的延续或发展,更主要的是这些方法的集成应用和在实际数据分析中的真实体验。过去,企业数据库价格昂贵,在统计学教育的教学案例或实验课教学中,很少采用真实和海量的数据库资源,基本都是采用过时或虚拟的数据。今天,像百度大数据引擎这样的数据库的逐步对外开放,将有助于开展“线上大数据统计实验”教学。为了适应大数据时代要求,有必要利用网络资源以及各种数据处理软件,搭建线上大数据分析实验教学平台,全面开展大数据统计实验教学的改革。实际上,借助大数据分析平台,本科阶段的统计学教育就可以融人联机分析和数据的可视化教学。其次,要时刻关注大数据分析理论的进展,及时将新理论新方法融入课堂教学内容。
需要指出的是,在大数据时代,经典统计理论和方法并没有过时,但需要进行改进和进一步发展。这是因为,网上采集的巨型数据集往往存在大量的重复性和无价值数据信息,使得大数据价值密度降低。在对这些数据进行分析处理之前往往需要通过去噪、分层、截断、聚类等方法的预处理,将其变成便于进行分析处理的小数据,继而借助于经典统计方法进行分析和处理。因而在大数据时代仍然需要采用传统统计学的小样本理论和方法。所以,即便是在大数据时代,经典统计方法仍然是进行统计分析的基石,其核心地位不可动摇。所以,在大数据时代仍然要强化统计学的基本理论和方法,尤其是在长期发展和实践应用中经过验证的、成熟有效的经典和现代统计方法,在大数据时代仍然没有过时,但需要结合大数据分析的需要对经典统计方法进行必要的发展和改进。
大数据科学需要统计学与数学、计算机等学科的结合。亚马逊大数据科学家John Rauser 认为:“数据科学家是统计学家和计算机工程师的结合体”。为了满足大数据时代的要求,统计学专业的课程设置需要进行必要的调整。应根据新时代人才培养的要求,增设与大数据前沿领域发展相关的课程,如计算机网络和大数据相关的软件应用,同时要加大实验课和社会实践课的比重,引导学生理解和掌握大数据概念、理论、技术和方法,培养其运用大数据的相关分析工具解决实际问题的能力。对于理论课程,除基本统计理论外,还应开设一些较为现代和深入的课程,如现代贝叶斯方法、神经网络、数据挖掘、应用随机过程论等。另外,还应开设与大数据分析相关的关联规则、决策树、机器学习、支持向量机等课程。
为了培养与时代适应的统计学人才,统计学专业教师应不断更新自身的知识结构和价值观念,改变认识数据、收集数据和分析数据的思维,主动学习和补充互联网、现代数据分析技术、数据库和数据挖掘技术,使自己的知识体系不断更新和提升,跟上时展的步伐。
在大数据时代,要注意培养学生适应社会的能力。统计专业人才培养模式应以提高本专业学生数据分析方面的能力,开阔他们的视野,培养其适应社会的能力。应积极引导学生进入实训场所动手操作和锻炼,尝试以企事业单位的财政、金融、保险、统计、咨询和信息公司等部门为主构建专业性教育实践基地。鼓励学生到大数据相关的机构部门、产业园区和企业中去调查研究和实践。此外,统计专业应积极同其他专业进行合作,联合培养适应新时代要求的数据分析人才。鉴于大数据对数据分析人员在计算机技术、行业认知、业务知识、数据分析工具和方法的要求提高,统计学科应主动与计算机、经济学、管理学等相关学科合作,培养学生的计算机能力、专业素质和业务修养。
“它山之石可以攻玉”,关于统计学专业的课程设置,可以参考和借鉴美国统计学会公布的统计学本科专业指导性教学纲要。根据该教学纲要,统计专业的课程设置应该涵盖五个模块[7]:(1)统计方法与统计理论。建立统计模型并对模型的输出结果进行评价,熟悉统计推断,能够从数据分析中得出恰当的结论。(2)数据操作和统计计算。熟练使用一款专业统计软件进行探索性数据分析,发现和清洗数据中的错误记录,具有编程能力和算法思维,可以进行各种数据操作,还应掌握统计计算技术,能够进行模拟研究。(3)数学基础。熟练掌握微积分、线性代数、矩阵论、概率论和数理统计的基础知识。(4)实践训练和表达能力。具有良好的表达和交流能力,善于通过图示和动画等听众易于理解的方式展示分析结论,并且具有团队合作精神和项目领导能力。(5)特定领域的知识。掌握特定应用领域的知识,并用统计学特有的思维方法来分析和解决特定领域的实际问题。
大数据时代是以数据为中心的时代,统计学专业的教育改革必须适应这个时代的要求。统计数据分析中软件应用能力至关重要。在众多统计软件中推荐使用R和SAS软件,因为R是免费开源软件,其统计建模、统计计算和可视化功能强大,更新迅速,是最新统计方法的主要平台,非常有利于培养学生的编程能力和知识更新能力,而SAS软件被很多公司用于数据管理和数据分析,在实际应用领域具有长期而深远的影响,是数据分析不可或缺的专业统计软件。当然,教学中也可以尝试使用其他专业统计软件,例如经济统计专业学生也可使用SPSS软件,但最好会使用SAS或R软件。在加强软件使用和编程能力的基础上,应加强学生统计计算和统计模拟能力的培养。在大数据时代,强调统计计算的重要性是大势所趋。统计模拟技术是伴随着高速计算机和信息技术的快速发展而广泛应用的现代技术,可用来解决传统学科领域中无法解决的问题。例如,在计算技术飞速发展的今天,贝叶斯统计方法过去曾经面临的计算瓶颈正在逐渐消失,基于马尔科夫链蒙特卡洛(MCMC)技术的统计模拟方法在数据分析中的强大威力正在日益显现[8]。
参考文献:
[1] 刘春杰,大数据时代对当代统计学教育的挑战,统计与决策,2015年,第8期。
[2] 孟生旺,袁卫,大数据时代的统计教育,统计研究,2015年,第32卷4期。
[3] 葛虹,韩伟,大数据时代统计教育变革的SWOT分析与发展策略,统计与决策,2015年,第4期。
[4] 张海波,黄世祥,统计学专业学生大数据分析能力的培养方式选择,统计与决策,2014年,第24期。
[5] 李卫东,大数据对统计学科发展的影响,统计与决策,2014年,第13.期。
G642
统计学相关课程的课堂教学模式,一直是教师探讨的重点,以提高教学效率为主采取一系列新的教学方式。激发学生主观学习思维,面对统计学中各个知识点能够通过借助统计软件平台,有效促进自我学习能力,达到教学的真正目的。
一、《统计预测与决策》课程设置及教学问题
决策是经济研究及管理中的关键要素,而预测又是决策的一大前提。《统计预测与决策》这门课程对于研究经济及管理至关重要,做为统计学专业的必修课程,重视学生的综合性培养。使得学生在面对社会经济问题时,能够快速建立统计思维模式,具有实践意义。
而如今教学面临诸多困难,很多学生在接受《统计预测与决策》课程知识时,感到学习吃力。导致这一因素的原因有很多,首先有些学生没有足够的相关知识基础,当课程要求理论和实践结合时,会有些力不从心。另外,《统计预测与决策》安排的课时较少,使得学生不能保证足够时间的深入学习。最后就学生本身而言,其对于相关课程缺乏学习的兴趣,影响教学质量。
就《统计预测与决策》这门学科来看,其知识内容涵盖的很广,不仅包括数学、统计学还有经济学,不容易被学生理解。复杂多向的学科,需要重视基础理论的坚实教学,另外为培养综合性素质人才,兼顾统计学专业学生在面对经济管理问题时,合理运用统计预测与决策方法进行问题的解决。全面培养学生问题的处理能力,在教学改革中一直具有一定的研究意义。
二、探索教学改革新模式
对于统计预测与决策教学改革,深入分析相关模式的应用,在教学中探索课程教育的最大价值。面对教学改革带来的挑战,实施科学有利的教学方法,是提高统计学教学质量的前提。
1.经典案例教学法
为了提高学生的学习兴趣,在教学中使用之前发生过的生活中一些经典的案例,可以利用时下最热的事点引入课堂知识教育,提高经济或管理领域学生主动学习的心态。学生通过案例进行自我分析,发现其中的问题并参与到问题的解决中,可以提高学生的自信心。结合统计学专业知识培养学生的个性化发展,提高《统计预测与决策》课程的实践性。
2.实验教学辅助法
理论是实验教学的前提,而实践教学会更有效地提高学生的学习能力。为了加深学生对《统计预测与决策》课程理论知识的彻底掌握,根据课改要求在课程教学中,为学生提供更多的上机机会,在实验课上学生一人一机,通过自己收集或教师给定的经济数据,进行自作分析统计相关计量结果。结合统计软件的应用,熟练掌握课堂知识并进行训练。提高学生思维能力,在实验中发现易错的环节,并及时改正。问题的发生是学习的开始,加深薄弱环节的处理,教师辅助完成任务,巩固学生理论知识的运用,加深理论印象的同时激发学生主动学习的热情。
3.任务驱动法
让学生参与到课程的学习中是提高教学效率的重点,教师通过指定一些学习任务对学生产生“驱动”作用。通过一些客观存在的经济问题,引发学生自我思考的能力,激发学生运用其自身思维方式寻找答案,在实践中发挥理论价值。从实际出发,学生对问题展开分工、整理、方案实施等过程,经过对实际问题的自我处理,主动的参与到课程的教学过程中。在整个过程中形成自我处理问题的能力,相关知识理论的掌握也水到渠成。
三、借助统计软件实训平台实施教学改革
1.件实训目的
为了更进一步促进学生对统计学数据的处理能力,考虑通过统计软件实训平台,提高学生对《统计预测与决策》课程知识的加强巩固。通过统计软件实训培养学生发现问题、解决问题的基本能力,提高最理论知识的加深认识,建立自我解决问题的思维方式,为学生面对实际问题时可以快速进行分析处理,在经济或管理中得到更大价值的应用。
2.统计软件实训的现状
统计软件数据文件的建立与编辑,经济系统的多元线性回归分析,经济系统的聚类分析,统计质量控制图。以上是统计软件实训的四个主要内容安排,配合课程需要将理论与实训紧密结合,是当下统计学教育的专业建设需求。
3.统计软件实训平台教学时间安排
根据《统计预测与决策》课程的具体安排,进行统计软件实训。教师需要详细记录课时信息及进度,按照具体教学模块安排软件实训,使得学生紧密结合理论的同时借助统计软件实训平台,有效强化预测与决策的综合能力。统计软件实训平台会根据学生不同学习程度,有效推动学生的学习主动性。
4.统计软件实训成绩考核
应该将统计软件实训的考核成绩设置入整体课程考核中,重视软件实训在课程中的应用。将课时实训与理论紧密结合,“趁热打铁”可以巩固《统计预测与决策》课程知识点,有利于提高学生更全面、扎实的学习功底。激发学生对统计学的概念性理解,面对生活中的问题可以快速进行处理。
四、统计软件实训平台在教学中的改进
1.实训平台形式选择
教师应该考虑根据学生们在实训中的一些意见或实训报告,在实训中使用更容易符合学生需求的实训形式。其中验证性形式和综合实训形式,是课堂实训重点采用的实训形式。操作性较强、独立性较强的内容一般适合验证性试验。在系统上更具优势的综合性实训形式,与前者相得益彰,教师根据课时结合实训形式,有效提高教学质量。在实训中通过统计软件实训平台,了解学生对知识掌握的程度,适时调整实训形式保证统计软件的高效进行。
2.实训时间的安排
由于《统计预测与决策》课程具有复杂性和实践性这些特点,对于软件实训的时间安排,应该考虑适当增加。学生在足够的时间里可以继续探索相关领域的扩展性知识,提高学生具体分析能力,培养综合素质的提升。通过统计软件实训平台的进一步延伸,学生快速适应实训环境,体现课程教学改革发展的正确方向。
五、结束语
将统计软件实训做为改革任务,实现统计学下课程教育的有效性,丰富了学生的认识和思想范围。充分改革教学模式,激发学生对《统计预测与决策》课程学习的兴趣感,主动参与到课程问题探索,发挥课程学习的最大价值。经过调查发现,通过统计软件实训平台介入教学,优化了教学模式,帮助学生在实际中培养逻辑思维、统计分析、解决问题等综合能力。
参考文献:
[1]王桂梅.浅谈计算机实训室建设和管理[J].软件.2014(03).
中图分类号:R2-03 文献标识码:A 文章编号:1673-7717(2007)07-1449-02
何谓“个案”?个案即是前辈医学家终其毕生临床诊治经验,认为非常有保存价值的诊治案例,流传给下一代医家的经典治验。它的内涵是:第一,它源于临床,具有完整的真实性;第二,亲身体验,全身心投入的治疗案例;第三,具有经典的临床指导意义,对后人有启示性示范;第四,具有个性化治疗,理法方药通盘设计的套路:第五,凡经典“个案”均包涵有类、证、病、机、治、法、方、药的整体辨证思维内涵,对后辈有振耳发聩般的指南作用,如一代巨匠叶天士医案即是。
纵观有文字记载近两千年医学史料,上自司马迁中记载的“个案”,中到明代江的《名医类案》,清代魏之砺的《续名医类案》,叶天士的《临证指南医案》。近到现代的余瀛鳌《现代名中医类案选》,再看今日中国中医药出版社发行的《中医临床家颜德馨临床精华》。都是以“个案”的记载形式作为历史病案流传范式的。如果把“个案”否定了,剔除到“科学”之外,那就从千百年宏观医学史上否定了中医的科学价值体系。认为中医“个案”不科学的另一种理由是“个案”不能重复,仅仅是个人的偶然性的治疗经验,与此相比建立在医学统计学基础上的多中心、大样本、随机、对照、双盲的临床试验设计研究结果有很强的可信性和应用价值。初一听,这是不可质疑的科学比较,中医注重“个案”示范,西医强调“群案”统计分析;“个案”不可重复,“群案”可以重复,似乎无理可驳。
但是让我们仔细分析,全盘审视联想,纵观中医千百年“个案”记载史,这其中定有它的秘诀,潜藏着一种隐态的、让人一时难以识透的公理性定律。
中医千百年来一贯注重“个案”,是建立在整体审证求因、辨证基础上的。“个案”表面上看是针对个别患者治疗经验记录,其实,这初看是“个别性”的治疗案例中潜藏着非个别性,具有“类、证、病、机、治、法、方、药”整体示范启示作用的一般普适性指导原理。“智者求同,愚者察异”,中医高层医学哲理是“智者求同”,求同必然要寻找具有普适性原理的治疗规律,这一求同规律的发现必然是在临床第一线上的亲历验证。“个案”中寓藏着求“同”的普适性指导性示范机理,这才是中医流传千年不衰的真理。“个案”是“大病案群流”的科学内涵。清代杭州医家魏之发明了一贯煎方剂。魏氏发明一贯煎并非运用群案统计学,而是建立在无数个“个案”的亲身验证上,在积累了长期的临床治疗经验的某一时刻,内心突然涌现出“肝体阴而用阳”。历代治疗肝病虽然有肝病传脾,当先实脾的机理,但大多是注重在健脾、理气、疏泄,升左用阳的思路上,忽略了肝“体阴”这一本质属性机理。只有悟出了顾护肝“体阴”这一病理,才是辨治慢性肝病的关键,从而组建了一贯煎六味药对的经典方剂。同样李东垣在发明了补中益气汤之前也是在临床第一线上反复地碰到一个个中气不足脾气下陷,清阳不升,纳谷不馨,便溏烦热的无数个“个案”,运用补中益气汤所组建的药对,治愈了无数个“个案”病例。在某年某月某一天,某一时刻,突然内心涌“悟”出了,凡是证属中央者“土”,脾气下陷的患者均可运用补中益气法得以调治中焦气虚证的杰出科学理念。
《金匮要略》的小半夏汤治支饮呕吐仅用两味药,从单体生半夏到炮制半夏,再与生姜配伍成最简单的复方。它的形成是建立在无数古代医家针对无数呕家,口渴反不欲饮“个案”的亲临躬行,在临床反复试错纠偏过程中,审证求因得以完善的“个案”。有人研究,仅从小半夏汤剂到二陈汤的演化过程,就经历了1千年左右,不要说古人亲口尝试生半夏,不知献出多少条生命才得以形成。从单味生半夏到制半夏,小半夏汤经历了多少年?再从二陈汤到温胆汤,十味温胆汤,蒲辅周加减温胆汤经历了多少“个案”岁月?同样,北宋的钱乙在承传《金匮》肾气丸基础上创立了六味地黄丸,也是他在无数年临床“个案”辨治中,历经无数试错、纠偏法“个案”验证上得以完善的。
中图分类号:G642.4 文献标志码:A 文章编号:1674-9324(2014)19-0077-02
一、计量经济学背景介绍
1.计量经济学的产生与发展。计量经济学(Econometrics)一词最早由挪威经济学家、第一届诺贝尔经济学奖获得者弗里希(R.Frisch)于1926年在《论纯经济问题》一文中,按照“生物计量学”(Biometrics)一词的结构仿造出来的。计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科,是由经济学、统计学和数学三者结合而成的交叉学科。1930年12月弗里希和丁伯根(J.Tinbergen)等经济学家发起在美国克里富兰成立国际计量经济学会,该学会的成立标志着计量经济学作为经济学的一门独立学科被正式确立。美国诺贝尔经济学奖获得者萨谬尔森(P.Samuelson)认为:“第二次世界大战后的经济学是计量经济学的时代。”20世纪70年代以来,随着计算机的广泛应用和非经典计量经济学的理论有了新突破,使得计量经济学的理论和应用又进入一个新的阶段。
2.计量经济学在国内的发展。中国高等学校开设计量经济学课程已有20多年的历史,起初只是在部分学校的少数专业开设,1998年经教育部全国经济学教学指导委员会讨论决定,把计量经济学纳入了高等学校经济学门类各专业8门共同核心课程之一。全国各高校不仅在经济学类各专业已普遍开设了计量经济学,而且一些管理类专业也十分重视这门课程的学习。与此同时,计量经济学的学习不再仅限于理论层面,计量经济分析在经济领域中得到一定运用,仅从经济学类期刊文章看,学者在探索经济问题的过程中,更希望通过对经济问题的定量分析来提升文章实用价值,它也成为文章含金量的一个重要尺标。据统计,在1984―2007年《经济研究》刊物上发表的近3300余篇论文中,以计量模型作为主要分析方法的论文占到了53%[1]。
二、计量经济学的学科特点
从学科综合性看,计量经济学是一门综合性边缘学科。计量经济学的一个显著特点是它自身并没有固定的经济理论,计量经济学中的各种计量方法和技术,大多来自数学和统计学,但建立的计量经济模型需有相关的经济理论作为支撑。因此,在运用计量经济学的过程中,我们需坚持以科学的经济理论为指导,紧密结合经济问题所处的环境,选择适当的计量方法才能使计量研究成果发挥它应有的作用。从方法论角度看,计量经济学是一门工具学科。作为方法论学科,计量经济学信奉“经验主义”,作为经济问题分析的工具,计量经济学需要通过对经济问题的数量关系,并从定量角度分析实际经济问题。因此,计量经济学通过自身的优势,将现实中的经济问题,通过计量经济方法并结合相应软件,将经济问题转化为可度量且具有实际经济意义的分析结果,并为后续政策的制定提供数据支撑。
三、计量经济学在财经院校的发展现状
财经院校在开设课程的过程中,更强调课程的实际应用而不是课程的理论推导,理论推导并不是其教学主要目的。虽然理论推导及证明不是其学生的强项,但学生具有较强的经济学基础。虽然计量经济学作为经济学门类各专业核心课程,且该课程在教学建设中越来越受到重视,但计量经济学在财经院校的课程开设中仍面临着许多挑战。首先,课程具有课时少、内容多、实践性强的特点。目前,财经院校为本科生开设的计量经济学课时较为有限,而计量经济学是由经济学、统计学和数学结合而成的交叉学科,以微积分、线性代数、概率论与数理统计、微观经济学、宏观经济学和经济统计学等为先修课程。因此,计量经济学所涉及的知识内容广泛,内容较多。其次,计量经济学现有教学特点致使学生课程压力进一步加大。计量经济学要求学生在学习计量经济学之前必须具有宏微观经济学、微积分、线性代数、概率论及数理统计等先行课程的良好基础。但对财经院校而言,选修计量经济学课程的本科生其数学基础参差不齐,加之开设的时间正好为学生专业课最多的时间段。另一方面,计量经济学的学习是一个循序渐进的过程,前部分知识掌握的熟悉程度将直接影响后面知识的学习效果。最后,教学方法仍以理论讲授为主,导致教学的“深入深出”。现行的计量经济学教材中充斥着各种数学公式,教师在教学过程中可能过分注重于数学理论推导,而忽视了财经院校学生知识结构背景,在课堂教学过程中缺乏对学生的引导与启发,使得学生对计量经济学的学习兴趣缩减。
四、实现计量经济学本科教学的“深入浅出”途径
如果在计量经济学教学过程中忽视定量分析,经济研究很难深入下去,对经济“政策效应的验证也是一句空话”,但如果不改变理论脱离实践的问题,我们将会看到从公式到公式的数字游戏[2],这将最终形成计量经济学教学的“深入深出”,教学效果难于达到最大化。从财经院校本科教学视角出发,实现计量经济学教学的“深入浅出”教学途径可以从以下几方面进行考虑:
1.选择经典计量经济学部分作为本科教学重点。在本科阶段,计量经济学的教学目标应定位于让学生掌握计量经济学最基本的理论与方法,让学生具有运用计量经济方法分析实际经济问题的初步能力[3]。其中,经典计量经济学应用最为普遍,也是学习更高层次计量经济学课程的重要基础,符合财经院校绝大多数本科教学的实际要求。因此,可以选择经典计量经济学部分作为本科教学重点,更多的非经典计量经济学的内容可以放入更高层次学生的教学或学生根据自己个人兴趣爱好拓展非经典计量经济学知识。
2.减少数学的理论推导,重视其分析思想及实际应用。计量经济学是一门经济学课程,并不是数学课。因此,教学的内容和教学过程不能过于数学化。尽可能地避免不必要的数学推导,使学生了解方法的基本思想即可。以学生扎实的经济知识基础为支撑,加强其计量经济学的实际应用。
3.加强实验教学及启发教学。教师在教学实践中需适当引入案例调动学生的学习兴趣,增加教师与学生之间的互动。根据理论教学的进度合理安排实验教学的时间,通过案例演示及实验操作以提高学生解决实际问题的能力。在案例讲解的过程中,选择经济热点主题,同时案例内容紧扣教学大纲,改变教材中实例一成不变的形象,保持案例的动态更新[4]。计量经济学的实验课程学习可以让学生更为直观掌握计量经济学的运用。在实验课案例讲解的过程中,各个步骤需要结合经济问题及计量经济软件讲解,增加讲解的直观性,培养学生综合运用知识的能力。
4.增加同行间的学术交流,把握学术前沿发展动态。计量经济学是一门交叉性学科,虽然这门学科在中国发展仅20多年,但其运用领域在不断扩大。仅从目前权威的经济学类相关文献统计数据可知,越来越多的文献在分析实际经济问题的过程中涉及计量经济学方法作为辅助。计量经济学在中国的发展仍不成熟,并且其学术前沿问题也在不断更新,仅凭专业教师单一力量还略显单薄,因此,专业教师需增加专业间的学术交流活动,探讨专业领域相关困惑。通过学术交流活动,专业教师可以更为深刻地理解计量经济学相关理论及学术前沿发展动态。教师在教学过程中可适当为学生讲解专业相关的学术前沿发展现状,增强学生自主学习能力。
参考文献:
[1]陈永伟.计量经济学课程教学的创新性探索与思考[J].科教新报(教育科研),2011,(4):12-13.
[2]陈岱孙.陈岱孙文集(下卷)[M].北京:北京大学出版社,1989.
[3]庄.关于《计量经济学》课程本科教学改革的研讨[J].统计与咨询,2010,(06):46-47.
[4]徐盈之.研究型大学高级计量经济学课程教学改革探讨[J].东南大学学报(哲学社会科学版),2009,11(12):228-231.
[5]高铁梅.计量经济学分析方法与建模[M].北京:清华大学出版社,2006.
Zellner的《An Introduction to Bayesian Analysis in Econometrics》一书的出版标志着贝叶斯计量经济学的真正诞生。该书较为全面地阐述了贝叶斯计量经济学的大多数专题,其中包括回归模型中的大多数问题、联立方程模型和时间序列模型等的贝叶斯计量方法。
此后,研究贝叶斯计量经济学的文献开始大量出现。当代许多杰出的计量经济学家如Geweke,Litterman ,Dempster, Sims, Maddala ,Chib等都应用贝叶斯计量经济学解决经济问题。Qin(1996)对贝叶斯计量经济学理论发展进行了回顾。Poirier(2006)对国外1970―2000年间几种重要的期刊在经济和计量经济学文章中使用的贝叶斯方法数量发展速度进行了回顾。国内研究贝叶斯理论的人员很多,但是研究贝叶斯计量经济学的文献并不是很多,只有朱慧明、韩玉启(2006)研究了贝叶斯计量经济学的几个重要专题,并深入地进行了讨论。虽然贝叶斯计量经济学作为一种科学的数据分析的方法早已经存在,但贝叶斯计量经济学分析应遵循的基本框架是什么?本文就此分八个部分进行阐述,并对其发展和应用前景进行展望。
一、贝叶斯学派与经典学派之间的差异及其分析的优点
统计学发展过程中产生了两个主要学派:经典学派与贝叶斯学派。经典学派又叫频率学派,其发展已有几百年的历史。而贝叶斯学派的发展历史不过0多年,在贝叶斯学者的努力下,打破了经典统计一统江山的局面,两个统计学派共同发展起来,而且不同的派别各自有大量的追随者(茆诗松,1999)。
贝叶斯学派与经典学派之间的差异是明显的。首先,两个学派的核心差别是对于概率的不同定义。经典学派认为概率可以用频率来进行解释,估计和假设检验可以通过重复抽样来加以实现。而贝叶斯学派认为概率是一种信念。结合这种信念加以假设检验(先验机会比),当数据出现以后就产生后验机会比。这种方法结合了先验和样本信息辅助假设检验。其次,两者使用的信息不同。经典学派使用了总体信息和样本信息,总体信息即总体分布或总体所属分布族的信息,样本信息即抽取样本(数据)提供给我们的信息。而贝叶斯学派除利用上述两种信息外,还利用了一种先验信息,即总体分布中未知参数的分布信息。两者在使用样本信息上也有差异,经典统计对某个参数的估计说是无偏的,其实是利用了所有可能的样本信息,贝叶斯学派只关心出现了的样本信息。而且贝叶斯学派将未知参数看作是一个随机变量,用分布来刻划,即抽样之前就有有关参数问题的一些信息,先验信息主要来自经验和历史资料。而经典统计把样本看成是来自具有一定概率分布的总体,所研究的对象是总体,而不局限于数据本身,将未知参数看作常量。
贝叶斯方法的优点很多。例如:与频率方法比较贝叶斯方法充分利用了样本信息和参数的先验信息,在进行参数估计时,通常贝叶斯估计量具有更小的方差或平方误差,能够得到更精确的预测结果;贝叶斯PD(最大后验)置信区间比不考虑参数先验信息的频率置信区间短;贝叶斯方法能对假设检验或估计问题所做出的判断结果进行量化评价,而不是频率统计理论中的接受、拒绝的简单判断;在基于无失效数据的分析工作,贝叶斯统计有着更大的优点(韩明,200)。
二、贝叶斯定理的表述
贝叶斯方法的一个关键元素是贝叶斯定理,通常又叫反概率原理。当先验分布和后验分布都是连续形式时:用θ表示我们关心的参数向量或矩阵,用y表示来自联合密度函数f(y∶θ)的样本观测值向量或矩阵,联合密度函数又可以写成f(y|θ),函数f(y|θ)在代数上等同于θ的似然函数,它包含了关于θ的所有样本信息,在贝叶斯理论中由于θ是随机变量,f(y|θ)是给定θ的条件下y的条件密度函数,而且有h(θ,y)=f(y|θ)π(θ)=π(θ|y)f(y)。其中h是θ和y的联合密度函数,π是θ的先验密度函数,它包含了关于θ的非样本信息,通常将上式重新排列得到结果π(θ|y)=f(y|θ)π(θ)f(y)。由于f(y)是与θ无关的一个常数,上式可写成:π(θ|y)∝f(θ|y)π(θ),其中∝表示“与……成比例”,若用文字表述就是:后验密度∝似然函数×先验密度。这就是贝叶斯定理的连续形式,它把先验信息、样本信息和总体信息融为一体。
贝叶斯后验均值估计的最基本特性是伸缩性(shrinkage)。当似然函数的精度h0较大时,后验均值主要受样本均值支配;相反,当先验精度h1较大时,后验均值主要受先验均值支配。这就是为什么贝叶斯估计通常取先验精度较低的原因(方差给得较大),也可以看出贝叶斯估计在调整先验精度下可以达到经典估计的效果,从某种意义上说经典估计是贝叶斯估计的特殊形式。通过两种精度的调整达到对后验均值的估计叫做伸缩性估计特性,所有贝叶斯估计的均值都具有伸缩性估计这个特性。
三、先验分布理论的研究
从上面已经看出,似然原理在贝叶斯学派和经典学派都有应用,而区别在于解释不同。除了似然原理外,贝叶斯定理得到后验分布的另外一个元素就是参数θ的先验分布。先验分布是后继贝叶斯推断的基础和出发点,是贝叶斯学派研究的重点问题之一,也是贝叶斯理论有争议最多的部分。先验分布大体可以分为扩散先验(diffuse prior)分布和共轭先验(conjugateprior)分布两大类。此处的扩散先验即一般文献中的无信息先验分布(noninformative prior)。当然无信息先验分布并非一无所知,实际包含许多信息,至少知道该参数是位置参数还是尺度参数。共轭先验分布是指这个先验分布与似然函数相乘后,得到的分布与先验分布函数形式一样,即属同一个分布族。这种先验的好处是,当一个新的样本被观察后,关于参数θ的后验分布有同样的解析形式,只需带入超参数和样本值,就可以计算出后验的均值和方差。
参数的先验分布的选取方法之一是贝叶斯假设,即假设参数的先验分布在取值范围内是均匀分布的:若将θ的取值范围记为,并略去密度取值为0的部分,则参数θ先验分布密度函数为:π(θ)∝a constant时,这时先验叫improper prior 或叫flatprior 。因为这个分布积分不为1(概率公理不满足)。
通常,贝叶斯假设在参数变换下并不满足不变性的要求,即变换后的分布不再服从均匀分布。如果参数θ选取均匀分布作为其先验分布,根据贝叶斯假设,θ的函数π(θ)也应选取均匀分布作为其先验分布,然而由θ服从均匀分布这一前提,往往导不出π(θ)也服从均匀分布。例如正态总体标准差为σ,它的参数空间是(0,∞),为能变换,我们选取贝叶斯假设σ~U(0,1),即f(σ)=1,0<σ<1,其它情况密度为0,取它的一个变换η=σ2,这是一一变换,根据随机变量函数的变换,g(η)=f(σ)×1/2σ=1/2σ,可以看出η的密度已不是均匀分布了,而是与随机变量σ有关了。
针对贝叶斯假设在变换下并不满足不变性,effreys(1961)建议对于参数在有限范围内或-∞到+∞范围内取任意值,它的先验分布应取成均匀分布,若它的可能取值范围是从0到∞之间,则它取对数后的先验分布应是均匀分布。所以位置参数的先验应与一个常数成比例,尺度参数应与自己的逆成正比,例如来自正态分布N(μ,σ2)的样本的扩散先验应为π(μ,σ)∝1/σ。effreys(1961)根据不变性的要求,又提出了一种基于Fisher信息阵的多参数模型扩散先验分布选择方法。若令L(θ)为似然函数,effreys认为参数先验分布应与Fisher信息阵的行列式的平方根成比例:π(θ)∝[detI(θ)]1/2,其中I(θ)=E-2logLθθ,ellner(1971)详细研究了effreys先验分布能够满足的各种不变性要求。所以在贝叶斯计量经济学中讨论位置参数θ的扩散先验应为π(θ)∝1,θ∈,尺度参数的扩散先验分布为π(θ)∝1/θ,θ>0;对于正态分布N(μ0,σ2),μ0已知,σ>0未知,此时标准差σ是尺度参数,那么标准差σ的扩散先验分布应为:π(σ)∝1/σ,σ>0。对于正态分布N(μ,σ20),σ20已知,此时μ是位置参数,那么其扩散先验分布应为π(μ)∝1,μ∈R。位置――尺度参数的联合扩散先验分布形式
四、贝叶斯点估计
参数的后验密度概括了参数的所有信息。因此,一旦得到参数的后验密度,就可以对参数进行研究。在确定参数的具体值(点估计)时,就要依据某个准则来决定哪一个值最佳。若最佳估计值的选取依赖于用来估计真参数θ时所造成的损失。一般来说,当估计值离参数真值θ越远,损失就越大。描述点估计与真参数θ间的函数L(θ,)称为损失函数。常用的损失函数是二次损失函数L2=c(-θ)2和线形损失函数L1=c|-θ|,其中c是一个正的常数。要获得点估计值,需要考虑某种损失函数形式使损失最小,要使所有类的损失函数都能达到最小的,只有=θ;然而,真实参数θ是未知的,这种方法明显不行。为了克服这一困难,在θ的所有可能值上加权平均(或期望)损失最小,权数为后验密度函数π(θ|y),因而,一个贝叶斯点估计值就是使期望后验损失最小的值。这里,期望后验损失由下式给出Eθ|y[L(θ,)]=∫L(θ,)π(θ|y)dθ,对于二次损失函数L2,后验分布的均值就是使上式达到最小的点估计值,因为Eθ|y[L2(θ,)]=∫c(-θ)2π(θ|y)dθ,为使上式达最小的值,对上式求导得dd{Eθ|y[L2(θ,]}=∫2c(-θ)π(θ|y)dθ,令上式为零便得的最小值,∫π(θ|y)dθ=∫θπ(θ|y)dθ。 由密度函数的性质知上式左边积分号的内容等于1,因此二次损失函数下的θ的点估计值就是后验密度的均值(期望):=E[θ|y]=∫θπ(θ|y)dθ 。在贝叶斯计量经济学中,只要对后验分布求期望就能得到参数的点估计值。
五、贝叶斯区间
我们在经典统计下讨论置信区间和参数时,都是说这个区间覆盖参数的可能性,而不说这个参数在这个区间内,因为这里随机变化的是区间而不是参数。当说一个参数有90%的把握落在某个区间内,这种说法经典统计是不容许的,因为经典统计认为参数是固定的;只能说90%的机会覆盖这个参数;而贝叶斯学派可以说某个参数落入某个区间的概率。这是因为贝叶斯学派认为参数是个随机变量,有一个概率分布。而只有在得到贝叶斯后验分布时,才用区间覆盖某个参数这种说法。为了与经典学派相区分,贝叶斯学派用可信区间而不是置信区间,可信区间来自后验分布。
所以当θ的后验分布π(θ|y)获得以后,立即可以计算出θ落入某个区间[a,b]内的后验概率。p(a<θ<b)=∫baπ(θ|y)=1-α,满足这个式子的a,b不唯一(单峰型的密度函数中是唯一的),因此需要依据某些准则来选择这个区间。一种可能是,要求所选区间内的每点的后验密度函数值都大于区间以外点的密度函数值。具有这种性质的区间叫做最大后验密度(PD)。反之,若给定1-α的概率,要找一个区间[a,b],使上式成立,这样求的区间就是θ的贝叶斯可信区间。
六、贝叶斯假设检验
抽样理论中的假设检验是通过设置两个假设0和1,和一个适当的统计量,根据此统计量的值是否落入临界区域内决定每个假设被接受还是拒绝。贝叶斯假设检验是根据零假设0下的设定值是否以预先指定的概率落入PD区间,来决定接受或是拒绝零假设。常用的贝叶斯假设检验是利用后验机会比(posterior odds)。这种方法通过计算每种假设下的后验概率P(0|y)和P(1|y)得到后验机会比01,01=P(0|y)P(1|y) 。这一比率给出了0相对于1的优势。利用后验机会比进行假设检验,与其说是假设检验还不如说是“比较”。从上面可以看出,贝叶斯假设检验不要求接受或是拒绝某个假设,因为后验机会比就足以说明问题。后验机会比01大于1表明支持原假设,后验机会比小于1表明接受1,后验机会比01约等于1时须重新搜索信息,不宜做出判别,这种后验机会比01也适合多重假设检验,这是经典统计办不到的。
七、贝叶斯预测
许多情况下,给定样本信息y后,我们希望对其它还未观测到的未来值y进行预测。在贝叶斯方法中,给定样本信息后能够求得还未观察值的分布,我们称之为预测分布。令y为还未观察到的向量,y和参数向量θ在
们就可以对未来参数进行点预测和区间预测了。
八、贝叶斯计算方法
尽管贝叶斯推断模式简单,并且概率形式优美。然而,在贝叶斯分析中,一般只知道后验分布密度函数的核,而难以获得具体的边缘密度函数和条件密度函数,也很难找到累积分布函数的数值分位点,计算边缘后验分布密度函数和条件密度函数的困难是阻碍贝叶斯方法应用广泛的最大障碍。对于贝叶斯后验分布的高维问题,通常的格点搜索方法和拉普拉斯算法都不是很有效。而蒙特卡洛方法对这类问题较为强劲,且一直受到计量经济学家的关注(朱慧明、韩玉启,2006)。然而,这些方法的实现,需要依靠复杂数值的解析近似技术及相应的软件支撑。
目前,在贝叶斯分析中应用最为广泛的是MCMC方法,而MCMC方法主要有两种:Gibbs抽样方法和Metroplis-astings方法。能够支持这种运算的软件和应用程序已经有很多被开发出来,例如WinBUGS通常专门用来实现MCMC,还有一些在软件中加入贝叶斯模块,例如 RAS、S-Plus 和Matlab等。尽管MCMC方法应用广泛,但很难判断何时马尔科夫链已经渐近收敛于平稳分布,所以对MCMC方法收敛性的研究一直是个重要课题。从某种意义上说,贝叶斯研究带动了计算技术的发展。
通常一个完整的贝叶斯计量经济学问题的分析结构都应包括上述八个步骤的讨论,当然具体问题还要具体对待。展望未来贝叶斯计量经济学仍然是一个值得大量研究的领域,例如,面板数据分析中的随机系数模型和时变参数模型,若是给定先验分布就是一个贝叶斯问题;单位根检验也是贝叶斯方法大有用武之地的领域,很多计量经济学家都对其进行了研究,并且提出了不同的观点,得出了宏观经济数据的不同单位根检验的结果;缺失数据的分析天然地与贝叶斯方法结合比较紧密,它本身就是对未知值的一种信念。越来越多的文献目前关注着贝叶斯方法的发展和贝叶斯方法在计量经济学文献中的应用。
参考文献:
阿诺德・泽尔纳. 200. 计量经济学贝叶斯推断引论[M]. 上海:上海财经大学出版社.
韩明. 200. 基于无失效数据的可靠性参数估计[M]. 北京:中国统计出版社.
茆诗松. 1999. 贝叶斯统计[M]. 北京:中国统计出版社.
朱慧明,韩玉启. 2006. 贝叶斯多元统计推断理论[M].北京:科学出版社.
UDGE G G.1980. he theory and practice of econometrics[M]. New York :Wiley.
POIRIER D . 2006. he growth of bayesian methods in statisticsand economics since 1970[] . Bayesian Analysis,1(4):969-980.
PRESS S . 1989. Bayesian statistics: principles, models, and applications[M]. New York. ohn Wiley and Sons, Inc.
QIN D. 1996. Bayesian econometrics:the first twenty years[]. Econometric heory.
ELLNER A. 1997. Bayesian analysis in econometrics and statistics :the ellner′s view and papers[M]. [S.L]:Edward Elgar.
ELLNER A. 2004. Statistics, econometrics, and forecasting[M]. [S.L]:Cambridge University Press.
he Framework of Contemporary Bayesian
Econometrics Analysis and Its Outlook
LI Xiaosheng1,2 XIA Yuhua1
(1.Xiamen University, Xiamen 36100; 2.Anhui University. of Finance and Economics, Bengbu 233041)
引 言
计量经济学作为一门基础学科,在经济学的分支学科中占有重要地位。这一学科在本科阶段的传统教育中往往偏重于模型的推导、检验等数理环节,忽视了在现实生活中的应用。因而,造成学生在理论学习完成以后却不知该如何运用,进而为了应付考试死记公式,学习积极性无法得到有效提高。因此,本文拟首先分析本科阶段学生学习计量经济学的特点,其次通过对Excel、Eviews、SPSS三款软件的比较分析,对现有教学模式展开探讨,最终得出对计量经济学教学模式的改革建议。
一、本科阶段学生学习计量经济学的特点
随着我国社会主义市场经济不断发展,人们愈来愈迫切要求用定量分析工具去解决经济发展中的问题。计量经济学的理论和方法,作为研究经济运行中具体数量规律的科学,把经济理论分析和对经济现象的经验观测方法结合起来,具有科学性和实用性,因而得到了越来越广泛的应用…。在教学实践中,计量经济学的科学性得到了很好的体现,但其实用性却并未得到学生的普遍认可,这与本科阶段学生计量经济学的特点有着密切联系。
1.学生基础知识不牢固
计量经济学是一门以经济学为基础,以统计学为资料依据、数学为研究工具的交叉学科。对它的学习要求学生具备概率、统计、线性代数、微积分等课程的良好基础,但从实际情况来看,能够具备这些基础的学生并不是很多。究其根源,首先,在于我国现行的高中文理分科制度。我国多数高校经管类专业在招生时面向的是以文科课程学习为主的文科生,这类学生数学基础相对较弱,在学习计量经济学时对模型的理解和掌握能力较差;其次,作为前期基础的统计学、线性代数、概率等课程的连贯性不强,且缺乏与经济学理论相关的案例分析,使得学生对这些课程的学习停留在传统的数学学习方法上,对以经济学理论为基础的计量经济学缺乏了解。
2.教材过于偏重对模型的推导
现行计量经济学教材在相当程度上跟数理统计学教科书相差无几,“形而上”的倾向比较严重。且大多对理论模型的推导、证明较为重视,而对模型经济理论含义的解释流于形式。例如,多数计量经济学教材均蕴含《供给函数与需求函数模型》、《生产函数》、《投资函数》等基本模型内容,这些本应是与现实经济情况以及学生前期学习过的宏观经济学等课程联系最为密切的章节,但在多数教材中往往只注重模型推导过程的演绎,实际案例过少或根本没有,在课后练习题中模型的证明也占了绝大部分。这样一来,学生在学习过程中只能体会到模型的复杂性,而不了解其可操作性。
3.实验课学时过少
计量经济学作为一门理论和实际联系密切的交叉学科,其应用性应当在教学中得到充分体现。应用计量经济学在现阶段来说,指的就是计量经济学相关软件的操作与运用,主要包括Excel、EViews、SPSs等。多数现行教材都将实验课作为单独章节予以讲解,其余各章中只是在案例分析时会交代一下简单的应用。因此,在教学过程中多数教师也习惯于将计量经济学理论与计量经济学实验分成独立的两个部分。其结果是,理论与实验教学在时间衔接上出现了问题:往往是要求学生强化记忆理论部分,待数周以后,甚至是学期即将结束时才安排上机操作,破坏了整个课程体系的系统性和连续性。
综上所述,计量经济学在本科阶段的教学重点,应当是经济学理论的可实践性与可操作性。而最能体现这两者的就是对相关计量经济学软件的运用。因此,笔者拟通过对Excel、Eviews、SPSS三款软件的对比分析来阐述如何将理论与实践相结合。
二、Excel、Eviews.SPSS对比分析
Microsoft Exccl是微软公司的办公软件Microsofl office的组件之一,是由Microsoft为windows和AppIe Macintosh操作系统的电脑而编写和运行的一款试算表软件。Excel是微软办公套装软件的一个重要的组成部分,它可以进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。在多数院校的计算机课程中对Excel的操作都有着侧重点不同的讲解,但对其数据分析功能的运用相对较少。换而言之,大学阶段对Excel功能的使用程度不及其总功能的十分之一。
Eviews是Econometrics Views的缩写,直译为计量经济学观察,通常称为计量经济学软件包。它的本意是对社会经济关系与经济活动的数量规律,采用计量经济学方法与技术进行“观察”。计量经济学研究的核心是设计模型、收集资料、估计模型、检验模型、应用模型(结构分析、经济预测、政策评价)。Eviews是完成上述任务比较得力的必不可少的工具。正是由于Eviews等计量经济学软件包的出现,使计量经济学取得了长足的进步,发展成为一门较为实用与严谨的经济学科。
SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于20世纪60年代末研制,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS,总部。1984年SPSS,总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+.开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。
这三款软件在目前计量经济学教学实践中应用较为广泛,但就其难易程度及学生掌握程度来看却有着明显区别。因此,笔者以南阳师范学院经济与管理学院06、075工商管理、电子商务、财务管理、国际经济与贸易、物流管理专业学生为调查对象,详尽分析三款软件的优劣性。
首先,对三款软件的难易程度做概况分析(以一元线性回归模型计算、多元线性回归模型计算及非经典模型的修正为例),调查结果如表1所示。
由表1可以看出,Excel在前三项调查中具有明显优势,而在“非经典线性模型的修正”一项中三款软件基本保持平均水平。对这一现象起因的调查结果如下列图1、图2所示。
由上述两图可以看出,在三款软件中Excel在“软件界面语言易懂”项中为绝大多数学生所接受。原因在于.1.Excel为中文操作界面,学生可以从“工具”一“数据分析”中便捷地找出所需运算工具,如“相关系数分析”、
“回归分析”等,相对于Eviews和SPSS的全英文操作界面更易接受;2.Excel在“一元、多元线性回归”章节中,操作步骤相对较少(三款软件学生实际操作时间比例为1:2.5:3.1)。从这两方面原因来看,Excel的主要优势还是在于其中文的操作界面更易于掌握和记忆,且学生在统计学的学习中已经广泛使用过Excel的数据分析功能,属于轻车熟路易于上手。
在非经典线性模型的修正中,Excel的优势不如前两项明显,主要原因是由于Eviews、SPSS在计算例如权重序列、运用广义差分法、杜宾(Durbin)两步法、逐步回归法、Reset法等方面具有明显优势,而Excel则显得较为复杂。因此,在进行非经典线性模型的修正中Eviews:~SPSS的受欢迎程度明显提高。
据不完全统计,学生愿意在自备电脑或网络机房学习使用统计软件的比率高达56.74%,可以看出创造条件激发学生学习统计软件来更好地提高教学效果具有可操作性。因此。在本科阶段加大相关软件的应用教学对增强学生学习兴趣具有重要意义。
三、计量经济学教学模式改革建议
相对于复杂的公式推导及证明,通过软件计算计量经济学模型更能为学生所接受。这就要求任课教师在加强、巩固基础理论教学的同时,要不断加大对软件教学的重视程度;其次,增加实际案例分析的数量,通过对现实社会经济发展中存在的真实案例的分析一方面增强学生对计量经济学模型重要性的理解,另一方面充分调动其学习积极性,以便能够更好的掌握、运用计量经济学模型。
笔者以为要达到上述要求,可以从以下几个方面人手:
1.按照章节不同将软件区分应用
针对Excel、Eviews、SPSS三款软件各自的特点,可根据不同章节安排软件,如下表所示。
Excel在界面语言、可操作性及学生熟悉程度上来说,都优于其他两款软件。因此,在入门的一元线性回归模型一章中可使用Excel为主要案例软件。具体包括,利用“图标导向”功能做一元散点图,利用“数据分析”功能进行相关系数分析及回归分析。在此基础上,要求学生深入掌握相关及回归分析结果,能够顺利找出可决系数、函数标准差、相关系数、回归系数、t统计量、F统计量等主要指标,并且能够利用这些指标完成一元置信区间预测等计算。
在多元线性回归一章中,应使用Excel与Eviews相结合的方法进行多元案例分析。在分析过程中,首先运用Excel得出相关结果,使学生对多元与一元的区别有一定的了解。然后,在Eviews软件中再次进行同一案例的回归分析,并将两次分析结果加以比较,了解Excel与Eviews在操作过程中的异同点,为进一步掌握Eviews打下基础。
在非经典线性方程修正中,应尽量使用SPSS作为主要应用软件,利用其完备的计算功能对异方差、自相关、共线性等违背经典假定的模型进行修正。在联立方程等后续章节中,应使用以Eviews、SPSS软件为主的教学方法,但在宏观计量模型中应当首先使用Excel。
2.在前期增加对统计学.线性代数等相关知识的复习
由于现阶段高校经管类学生多为文、理混编,且文科生占主导地位。因此,在开始学习计量经济学之前,应对线性代数、微积分、统计学、运筹学等相关知识做出系统复习。特别是针对学生数学基本薄弱的特点,加强对线性回归分析的复习,使学生在学习计量经济学之前了解和掌握基本的分析方法,为以后的深入学习打下良好基础。
3.建立计量经济学案例数据库
建立计量经济学案例数据库,是因为现行教材中的案例数据普遍较为陈旧,很多教材中充斥着数年以前的数据,且很多数据已于现实生活严重脱节迫切需要更新。一个适应本科计量经济学教学的案例数据库,需要满足来源广泛性、方便性的要求,同时,案例要能够尽量浓缩计量经济学的概念和原理,应包含有复杂、模糊和有待解决地问题,以激发学生主动学习的动机。为此,笔者建议在计量经济学教学过程中,首先,各高校应当联网建立完善的案例数据库,对现实数据进行实时更新;其次,应指导学生自己动手上网或通过调研搜集数据。这样以来,能够使学生掌握搜集数据的方法、工具,为日后独立运用计量经济学相关知识提供宝贵经验。
四、结 语
综上所述,计量经济学作为一门交叉学科,在本科阶段的教育工作任重道远。只有在本科阶段为经管类学生打下坚实的理论与实践基础,才能使其在更高一级的学习中去掌握高级计量经济学。而要达到这样的目的,唯有将计量经济学基础理论与软件应用相结合,坚持不懈地培养学生实际动手能力,形成对经济问题分析、理解的逻辑性。
参考文献
[1]于俊年,计量经济学,北京:对外经济贸易走学出版社,2000
[2]刘明广,本科《计量经济学》课程教学的几点建议[J]统计与咨询,2008(2)
[3]张兵,本科《计量经济学》课程教学方法的探讨[J]中国科教创新导刊,2007(11)
[4]baike baidu.corn/view/28127 htm?fr=-alaO_1_1
[5]baike.省略/view/207806.htm
Competence effect and financial market participation: Evidence from Household Survey Micro-Data
Wu Weixing Xu Qian Wang Gong
(Research Center of Applied Finance, University of International Business and Economics, Beijing 100029, China)
Abstract: In addition to household demographic characteristics, household wealth, illiquid assets and other objective factors, investors’ subjective perceived competence also have a significant effect on household participation in the financial market. Based on survey micro-data of households, this paper defines two indicators by the self-assessment of understanding of the market and investors’ own perceived ability. Empirical results show that investors’ subjective perceived competence has a significant and positive effect on household behaviors about market participation. It implies that the investors with higher self-perceived competence are more likely to participate in stock investment. It is also found that investors’ subjective perceived competence is mainly affected by education level, household income and health status.
Key words: Household finance; Competence effect; Market participation
能力效应与金融市场参与:基于家庭微观调查数据的分析
摘要:除了居民家庭的人口统计学特征、财富水平和非流动资产等客观因素之外,投资者主观能力感受对居民家庭金融市场参与也有显著影响。基于中国居民家庭微观调查数据,根据家庭户主对市场了解程度的自我评价以及能力水平感受构建指标,发现居民家庭主观能力感受对居民家庭市场参与行为具有显著的正向影响,表明如果投资者如果在自我感知的能力方面对自己有更高的评价,则更有可能参与股票市场。同时研究也发现教育程度、家庭收入和健康状况等均会显著影响居民家庭的主观能力感受。
关键词:家庭金融;能力效应;市场参与
经典的投资组合理论在最为一般的假设下证明经济人的最优资产配置是持有一定比例的风险资产和一定比例的无风险资产,并且风险资产的权重是不变的。但实证研究发现不管是在发达国家还是在新兴市场国家的居民家庭即使是非常富有的家庭都有很大比例没有参与股票等风险类资产的投资,这似乎并不符合经典理论的结论,学术界称之为“市场参与之谜”。那么,在现实中哪些因素是导致投资组合异质性的原因呢?大量的研究已经对居民家庭的人口统计学特征、财富水平和非流动资产等客观因素与家庭资产配置的关系进行了研究,本文则在此基础上基于中国居民家庭微观调查数据,对投资者主观能力感受与居民家庭金融市场参与之间的关系进行了分析,并探讨了影响居民主观能力感受的因素。
一、 相关研究综述
[中图分类号] G642.3 [文献标识码] A [文章编号] 1005-4634(2013)04-0082-03
0 引言
数据挖掘技术能从大量数据中发现和学习有价值的和隐藏的知识,因而近年来在国内外受到极大重视,在电信业、零售业和银行业等生产大数据的行业中正获得越来越广泛的应用[1]。因此,近几年数据挖掘这门课程已越来越多的走进了高校课堂。但是,数据挖掘又是一门综合性较强的交叉学科,它涉及到统计学、数据库技术、数据仓库、人工智能、机器学习和数据可视化等学科知识,对学生的专业知识背景和前期所学课程有较高的要求,这在一定程度上限制了数据挖掘作为一门既有理论价值又有实践价值的学科的应用和推广。笔者结合自己的教学实践研究经管类专业本科生开设数据挖掘课程的教学探索。
1 经管类专业本科生开设数据挖掘课程的必要性和可行性分析
从经管类各专业的培养目标角度分析。以南京邮电大学经管类专业为例,该专业包含信息管理与信息系统、电子商务、市场营销、经济学和工商管理等专业,这些专业的培养计划都把培养学生具备市场分析、经营和管理决策能力作为专业的基本培养要求之一。数据挖掘作为商务智能的核心技术,是辅助管理者进行决策分析的有效工具,在激烈的商业竞争中发挥的作用越来越大。因此,为经管类专业本科生开设数据挖掘课程可以更好地实现专业培养目标。
从经管类专业本科生的就业角度分析。经管类专业本科生毕业后,有相当一部分同学会从事营销岗位或者信息管理、网站设计与维护等技术岗位。对于从事营销岗位的同学来说,由于现在的市场营销概念已经发展到精细营销理念,即企业恰当而贴切地对自己的市场进行细分,对各种客户群进行深入的分析和定位,并根据不同的客户群特点,采取精耕细作式的营销操作方式,将市场做深做透,进而获得预期效益。数据挖掘技术是实现精细营销的重要工具;对于从事技术岗位的同学来说,学习数据挖掘课程,掌握数据挖掘的思想和方法对培养学生的系统思维和解决实际问题的能力、提高学生的信息素养很有必要。因此,学习数据挖掘课程对学生未来的工作也是非常有帮助的。
数据挖掘是一门交叉学科,课程理论性强,且对学生的计算机基础要求较高。经管类专业只有信息管理与信息系统、电子商务两个专业开设了较多的计算机课程。但是所有经管类专业都开设了统计学必修课程和数据库原理与应用必修或选修课程,这两门课程是数据挖掘的核心。因此,适当地调整教学目标,将数据挖掘作为一门选修课程为经管类专业本科学生开设是完全可行的。
2 教学过程中存在的问题
笔者在为经管类专业本科生开设数据挖掘课程的过程中,往往遇到两个问题。
1)课程较强的理论性与学生知识结构缺陷之间的矛盾问题。数据挖掘这门课程涵盖了统计学、数据库原理、机器学习、信息论和时间序列等众多内容,课程教材中有较多的公式推导和算法分析,因此课程的理论性较强。然而,经管类专业本科生之前只是学习了统计学和数据库原理与应用两门课程,机器学习等其他课程知识均没有涉及到,因此在学习数据挖掘课程时会感到内容难度较大,障碍较多[2]。
2)理论教学与实验教学学时合理分配的问题。由于数据挖掘课程通常是作为选修课安排在经管类专业本科生培养计划中,总学时数相比学位课程要少,只有32学时。正如前文所述,这门课程包含的内容多、难度大,因此必须要保证足够的理论教学学时数量。同时,数据挖掘又是一门应用性较强的课程,特别是对于经管类专业本科生来说,一定要安排足够的实验教学学时,让学生在实践中提高分析问题和解决问题的能力。在较少的总学时约束条件下,如何合理地分配理论教学学时和实验教学学时是课程教学遇到的又一个问题。
针对经管类专业本科生开设数据挖掘课程时遇到的矛盾问题,将这门课程的教学目标确定为:掌握数据挖掘基本流程和经典算法的基本原理,熟练运用数据挖掘软件工具,分析和解决商业应用问题。课程教学目标指出,为经管类专业本科生开设数据挖掘课程的目的是培养学生利用数据挖掘这种工具去分析和解决商业应用问题的能力,而不是要求学生具备数据挖掘算法设计能力。因此,对于经管类专业本科生来说,实验教学和理论教学同等重要。在课程教学大纲中应将理论教学学时和实验教学学时设置为各16个学时。
3 教学内容设计
用16个学时来介绍数据挖掘课程的理论知识点,这就要求教师能够为经管类专业本科生精心挑选知识点,“量身定做”教学内容。
1)以应用为目的设计教学内容。根据经管类专业本科生数据挖掘课程的教学目标,本门课程在教学过程中应注重培养学生应用数据挖掘分析问题和解决问题的能力,这就要求教师能够围绕数据挖掘的整个应用过程来安排教学内容。数据挖掘的应用过程包括数据收集、数据预处理、模型构建和知识评价四个主要步骤。数据收集步骤是指准备数据挖掘的对象——数据源,有的数据源是一个数据文件或者是数据库中的一张关系表,但对于具体的商业应用来说,数据源往往是来源于同一个或不同数据库中的多张关系表,或者是多个数据文件,这时需要对数据源进行集成,甚至是构建数据仓库;数据预处理步骤是指通过数据清洗、数据集成、数据变换和数据归约等操作为数据挖掘任务提供干净、准确和简洁的数据,提高数据挖掘效率和挖掘结果的质量,它是数据挖掘中非常重要的环节;模型构建步骤是指选用数据挖掘算法在预处理后的数据集上构建挖掘模型的过程,关联、分类、聚类和回归分析是数据挖掘中四个主要的挖掘任务,每个挖掘任务又对应了多个挖掘算法;知识评价步骤是指采用各种统计指标对挖掘结果进行评价,以发现有价值的知识。由于不同挖掘算法得出的挖掘结果表现形式不同,知识评价应针对具体挖掘算法进行,因此知识评价步骤要安排在每个挖掘算法介绍完之后。
2)重点介绍经典算法。针对经管类专业本科生在学习数据挖掘课程时感到内容难度较大这一问题,且考虑到课程的理论授课学时有限,笔者对原有的数据挖掘内容进行了适当的精简。数据挖掘包含数十种挖掘算法,删除复杂和难度大的数据挖掘算法,针对每种挖掘任务重点介绍其经典算法。例如,关联挖掘中的Apriori算法,实现分类挖掘的决策树算法,实现回归分析的最小二乘法以及聚类分析的k-means算法。对于神经网络、贝叶斯分类、时间序列挖掘和Web数据挖掘等难度较大或内容拓展性算法,在介绍相关章节时略提一下,并鼓励有兴趣的学生在课余时间自学。
3)增加商业案例。数据挖掘是一门技术性较强的课程,一般的教材往往注重理论,相关案例较少,因而不容易激发学生的学习热情[3]。为了帮助经管类专业本科生增加对课程中各种挖掘任务的感性认识,同时也是为了激发学生对本门课程的学习兴趣,笔者在讲授过程中增加了若干关于数据挖掘的幽默故事、经典案例和在各行业中的应用案例,通过分析案例加深学生对算法应用的理解。例如,在介绍关联挖掘任务时给学生们引入“啤酒与尿布”的故事;在介绍分类挖掘任务时讲解客户流失分析的应用案例;在介绍聚类挖掘任务时分析客户细分的应用案例。
基于上述分析,笔者为经管类专业本科生开设的数据挖掘课程教学内容具体如下。
第一章为绪论,主要是对数据挖掘技术作概括性描述,让学生对数据挖掘定义、与数据仓库的关系、研究热点以及发展趋势形成感性认识。本章内容分配2个理论教学学时。
第二章为数据仓库,主要内容包括数据仓库的定义与特征、数据仓库的数据组织、数据模型、总体结构和设计等原理性知识点,以及联机分析处理(OLAP)的基本概念和分析操作等基本知识。本章内容分配2个理论教学学时。
第三章为数据预处理,主要介绍数据清洗、数据集成、数据转换以及数据归约等数据预处理的基本步骤和常见方法。本章分配3个理论教学学时。
第四章至第七章围绕数据挖掘的4个重要任务——关联、分类、聚类和回归分析,在介绍每种挖掘任务基本概念的基础上,重点介绍经典算法的基本原理和挖掘结果评价方法,以及每个挖掘任务在具体行业的应用案例。第四章至第六章每章内容分别分配3个理论教学学时,第七章内容分配2个学时。
4 实验项目设计
数据挖掘是一门与实际应用结合紧密、实践性较强的课程。为了加深学生对数据挖掘理论知识点的理解,锻炼和提高学生的实际动手能力,必须结合实验进行教学。数据挖掘课程的理论教学和实验教学构成一个完整的整体,缺一不可[4]。实验教学要充分调动学生的主动积极性,而不是简单地让学生进行验证式的操作实验或仅仅局限于机械地使用、熟悉某种软件工具。
笔者针对课程知识点设计了4个实验项目,每个实验项目分配4个实验学时。
第一个实验项目为数据仓库构建,实验软件是SQL Server 2000,它提供了一套完全的数据库和数据分析解决方案,其中的Analysis Service 组件支持数据仓库的创建和应用,并提供OLAP联机分析操作。构建数据仓库的数据源来自SQL Server 2000的样例数据库Northwind,Northwind是一家虚构的公司,从事世界各地的特产食品进出口贸易。Northwind数据库包含有这家公司的销售数据,数据内容多,数据量大,数据结构贴近企业的真实数据,符合实验要求[5]。实验包含4个步骤:(1)理解业务数据,确定分析主题。Northwind数据库中的表非常多,需要理清各关系表的内容及其相互间的关联,在此基础上确定感兴趣的主题;(2)围绕分析主题,将主题相关的关系表通过企业管理器中的DTS进行清洗和转换,为数据仓库提供合适的数据;(3)使用Analysis Server向导,建立多维数据集;(4)基于构建好的多维数据集,对数据进行切片、切块、钻取、聚合和旋转等各种OLAP分析操作。
第二至第四个实验项目均是基于Clementine12.0等数据挖掘工具,通过构建数据挖掘模型分析具体商业问题。其中,第二个实验项目为关联挖掘的综合实践,要求学生运用关联挖掘经典算法Apriori分析移动产品交叉销售;第三个实验项目为分类挖掘的综合实践,要求运用决策树算法进行电信客户流失分析;第四个实验项目为聚类挖掘的综合实践,要求运用聚类经典算法K-means进行电信客户细分分析。上述三个综合实验项目都要求学生首先能够分析具体应用问题,然后进行数据预处理、构建数据挖掘模型,并对挖掘结果进行分析和讨论,以锻炼学生数据挖掘的思维体系和数据分析能力。
5 教学方案实施
在教学方案实施过程中,着重营造活跃的课堂教学氛围,重视对课后作业的指导,以期提高课堂教学效果。考虑到经管类专业本科生的知识背景和本门课程的特点,在每次课堂上都会抛出一个思考题,要求学生们运用所学理论联系身边实际展开讨论。例如,在介绍完第一章后设计了一个讨论题:如何运用数据挖掘帮助电信企业提高竞争优势?学生讨论得很热烈,也得出了多个答案。由于本门课程课堂讲授学时较少,为了帮助学生复习、巩固及应用所学内容,课程每章节后都安排了课外作业,并就其中的难点进行指导和讲解。实验过程中,着重培养学生的独立性和数据分析能力。首先向学生讲授清楚实验具体要求和注意事项,然后放手让学生自己去做,遇到问题先鼓励学生自己思考解决,实在有困难再稍加指点。实验结束后,要认真分析实验结果,完成实验报告。选择实验数据时要考虑到数据是否符合现实情况且能够突出所分析的问题。除实验以外,其它实验项目均采用SPSS产品培训过程中所用的相关数据,数据量大小适中,适合在实验课上使用,而且这些数据与真实数据的差异小,有助于提高学生解决现实问题的能力。数据挖掘课程的教学方案已实践了5年,其间不断进行经验总结和探索,无论从近几年选修本门课程的学生人数还是从课堂上学生的反映和学习气氛看,本门课程都取得了很好的课堂教学效果。
6 结束语
数据挖掘作为一门技术性和应用性较强的课程,对优化经管类专业本科学生的知识结构、扩展学生的专业应用领域有着重要的作用。笔者结合自己的教学经验,对经管类专业本科生数据挖掘课程的教学内容和实验环节等方面进行了积极的教学探讨和实践,学生反映非常好。在今后的教学工作中,要不断实践,不断总结,进而不断改进和提高数据挖掘课程的教学质量。
参考文献
[1]刘云霞.统计学专业本科生开设“数据挖掘”课程的探讨[J].吉林工程技术师范学院学报,2010,26(6):20-22.
[2]李志勇,王翔,喻军.信息管理专业数据挖掘课程教学探讨[J].管理工程师,2012,(4):66-68.