你好,欢迎访问云杂志! 关于我们 企业资质 权益保障 投稿策略
咨询热线:400-838-9661
当前位置: 首页 精选范文 统计学大数据分析

统计学大数据分析范文

发布时间:2023-09-24 15:39:05

导语:想要提升您的写作水平,创作出令人难忘的文章?我们精心为您整理的13篇统计学大数据分析范例,将为您的写作提供有力的支持和灵感!

统计学大数据分析

篇1

一、大数据与统计学

(一)大数据与统计学关系密切

简单来说,我们可以分为两个方面来理解大数据:若“大数据”作为形容词,则描述的是大数据时代数据的特点;若“大数据”作为名词,则体现的是数据科学研究的对象。对大数据的定义有非常多,不同领域不同专业对大数据的界定都会有些许不同。通俗地说:大数据是目前人类所有可抓取、可记录、可存储的信号集合。这个包含了一切信号的集合将非常非常之庞大、多样、繁杂,并且还在不停地、迅速地增加。现代互联网和信息技术的飞速发展,使得人类开始有能力收集、储存、分析、处理这些从前无能为力的数据,从中挖掘出有用的信息促进社会的发展。迈尔•舍恩伯格说:大数据发展的核心动力就是人类测量、记录和分析世界的渴望。而统计学正好是收集、整理、分析、解释数据并从数据中得出结论的科学。由此可见大数据与统计学关系密切,将大数据与统计学结合发展潜力无穷。

(二)大数据时代下的非结构化数据与结构化数据需整合

对接统计研究可根据自身的目的收集总体数据或样本数据,但如果总体太过庞大,以过去的技术方法来收集总体数据成本会很高,受于限制统计研究更多收集得是样本数据。如今,人类已经开始能够在合适的成本下获得大数据,大数据的广博给统计研究带来了新的发展方向。我们需要着重研究的一个方向就是如何将结构化数据和非结构化数据对接。大数据的核心是数据,统计学的研究对象也是数据,但是它们获得的数据性质有所不同:大数据收集的多是半结构化和非结构化的数据,通俗地理解,先获得数据,再整理结构(如声音、图片、视频等信息);传统统计学收集则主要是结构化数据,先定好结构,再根据目标结构收集数据(如数字、符号等信息)。拿非结构化数据和结构化数据来说:大数据时代使得我们有更多可以分析利用的数据,使得统计研究不仅可以在有更多的结构化数据的情形下进行;对于一些领域的研究工作还可以设法将非结构化数据和结构化的数据结合起来分析。如何实现非结构化数据与结构化数据的结合?首先,完善非结构化数据的整合,然后我们可以用结构化数据做数量说明,非结构化数据加强描述;或是提高数据处理技术,实现结构化数据与非结构化数据的互相转化,选择能更好说明问题的数据形式作为后续分析基础。这都是值得再深入思考研究的新问题,而且这不仅仅是大数据和统计研究的事,同时需要计算机技术的一同创新发展。统计研究的范围在大数据时代越来越大,能用数据说明的问题越来越多。

(三)大数据时代下的相关分析与因果分析发展并重

《大数据时代》一书中表示:大数据时代的一个显著变化是:相关分析比因果分析更重要。我的看法是:大数据时代下,市场确实会对相关分析有着更强的关注度,但这并不意味着因果分析的重要性会有褪色。统计学中既有相关分析,也有因果分析,要对它们有合理的了解,首先需要明确的是相关关系和因果关系之间的联系,简单说:有相关关系不一定有因果关系,有因果关系则一定有相关关系。大数据时代,相关关系变得比以前更加为人所关注的原因:一方面,在很多领域的应用里,相关分析比因果分析更简单可行;另一方面,因为相关关系足以体现事物之间的一定联系,在商业效益上更为经济有效。因此在商业利润的推动下,相关关系也会更加受到青睐。但是我们不能就此否定因果关系的重要性,因果关系是对数据更加深度地分析:相关关系让我们知道了“是什么”,因果关系是让我们知道了“为什么”。倘若只是在商业经济上的利用和成本考虑,“是什么”在很多时候就以足够;但如果是在科学研究领域,“知其然而不知其所以然”就远远不够了。结合现实发展需要,可在分析确定相关关系后,根据情况研究因果关系,若能够得出因果关系,那肯定是更具价值和意义的。探求“为什么”始终是人类探索世界的动力,因果分析是人类永恒的使命。

二、结语

大数据时代的到来几乎对每个领域都有着不可忽视的影响。大数据与统计学关系密切,大数据的出现对统计学的意义是非凡的,我们应把握住大数据时代和统计学的可结合点。其一,完善非结构化数据的整合,深入研究如何实现非现结构化与结构化数据的对接,都需要我们思维上的创新、数据处理技术上的提高。其二,在注重相关分析的同时,不能丢掉对因果分析的研究,应合理并重,实现大数据的进一步利用,真正挖掘出数据的价值。对于以数据为研究对象的统计学科,大数据时代就是统计学变革创新的时代,统计研究工作人员也应把握机会思考创新,为统计学增添新的生命力。

参考文献:

[1]朱建平,张悦涵.大数据时代对传统统计学变革的思考[J].统计研究,2016(02):3-9.

篇2

【中图分类号】C81【文献标志码】A【文章编号】1673-1069(2020)06-0071-02

1引言

统计学作为企业经营管理的重要手段,在企业经营过程中统计工作是否落实到位,对于企业可持续发展目标的实现而言具有重要影响,尤其在当前多元化市场竞争环境下,企业规模化发展虽然推动了国民经济的进一步发展,但与此同时企业市场竞争也愈演愈烈,实现持续性经营,确保统计学应用效益的最大化,是目前推动产业可持续发展的重要战略基础。

2大数据时代内容的基本概述

简单来讲,所谓的“大数据”是指在当前信息化产业时代背景下,无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是互联网公司在日常运营中生成、累积的用户网络行为数据,是需要新处理模式才能有效处理的海量、高增长率和多样化信息资产。随着近年来信息技术的不断发展和广泛应用,“大数据”时代是“互联网+”技术应用下时代未来发展的趋势。就目前来看,与传统信息数据相比,大数据具有数据量大、数据多元以及数据价值高的显著特点,伴随城市化、工业化建设进程的不断加快,如何有效地对大数据进行处理,成为现阶段基层产业结构和相关主管部门的核心发展方向,也是促进企业进一步发展的重要基础。

数据实质上是存储于计算机内的各种信息集合,在当前全球化、市场化不断发展的新产业时代背景下,商业模式的巨大转变,在改变人们关注度的同时,也为企业的进一步发展奠定了良好基础,最终为企业预期发展目标的实现创造了良好条件。对于大数据的处理,倘若采取传统的处理技术,不仅难以达到预期的处理目标,更极易导致一系列其他问题的产生,最终对企业整体发展造成了极为不利的影响,为此在大数据发展的同时,技术领域也取得了显著突破,目前常见的管理技术主要有——数据仓库技术、数据安全技术、数据分析、数据挖掘和模型预测,其中,数据分析、数据挖掘与大数据关系最为密切。

3新形势下统计学存在的主要问题

3.1企业对于统计管理工作的重视度不足

在经济全球化和一体化建设进程不断加快的新市场经济常态下,企业规模和数量的不断增加,在加剧企业市场竞争力的同时,如何有效地提升企业工作质量和工作效率是现阶段企业的核心发展方向,但由于部分企业受传统发展以及管理理念根深蒂固的影响,企业管理和发展重心始终集中于企业经济效益,忽视了对统计管理的关注度,致使单位在统计管理工作方面的人力和物力投入不足,各项管理工作受到一定影响的同时,企业的整体发展也受到了一定影响。

3.2统计管理人员自身专业素养有待提高

统计管理人員作为统计管理工作的实践者,其自身专业能力和综合素养水平的高低,对于统计管理工作质量和工作效率具有重要影响,但随着当下统计管理工作量的增加,部分企业为满足人员配置需求,不断地降低人员选拔标准,导致聘用人员无论是专业能力还是综合素养都有待完善。作为一项专业、系统的管理工作,统计管理不仅要求管理人员拥有细心、踏实、耐心等基本素质,还要具备一定的计算机操作能力,但随着企业规模和数量的持续增加,统计管理人员身兼数职、待遇不高等问题的存在,导致管理人员自身专业能力有所欠缺,业务操作等方面也存在一定不足,最终对统计管理造成了极为不利的影响。

3.3数据库硬件设施、设备不完善

信息化产业时代背景下,“互联网+”技术的广泛应用,在便捷人们日常生活,提高企业生产效益的同时,将其应用到其他领域中,在一定程度上也为各单位的转型升级注入了新的发展动力。统计管理是企业管理作业的重要内容,在很大程度上数据管理库自身硬件设施、设备的完善度对于统计管理工作质量和效率具有直接影响,但对于某些偏远地区亦或经济发展相对缓慢的区域,统计管理设备、设施的落后性在影响现代化科技管理手段应用效益的同时,统计管理作业也始终未能得到突破性进展,企业发展也由此受到了一定影响。

4新形势下统计管理工作的创新策略探析

4.1加强对统计管理重要性的宣传力度,提高对统计管理工作的重视

统计管理作为企业管理的重要组成部分,其管理工作质量和工作效率对企业发展而言也具有一定影响,而为实现企业可持续发展的目标,确保统计管理工作落实到实处是极为必要的。通过上述分析可知,管理人员对于统计管理工作的不重视是影响统计管理工作效益的重要因素,为有效地改善当前管理现状,一方面基层产业机构需加大对统计管理重要性的宣传力度,在不断提高人们对于“统计学应用效益”高度认同的同时,为统计管理工作的顺利开展奠定良好基础。而另一方面企业还需加强对统计管理工作人员的教育力度,在不断增强统计管理人员工作责任感和使命感的基础上,为预期管理目标的实现创造良好条件。

4.2积极和有关大数据公司或机构进行合作

要想在大数据时代背景下进一步优化和提高统计管理工作,就必须将大数据有关技术和统计管理的实际工作紧密结合起来,因此必须解放思想,打破行业限制,积极寻求和有关大数据公司或者机构进行合作开发,开发出真正适合统计管理工作的大数据技术和工具,大数据无法使用单台计算机进行操作和处理,必须采用分布式架构技术等,其也必然和云计算的有关分布式处理、云存储以及虚拟技术等密不可分,因此统计管理必须要积极寻求多方合作,积极将大数据的有关技术引入统计管理的实际工作中去。

4.3不断优化和完善统计管理模式

在当前企业规模和数量持续增加的新产业时代背景下,数据的形成过程较为烦琐,且数量也较为庞大,为从根本上有效提高管理的科学性、高效性和有效性,不断地优化统计管理模式和管理手段也是极为必要的。通过大量调研数据分析可知,在进行统计管理过程中,信息技术的不断发展和传播渠道的日趋增多,在很大程度上为企业统计管理创造了良好条件,但由于部分企业在计算机信息技术应用过程中,未将现代化技术应用到电子统计管理中,导致管理信息化水平较低的同时,预期管理目标也难以实现,为有效地解决上述问题,将数据信息化纳入到工作日程中,为单位的数据管理部门配置专门的信息化设备,是现阶段提高统计管理信息化水平,促进企业进一步发展的重要战略手段。

4.4将各项统计管理工作细节落实到位

在统计管理作业过程中,从根本上有效地提高企业的经济效益、确保各项统计工作细节落实到位也是现阶段基层产业机构和相关主管部门的重要工作内容,换言之,在当前多元化市场竞争环境下,要想从根本上提升统计管理工作质量,提高企業整体的经济效益,以会计管理工作为中心,确保各项细节管理工作落实到位是十分必要的。要想确保管理工作效益的最大化发挥,提升企业经济效益,企业需将会计的发展目标与企业的发展方向相结合,在确保两者“统一性”的基础上,以会计管理工作为中心对企业经营进行系统化管理,最终为企业可持续发展目标的实现奠定良好基础。

4.5确保预算统计管理工作落实到位

篇3

一、引言

在现如今的社会,无论是干什么都离不开信息。小到穿衣吃饭,大到国防军事,每一样都需要信息才能完成。信息是一个名词,围绕着它有信息的产生、信息的处理加工、信息的传递、信息技术的发展等等的一系列环节。所以在现代社会信息就如同一个核心细胞,其他细胞的工作都是围绕它展开进行的。我们对信息一定要敏感而精准。

二、何为大数据时代

大数据最初是由麦肯锡公司所提出来的,它在物理、生物、化学、金融、通讯行业出现并存在已经有一段时日,但它真正为人们所熟知认识却是因为互联网行业的飞速发展。人们总是用它来表述现时代是一个信息爆炸、海量、共享的时代。现如今一个决策的出台不再是凭借昔日的经验和感觉,而是数据的收集、整理、处理、分析所得出的结论。这就表示了一个新的时代,也就是信息数据时代的到来,经济、商业、金融、贸易等多个领域,信息已经成为主宰。这就是大数据时代,也是信息的年代。

三、统计学专业基本概况

统计学,从名称来看貌似是一个新兴专业,其实不然,它是一门非常古老的学科。它最早始于希腊雅典的亚里士多德时代,距今已有两千多年的历史。统计学是通过对数据信息的搜索、整理、分析、描述,以达到窥测所测对象的本质的目的,它是预测对象未来性的一门综合性科学。运用到了大量的数学和其他学科的专业知识,它的使用范围几乎涵盖了社会科学和自然科学的各个领域。统计学家王见定的研究已经说明了数理统计学永远打不败社会统计学,所以在以后的发展道路上,将是社会统计学与数理统计学共存与互补共同前行的模式。

目前作为高校所开设的一门学科,统计学专业主要有一般统计、经济统计两类专业方向,它所培养的是具有良好的数学、经济学素养,熟练掌握统计学的基本理论和方法,熟练地运用计算机分析数据,在企业、事业单位、经济管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的专业型精英类人才。

四、如何很好发展大数据时代下的统计学专业

首先从上文的论述中我们可以得出以下结论:統计学的技术手段是,搜索、整理、分析、描述数据,它的目的是预测、推断检测对象的本质,它是一门综合性非常强的科学性学科。从它的使用广度上来看,它几乎覆盖了社会科学和自然科学的各个领域。所以统计学的“势力”非常大。

而统计学所依赖的基础则是数据,传统的统计学中数据的收集主要包括实验数据、调查数据以及各种途径收集到的第二次数据。但是在经过一段时期的实践后人们发现这种方法得到的数据经常会存在一定范围内的误差,这对样本的客观性是一个根本上的影响,同时样本选取结果产生影响,因此传统的数据收集方法很难适应统计学的飞速发展的需要。从这个层面上来说,大数据的出现是科学发展到一定阶段的必然结果。因此大数据的产生和统计学的发展有着密不可分的关系。从另一面来看大数据的出现也是统计学中的核心环节实现,也就是数据的采集实现了大幅度的跨越。大数据时代的到来意味着检测对象的任何数据都能应用到统计过程中,打破了数据采集处理的局限性,再加上精准、合理的统计处理方法,使得统计结果将更具有代表性和说服力。

同时大数据、统计学、云计算技术三者的强强联合,预计未来的统计学势必会发生革命性的变革。大数据将对未来产生深刻影响,目前可以预见的统计学未来发展的前景有以下两个关键的点:第一点是在数据中科学性将和数据本身形成联盟。数据科学独立门户成为一门专门的学科势不可挡,数据的重要性不言而喻。统计学也将乘浪前行迎来新的发展的奇迹。对于数据平台,也将实现跨领域共享,最终将数据的共享扩展到企业层面,成为未来产业的一员。第二点则是数据的管理处理的竞争力大大增强,数据管理成为企业竞争力中的核心竞争力,直接关乎财务表现。数据资产是一个企业的核心资产,这个理念会逐步深入人心。之后,企业对于数据管理便有了更加精准的定位,企业就会将数据管理作为企业核心竞争力,持续发展,战略性规划与运用数据资产。数据资产管理效率与主营业务收入增长率、销售收入增长率显著正相关。届时,统计学的相关知识将会有大作为,每一位统计学专业的学生的就业前景将是不可估量的。统计学的发展前景也是一片大好,大数据、云计算、统计学三者则是珠联璧合,我国乃至全世界的信息技术又会迎来新的浪潮,并且是一浪高过一浪,让我们拭目以待。

五、结束语

本文就大数据,统计学二者的定义、概念首先做了介绍。其次是对统计学和大数据包括云计算在内的联合后的优势,以及未来的发展前景做了合理的分析与预测。数据时代已经起航,我们每一个人万万不可落后,我们要追赶信息技术的时代潮流,乘风破浪,迎难而上。为我国信息技术的发展增砖添瓦,为实现自我的价值奋斗不息。

参考文献: 

[1] 薛艳.大数据时代统计学专业教学体系的改革[J].教育教学论坛,2015(4):110-111. 

[2] 周茂袁.大数据时代统计学专业教学改革的初步探索[J].教育教学论坛,2015(35):105-106. 

篇4

中图分类号:G258.6 文献标识码:A 文章编号:2095-5707(2017)01-0040-07

Abstract: Objective To provide references for the resources construction of university libraries, business process optimization, user behavior research, and reader service improvement. Methods Excel 2010 was used to analyse the circulation data of 2013-2015 undergraduate, graduate students, international students, teachers and other readers from the Aleph 500 automated management system. Results In 2013-2015, there were downward trends of the numbers of visitors and the borrowed books. The numbers of borrowed books were more prominent in March and September. Lending period presented 10:00, 16:00, 18:00 and 20:00 four peaks. Book categories mainly focused on R, I, H, and so on. There were obvious regularities of borrowing preferences of students of various subjects. Conclusion Libraries of medical colleges and universities can increase self-service publicity, adjust human resources according to the borrowing situation, strengthen the construction of library resources, and pay attention to the reconstruction of the space and the arrangement of the environment.

Key words: Capital Medical University; libraries; circulation; data analysis; reader services

流通借阅是高校图书馆开展的基本业务之一,流通借阅数据分析是图书馆文献资源建设、业务流程优化、用户行为研究、读者服务提升的重要依据。随着网络技术对人们阅读行为的改变,图书馆已经从知识收藏中心向学习中心转变。各高校图书馆越来越重视对流通借阅数据的分析挖掘,通过对借阅率与学生学习状态相关性分析、探索用户利用图书馆馆藏资源现状,挖掘用户行为,提出相应的服务对策[1-9]。本文通过对首都医科大学各类型读者在图书馆中产生的流通借阅数据进行深度分析,力图为图书馆文献资源建设、用户服务和空间利用提供参考依据,充分发挥图书馆的文献保障与学习支持功能。

1 资料与方法

以首都医科大学2013-2015年的本科生、研究生、留学生、教师等各类型读者产生的流通借阅数据为研究对象,数据均来自首都医科大学图书馆使用的Aleph500自动化管理系统,应用Excel 2010统计分析读者到馆情况、借阅率、阅读偏好等。

2 结果

2.1 到馆情况

首都医科大学图书馆2013-2015年读者到馆及借阅情况如表1。整体上,到馆次数2013年最高,2014年各月份均出现大幅下降,2015年有所回升,但仍低于2013年;借阅人数各年度和月份变化较到馆情况变化相对较小。可以看出各年份、各月份到馆借阅率均低于7%,2014年9月最高为6.99%,3年的平均到馆借阅率为2.84%。

2.2 借阅情况

图1所示为首都医科大学图书馆2013-2015年每年1~12月份的借阅册数情况,可以看出每年的借阅情况逐月分布情况较为规律,通常每年2月、8月为寒暑假时间,借阅量较低,3月、9月为开学初,借阅量明显较大,紧接着又呈现逐月下降的趋势。2013-2015年借阅量逐年递减。2013、2014年借阅量分别为53 651、40 198册,下降25.08%;2015年借阅量为36 253册,相对2014年下降9.81%。3年的到馆人均借阅册数分别为4.54、4.15和4.06册,均呈逐年下降趋势。2015年3月、9月时间段的借阅量尤其突出。

图2为2013-2015年各时段12个月份的平均值,整体上分时段借阅量有4个波峰,分别在10:00、16:00、18:00和20:00左右出现。其中16:00的波峰最明显,相应的借阅量最多;其次是上午10:00、晚上18:00和20:00;晚间的借阅量比上午11:00-14:00之间的借阅量还要高。

依照《中国图书馆分类法》22基本大类对首都医科大学图书借阅量进行统计,结果如表2所示。可以看出2015年占借阅总量排名前三的类分别是R类占42.97%、I类占20.84%、H类占9.22%,前三类占总量的74.03%;其次是Q类4.55%、O类4.04%、T类4.04%、K类3.77%、B类3.72%、C类1.53%;其余均低于1%;借阅量高于4%的前6类占阅读总量的85.66%。

各类图书占本类馆藏百分比可以用来衡量某类图书的利用率。表2可以看出I类借阅量占本类馆藏百分比为12.95%,此类图书利用率最高;其后依次是Q、B、J各占本类馆藏百分比分别为7.63%、7.36%、7.02%;后面依次是R、C、H、K、O、P借阅量占各类馆藏百分比在5.26%~6.77%之间;其余均低于5%。

表3详细分析2015年各月份各类图书借阅量,各个月份的22基本大类情况趋于一致,R(医药、卫生)、I(文学)、H(语言、文字)等3类图书借阅量明显较多,其次是Q(生物科学)、O(数理科学和化学)、T(工业技术)、B(哲学)等4类。9月份为借阅高峰,各类图书的借阅量都高于其他月份,其次是3月份也相对较多,3月份和9月份借阅量分别为6200、6380册;2月份及8月份寒暑假期间,借阅量均低于200册;7月份有一半时间是暑期,借阅量为1760册,比正常月份稍低;其余月份均在2000~4000册之间。

表4列出了2013-2015年的外借次数排名前20位的二级类目。可以看出2013-2015年3年借阅量排名前5位均为中国文学、基础医学、常用外国语、中国医学、临床医学;6、7位为预防医学及卫生学、内科学,但排名稍有变化;其后是欧洲各国文学、自动化技术及计算机技术、外科学、药学、美洲各国文学、心理学、亚洲各国文学、化学、神经病学与精神病学类目,排名各年份稍有化;其余是中国人物传记、分子生物学、数学、法律、中国史类目。整体上来看排名前20位的二级类目2013-2015年变化不大。

2.3 各学科学生借阅偏好

由于系统内部不能获取研究生、博士生的具体学科类别,仅选择2015年本科生各学科借阅图书排名前10位的二级类目,然后综合各学科前10位的二级类目,共得到口腔、临床医学、中药学等12个学科30个二级类目的借阅情况(见表5)。

可以看出各学科学生借阅图书有一定共性,同时也非常有学科特色。横向来看,基础医学、中国文学和常用外国语是所有学科的学生借阅量都比较大的二级类目。纵向来看,临床医学学科学生人数总体较多,呈现出借阅量整体较高的情况,所借图书的学科范围也最广泛,包含各国文学、常用外国语、中国哲学、心理学社科类;基础医学、临床医学、中国医学、内科学、外科学、神经病学与精神病学医学各科、自动化技术及计算机技术等。中国文学、常用外国语这2个二级类目在各专业借阅量都在排在前10位,除此之外,中药专业学生侧重中国医学、基础医学、化学、药学二级类目;护理学专业的学生侧重临床医学、基础医学;公共事业管理学科的读者侧重预防医学和卫生学、自动化技术及计算机技术、心理学;中医学专业侧重中国医学、基础医学、心理学;生物医学工程学科的读者相对更关注自动化技术及计算机技术、数学、无线电电子学及电信技术;药学专业的学生侧重化学、药学、心理学;基础医学侧重基础医学和各国文学;康复治疗专业学生侧重基础医学、临床医学和心理学;法学专业学生侧重法律及预防医学和卫生学;儿科学生较多关注基础医学、内科学、药学、心理学。

3 讨论

综合分析2013-2015年首都医科大学图书馆各类型读者的流通借阅数据,可以看出到馆人次及借阅数量呈逐年下降趋势,借阅的月份、时段、图书类别及各学科学生借阅偏好具有明显的规律性。基于2013-2015年流通借阅数据的分析,高校图书馆应采取以下措施,更好地服务读者,提升服务质量。

3.1 加大自助服务宣传

自助服务指在一定的条件下根据用户的阅读兴趣、需要偏好来完成的书目查询、藏书借阅、资料检索、文献复印、学习空间使用等活动,从而实现自主服务的一种读者服务方式[10],北京大学、清华大学、上海交通大学、厦门理工学院乃至国外高校图书馆都在不断探索自助服务新方式[11-15]。自助服务逐渐成为流通借阅服务的主流服务方式。我馆统计数据表明,自助借阅服务占所有借阅量的60%以上,可以继续加大自主服务宣传,培养读者自主服务方式,提倡师生自主完成图书借还服务。

3.2 根据到馆借阅情况调整人力资源

传统的老馆舍由于要开设不同的阅览借阅室,人员尤显不足,根据到馆人数、借阅数据,在借阅高峰如每学期开学之初,加大人力投入,每天的10:00,16:00,18:00,20:00几个借阅高峰时段适当增加一线流通人员数量,保证服务质量,非借阅高峰可以适当缩减人员。

3.3 加强馆藏资源建设

除了保证医学特色资源建设以外,适当增加文学、生物科学、哲学、艺术等类图书,与院系紧密集合,针对不同的专业学科适当补充各学科个性化需求。加大电子资源的使用宣传。提供读者来馆随时荐购、书展现场采购、学科馆员推送、微信、网站等多渠道荐购图书。

3.4 注重馆舍空间改造

读者来图书馆,很大程度上是利用馆舍空间环境,所以传统图书馆的馆舍空间改造,人文环境优化尤为重要。首都医科大学图书馆设立了研究生自习室、研讨室等,并进一步细化阅览室学科功能,如我馆2009年成立了外文图书阅览室,使用馆员自创的作品装饰优化内部装饰、提升人文气息,现已成为吸引读者休闲阅读的重要场所。2015年9月成立了社会科学阅览室,收藏A~G类图书,促进社科图书的管理流通,自开通以来,借阅量较之混杂在自然科学大书库一起流通时有了显著提高。

4 小结

在大数据环境下,对于图书流通借阅数据进行有效的分析,能够为图书馆改善提升服务质量,深度挖掘用户行为,揭示其潜在的规律,为图书馆科学管理、资源建设和学科服务提供依据与参考。图书馆服务应结合用户统一认证系统、电子资源访问情况对借阅数据进一步挖掘,充分发挥图书馆的信息保障与学习支持作用,丰富图书馆的馆藏资源,优化图书馆空间环境,提高图书馆资源的利用率,有针对性地对不同学科的读者开展个性化服务,为图书馆科学管理提供事实依据。

参考文献

[1] 乔慧君,周筠B.高校图书馆借阅率与学生学习状态关系研究[J].大学图书馆学报,2015,33(1):55-60,50.

[2] 郑毅,叶翎,杨峰.医学院校图书馆中文图书利用率分析[J].医学信息学杂志,2010,31(12):82-85.

[3] 杨军花,聂江城,王刚.用户利用高校图书馆馆藏资源分析及对策研究――以南开大学图书馆借阅统计为例[J].图书馆工作与研究, 2011(5):66-70.

[4] 牛玉兰,王德强.医院图书馆读者借阅统计分析及其对策[J].医学信息学杂志,2008(2):53-55.

[5] 姬曼姝.高校D书馆流通借阅现状的统计分析――以内蒙古师范大学图书馆为例[J].图书情报工作,2013,57(S1):178-181.

[6] 何祯,司徒俊峰.高校图书馆“借阅无限量”的实践与思考――以中山大学图书馆为例[J].大学图书馆学报,2015(4):14-18.

[7] 陈进,刘宝杰.从未被借阅图书数据分析医科大学图书馆LIB2.0的应用[J].医学信息学杂志,2009,30(9):76-78.

[8] 陈娟,洪丹.基于Logistic模型的高校图书馆用户借阅影响因素分析[J].情报科学,2013,31(3):96-101.

[9] 韦耘耕.从图书馆流通数据分析读者阅读倾向及馆藏结构[J].医学信息学杂志,2010,31(2):75-78.

[10] 陈武,姜爱蓉.构建以自助服务为导向的现代图书馆[J].大学图书馆学报,2013(3):93-96.

[11] 高桂英,黄涛,聂华.图书馆自助服务的个性化应用――北京大学图书馆的实践与经验[J].大学图书馆学报,2011(4):77-80,121.

[12] 邢卓媛,孙翌,曲建峰.多终端环境下图书馆实体场馆自助服务的设计与实践――以上海交通大学图书馆为例[J].图书馆工作与研究, 2016(4):45-51.

[13] 凌宇飞.高校图书馆自助服务现状研究及发展策略[J].图书情报导刊,2016,1(5):62,156.

[14] 施航海,苏文辉.图书馆一站式自助离馆服务系统构建――以厦门理工学院图书馆为例[J].图书馆学研究,2016(16):65-69.

篇5

一、SPSS统计软件特性分析

(一)SPSS统计软件应用范围

SPSS(Statistical Product and Service Solutions),是一种“统计产品与服务解决方案”软件。开始时它的全称为“社会科学统计软件包”,但最后被命名为“统计产品与服务解决方案”。它最初用于统计学分析运算、数据挖掘、预测分析和决策支持任务,有Windows和Mac OS X等版本。后来随着SPSS公司对这款软件的更新与改进,它的应用范围也逐渐扩大起来,它在自然科学、技术科学和社会科学等方面都有涉及,并且都收到使用者的好评。世界上许多著名的杂志报刊都对SPSS统计软件的各方面功能做出了很高的评价。

(二)运用SPSS统计软件的实例分析

某高校要对大学生党员素质进行评价,以便于对发展和培养当代大学生的工作实践。他们首先选取了“道德品行”“政治素养”“学习能力”“工作能力”“心理素养”这五个方面对大学生党员素质进行评价,然后要求被调查者根据自己对党员的要求来判断学生党员是否能做到其中一点。其中1表示“非常不同意”、2表示“不同意”、3表示“不能确定”、4表示“同意”、5表示“非常同意”。从发出的300份卷中筛选出有效的188份,然后用SPPS统计软件对分卷信度用克隆巴赫系数测量,该系数表示的是问卷调查结果总变异中由不同被调查者导致的比例占多少,整个问卷和各个子问卷的克隆巴赫系数如下表所示:

为了验证所获得数据的有效性,该试验还进行了Bartlett’s Test和KMO指标验证。Bartlett’s Test检验的sig为0.000说明参与分析的数据来自正态分布的总整体,而KMO的取值在0到1之间,所得到的值越接近1,表明这些变量对因子分析的效果越好,这些因素很好的解释了大学生优秀党员应当从什么地方开始培养,而SPSS统计软件则是验证了这些因素的有效性和可信度,为大学生党员的培养工作提供科学依据。

二、大学生职业素质评价模型构建

(一)大学生素质评价模型研究背景

随着时代的前进和科学技术的发展,现代年轻人的思维也追上了时代的最前端。步入大学殿堂的“90后”一代年轻人,他们追求自我和个性的特点越来越显著,教育工作者对大学生职业素质的培养与分析也遇到了挑战。如何根据大学生的特点来构建素质评价模型是新一代教育工作者需要考虑的问题。

(二)SPSS统计软件对大学生职业素质评价模型构建的作用

对大学生职业素质评价要从学习能力、工作能力、政治思想、心理素质四个因素考虑,这四个因素涵盖了大学生的外在处事能力和内部思想,是对一个人的综合职业素质比较全面的评价。大学生的职业素质评价模型由这四个因素构成。运用SPSS统计软件对这几个因素进行分析,可以看出这些因素对职业素质评价所占比重的大小,然后根据各个因素所占的比重构建大学生职业素质评价模型,得出科学的评价方法和评价重点。

(三)SPSS软件对大学生职业素质评价情况分析

运用SPSS统计软件对大学生职业素质进行数据统计分析,可以了解到我国当代大学生需要培养的职业素质,也可以看出在校大学生对自身优秀职业素质的期盼和要求。大学生的职业素质涵盖了学习、工作、政治、心理等四大方面,以大学的具体生活为基础,由校园小范围扩大到社会这个大范围,具有很强的现实指导意义。运用SPSS统计软件,可以得出大学生职业素质评价的重点,让大学生充分了解到自己达标和不达标的地方,加以改正。

三、结论

对大学生的职业素质进行评价是大学生发展阶段中的必要条件。大学教育的目的在于让大学生成长和发展,让他们掌握更多的知识技能,认清自己与社会外界的关系,有助于自己以后的工作和生活。而在SPSS统计软件的分析下,可以看到大学生的职业道德素质由多种原因共同决定,因此我们可以知道,只有多方面的对大学生进行教育,才能使大学生形成良好的职业道德素质,做一个对社会、对国家有用的人。

篇6

关键词:

大数据;人才培养模式;教学模式

2015年9月5日,我国政府公开《国务院关于印发促进大数据发展行动纲要的通知》,大数据逐步走上我国经济社会发展的大舞台,在社会各个领域中发挥着巨大的促进作用。高等教育作为我国培养高素质人才的主要阵地,避免不了受到大数据的冲击和影响。有效利用大数据是化解冲击并促进高等教育改革的明智之举。高等教育改革的关键是改革人才培养模式,将大数据融入人才培养模式改革的各个环节会达到事半功倍的效果。

一、大数据引领统计学专业人才培养模式的改革方向

1.大数据引领培养目标的改革方向。随着大数据的迅猛发展,大数据分析公司不断涌现,传统的调查公司、数据分析公司纷纷转型,社会急需大量的大数据分析人才。统计学专业按以往培养目标培养的数据分析人才已经不能满足社会需要,因此必须对人才培养目标进行改革,培养目标应从培养专门的统计人才转换为培养精通统计学知识、计算机技术(大数据分析技术),了解相关行业背景的复合型统计人才,保障统计学专业能够为社会经济发展输送高质量的大数据分析人才。2.大数据引领课程设置的改革方向。课程设置是实现培养目标的关键环节,为实现培养大数据分析人才的目标,课程设置应该与培养目标相配套。课程设置的核心课程中应该引入大数据技术相关的计算机软件、语言及算法课程,选修课程中应该增设一些辅助大数据分析的数据挖掘类相关课程及不同行业的相关专业背景课程。3.大数据引领实践教学的改革方向。实践教学环节设计的基本原则是能够有效检验理论教学环节的学习效果,同时锻炼学生的分析问题,解决问题的能力。因此,相应于培养目标和课程设置的改革,实践教学环节的改革应注重学生大数据分析能力的检验和锻炼,积极为学生创造丰富的大数据分析实践机会。例如,在调查分析课程中引导学生改变传统的调查方法,尽量通过数据挖掘揭示某一类现象背后的发展规律,积极开展与大数据分析公司或者相关行业的企业的合作,为学生进行大数据分析实践提供数据及技术支持。4.大数据引领教学方法和手段的改革方向。MOOC、翻转课堂和大量的在线资源的出现为统计学专业教学方法和手段的改革提供了丰富的资源基础,有效构建充分利用各种资源的混合教学模式将成为统计学专业人才培养模式改革的一个重要组成部分。5.大数据引领评价方法的改革方向。传统的评价方法主要注重期末时的总结性评价,忽略过程评价,因此应广泛和合理利用教学各个环节留下的痕迹,即形式各样的数据,创新教育教学评价方法,以此达到对学生、教师及教学效果的科学评价。

二、大数据融入统计学专业人才培养模式的构建

1.大数据融入人才培养目标的制定。人才培养目标的制定一方面要适应经济社会发展的需要,另一方面要从生源质量,办学条件出发,不能盲目追求高目标,因此适当对本校统计学专业历届生源质量和办学软硬件条件等相关数据进行挖掘和分析,有利于制定切实可行的人才培养目标。当然这需要人才培养目标制定者有一定的数据挖掘和分析的能力,需要学校各个相关部门的配合,实际操作起来存在一定困难。2.大数据融入教学方法和手段的选择。教学方法和手段的选择一方面依靠丰富的资源,打破传统的大客厅式的封闭教学模式,另一方面要注重以学生为本和因材施教,这就需要对每个学生的基本素质有客观的把握,仅靠教师的力量很难做到这一点,因此应适当引入相关技术和设备帮助收集课堂教学,课后作业等教学各个环节的实时数据,利用大数据技术全方位综合考量每一位学生的基本素质,为教学方法和手段的选择提供客观的依据,真正意义上做到因材施教。对于一些利用计算机或其他电子设备完成的环节,收集数据的同时,应适当建立针对不同学生的教学策略,以此实现个性化教育。3.大数据融入实践教学环节的设置。统计学专业的实践环节设置应充分考虑利用学习分析和数据挖掘技术分析学生的学习心理,学习行为及学习能力,充分了解学生的前期学习情况,分析教师课堂教学水平和教学能力,充分挖掘教师的特长,以此为基础打造实践教学环节师生的完美匹配,不再拘泥于一个班级或一个专业的学生同时进行相同的实践项目,可以有效提高实践教学的水平和学生的实践能力。4.大数据融入教学评价体系的完善。传统的教学评价体系不能够客观评价人才培养的各个环节的效果,通常是对结果的评价。因此,学校需要利用大数据技术全面分析和挖掘每一个环节的相关数据,包括学生的学习过程,教师的教学过程等,有效利用数据说话,避免对学习效果及教学效果的片面评价,完善统计学专业的教学评价体系。大数据为统计学专业人才培养模式的构建带来了机遇的同时也提出了挑战,我们不能盲目跟风,应认真结合统计学专业学科特点及各方面的条件,合理利用大数据,构建切实可行的人才培养模式。

参考文献:

篇7

一、相关概述

大数据环境下经济社会生活都出现了较大的变化,同时自然科学和人文科学等也都有了较大的提升。在此背景下,依靠计算机信息技术的不断发展,研究者能够使用一定的方法和技能对较为复杂且规模较大的海量数据进行数据处理,并有效挖掘其中的价值信息。大数据环境为统计学的研究和发展提供了好的机遇,同时也对统计学的拓展提出了一定的挑战。

大数据环境下数据在各个行业和领域中都有所渗透,并逐渐成为主要的生产要素。大数据本身具有价值密度低、数据体量大、数据类型多、数据处理速度快的特点。不过由于数据量的急速增长,也使得在数据分析和研究过程中由于数据库缺少必要的管理工具进行数据采集和管理,而导致数据搜索、数据分析、数据存取和数据共享等出现一定的困难。一般情况下,在大数据环境下,往往存在着数据存储、处理技术、数据安全等相关的技术性问题。这些问题的存在一定程度上影响和制约了数据的开发和应用效率。尽管大数据下进行数据分析存在一定困难,但是其在实践中的应用空间和领域却十分广泛,对于经济社会的发展具有重要的推动力。

二、大数据环境下数据分析过程分析

(一)数据的价值挖掘过程

面对海量的大数据环境,数据使用者应当围绕数据分析目标和具体要求对大数据进行有效挖掘,提取有用数据,摒弃无用数据,从海量数据中进行价值挖掘,结合数据类型提升数据使用价值。在进行具体的大数据挖掘时可以按照具体的案例来进行,比如在进行广告人群匹配时,在进行数据分析和数据挖掘上主要是面对着两种数据。一种是广告库数据,主要包含了广告库以及广告的客户信息等。这种数据一般都具有较高的结构性,能够在传统的数据库中进行采集和应用、分析。另外一种数据是客户的后期行为数据。通过对此两种数据的结合分析,有效挖掘其中的有效价值。与此同时,在具体的应用实践过程中,还需要积极发挥第二种信息的作用和价值,这样能够获得客户所需的信息。依靠对群体行为和群体智能的分析,最终形成具体的反馈机制和反馈流程,在此基础上为信息使用者提供优质可靠的数据处理信息,为信息使用者科学决策提供有效的信息和数据支持。

(二)数据的处理与分析过程

在此过程中,一方面要及时更新抽样调查的工作理念。一般情况下,大数据的样本资料都是之前的材料汇总,这就要求在对此数据进行分析处理时应当首先对数据整体进行梳理和了解,并逐步向数据局部进行延伸。同时在对海量数据进行分析处理时还应当解决好调查目标设定不合理、抽样框架不稳定以及样本数量受限制等问题。另一方面,也要进一步提升大数据环境下数据精确度标准。由于大数据环境下数据的来源比较广,数据处理质量和效果也各有差异,因此应当在允许数据之间存在准确度差异的同时提升数据精准度的标准。要在积极吸收各种数据资源的基础上,提升数据处理能力和质量,科学应对数据复杂性和变量关系复杂性等问题。除此之外,也应当围绕大数据中的数据分析,对数据关系的分析重点进行合理转换。既要重视对数据中因果关系的分析和梳理,同时也要重视对事物之间相关性的分析研究,及时转换分析思路,围绕数据分析目标和事物之间关联关系进行大数据环境下的数据分析工作。

三、大数据对统计的影响分析

(一)能够进一步拓展统计学研究领域

大数据环境对于各个研究领域都能够产生比较大的影响,对于统计学也是一样。统计学研究的是客体、客观事物之间的数量关系和数量特征,数量性是统计学研究对象最为主要的特征。由于在传统的统计学研究实践中实验数据和调查数据是最主要的研究数据,因此在大数据环境下,统计学研究对象既包括了之前的结构化数据,同时也包括了非结构化数据,这些非结构化数据不能够单纯地依靠数量关系来加以衡量和表示。这其中就包括了文本、声音、图片、动画等数据信息。从这个意义上讲,大数据环境下统计学的研究领域有了较大范围的扩展。

(二)能够对统计计算的规范性产生影响

按照传统的统计学研究方法,在反应事物量的特征时大都是依靠方差、平均值、相对数等来进行,这些研究方法能够反映出事物之间的界限和关系,并且也能够依靠数据计算规范来反映出具体的数据。不过在当前的大数据环境下,非结构性数据常常难以使用传统的数据计算规范来加以计算。从这个角度上讲,大数据环境下统计的数据计算规范也受到了较大的挑战。

(三)能够对统计的数据整理和分析过程产生影响

统计学中数据审核之前主要是针对数据的完整性和准确性。不过在当前的大数据环境下,数据审核除了要保障原先的数据完整性、准确性外,还应当保证数据审核的速度、效率以及数据预测的准确性等。除此之外,还应当准确确定数据处理的规模,合理确定数据量的级别。尽管大数据自身具有混乱性和不稳定性的特点,但是使用合理的数据整理方法也能够在大数据中有效挖掘出数据之间的隐蔽关系,提升数据挖掘的价值性。因此,大数据下统计研究对象本身具有准确和不准确两种情况,它们分别具有不同的价值属性,一般情况下不需要对其进行删除或者替换。

对于数据存储来讲,之前的统计研究数据存储过程中都是将审核、汇总或者编制的表格、图表等,并将它们进行适当的保存处理。不过在大数据环境下进行数据的保存就还需要重视数据存储成本的管控,并结合自身实际制定规章制度和计划合理确定数据存储的规模和目录。

(四)能够对数据开发和利用过程产生影响

这主要涉及大数据环境下数据的积累、开发以及应用。在传统的数据统计工作过程中,研究者都是围绕自身目标来对相关数据进行分类和汇总,通过存储和提取过程,对数据进行有效挖掘,并在此基础上为后续的数据分析和查询提供支撑。大数据环境下,数据量比较大,只有对数据信息进行适当处理才能够获得其中价值量比较高的信息。正是基于大数据自身的复杂性,统计研究者应当对前期数据进行适当处理。围绕数据的规模和结构、层次等进行合理分类和汇总,在确保真实性的同时提升数据的价值性。与此同时,由于大数据环境下数据具有流动性特点,使得数据本身也具有再生性特征,并进一步增加了数据的价值性。因此有必要针对统计研究中的大数据进行深入的数据挖掘,依靠数据整合提升数据价值性。在数据应用上则主要是针对统计学现象的预测和解释,实现在大数据环境下数据相关关系的预测和分析。

总的来讲,大数据环境不仅改变了经济社会生活,也对统计等相关科学产生了巨大的影响,如何实现大数据环境下的统计研究是统计学领域的重要课题。进一步强化对大数据的理解和把握,重视大数据在统计中的研究和应用,有效分析和挖掘大数据中的价值信息,更好地推动统计学的理论和实践应用。

(次世青、高东宇单位为首都航天机械公司;次青波单位为中国航天标准化研究所)

参考文献

篇8

二、基于大数据分析的特点科学构建课程体系

大数据背景下,人们可以通过互联网、数据库以及各种通信工具获得海量数据,人们日常生活、学习和工作的各类事物都可以实现信息化,世界几乎是由各种信息和数据所构成的。大数据的特点可以归结为四个V,数量大(Volume)、类型繁多(Variety)、价值密度低(Value)、速度快时效高(Velocity)[6]8-9。大数据的真正意义不在于能提供庞大的数据量,而是对海量的数据进行专业的处理和分析,并从中获取用户关注的信息。结合当前互联网应用中大数据本身的特点,从大数据中挖掘出重要知识并对之深度学习和分析的工具和方法也应与时俱进地发生改变,传统的统计方法和统计分析工具已无法满足大数据分析的需要。然而,在大多数高等院校中,统计学专业人才培养的课程体系并没有考虑社会的实际应用需求,仍然停留在以传统的统计模型框架为主导的课程体系设置,本科生教育的主要专业课程包括:数学分析、高等概率论与数理统计、应用随机过程、回归分析和多元统计分析等[10]248-249,这些课程内容和知识结构还不足以满足大数据时代对数据分析专业人才知识结构的要求,课程体系设置中缺少能有效整合的数据分析能力培养模块[11]66-68。因此,有必要针对各类院校师生各自的专业特点和学科基础,分层次、分阶段地展开课程体系改革。(一)参考国内外先进高校大数据分析专业的课程设置,结合本校的师资和专业结构特点采取灵活的策略制定课程计划,在实施学分制改革的高校中各类学生可以在学业导师指导下实施符合学生自身特点的课程学习方案。(二)以大数据分析人才需求驱动的课程体系改革要考虑市场的行业需求变化、大数据应用中跨学科的特点。素质好的数据分析人员不仅仅要具备专业的数据分析能力,还应该对具体数据中涉及的学科知识有较好的储备,能将不同行业的专业知识与数据分析紧密关联起来,实现大数据分析的效用最大化。此外,在充分借鉴国内外大学成功经验的基础上,课程设置应该与学生的学术倾向和基础能力紧密结合,注重基础课程教育的同时强调文理渗透,同时要兼顾学生的兴趣与学习的联系,在课程体系的设置中需要增设一些多领域、跨学科的选修课程,如经济学、金融学、保险学、管理学和会计学等。因此,校内跨学科或高校与高校之间联合培养是实现跨学科课程建设的有效方法之一。(三)科学构建课程体系的主要思路还包括根据大数据时代需求,对专业必修和专业选修课程在课程时间、顺序及内容等方面进行改革。专业必修课程重点内容为统计学和计算机科学的交叉部分,在讲授统计基础理论(如多元统计、决策树、时间序列等)课程基础上设置大数据案例分析课程,在案例分析过程中让学生实际操作企业当前应用的大数据计算平台[6]8-9,从而增强学生大规模分布式计算技能。为提高学生的实际动手和二次开发能力,专业选修课程需更多地开设与数据挖掘及面向数据的编程语言相关的课程,如数据挖掘算法、C++、Java和Python等课程,强化学生的数据挖掘和分析能力。

三、基于协同创新的理念开展实践教学改革

篇9

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2014)49-0248-02

随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、互联网应用的丰富,更多的传感设备、移动终端接入到网络,由此产生的数据及增长速度将比历史上的任何时期都要多,都要快。“大数据”时代已经来临,它对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。大数据是指海量数据集,其来源包括动漫数据、企业IT应用带来的数据、博客、点击流数据、社交媒体、机器和传感数据等。它是互联网、电子商务的又一次重大革命,对数据处理、数据挖掘、数据分析提出了新的挑战。如今互联网行业、电子商务行业中的数据应用及分析已经相当普遍,为了应对大数据时代的要求,同时要具备较强的统计学功底和娴熟的计算机软件运用能力,而今完全具备这些能力的数据分析专业人才是极其匮乏的。数据分析师便应运而生,不仅互联网行业、电子商务行业需要大量的数据分析师,近年来项目数据分析事务所不断涌现,而项目数据分析师因其专业技能及量化的数据分析为客户以及所在单位控制决策风险、保证利益最大化而备受各界青睐,以待遇优厚和地位尊崇而闻名国际,也被视为我国21世纪的黄金职业。《华商报》将项目数据分析师纳入了新七十二行,《HR管理世界》将项目数据分析师评为七大赚钱职业。本文就如何在统计学专业开展数据分析方向进行了阐述,首先论述了数据分析的重要意义,其次讨论了数据分析方向的课程构建,最后分析了如何加强理论与实践环节的结合。

一、数据分析的重要意义

大数据预测美国总统:美国时代周刊报道称,数据驱动的竞选决策才是奥巴马竞选获胜的关键。数据分析团队在筹集竞选经费、锁定目标选民、督促选民投票等各个环节的决策中都发挥了重要作用。这意味着华盛顿竞选专家的作用极具下降,能够分析大数据的量化分析家和程序员的地位却大幅提升。如今从事专业数据分析工作的企业如项目数据分析师事务所、数据挖掘公司等都应市场需求而大力发展,并且受到风险投资的青睐。如美国社交数据挖掘公司Datasift于2012年宣布,获得1500万美元风险投资。2013年,DataSift成为Twitter的“认证合作伙伴”,主要负责海量微博社交数据分析。这是该公司今年第二笔融资,五月份其曾融资720万美元。又如面向开发者的大数据应用软件平台服务提供商Continuity最近获得1000万美元的融资,目前融资总额已经达到1250万美元。

数据分析的应用无处不在,那什么是数据分析呢?数据分析就是用适当的统计方法对数据进行分析,以求最大化地开发数据的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析技术不仅能通过对真实数据的分析去发现问题,还能够通过经济学原理建立数学模型,对投资或其他决策是否可行进行分析,预测未来的收益及风险情况,为做出科学合理的决策提供依据。在提高工作效率的基础上,也增强企业管理的科学性。无论是在国家政府部门,还是企事业单位中,数据分析工作都是进行决策和做出工作决定之前至关重要的一个环节。因此,针对项目可行性、风险承载力、投资回报率以及相关经济效益指标等方面的分析工作显得格外重要。在这个工作过程中,专业的数据分析人员扮演着无比重要的角色,数据分析成果的质量高低直接决定着项目投资、企业经营决策计划最终的方向。所以,各个行业对数据分析人员的需求之多是不言而喻的。传统行业,如政府机构:一类是计委、经委、统计局等一些经济综合管理部门所设有的调研处、研究室和情报所。第二类是商业、粮食、物资、银行等经济主管业务部门会设有信息中心或调研室,从本系统、本部门的业务出发进行专业性调研,提供支持本部门的市场信息。而伴随着数据分析应用的扩大,其在新兴行业中也得到了发展,如计算机软硬件及IT行业、电子商务与网络游戏、金融保险、消费品、咨询业与广告媒体、大型设备与重工业以及房地产行业等对数据分析师的需求量很大,尤其是电子商务,由于利用互联网,能够比传统零售业具有更好的数据收集和管理能力,能积累海量的数据,因此更看重从海量数据中挖掘出用户偏好和市场机会。研究机构:比如市场研究公司、咨询公司、证券公司、研究院。自主创业:取得注册项目数据分析师(CPDA)资格证可以自主创建或就业于项目数据分析师事务所等。所以,数据分析的行业应用是极其广泛的,并且随着大数据时代的到来,数据分析尤其是数据挖掘将借助互联网的发展,逐步形成人们依靠的重点,并可能成为未来发展与竞争的重点之一。由此我们可以看到数据分析师的就业前景是非常广泛而乐观的,无论是数学专业、统计专业,还是计算机专业的学生,都可以通过系统的学习数据分析课程来适应对数据分析人才的要求。

二、课程体系构建

1.主干课程。主干课程包含高代、数分、概率论、数理统计、多元统计分析、时间序列分析、市场调查与分析、统计预测与决策、数据结构、C语言、数据分析、数据挖掘、大数据分析与展示。理论课程的学习可以使学生了解数据分析的基本内容,学会如何对已获取的数据进行加工处理,如何对实际问题进行定量分析,以及如何解释分析的结果。掌握几种常用数据分析方法的统计思想及基本步骤,并具备一定的分析论证能力。

2.实验课程。数据分析的操作离不开计算机。目前数据分析行业常用的一些统计软件有SAS、SPSS和R软件。SAS软件是一个模块化、集成化的大型应用统计系统。它的功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等。SPSS软件是一个社会科学统计软件包,是采用图形菜单驱动界面的统计软件,SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。R软件是一套完整的数据处理、计算和制图软件系统,包括:数据存储和处理系统、完整连贯的统计分析工具、优秀的统计制图功能、可操纵数据的输入和输入等功能。这三个软件在数据分析中针对不同行业的需求有不同方向的应用。

3.专业课程。从数据分析的行业需求出发,好的数据分析人员不仅要有较强的数据分析能力,还要有该行业的背景及相关知识的储备,这样才能将数据分析与行业特性联系起来,发挥数据分析的最大功能,即所谓的“因地制宜”。同时要兼顾学生的兴趣与学习的联系,需提供多领域的课程选择,如:经济学、金融学、保险学、管理学、会计学等。而在软件学习方面也要拓宽渠道,除了实验课程安排学习的软件,学生可根据自身发展意向再多掌握一些软件如:SQL数据库,熟悉office常用功能,尤其熟练运用Word和PowerPoint、Excel图表及数据分析等。同时还应该结合对数据分析师的要求设置一些相关课程:投资数据分析、市场调研与预测、预测技术分析、现金流量表编制、风险投资项目筛选、不确定性分析、编制数据分析报告等。

三、实践环节

培养数据分析的专业型人才目的就是为了学以致用。数据分析本身就是为了从数据中发现问题、建立模型、预测收益风险企业决策进而做出合理正确的决策判断。因此,学习了基本的知识和技能就要运用到实际操作中。学校可以和本地的数据分析事务所,或者大量需求数据分析人员的互联网行业建立实训基地,进行合作式教学,使得学生在实习的过程中能够理论联系实际,切身体会数据分析的商业操作体系,这样就能够促进学生有目的、有取舍地针对自身情况学习钻研,继而就能够培养出适应经济发展,满足市场需求的应用型人才。

四、结语

在大数据时代到来之时,数据分析在互联网中的应用将会空前广泛,与此同时对数据分析师的需求也将会井喷,无论是在军事、工业、企业还是在政治上,大数据分析都将会十分紧缺。因此,目前对数据分析师的培养刻不容缓。本文从分析数据分析行业发展及其重要意义、数据分析专业课程设置以及教学实践环节方面对构建数据分析课程体系进行了探讨。不仅从教学课程的内容上予以安排,而且更加注重引导学生自主学习,特别强调理论结合实践的合作式教学。希望能够结合行业需求合理地构建课程,培养出专门从事数据分析的项目数据分析师,从而能够满足市场需求和自身发展。

参考文献:

[1]范金城.数据分析[M].科学出版社,2010.

篇10

当前,大数据已经渗透到社会、经济、政治以及文化等众多领域。大数据在给各行各业带来了新的历史发展机遇的同时,也将给各行各业带来新的挑战。显然,对高等教育来讲也同样如此。相应的,对直接服务于经济统计人才培养的经济统计学专业建设来讲,迫切需要回答的问题是,在新形势下,专业建设遇到新的挑战又将是怎样的呢?进一步的,为了积极应对新的挑战又需要对旧的培养模式进行怎样的修正和改进呢?从现有的文献资料看,虽然学术界已经积累了大量与(经济)统计学专业建设相关的研究成果(如庞皓,1991;曾五一,1999;曾五一和尚卫平,1999;曾五一等,2010;朱宇兵,2009等),但基于大数据背景对这些问题较为深入的研究还比较缺乏,本研究则可以视为是对此进行弥补的一个努力尝试。

1经济统计学专业建设的发展现状

从某种意义上讲,经济统计学是一个新的专业。2012年10月,教育部颁布了《普通高等学校本科专业目录(2012年)》。在新专业目录中,除保留统计学为理学类一级学科(包括统计学和应用统计学两个二级学科)之外,在经济学类的经济学一级学科下增设经济统计学。正是在这样的背景下,目前我国高校经济统计学专业的开设一般有两种情况,一种是新专业目录颁布后新设立的,如中央财经大学、对外经济贸易大学、西南政法大学以及中南民族大学等;一种则是由原来的统计学专业更名而来的,如中南财经政法大学、天津财经大学、江西财经大学、南京财经大学以及中央民族大学等。从发展历史过程看,经济统计学并非是一个全新的专业,而是由以前的统计学专业发展而来。在1998年9月国家教育部颁布的《普通高等学校本科专业目录和专业介绍》中,统计学被列为理学类一级学科,但可选择授予经济学或理学学位。在这种背景下,根据具体的办学条件和偏好,各高校采用了不同的教育模式,一类是强调各类统计学所具有的共性。它肯定统计学的“理学性质”,按照理学类学科的特点设置课程。另一类则是强调各类统计学的个性,如财经类院校统计学专业(曾五一等,2010)。前者的数量较少,它是将统计学作为应用数学的一个分支来看待,所开设课程主要是数学和各种数理统计方法。后者数量占有绝大的比重,其专业方向包括国民经济统计、经济统计、管理统计、金融证券统计等(李宝瑜,2004)。从我国统计学学科建设的发展过程看,其特征主要表现为两个转变,即从起初的侧重理论培养向当前的强调实际应用转变以及从起初的主要服务政府部门向当前的主要服务社会企业组织转变。由于新专业目录颁布时间还很短,经济统计学专业还没有建立起新的培养模式,主要还是其前身———(经济学方向的)统计学——培养模式的一种延续。从我们掌握的资料看,目前各高校经济统计学专业的培养方案还主要是参照1998年《普通高等学校本科专业介绍》制定的,其培养目标是所谓的“复合型人才”,即具有坚实的经济理论基础,既懂数理统计方法、又懂经济统计方法,并能熟练掌握现代计算手段的经济统计人才(曾五一等,2010)。这种人才既是统计人才又是经济管理人才,不仅能胜任基层企业和政府部门的日常统计业务,而且能从事市场调查、经济预测、信息分析和其他经济管理工作。相应的,在具体的课程体系构建和安排上,各高校大都贯彻了“大统计”的学科观点,遵循“厚基础、宽口径、重应用”的复合型人才培养原则(向书坚和平卫英,2010),即在强调较为完整系统地介绍统计学主要理论和分析方法的同时,还强调其与经济学其他学科的密切联系,按照经济类学科的特点设置课程。也就是说,经济统计学专业的课程设置具有显著的二元性特征。从各高校的具体设置看,统计学方面的课程一般有数学基础课、概率论、数理统计、运筹学、随机过程、回归分析、时间序列分析、多元统计分析、抽样调查、非参数统计、统计预测与决策等;而经济学方面的课程一般则有微观经济学、宏观经济学、会计学、国际经济学以及与专业方向(如国民经济统计、财务会计统计、金融证券统计等)有关的课程。此外,和其他专业一样,经济统计学也重视学生应用和创新能力的培养,特别强调本专业的毕业生应该具有熟练地采集数据和应用计算机分析、处理数据的能力。因此,Excel、SAS、SPSS等常用软件的学习和训练也通常以实验课的形式被纳入到课程体系中。但是,要注意的是,我国各高校在制定或修订经济统计学培养方案时,有意或无意地忽视了当前随互联网技术日新月异带来的大数据海量涌现。而由于大数据和传统数据存在显著的差异,各高校现有的经济统计培养模式可能需要做出重大调整。

2大数据带来的挑战

大数据之所以在众多领域里引起关注,其根本的原因在于大数据蕴含着巨大的潜在价值。相对于传统的标准化数据,大数据不仅体量庞大、产生速率极快,而且也更为全面(甚至是整体数据)。因此,大数据的分析结果也更接近真实。换句话说,大数据分析往往意味着人们能够从这些全面的数据中获取新的洞察力,从而更有可能创造出新的价值,进而带来更大的发展。大数据蕴含的巨大潜在价值,势必将打破现有的数据边界,使大数据逐渐成为经济统计分析的主要对象。由于大数据与传统的标准数据存在显著的差异,对未来的经济统计工作而言,大数据势必将带来新的问题或挑战。简要地说,大数据带来新的问题或挑战主要来自于两个方面,即:

(1)数据来源问题。与传统数据主要来源于抽样调查或组织内部不同,大数据是互联网高速发展的产物。随着科技环境的巨变———个人电脑的全球普及,移动智能终端的盛行,物联网和社交网络的爆炸式发展,以及数以千万计的联网传感器节点在交通、汽车、工业、公用事业和零售部门等的广泛分布,这些都让数据的生产和收集的途径更为多元、更为广泛。不过,需要特别注意的是,由于其蕴含的巨大潜在价值,大数据已经成为了可以与物质和人力资本相提并论的重要生产要素和组织资产。相应的,对各类逐利组织(尤其是企业)来说,不仅需要考虑如何收集到大量的有效信息,同时也希望这些信息为其独自所占有,如最近阿里巴巴封杀微信、京东,断绝与社交网络新浪微博的账号合作。这种电商行业“封杀”现象的出现,其理由看似是如这些企业所宣称的那样为了保护公司的信息安全,但背后的根源其实是担心自身的内部商业信息通过互联网泄漏,担心用户流量的命脉被他人掌握。因此,在大数据时代,如何解决数据的封闭性问题将是经济统计工作数据收集面临的一个重要挑战。此外,对经济统计人才来讲,由于数据不再仅仅是标准结构的,资料收集新技术的开发和掌握也成为一种迫切的需要。

(2)数据分析问题。由于数据更多的是半结构化或非结构化的,传统的经济统计分析工具和方法可能不再有效。就大数据分析而言,经济统计工作需要解决的问题是如何从体量庞大且杂乱无章的各类数据中挖掘有效信息以创造新的知识和新的价值。在以前,数据很大程度上是指“数字”,如业务量、营业收入额、利润额、工业企业产值、固定资产投资、GDP等,都是一个个数字或者是可以进行编码的简单文本。而在大数据时代,人们不再是隐藏在终端和网络后面的隐形者,购物、社交、游戏、阅读、出行等信息都变成数据被收集到各种各样的储存设备中。而数据也不再是单纯的“数字”,还包括文本、图片、音频、视频等多种格式,其涵括的内容也更为丰富,如博客、微博、通话录音、位置信息、交易信息、点评信息、互动信息等。也就是说,数据不再只是结构化的,更多是广泛存在于社交网络、物联网、电子商务等之中的半结构化数据和非结构化数据。随着数据越来越大,越来越复杂,增长越来越快,要想建立和保持竞争优势需要对数据进行实时、有效的分析。而由于数据更多的是以半结构化和非结构化形式出现,过去传统的数据分析技术可能无法实现实时监测和分析。

3应对措施及建议

从个人服务到商业运营,从医疗卫生到公共教育,从城市交通到公共管理,大数据已开始撼动世界的方方面面。在带来新的发展机遇的同时,大数据时代也向包括经济统计在内的众多领域提出了众多挑战,需要做好充足的准备及应对。具体到与人才培养息息相关的经济统计学专业建设,我们认为需要从以下几个方面做出必要的变革:

(1)树立市场意识,避免人才培养与现实需求脱节。从目前的实际情况看,我国高校经济统计人才培养与市场需求之间或多或少存在一定程度的“学”“用”脱节,还没有全面实现学以致用。一方面,以企业为主的各类组织对经济统计人才需求非常急迫,如最近一份针对近千家企业和从业人员的调查显示,97.9%的企业认为数据分析对电商运营很重要,超过半数的企业表示数据分析能力欠缺,同时有近60%的企业希望专业数据分析人才加入,并愿意为此支付更高薪资;①另一方面,无论是课程体系还是教学内容以及教学方式,现有模式基本上是以传统数据为对象的。换句话说,在现有培养方式下,学生掌握的数理统计和经济统计方法可能无法满足大数据的分析需要,如传统的统计分组、频数分布等数据整理方法显然难以完全适用于图片、音频、视频等非结构化数据。因此,要真正做到“厚基础、宽口径、重应用”,则需要根据经济发展的需求设置教学计划、更新落后的教育内容、采纳现代化的教学手段,需要注意与其他学科之间进行充分的交流与融合,跟上当代社会科学的杂交化、整体化趋势发展的步伐。

(2)经济、统计与IT相融合,优化课程体系。在大数据的洪流中,数据分析是否能够带来新的洞察力、创造新的知识和价值,取决于从业人员是否掌握大数据收集、管理、分析和开发的相关特定工具。从我国高校经济统计学专业课程体系看,专业课程设置主要包括经济类基础课程与专业主干课程两大基本模块。虽然各高校都强调遵循“厚基础、宽口径、重应用”的复合型经济统计人才培养原则,也主张将理论方法的教学与计算机软件紧密结合起来(如“统计学导论”选用Excel,“应用多元统计分析”选用SPSS,“计量经济学”选用Eviews等软件作为计算工具),但在大数据的开发和应用日益成为新潮流、新趋势的背景下,仍然很少看到有高校在经济统计学专业中开设独立的、专门涉及大数据技术的相关课程。因此,根据现实人才需求的新变化以及大数据技术的不断进步和升级,我们应该对经济统计学专业的课程体系进行必要的调整,即根据大数据分析的内在需要,在经济学和统计学相关课程之外把大数据技术相关的课程纳入到现有体系之中,实现“经济、统计与IT”三方面内容的平衡和融合。在大数据时代,虽然经济统计所包括的主要工作仍然是数据收集和数据分析等,但是其内容却发生了翻天覆地的变化。如收集数据不再依赖于随机采样,而是需要利用多个数据库来接收发自客户端的数据,并导入到一个集中的大型分布式数据库。相应的,数据存储和预处理以及数据挖掘和分析也都是以分布式数据库为工作对象的。考虑到本科教育的基本要求与技术的实际发展水平以及通用性等,在Hadoop、NoSQL、HDFS等目前较为常用的大型数据分析软件和工具中,我们建议至少增设Hadoop方面相关的课程。

(3)与时俱进,加强师资队伍培养。能否把本专业的学生培养成为复合型的应用人才,取决于是否拥有一支高素质的教师队伍。随着大数据及其应用成为一种新的潮流和趋势,经济统计的专业教师团队建设也需要做出相应的调整和变革。从教师队伍的结构看,由于经济统计学专业发展的过程使然,目前我国各高校该专业的专业教师以具有经济学或统计学学科教育背景的教师为主,而具有信息技术教育背景的教师还非常稀少。由于大数据及其应用需要融合经济、统计以及IT等多个领域的理论、方法和工具,因此对经济统计专业建设而言,当前最为迫切的是,需要建设一支教育背景涵盖上述三个领域的结构合理的教师队伍。而实现的途径无非是两种:一方面是在全校范围内进行挖潜,重新组合和配置教师资源以优化经济统计专业教师团队;另一方面则是实施“请进来”战略,加大力度引进海内外优秀人才。在内部挖潜和外部引进的同时,专业教师团队建设还应该努力创造一个良好的人才成长环境,鼓励教师积极“走出去”,到国内外高水平大学进修和学习,鼓励教师不断以新的知识充实、提高自己,以此来不断提高本专业的教师质量和水平.

参考文献

[1]李宝瑜.统计学一级学科建设中的若干问题[J].统计研究,2004(8).

[2]庞皓.经济统计学课程体系改革的方向[J].统计研究,1991(1).

[3]向书坚,平卫英.30年来我国财经类院校统计学专业本科课程设置的历史回顾与展望[J].统计研究,2010(1).

[4]曾五一.关于经济管理类统计学专业课程体系设置的几点意见[J].统计教育,1999(8).

[5]曾五一,尚卫平.关于经济统计学若干问题的思考[J].统计研究,1999(11).

篇11

1大数据的含义

各行各业都存在着大数据,从表面来看,它就是实时性较强、种类较多、数据量大的一个集合,但其真实含义不仅仅如此,大数据的深层含义是在众多错综杂乱的数据中,利用科学方法及时提取出有效的数据,并进行整理和分析,为政府、企业等决策者提供潜在价值的数据。因此大数据时代给《统计学》带来了更多发展机遇。这就要求《统计学》课程无论从内容上,还是教学方式、教学资源上必须进行改革和完善。

2大数据为人才培养的研究带来新的发展机遇

《统计学》是一门应用性较强的学科,它是经管类专业的专业基础课,旨在于培养学生能进行数据收集、数据整理与数据分析的专业技能;从数量的角度去认识经济变量及经济变量间的关系,掌握其发展规律,指导实践的方法论科学。大数据现代信息化扩大了统计学的应用范围,为统计学的发展带来新的机遇。

2.1有效提升数据收集的时效性、准确性、全面性

大数据时代出现前,只有当要分析某经济现象时,才会主动调查收集此方面的数据,且数据的收集只限于人工,查找一下有关的统计年鉴、权威性较强的经济报告等,遇到一些具体数据没有的,只能在文章中进行说明,用一些相关的数据去代替,所以说传统的数据收集来源存在不稳定性,且数据的可靠性较一般,这些特点对数据分析结果存在着一定程度的误差。但大数据时代的到来,给数据收集带来了发展的机遇,数据收集的时效性、准确性、全面性得到了大幅度的提升。数据的收集不再仅局限于人工,因为大数据的数据收集是建立在网民在互联网留存的信息,且数据收集更有针对性、数据质量也更为精确、数据的时效性更高以及数据更加全面。相对于传统的数据收集,它更加省时、省力和省物。

2.2数据分析结果更加准确

传统的统计分析在分析总体的规律性时,由于数据收集的有限性,只能对样本数据进行分析,使用推断性统计分析方法推断总体的规律,其结果并不能全面、总体概括数据的整体情况。大数据的出现,为数据分析提供了良好的数据基础,利用现有的多种统计软件同时进行多方面的统计分析,对分析对象的了解更全面、更准确,为统计员提供更准确的决策依据。

3人才培养存在的问题

3.1与思想教育长期相互隔离

作为一名高校教师经常会在课堂上问学生们“你喜欢现在自己的专业吗?”“你对自己的未来有什么规划?”等问题,但很多同学不喜欢自己的专业,甚至有的学生都不知道自己专业将来毕业后可以做什么,对自已的规划就更谈不上了。这些问题都显示了高校大学生的思想教育存在着问题,无法树立正确的人生观、价值观和世界观。而高校的思政教育通常开设了专门的课程,如《基本原理概论》《中国近现代史纲要》《思想和中国特色社会主义理论体系概论》《形势与政策1-4》,分别设于大学生的前四学期,作为公共基础课,总学时比例也很高,但由于大学生在学习过程中,对课程的不重视,导致这些课程没有对大学生的思想教育起到作用。高校的专业课教育虽然经过长期的改革及教师们的努力研究,专业课之间进行了有效的融合讲解,但专业课教育长期与思想教育相脱离,这种现象不利于学生的整体发展,也没有体现出公共基础课与专业课的相辅相成作用,导致人才培养方案设计的失效。所以大学生的专业课与思想教育融合是势在必行的。《统计学》课程是高校经管类专业的专业基础课,讲解如何收集数据、整理数据、分析数据、解释数据,并从数据得出规律性结论的一门学科,提高学生数据分析和解决实际问题的能力,是学生在日后工作中提供经营管理的咨询、决策、实施管理的工具。《统计学》课程一定要在授课过程中融入“课程思政”元素,发挥《统计学》课程的思政教育功能。

3.2SPOC建设不完善

2020年受肺炎疫情的影响,各大高校纷纷改为以“网上授课”为主。在疫情期间,教师为了监督学生学习,提高学习效果,不断地更新和探索新的教学方法,向学生推送网络资源,利用学习通、腾讯课堂等方式进行网络授课。线上和线下结合的教学模式已成为一种教育的发展趋势。但疫情期间,《统计学》课程线上教学出现了很多问题,导致学生的学习积极性不强。《统计学》课程的网络资源很多,但由于各大高校的学情不同,很难从现有的线上资源找到一个适合不同层次学生的网络资源,尤其对于民办高校学生来说,其知识基础薄弱、学习兴趣不浓、学习积极性较差,很难固定找到一个网络资源完全与民办高校的《统计学》教学大纲培养应用型人才相符。除了向学生推送网络资源提前预习外,课堂前、课堂中、课堂后提高学生学习的参与率、考核学生在授课后其基本理论知识的掌握程度等也是非常重要。那如何能做到这些有效的监督呢?这就需要高校针对自己的学情进行课程SPOC建设,再以其他网络资源为辅,可以有效提高学生的主动学习性。而现有的高校《统计学》课程SPOC建设还不完善,甚至有很多高校的《统计学》课程SPOC建设几乎为零。

4大数据背景下人才培养的建设

4.1与思政教育相结合的建设

(1)理论授课的要点与思政教育的融合。第一,统计学的基本理论包括统计学定义、统计学研究对象、特点、统计学的起源和发展、统计学学科的性质等内容,它与思政教育的融入点为:认识统计学的作用、统计学的发展历史,以史为鉴可知兴替。在原始社会中只是有计数活动;到了奴隶社会为了课税和征兵,开始对人口进行普查、土地和财产进行统计;到了封建社会,秦汉、唐宋、明清分别对地方田亩和户口统计、土地调查和计算、人品登记和保甲制度;到封建社会后期和资本主义社会前期,随着社会生产力发展及分工细化,直到目前已进入大数据时代。第二,统计数据的收集,数据的来源有两种:直接来源和间接来源。对于间接来源数据,融入“诚实守信,尊重他人劳动成果,为企业一些机密数据保密原则,遵守统计人员的职业道德等”思政教育;对于直接来源数据,要“实事求是,对真实数据产生敬畏,做一个有思想不盲从的统计从业人员等”思政教育。第三,统计学的分析主要有描述性统计和推断性统计。其中推断性统计分析的参数估计引入“以点概面、从局部到总体”、假设检验引入“事物的对立面”等思政教育。(2)课程思政融入于案例和实践教学中。检验学生对《统计学》课程内容掌握的程度及是否能进行应用去解决经济问题,最有效的方法就是实训教学。在实训教学中,教师以生活熟悉的案例为载体讲解统计学各种分析方法在软件的操作,将学生进行分组,利用学生的好奇心和兴趣,让学生自选一个身边感兴趣的现象作为研究。引导学生们用科学的方法进行问卷调查收集数据,对回收的数据进行细致的审核和整理,此时融入“坚持客观、严谨科学的态度等”思政教育。在整理好的数据进行数据分析时,融入“尊重数据分析的最终结果等”思政教育。在实训过程中,让每组学生对所收集的数据中某一问卷中的某一数据进行撰改后数据分析结果与未撰改数据分析结果相比,有何差别,引导学生们去认识数据真实性的重要性,让学生养成严谨、敬业、尊重事实的科学态度,培养他们成为真正热爱并有职业操守的统计职业人才。

4.2线上SPOC建设

《统计学》课程的SPOC建设针对校内线上资源建设,它的完善会极大提高学生自主学习的能力。作为一名民办高校《统计学》教师,笔者认为针对我校的学情,此课程的SPOC建设包括线上微课、线上讨论、线上答疑的建设。线上微课视频是指通过“碎片化”教学,将教学过程中的重点、难点和疑点结合实例讲解,以教学视频方式呈现出来,具有针对性强、目标明确和时间短等特点。利用学习通等软件提前上传给学生,向学生布置任务,利用软件的一些功能,监督学生观看的时间,并设置在学生观看后,需学生总结出学习视频内容的心得,即理解内容、不理解内容,也可以提出问题及意见。这不仅可以监督学生学习,提高他们自主学习的时间,也可以为教师后续的课程改革提出方向及依据。线上讨论主要是设置在每一章理论课结束后,在线上设计一些案例,并提出任务,让学生在课后对所提出的案例任务进行线上讨论,运用所学的理论知识去解决实际的经济问题,不仅提高学生理论与实践相结合能力,还可以提高学生的独立思考、解决实际问题的能力。教师根据学生在线上讨论的参与率及讨论效果给予学生平时成绩,也体现了各大高校对课程考核成绩的一项改革,侧重于平时学习的考核。而线上答疑,是利用现代信息技术,在网上进行的一种答疑方式,教师可随时随地在线上看到学生的疑问,针对学生的疑问及时进行解答。这种线上答疑方式为学生对重点知识的反复学习和深刻理解提供了及时、较好支持,为其巩固知识和加强理解给予很大的帮助,提高学生学习积极性,提升其学习兴趣。

参考文献:

[1]胡瑞香.浅谈课程思政理念下《统计学基础》课程教学改革的探索[J].国际教育,2020(10).

[2]方万里.统计学与思政课程同向同行的思考[J].太原城市职业技术学院学报,2020(11).

[3]杨潇伟.大数据对高职统计学教学的影响[J].产学研经济,2020(11).

[4]唐谦.大数据背景下统计学教学改革探讨[J].课程教学,2020(10).

篇12

大部分传统的统计方法只适合分析单个计算机存储的数据。而目前大数据的环境包括以下要素。1.流数据:数据快速地不断涌来,现有存储设备和计算能力难以应付这种数据流(比如欧洲高能粒子对撞机所产生的数据,每秒钟可以达到500TB)。2.磁盘存储限制:数据已不能完全存储在内存中,需要硬盘存储。3.分布存储状态:数据分布存储在多个计算机中。4.多线条状态:数据存储在一个计算机中,多个处理器共享内存。大数据的发展就是对数据产生的机制进行探索,将所产生的数据转变为人们所需要的知识,进而对相关政策的制定产生影响。这个过程是一个漫长的过程。一个小孩子随着年龄的增长可能会掌握更多的单词,但是根据一个孩子的年龄确定他掌握的单词多少则并不科学。进一步来说,大数据有记录保存自然与社会现状的功能。现在大家收集着海量数据,尽管他们还不清楚如何分析大量的数据,但是他们相信需要保存现今社会经济高速发展的过程,期待着今后能够分析和解释这段历史。还有些人将百岁老人的血液和其他各种生物的标本等存放在冰箱里,他们认为当今的技术还不足以测试和分析这些资源,期待今后更先进的测试技术能够做到。大数据就如同自然和社会的血液那样记录着社会的现状和发展过程。17世纪望远镜以及显微镜的发明使人类看到了以前从来没有看到过的宇宙空间和微生物,扩大了人类对自然的基本认识。大数据就像“望眼镜”和“显微镜”那样,使得人们能够通过数据来观察和分析自然、经济、社会的现象。借助于互联网数据,可以及时了解疾病的疫情、科学的动态、社会的动态。谷歌借助频繁检索的词条能及时判断流感从哪传播,哪些人可能已经感染了流感。大数据将形成自然和人文社会的历史长河,不但能用于探索当代的科学问题,将来也可以用于研究人们食用转基因食品对子孙后代的影响等追踪研究问题,为未来留下当前的历史资料。

二、大数据带来的变革

时代的进步有赖于大数据的发展,大数据的发展给时代变革增加了更多的不确定性。就当前研究来看,数据的搜集很大程度上依靠所研究问题的出现来推动其向前发展。不过在不久的将来,随着大数据时代的到来,人们对于问题的研究将会由“数据”来驱动。例如,如果我们想去某地旅行或出差,会首先查询目的地的交通情况、天气情况以及住宿情况等信息,但是将来我们可以根据所查询的数据信息来决定所要去的目的地。在古希腊时代,当时的哲学家无所不知,号称百科全书,到了文艺复兴时代,随着学科的不断细化,不同学科出现了各自的专家。随着大数据时代的到来,大百科全书式的人物将有可能再次出现,而不同领域的专家的权威性将被逐步消弱,随着大数据的不断发展,很有可能会逐渐将学科专家消亡掉。例如,随着计算机专家和统计学家对数据的搜集越来越多并且处理能力不断增强,他们将逐步成为生命科学方面的专家。再比如,如果我们掌握了足够数量的相关专业书籍和日文译本,就算我们对日文一无所知,我们也可以采取有效的方法将所需要的中文翻译成为日文,因为我们有很多非常可靠的翻译软件,如谷歌翻译软件等。大数据已经在各个领域和学科得到了应用,例如医疗领域,大数据可以指导人们健康饮食,适时进行身体检查,并且确定检查项目,帮助医生对患者进行疾病诊断等。

三、大数据时代统计学专业教学现状

随着科技的不断发展和进步,人们获取信息和数据的途径也发生了很大的变化,电子商务的发展和各种多媒体信息技术的飞速发展和应用,给传统的统计学应用和教学带来了机遇的同时也带来了非常大的挑战。一方面,由于各种信息和数据的不断涌入,人们在被动搜集着各种数据。统计学的教学也需要不断探索新的模式。另一方面,人们在被动接受数据的同时也在主动搜集数据信息,不同学科有不同的数据需要。例如经济学领域的专家每天都在搜集各自的调查数据和观察数据,而自然科学领域的专家学者则不仅搜集宏观天文数据,还在搜集微观基因数据。不同的人们搜集数据的方法也各不相同,有的在实验室通过试验进行数据搜集,有的人则通过网络进行数据搜集和研究。对于当前大数据给统计学带来的挑战,美国科学院“大数据分析委员会”给出了分析,他们认为这些挑战在于对不同格式和结构的数据的处理方面、对于数据来源的追踪方面、对于共享数据的安全性问题和完整性问题方面、对于样本异质性和偏倚性处理方面、在对问题进行处理时的决策和分析方面以及对分布式和并行式在开发时的算法方面的问题等。国内相关部门也对这一问题进行了研讨,最早一次是2012年5月在香山召开的“大数据科学与工程”会议,第二次是在2013年5月召开的对于大数据原理以及发展前景的探讨会,并同时制定了相关的科研计划。但关于大数据背景下统计学专业教学的探索还非常稀缺。

四、统计学专业课程改革

针对以上所述大数据时代的特点和变革意义以及目前统计学专业教学的现状,本文进行了相应的初步探索。

(一)改革的总体思路

将现有的统计学顶级杂志或著名文献中的成熟的大数据分析方法逐步凝练,形成教学内容;将使用R软件中的函数包实现这些大数据分析方法。

(二)改革的具体内容

1.在《数据挖掘原理与方法》课程中引入大数据分析方法及其R语言的代码实现。2.在《非参数统计》课程中引入多元非参数统计方法(诸如多元符号、多元秩、多元符号秩等)、非参数回归模型、半参数回归模型及其R语言的代码实现。3.在《回归分析》课程中引入回归树、boosting回归、bagging回归、随机森林回归等用来处理大数据的回归方法、高维回归变量选择方法(比如LASSO回归、动态LASSO回归等)及其R语言的代码实现。4.在《多元统计分析》课程中引入高维统计分析方法及其R语言的代码实现。5.在工科《概率论与数理统计》课程中引入R语言的代码实现。

篇13

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016. 23. 093

[中图分类号] TP311 [文献标识码] A [文章编号] 1673 - 0194(2016)23- 0178- 02

1 大数据与大数据时代

近年来,随着英国维克托・迈尔-舍恩伯格的《大数据时代》和美国Bill Franks的《驾驭大数据》等著作的出版,大数据引起了社会的广泛关注,人们已经意识到大数据时代正在呼啸而至。大数据几乎对每个领域都会产生影响,所以限于不同领域各自的特点,对大数据的表述也不同,但是一个广泛的观点是:“大数据是一个数据集合,这个数据集合是无法在规定时间里用常规软件工具对它进行搜集、整理和分析的。”

2 大数据时代对统计数据的挑战

大数据时代需要既讲机遇也讲挑战。各个应用领域的不断变化使得统计学成为一门难以成熟的学科。所以在数据分析的世界里,统计学发展的终身动力是不断提高驾驭数据的能力。大数据是推断数据,不是原始数据,所以会存在抽样偏倚、随机的和非随机的误差。数据包括原始数据和推断的数据。数据的认知范围有限,所以数据可解释的范围就有限。模型是对数据信息的汇总,由于数据信息有限,所以模型可解释的程度也有限。超出模型可解释的程度,就是对模型进行一系列的假设。大数据方法研究需要多学科的联合,统计学家需要关注实时决策和计算机资源,计算机学家需要了解算法和统计推断的复杂性。

3 大数据时代对统计数据质量的影响

3.1 大数据时代对数据时效性的影响

库克耶和舍恩伯格认为:大数据不用抽样调查的方法,而用所有数据的方法。数据科学家甚至提出“样本=总体”,这或许意味着统计工作重心要转移。舍恩伯格和库克耶认为抽样调查有很多自身的不足:一是样本的随机性很难实现;二是不适合考察有子类别的情况;三是采样忽略了细节的考察,而大数据分析则可以弥补抽样调查的这些不足之处。如果说之前统计工作的重点在于数据搜集和整理,那么大数据时代统计工作的重心就是如何搜集整理分析有用的信息。这样一来,已经得出的数据结论可能不具有这个时代的特点,即失去了时效性。

3.2 大数据时代对数据真实性的影响

大数据时代除了对数据的时效性有影响之外,对数据的真实性也有影响。由此,当通过网络搜集数据时,首先需要考虑的是,数据是否是由自动化算法系统产生?如果是,究竟有多少?以淘宝网为例,大量的虚假评论已经影响了信息的真实。

4 大数据时代统计工作的应对之策

大多数的研究指出,当前统计方面存在的问题在于业务部门没有利用好大数据导致数据资源缺乏;企业内部信息孤岛导致数据的有效信息无法充分利用;工作人员数据分析能力差导致大数据时代下统计工作很难进行。

4.1 国家应对之策

在大数据时代下,要保障统计数据质量,国家应当做到以下几点:

(1)尽快改革当前统计管理体制的制约,保证统计独立调查、独立报告、独立监督的职权不受侵犯。在大数据时代,统计体制改革要与时俱进,尽快建立符合我国国情的统计管理体制。

(2)充分发挥党委政府的主导作用,赋予各其统计数据质量的主体责任。要发挥各级地方党委政府对本区域统计数据质量的主体责任,将统计数据质量的好坏作为考核一个地区领导业绩的主要方面之一。

(3)尽快建立引导一个提速增效的统计考核评价指标体系,完善党政领导的绩效考评机制。

4.2 企业应对之策

企业应做到以下几点:信息以数据形式呈现,强化建设数据标准;融合结构化和非结构化数据;推广应用大数据,促进使用信息资源;重视数据的安全管理。

4.3 个人应对之策

统计学家必须积极学习新事物,适应大数据环境,拓展统计学的应用领域,创造出新的统计方法。大数据时代带给我们的挑战与机遇并存。

主要参考文献

[1]朱建平,章贵军,刘晓葳.大数据时代下数据分析理念的辨析[J].统计研究,2014(2).

[2]郑京平,王众全.官方统计应如何面对BigData挑战[J].统计研究,2012(12).

[3][英]维克托・迈尔-舍恩伯格.大数据时代――生活工作与思维的大变革[M].周涛,译.杭州:浙江人民出版社,2013.

[4]Brian Hopkins,Boris Evelson.Expand Your Digital Horizon with Bigdata[N/OL],2011-09-30.

友情链接