時間:2022-05-21 11:15:09
序論:在您撰寫統(tǒng)計學數(shù)據(jù)論文時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的1篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導您走向新的創(chuàng)作高度。
摘 要:圍繞大數(shù)據(jù)時代的到來對管理統(tǒng)計學教學帶來的機遇和挑戰(zhàn),分析現(xiàn)有的管理統(tǒng)計學課堂教學模式特點,總結其存在的不足,并探討大數(shù)據(jù)背景下的新型管理統(tǒng)計學課堂教學模式,優(yōu)化課程教學實施手段,不僅能積極應對大數(shù)據(jù)對管理統(tǒng)計學帶來的挑戰(zhàn),給管理統(tǒng)計學帶來新的發(fā)展機遇,也能增強大數(shù)據(jù)背景下學生的數(shù)據(jù)驅(qū)動的管理決策意識,培養(yǎng)適應大數(shù)據(jù)時代要求的高素質(zhì)人才。
關鍵詞:管理統(tǒng)計學;教學模式;大數(shù)據(jù);案例教學
1 引言
管理統(tǒng)計學是一門應用統(tǒng)計學方法和理論研究經(jīng)濟管理問題的應用性學科,它通過收集、分析、表述、解釋數(shù)據(jù)來探索經(jīng)濟管理問題的規(guī)律,并輔助企業(yè)進行管理決策和提高管理效率。傳統(tǒng)的統(tǒng)計學關注小規(guī)模數(shù)據(jù)下的數(shù)據(jù)描述、推斷和科學分析用。與之相應,管理統(tǒng)計學的課堂教學主要關注統(tǒng)計學原理的講述、小數(shù)據(jù)的推斷分析和經(jīng)濟管理問題的簡單應用。
然而,自2008年Nature雜志發(fā)表“Big data:science in the peta byte era”以恚大數(shù)據(jù)的發(fā)展方興未艾,備受學術界,企業(yè)界等關注。大數(shù)據(jù)的理念和技術不僅在互聯(lián)網(wǎng)、金融、機器人、人工智能等領域取得突破性進展,也將對企業(yè)的生產(chǎn)、經(jīng)營和決策等活動帶來深刻的影響,通過對企業(yè)大數(shù)據(jù)的深度挖掘,有助于實現(xiàn)企業(yè)的商業(yè)價值,規(guī)避企業(yè)的決策風險,提高企業(yè)的競爭力。
大數(shù)據(jù)時代的到來,對管理統(tǒng)計學來說既是機遇又是挑戰(zhàn),機遇在于:大數(shù)據(jù)的分析主要建立在統(tǒng)計學的基礎上對數(shù)據(jù)進行處理、分析,從而使得大數(shù)據(jù)可視化;而挑戰(zhàn)在于:當下管理統(tǒng)計學的教學方法和教學手段難以匹配大數(shù)據(jù)時代對數(shù)據(jù)分析從業(yè)者的要求,這就要求對管理統(tǒng)計學的課堂教學模式進行進一步的發(fā)展與創(chuàng)新,以期適應大數(shù)據(jù)背景下的新要求。
如何結合大數(shù)據(jù)時代的新要求設計合適的課堂教學模式,如何結合豐富的大數(shù)據(jù)應用案例開展課堂教學活動,如何增強大數(shù)據(jù)背景下學生的數(shù)據(jù)驅(qū)動的管理決策意識,培養(yǎng)適應大數(shù)據(jù)時代要求的高素質(zhì)人才,這些都是大數(shù)據(jù)背景下傳統(tǒng)的管理統(tǒng)計學課堂教學模式所面臨的問題和挑戰(zhàn),這也促使管理統(tǒng)計學教學工作者不得不去探究、優(yōu)化甚至改革現(xiàn)有的管理統(tǒng)計學課堂教育模式。
2 傳統(tǒng)管理統(tǒng)計學教學模式的概述
筆者所在的教學團隊來自于武漢科技大學管理學院,承擔全院《管理統(tǒng)計學》課程教學任務,在教學方法、實踐教學等有較為豐富的教學經(jīng)驗。然而,在多年的教學過程實踐和與學生的教學互動當中發(fā)現(xiàn):現(xiàn)有的管理統(tǒng)計學教學模式盡管相對較為成熟,在培養(yǎng)學生的數(shù)據(jù)分析意識方面起到的重要作用,但是仍存在以下不足,而這些不足恰恰難以適應大數(shù)據(jù)背景下對管理統(tǒng)計學教學帶來的挑戰(zhàn)。
2.1 注重理論講授,忽視應用教學
受技術發(fā)展和數(shù)據(jù)規(guī)模等因素的制約,傳統(tǒng)的管理統(tǒng)計學教學大都采用理論驅(qū)動的教學模式,教師依托教材,注重統(tǒng)計學基本原理和方法的傳授,學生掌握基本原理,對統(tǒng)計學的實際應用等關注較少。
盡管管理統(tǒng)計學課堂教學會涉及到一定的應用案例,但是這些案例大都簡單,陳舊,數(shù)據(jù)來源單一,難以接觸實際原始數(shù)據(jù),統(tǒng)計建模思路也相對固定,這些教學案例既不能反映管理統(tǒng)計學的最新發(fā)展和應用思想,也無法將其帶入企業(yè)經(jīng)營的情景,對企業(yè)決策過程缺乏了解,這些因素都使得學生對該課程的學習興趣不高,不利于培養(yǎng)學生應用統(tǒng)計學解決實際問題的能力,進而影響課堂教學效果。
2.2 注重數(shù)學推導,忽視工具應用
管理統(tǒng)計學要求學生掌握一定的數(shù)學基礎,教材也都有較多的數(shù)學公式和理論推導,忽視了培養(yǎng)學生應用SPSSvSASvR等統(tǒng)計軟件工具解決統(tǒng)計問題的操作能力。
根據(jù)經(jīng)管類專業(yè)的培養(yǎng)定位,對于經(jīng)管類專業(yè)的學生而言,相比于統(tǒng)計的數(shù)學公式,真正實用的如何借用SPSSvSASvR等統(tǒng)計軟件工具來解決企業(yè)經(jīng)營決策面臨的實際問題,尤其是在大數(shù)據(jù)背景下,需要處理海量、復雜、多源、異質(zhì)的高維數(shù)據(jù)。這些是單憑數(shù)學推導和簡單的手動計算無法完成的。
近年來,大數(shù)據(jù)、互聯(lián)網(wǎng)等技術的快速發(fā)展催生了一類新型且前景廣闊的職業(yè)方向-數(shù)據(jù)分析師。綜合數(shù)據(jù)分析師的職業(yè)要求,可以發(fā)現(xiàn),這些職位大都要求從業(yè)者了解基本的統(tǒng)計學原理和方法,熟練掌握SPSSvSASvR等統(tǒng)計軟件工具,并應用這些工具解決企業(yè)經(jīng)營管理面臨的實際問題。
2.3 注重知識考核,忽視項目訓練
受限于教學管理制度和考核手段等因素,目前管理統(tǒng)計學課堂教學考核方式大都以閉卷為主,主要考察學生對統(tǒng)計學基本知識點的掌握情況,以及學生應用統(tǒng)計學知識解決簡單案例的綜合能力。
然而,在大數(shù)據(jù)時代背景下,除了要求掌握統(tǒng)計學基本原理,更應培養(yǎng)學生應用統(tǒng)計學知識解決實際問題的綜合能力,而這種綜合能力往往涉及數(shù)據(jù)獲取、數(shù)據(jù)預處理、數(shù)據(jù)探索、統(tǒng)計建模、模型檢驗、模型評價、模型解釋、模型部署和模型修正等數(shù)據(jù)分析的全過程,這種綜合能力的掌握是無法通過現(xiàn)有的知識考核來達到的,這些必然要求學生通過參與實際項目或模擬情景來實現(xiàn)。
3 大數(shù)據(jù)背景下管理統(tǒng)計學教學模式探討
如何結合大數(shù)據(jù)時代的新要求設計合適的課堂教學模式,如何結合豐富的大數(shù)據(jù)應用案例開展課堂教學活動,如何增強大數(shù)據(jù)背景下學生的數(shù)據(jù)驅(qū)動的管理決策意識,培養(yǎng)適應大數(shù)據(jù)時代要求的高素質(zhì)人才,這些都是大數(shù)據(jù)背景下傳統(tǒng)的管理統(tǒng)計學課堂教學模式所面臨的問題和挑戰(zhàn)。而現(xiàn)有的管理統(tǒng)計學課堂教學模式難以匹配大數(shù)據(jù)時代對其提出的要求,這就要求對管理統(tǒng)計學的課堂教學模式進行進一步的發(fā)展與創(chuàng)新,以期適應大數(shù)據(jù)背景下的新要求。
3.1 構建案例引導的教學模式
現(xiàn)有的管理統(tǒng)計學課堂教學以講授基本的統(tǒng)計學原理為主,少量簡單的統(tǒng)計工具應用。大數(shù)據(jù)時代下企業(yè)的數(shù)據(jù)有了更高的商業(yè)價值,這對從業(yè)者帶來了更大的挑戰(zhàn)。因而管理統(tǒng)計學教學模式應主動應對這種挑戰(zhàn),調(diào)整教學模式,引入實際案例,綜合訓練學生的基本原理、數(shù)據(jù)整理、分析和操作能力。
【摘要】首先,本文給出了筆者認為的統(tǒng)計學研究的典型問題究竟是什么;然后,闡述了什么是大數(shù)據(jù);最后,就筆者的理解淺談了大數(shù)據(jù)時代統(tǒng)計學究竟還有沒有用武之地.
【關鍵詞】統(tǒng)計學;大數(shù)據(jù);統(tǒng)計分析
一、統(tǒng)計學研究的典型問題
眾所周知,統(tǒng)計學是處理數(shù)據(jù)的一門科學.人們給統(tǒng)計學下的定義很多,比如,《不列顛百科全書》中“統(tǒng)計學是收集、分析、表述和解釋數(shù)據(jù)的科學”;《韋伯斯特國際詞典(第3版)》中“統(tǒng)計是一門收集、分析、解釋和提供數(shù)據(jù)的科學”;Mario F.Triola的《初級統(tǒng)計學》中“統(tǒng)計指的是一組方法,用來設計實驗、獲得數(shù)據(jù),然后在這些數(shù)據(jù)的基礎上組織、概括、演示、分析、解釋和得出結論”.筆者認為,統(tǒng)計學研究的典型問題是“運用已知數(shù)據(jù)獲得所研究的客觀事物的數(shù)量特征和發(fā)展規(guī)律,利用規(guī)律對所研究的客觀事物的行為進行預測”.
首先,統(tǒng)計學研究的典型問題的關鍵之一就是必須有所研究問題的數(shù)據(jù),這是研究的前提.那么如何獲得已知數(shù)據(jù)呢?我們說可以通過調(diào)查,也可以通過實驗.先來說通過調(diào)查獲得已知數(shù)據(jù),情況有兩種,一種是抽樣調(diào)查,另一種是普查.給大家舉一個例子,比如,某研究部門想知道其所在城市所有職工家庭的年平均收入.那么,“該城市所有職工家庭的年平均收入”就構成了所研究問題的總體.“該城市中的每一個職工家庭的年平均收入”就是總體中的個體.如果要通過抽樣調(diào)查來獲得數(shù)據(jù),也就是抽取部分個體組成樣本,比如,該部門抽取了2 000個職工家庭的年平均收入作為樣本,那么就獲得了2 000個樣本數(shù)據(jù)(某年的年收入數(shù)據(jù)),這就是通過抽樣調(diào)查獲得的已知數(shù)據(jù).再用這同一個例子來說一說普查.比如,2016年,該研究機構對其所在城市中的每一個職工家庭都進行了調(diào)查,獲得了每個個體(職工家庭)的2015年的年收入數(shù)據(jù),這就是通過普查獲得的已知數(shù)據(jù).
當然也可以通過實驗來獲得已知數(shù)據(jù),做實驗的過程就復雜了.要想通過實驗獲得靠譜的數(shù)據(jù),首先,得滿足樣本量足夠大,然后,就是要做到隨機.現(xiàn)實中這兩點也不是很容易做到的.例如,假設我們現(xiàn)在想研發(fā)一種做運動鞋的新材料,看看是不是比舊的材料更耐磨.又假設我們現(xiàn)在的研發(fā)成本非常高,只能提供4雙樣品鞋.于是,我們找來了8個孩子來試穿,4雙新材料4雙舊材料.看到這兒,第一反應是樣本量小了,但是沒有辦法啊,實際情況只允許我們做到這種程度.那么在樣本量無法擴大的前提下,怎么做才能使實驗靠譜呢?我們給每一個孩子隨機選一只腳穿新材料,另一只腳穿舊材料.這樣,每一組新舊材料的對比都是基于同一個孩子的,這就不存在比如,孩子是否喜歡運動等的混淆因素了.
統(tǒng)計學研究的典型問題的第二個關鍵點就是需要有合理的統(tǒng)計分析.針對已經(jīng)獲得的已知數(shù)據(jù)也就是樣本數(shù)據(jù),我們采用合理的統(tǒng)計分析,定會對所研究的客觀事物的數(shù)量特征和規(guī)律進行準確的描述、分析和判斷.
統(tǒng)計學研究的典型問題的第三個關鍵點就是對未來的預測具有不確定性.分兩個方面來給大家闡述.首先,未來必須是未知的,如果所研究的某事物的未來行為或特征是已經(jīng)知道的,那這就不屬于統(tǒng)計學要研究的問題.其次,預測必須是不確定的.如果預測的結果只有一種,也就是預測的結果是確定的,那這也不屬于統(tǒng)計學要研究的問題.比如,我們想知道人體的骨骼有多少塊骨頭?于是,抽選部分人作為樣本,通過對樣本研究獲得已知數(shù)據(jù),進而來預測其余未被抽中的人,這種預測具有確定性,人體骨骼是由206塊骨頭組成.這就不屬于統(tǒng)計學要研究的問題.再比如,一種新藥出廠后用于臨床試驗獲得已知數(shù)據(jù),然后對更廣泛的同類型病人的療效做預測性推斷,具有不確定性.
二、什么是大數(shù)據(jù)
當今,“大數(shù)據(jù)”如日中天,似乎已經(jīng)成為人們的流行語,那什么是大數(shù)據(jù)呢?麥肯錫對大數(shù)據(jù)的定義是從數(shù)據(jù)集的“大體量”入手的:大數(shù)據(jù)是指那些規(guī)模大到傳統(tǒng)的數(shù)據(jù)庫軟件工具已經(jīng)無法采集、存儲、管理和分析的數(shù)據(jù)集.維基百科采納了麥肯錫的定義,認為大數(shù)據(jù)是一組龐大而復雜的數(shù)據(jù)集的集合,大且復雜到難以用現(xiàn)有的數(shù)據(jù)庫管理工具或傳統(tǒng)的數(shù)據(jù)處理應用來處理,大數(shù)據(jù)就是一切可記錄信號的集合.狹義地講,大數(shù)據(jù)是一個大樣本和高維變量的數(shù)據(jù)集合.廣義地講,大數(shù)據(jù)涵蓋多學科領域、多源、混合的數(shù)據(jù),自然科學、人文社會、經(jīng)濟學、通訊、網(wǎng)絡、商業(yè)和娛樂等各種領域的數(shù)據(jù)集相互重疊連成了一片數(shù)據(jù)的海洋.大數(shù)據(jù)涉及各種數(shù)據(jù)類型,包括文本與語言、錄像與圖像、時空、網(wǎng)絡與圖形.我認為,當今流行的“大數(shù)據(jù)”是通過互聯(lián)網(wǎng)獲得的足夠大量的、包含一切數(shù)據(jù)類型的數(shù)據(jù)的集合.
三、大數(shù)據(jù)時代,統(tǒng)計學是不可或缺的
我們姑且先不去談大數(shù)據(jù)和統(tǒng)計學中的數(shù)據(jù)誰更全面,誰更方便獲得,誰更相對有代表性;不去談什么樣本和總體,我們就只是來說一說,大數(shù)據(jù)時代,只是有全部的數(shù)據(jù)就足夠了嗎?筆者認為當然不是.無論是大數(shù)據(jù)還是統(tǒng)計學中的樣本數(shù)據(jù)最初都是雜亂的、無序的,所以說,大數(shù)據(jù)時代,數(shù)據(jù)的處理、理論分析等的問題就顯得尤為重要了.這些重要問題的解決都離不開統(tǒng)計學,它需要統(tǒng)計理論和統(tǒng)計分析方法.
就是舍恩伯格和庫克耶也不同意安德森的極端觀點.他們指出“大數(shù)據(jù)絕不會叫囂‘理論已死’”,因為“大數(shù)據(jù)是在理論的基礎上形成的”,無論是如何搜集數(shù)據(jù)、分析數(shù)據(jù)、還是解讀研究結果,都得依賴理論.“大數(shù)據(jù)時代絕對不是一個理論消亡的時代,相反地,理論貫穿于大數(shù)據(jù)分析的方方面面.”
摘要:大數(shù)據(jù)是21世紀的熱點話題之一,統(tǒng)計學是傳統(tǒng)的數(shù)據(jù)分析學科。利用百度指數(shù)提供的“用戶關注度”功能,本文選取2012年-2016年5年260周的百度周平均搜索指數(shù)為研究對象,以百度搜索指數(shù)來反映社會關注熱度,研究大數(shù)據(jù)與統(tǒng)計學關注熱度之間有無相關性,以及大數(shù)據(jù)搜索指數(shù)發(fā)展的趨勢變化。根據(jù)圖形分析與相關系數(shù)的計算,可知大數(shù)據(jù)與統(tǒng)計學搜索熱度呈現(xiàn)正相關關系,該關系線性程度不大,多為非線性關系。根據(jù)大數(shù)據(jù)的季平均搜索指數(shù)、每四周平均搜索指數(shù)的變化趨勢研究表明,大數(shù)據(jù)搜索指數(shù)不存在明顯季節(jié)性,存在明顯的正趨勢性;其搜索岫茸2012年初至2015年2季度以來呈明顯上升趨勢,其后增長速率放緩,呈現(xiàn)更為顯著的波動性,由此可知2015年2季度為其明顯的一個轉折點,符合其發(fā)展趨勢的模型有修正指數(shù)模型,以及龔珀茲曲線模型和皮爾曲線模型這兩個生長曲線模型,結果顯示三個模型的擬合度均較理想,其中龔珀茲曲線的擬合度最高。根據(jù)擬合結果,從大數(shù)據(jù)搜索指數(shù)反映的社會關注熱度來看,大數(shù)據(jù)搜索指數(shù)的發(fā)展已趨于飽和趨勢,其飽和值為4300左右。
關鍵詞:大數(shù)據(jù);統(tǒng)計學;百度指數(shù);趨勢外推
引言
現(xiàn)代社會,數(shù)據(jù)量呈爆炸式增長趨勢,數(shù)據(jù)已經(jīng)滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。2012年以來,大數(shù)據(jù)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關的技術發(fā)展與創(chuàng)新。而統(tǒng)計學作為傳統(tǒng)的數(shù)據(jù)分析方法,在擁有海量數(shù)據(jù)的現(xiàn)代社會既有著巨大的機遇,但由于大數(shù)據(jù)突破了傳統(tǒng)統(tǒng)計學關于樣本和總體界定等等限制,也對傳統(tǒng)統(tǒng)計學的分析方法提出了前所未有的沖擊和挑戰(zhàn)。在現(xiàn)實生活中,并沒有一門基于大數(shù)據(jù)的專業(yè)產(chǎn)生,各大企業(yè)往往通過招收統(tǒng)計學、計算機、數(shù)學等相關專業(yè)的人才來滿足其大數(shù)據(jù)分析工作的要求,盡管如此,關于大數(shù)據(jù)的熱門是否捧熱了統(tǒng)計學之類的相關學科的說法一直眾說紛紜;此外經(jīng)過了幾年的對大數(shù)據(jù)關注的大熱,市場逐漸對其回歸理性,甚至出現(xiàn)了“大數(shù)據(jù)泡沫”這樣的質(zhì)疑聲音。本文借助百度搜索指數(shù),對2012年-2015年每一周大數(shù)據(jù)、統(tǒng)計學兩詞條的反映其關注熱度的搜索指數(shù)進行定性、定量分析,實現(xiàn)以下目的:
觀察從百度搜索指數(shù)中反映出的人們對于大數(shù)據(jù)、統(tǒng)計學度的變化趨勢,了解在人們關注度方面二者有無相關性、有怎樣的相關性,即大數(shù)據(jù)的大熱有沒有帶來統(tǒng)計學關注度的變化。
通過建立統(tǒng)計模型,觀察大數(shù)據(jù)關注熱度5年來的變化,了解現(xiàn)實中其在關注度發(fā)展過程中所處的階段,即現(xiàn)實中對大數(shù)據(jù)的關注依然處于上升階段還是已經(jīng)趨于飽和。采用定量、定性結合的分析方法,將統(tǒng)計學和大數(shù)據(jù)的搜索指數(shù)時間序列作線圖,并計算線性相關系數(shù),觀察兩者的變化規(guī)律,并計算兩者有無線性相關關系。為滿足消除隨機性波動和保留足夠數(shù)據(jù)量的需要,分別計算大數(shù)據(jù)搜索指數(shù)的每四周、每季度加權平均值。觀察圖形有無季節(jié)性、周期性波動;觀察圖形是否存在轉折點,以此為基礎選擇統(tǒng)計模型。根據(jù)圖形識別的結果,建立可能的統(tǒng)計模型,并通過比較R方值的方法來選擇適當?shù)哪P汀?
一、中國統(tǒng)計學發(fā)展與大數(shù)據(jù)發(fā)展的相關性分析
用橫坐標表示周次,縱坐標表示搜索指數(shù),將大數(shù)據(jù)和統(tǒng)計學的搜索指數(shù)時間序列在一個圖中分別做折線圖,從圖像中可以看出,57周以前,統(tǒng)計學的搜索熱度大于大數(shù)據(jù)的搜索熱度,57周以后,大數(shù)據(jù)搜索熱度逐漸超過統(tǒng)計學搜索熱度。90周之后,大數(shù)據(jù)和統(tǒng)計學的變動趨勢呈現(xiàn)一定的相似性,例如都在214周時達到谷值,而后回升。在178周大數(shù)據(jù)搜索達到峰值,182周統(tǒng)計學搜索量達到峰值,在此期間統(tǒng)計學的增長略落后于大數(shù)據(jù)的增長,但是分布的形狀大體一致。
2.季平均值線性相關系數(shù)=0.292112357
結果分析:兩組數(shù)據(jù)的線性相關程度都不高,其中季平均線性相關系數(shù)略高于周平均線性相關系數(shù)。說明大數(shù)據(jù)與統(tǒng)計學的搜索指數(shù)之間并不存在明顯的線性相關關系,但是從圖中看出二者變化趨勢具有相似性,因此猜測二者可能具有某種非線性相關關系。
因為相關關系并不等于因果關系,因此對于如上結果我們做出兩種假設:
在90周以后,統(tǒng)計學的分布類似并且略落后于大數(shù)據(jù)的增長,這可能是由于人們對于大數(shù)據(jù)的關注,引發(fā)了人們對于統(tǒng)計學這個相關學科的關注。
兩者類似的分布形態(tài),可能是由于全國所有用戶搜索頻次的周期性、隨機性變動所引致的,大數(shù)據(jù)、統(tǒng)計學搜索指數(shù)變動之間并沒有直接的因果關系。
二、中國大數(shù)據(jù)需求量預測模型
由于原始數(shù)據(jù)有260周,波動性過大,為了得到更為準確的結論,我們僅對其按每季度、每四周兩種方式計算加權平均值得到的時間序列作討論,其目的是(1)平滑隨機波動;(2)判定按每季度和每四周平均哪個有季節(jié)性;(3)每季度平均更能反映長期趨勢,但數(shù)據(jù)較少,只能以季為單位預測未來值;每四周平均的數(shù)據(jù)較多,且可以進行更短期的預測。
1.季節(jié)性、趨勢性的判定
(a)圖形判別法
建立按季平均和按每四周平均的橫坐標為季度或周次,縱坐標為搜索指數(shù)的折線圖,按季節(jié)平均、按每四周平均,大數(shù)據(jù)搜索指數(shù)都不存在明顯的季節(jié)性;另外由于后一年的值往往大于前一年的值,因此可以判定其存在趨勢性。
(b)建立一元線性回歸方程并檢驗顯著性
季平均值:;
每四周平均值:;
由于兩個時間序列一元線性回歸的R2均顯著,所以大數(shù)據(jù)搜索指數(shù)顯然存在線性趨勢。
結論:上述過程從圖形和計算兩個角度得出了以下結論:大數(shù)據(jù)搜索指數(shù)并不存在明顯的季節(jié)性,不適合使用時間序列分解法;大數(shù)據(jù)搜索指數(shù)存在明顯的趨勢,一元回歸有較好的擬合優(yōu)度,但是一元回歸使用的前提是時間序列不存在明顯的轉折點,為了進一步確定更好的擬合模型,我們繼續(xù)如下討論。
摘 要:傳統(tǒng)的統(tǒng)計學是因數(shù)據(jù)而生的,也是以研究數(shù)據(jù)為根本目的,傳統(tǒng)統(tǒng)計學有其獨特的數(shù)據(jù)收集、整理與分析的方法體系,也確實為我們研究數(shù)據(jù)帶來了便利,但是不得不思考的是在數(shù)據(jù)爆炸的信息時代,尤其是“大數(shù)據(jù)”概念產(chǎn)生以后,傳統(tǒng)的統(tǒng)計學如果不改變,又將如何應對大數(shù)據(jù)分析帶來的挑戰(zhàn),該文將從零售行業(yè)的角度分析大數(shù)據(jù)為傳統(tǒng)統(tǒng)計學帶來的諸多挑戰(zhàn)。
關鍵詞:總體數(shù)據(jù) 相關性 個性化營銷 定制服務
隨著科技的發(fā)展,大數(shù)據(jù)已經(jīng)成為信息時代的一場技術革命。大數(shù)據(jù)是指傳統(tǒng)數(shù)據(jù)庫管理工具難以處理的大量的、多樣化的數(shù)據(jù)。當前普遍認為大數(shù)據(jù)有3個特點:第一,數(shù)據(jù)量非常大;第二,數(shù)據(jù)增長速度非???;第三,數(shù)據(jù)類型越來越多樣化[1]。零售業(yè)作為傳統(tǒng)的線下實體經(jīng)營行業(yè),積累了大量的消費者以及管理層的數(shù)據(jù),如果依靠傳統(tǒng)的統(tǒng)計學模型對這些數(shù)據(jù)進行分析,很難得出可以用于企業(yè)經(jīng)營管理的有效信息,加上年輕一代消費者越來越追求個性化,所以傳統(tǒng)統(tǒng)計學所采用的根據(jù)部分樣本推斷總體的分析方法已經(jīng)無法滿足市場的個性化需求,因此,傳統(tǒng)統(tǒng)計學要想跟上時展的步伐,就必須做出與之相適應的改變。
1 零售行業(yè)里大數(shù)據(jù)與傳統(tǒng)統(tǒng)計學的區(qū)別
維克多?邁克爾在《大數(shù)據(jù)時代》一書中提出了大數(shù)據(jù)思維的3個最顯著的變化:一是樣本等于總體。這與過去基于樣本進行統(tǒng)計分析的思維截然不同;二是不再追求精確性。在大數(shù)據(jù)中往往存在“噪音”和罕見事件,這樣的數(shù)據(jù)影響了結果的精確性;三是相關分析比因果分析更重要,在大數(shù)據(jù)時代我們將注意力更多地放在“是什么”而不是“為什么”[2]。大數(shù)據(jù)的以上特性在零售行業(yè)同樣適用,零售行業(yè)的大數(shù)據(jù)與傳統(tǒng)統(tǒng)計學的區(qū)別有以下3點。
第一,大數(shù)據(jù)收集總體數(shù)據(jù),而傳統(tǒng)統(tǒng)計學多采用抽樣的方式收集部分數(shù)據(jù)。傳統(tǒng)統(tǒng)計學在做統(tǒng)計分析時首先針對某一個問題提出假設,然后確定需要調(diào)查對象的總體,由于數(shù)據(jù)采集存在一定的難度,所以統(tǒng)計分析采取從總體中隨機抽樣選取一部分數(shù)據(jù)作為分析的對象,如此的話對隨機抽樣的方法與數(shù)據(jù)采集的準確性要求是非常高的。而大數(shù)據(jù)收集的是數(shù)據(jù)“總體”,在進行分析的時候不會人為進行假設,排除了人的干擾因素,僅僅從數(shù)據(jù)本身出發(fā)進行數(shù)據(jù)分析。在零售行業(yè)如果能運用大數(shù)據(jù)思維分析數(shù)據(jù),從產(chǎn)生數(shù)據(jù)的顧客行為本身出發(fā),針對不同顧客做出個性化營銷,而不是人為假設的話,管理層就可以根據(jù)數(shù)據(jù)進行預測,避免了主觀的經(jīng)驗與直覺的判斷。沃爾瑪作為零售行業(yè)的巨頭,運用大數(shù)據(jù)分析得出的著名的啤酒與尿布理論可以證明這一點。
第二,大數(shù)據(jù)注重個體行為的研究,統(tǒng)計學用樣本數(shù)據(jù)推斷總體行為。傳統(tǒng)的統(tǒng)計學采用抽樣調(diào)查的方式對樣本數(shù)據(jù)進行分析,用樣本推斷總體,那些在圖表上反映出來的異常數(shù)據(jù)被排除在外。大數(shù)據(jù)包容一切數(shù)據(jù),其中包括各種結構化、半結構化、非結構化甚至是異構數(shù)據(jù)。對于零售行業(yè)而言,顧客的總體行為表現(xiàn)是沒有意義的,因為每個顧客的需求不同,在不同的時間和地點需要的商品都不同,只有根據(jù)每位顧客的不同行為進行個性化服務才能讓線下的零售行業(yè)有優(yōu)勢可言。美國高檔連鎖百貨Nordstorm最近開始采用線下實體店客流分析服務供應商Euclid Analytics公司的客流監(jiān)測解決方案Euclid Zero,基于用戶連接Wifi行為來獲取店內(nèi)顧客手機的Mac物理地址并進行線下追蹤,由此可以通過單個顧客在百貨店里的行動路線和滯留時間,從而用于改善商品羅列與室內(nèi)動線以及顧客個性化偏好與推薦服務[3]。
第三,大數(shù)據(jù)注重數(shù)據(jù)之間的相關性,而傳統(tǒng)統(tǒng)計學更加關注數(shù)據(jù)分析的結果。從社會發(fā)展的角度來看,大數(shù)據(jù)對數(shù)據(jù)的關聯(lián)性分析更有助于零售行業(yè)管理層做出決策。對于傳統(tǒng)零售行業(yè)而言,線下的用戶體驗是非常重要的,如果能根據(jù)用戶行為數(shù)據(jù)分析出哪些商品放在一起能促進購買力,那么零售行業(yè)將會有更大的利潤空間,相比之下,統(tǒng)計學進行的結果分析顯得沒有那么重要。
2 大數(shù)據(jù)在零售行業(yè)的優(yōu)勢
邁克爾?舍恩伯格說:大數(shù)據(jù)發(fā)展的核心動力就是人類測量、記錄和分析數(shù)據(jù)的渴望。
第一,大數(shù)據(jù)收集的數(shù)據(jù)是多樣化的、非標準化的,而統(tǒng)計學收集的數(shù)據(jù)都是標準化、結構化的,統(tǒng)計學無法對非結構化的數(shù)據(jù)進行分析與測量。但是在零售行業(yè)僅僅對標準化的數(shù)據(jù)進行分析做出的判斷已無法滿足行業(yè)的需求,通過對用戶在商品前滯留的時間以及與貨架上商品的互動行為產(chǎn)生的數(shù)據(jù)進行分析,從而調(diào)整貨架的位置才是主流。
第二,大數(shù)據(jù)可以實時、快速監(jiān)測與收集數(shù)據(jù),而統(tǒng)計學收集數(shù)據(jù)時間長、難度高。大數(shù)據(jù)收集與處理數(shù)據(jù)的能力對于零售行業(yè)的供應鏈管理十分有效。零售市場可以利用大數(shù)據(jù)對庫存和員工行為進行監(jiān)測,從而為管理層做決策提供依據(jù)。沃爾瑪為了提高大數(shù)據(jù)成果在不同部門之間的高效利用,并增加存貨管理和供應鏈管理的投入回報率,其開發(fā)了Retial Link工具。供應商使用該工具可以預先知道不同店鋪商品銷售和庫存情況,從而能夠在沃爾瑪發(fā)出指令前自行補貨,極大地減少商品斷貨,提高供應鏈的庫存水平[4]。
3 傳統(tǒng)統(tǒng)計學面對大數(shù)據(jù)挑戰(zhàn)要做出改變
大數(shù)據(jù)的出現(xiàn)給我們的生活帶來了巨大的改變,甚至不同國家的政府都將大數(shù)據(jù)作為國家的戰(zhàn)略資源。相比之下,傳統(tǒng)統(tǒng)計學面臨著大數(shù)據(jù)的巨大挑戰(zhàn),如果能根據(jù)自身優(yōu)勢做出改變,傳統(tǒng)統(tǒng)計學仍然具有存在的價值。
第一,改變數(shù)據(jù)的收集方式。統(tǒng)計學收集數(shù)據(jù)時前期要做大量的準備工作,需要耗費大量的人力物力成本,所以想要更加高效收集數(shù)據(jù),就必須做出改變。由于大數(shù)據(jù)是基于互聯(lián)網(wǎng)收集數(shù)據(jù)的,所以對于不使用互聯(lián)網(wǎng)的地區(qū)和群體來說,大數(shù)據(jù)就顯得很無力,而傳統(tǒng)統(tǒng)計學可以在此基礎上發(fā)揮自身勢,在以往的數(shù)據(jù)收集方式上進行創(chuàng)新。
第二,傳統(tǒng)統(tǒng)計學在數(shù)據(jù)的分析思維上也要進行改變。傳統(tǒng)統(tǒng)計學不光要打破只能分析標準化數(shù)據(jù)的魔咒,更要著重分析問題的本質(zhì),而不是一味注重結果分析,雖然“是什么”很重要,但是一直以來探尋事物內(nèi)在本質(zhì)才是不斷推動人類社會進步的動力所在,所以統(tǒng)計學也要學會知道“為什么”。
4 結語
信息技術的發(fā)展是無法想象的,我們無法通過今天來預測未來10年信息行業(yè)的發(fā)展。只有追上時代的腳步,做出順應時代潮流的改變,才能免遭淘汰,對于傳統(tǒng)統(tǒng)計學也是一樣,停留在原地不動是不明智的,改變才是世界的本質(zhì)。而所有技術的變革都將反饋給人類的生活,讓人們和社會從中受益。
摘 要:隨著醫(yī)學健康檔案“電子化、信息化、數(shù)字化、智能化”的管理和醫(yī)學研究資料的不斷積累,醫(yī)學信息大數(shù)據(jù)時代悄然開啟。如何有效地利用這些海量信息為健康管理和健康決策提供支持,本文分析了大數(shù)據(jù)對統(tǒng)計學原理和方法提出的挑戰(zhàn),列出了在醫(yī)學統(tǒng)計學課程教學中應該思考的一些問題。
關鍵詞:大數(shù)據(jù);醫(yī)學統(tǒng)計學;教學
所謂大數(shù)據(jù)(Big Data),是指具有4V特征且用目前的管理、處理技術手段難以進行有效管理和分析的數(shù)據(jù)。4V的含義是數(shù)據(jù)量大(Volume Big),數(shù)據(jù)量級擴大至PB以及ZB級別;數(shù)據(jù)產(chǎn)生、輸入和處理快速化(Velocity Fast);數(shù)據(jù)結構和類型多樣化(Variable Type)及數(shù)據(jù)價值密度低(Value LowDensity)。大數(shù)據(jù)的目的是將數(shù)據(jù)轉化為知識,探索數(shù)據(jù)的產(chǎn)生機制和過程,進行預測和政策制定。隨著醫(yī)學健康檔案“電子化、信息化、數(shù)字化、智能化”的管理,隨著物聯(lián)網(wǎng)在醫(yī)學健康領域的應用,醫(yī)療、護理、康復、保健工作流程中產(chǎn)生的數(shù)據(jù)存儲量呈指數(shù)增長。如何有效地利用這些海量信息為健康管理、臨床治療、醫(yī)院決策及衛(wèi)生政策制定提供支持,是大數(shù)據(jù)時代醫(yī)學信息化帶來的挑戰(zhàn)。美國國家衛(wèi)生研究院(NIH)為此特設立生物醫(yī)學大數(shù)據(jù)研究中心及專項基金。在我國,科技部、國家自然科學基金委、國家社會科學基金委陸續(xù)醞釀和啟動了“大數(shù)據(jù)的處理與應用”系列重大研究項目。
統(tǒng)計是一門數(shù)據(jù)科學,醫(yī)學統(tǒng)計學是關于醫(yī)學健康數(shù)據(jù)的收集、整理、分析和解釋的方法論學科?!按髷?shù)據(jù)”處理對統(tǒng)計學的發(fā)展提出了新的命題,如何將“醫(yī)學信息大數(shù)據(jù)”處理技術融入相關統(tǒng)計學課程教學以促進現(xiàn)代醫(yī)學信息分析技術的發(fā)展?本文做了相關的分析,并提出應該思考的一些問題。
一、大數(shù)據(jù)對統(tǒng)計學原理和方法提出的挑戰(zhàn)
1.統(tǒng)計數(shù)據(jù)產(chǎn)生由“問題導向”到“數(shù)據(jù)驅(qū)動”
目前,統(tǒng)計數(shù)據(jù)的產(chǎn)生主要是基于所要研究的問題而主動進行的“數(shù)據(jù)收集”,落腳點在于如何獲取數(shù)據(jù)。在大數(shù)據(jù)時代,海量數(shù)據(jù)隨處可得,由數(shù)據(jù)驅(qū)動而進行問題研究將非常普遍。那么,獲得數(shù)據(jù)的關鍵點不在于如何獲得,而在于如何識別與選擇。由“問題導向”產(chǎn)生的結構數(shù)據(jù)是經(jīng)過嚴格抽樣設計獲取的,具有系統(tǒng)誤差小、總體代表性好的優(yōu)勢,但是信息量有限,且數(shù)據(jù)獲取周期長。大數(shù)據(jù)流環(huán)境下,海量數(shù)據(jù)中有價值的數(shù)據(jù)可能并不多,即數(shù)據(jù)的價值密度低,且難以避免和判斷數(shù)據(jù)獲取的誤差和偏倚。在很多情況下,統(tǒng)計數(shù)據(jù)不需進行抽取,而是“數(shù)據(jù)樣本即總體”;同時,也要研究如何從源源不斷的數(shù)據(jù)中抽取足以滿足統(tǒng)計目的和精度的樣本,這需要研究新的序貫性和動態(tài)性的抽樣方法。
2.數(shù)據(jù)格式和結構復雜多樣化
目前統(tǒng)計數(shù)據(jù)都是結構化數(shù)據(jù),如疾病空間分布和時間序列數(shù)據(jù)等,可使用二維表格表示,可以方便地被常規(guī)統(tǒng)計軟件讀取和進行分析。在大數(shù)據(jù)背景下,除少量數(shù)據(jù)具有結構化特征外,更多的是半結構和非結構化數(shù)據(jù),如各種格式的文檔、圖片、網(wǎng)頁、圖像、音頻和視頻等。目前,這些半結構和非結構化的大數(shù)據(jù)僅能做到初步的實時業(yè)務應用。如在研究氣候變化與人類健康相關的命題時,需要處理龐大的氣象數(shù)據(jù),而80%以上的氣象數(shù)據(jù)均為非結構化的大數(shù)據(jù),如何將這些非結構化的大數(shù)據(jù)做到降維、分解和長時間序列儲存無疑是統(tǒng)計學面臨的新命題。
3.大數(shù)據(jù)的整合及跨庫分析方法亟待建立
傳統(tǒng)上,數(shù)據(jù)集的合并和拆分都是利用關系數(shù)據(jù)庫技術,如共同的編碼或關鍵字進行操作。在大數(shù)據(jù)環(huán)境,很多數(shù)據(jù)集不再有標識個體的關鍵字,關系數(shù)據(jù)庫鏈接方法不再適用,需要探討利用數(shù)據(jù)庫之間的重疊項目來結合不用的數(shù)據(jù)庫。此外,還可以改變分析思路,如直接利用局部數(shù)據(jù)進行推斷,然后整合這些數(shù)據(jù)集的統(tǒng)計結論。
4.大數(shù)據(jù)對于統(tǒng)計學核心理論的沖擊
一個新生事物的出現(xiàn)將必定導致傳統(tǒng)理論和技術的變革。大數(shù)據(jù)對傳統(tǒng)統(tǒng)計學原理和方法的沖擊是劃時代的。傳統(tǒng)的統(tǒng)計學方法和理論立足于應用抽樣技術在總體中抽取小樣本進行分析,通過樣本統(tǒng)計量推斷總體的參數(shù)和性質(zhì)。在大數(shù)據(jù)背景下,我們更關心的不是數(shù)據(jù)量的大小,而是數(shù)據(jù)所蘊含的信息量及信息的識別和選擇。因此,大數(shù)據(jù)的預處理如數(shù)據(jù)清洗、糾偏完全跳出了傳統(tǒng)小樣本研究的范疇。同時,大數(shù)據(jù)充滿了各種隨機的、非隨機的誤差和偏倚,很難滿足小樣本數(shù)據(jù)精度和分布的要求。在大數(shù)據(jù)時代,需要進一步拓展統(tǒng)計思維,豐富現(xiàn)有統(tǒng)計學的理論和方法,賦予統(tǒng)計學新的生命力。
二、在大數(shù)據(jù)時代對統(tǒng)計學教學的幾點思考
《“十二五”時期統(tǒng)計發(fā)展和改革規(guī)劃綱要》中明確提出,“建立現(xiàn)代統(tǒng)計體系就是建立以現(xiàn)代信息技術為支撐的統(tǒng)計系統(tǒng)”。根據(jù)這個綱要,計算機技術、互聯(lián)網(wǎng)系統(tǒng)、多媒體等現(xiàn)代信息技術在統(tǒng)計技術中將發(fā)揮更重要的作用。在醫(yī)學信息大數(shù)據(jù)時代背景下,醫(yī)學統(tǒng)計學教育是否能夠與時俱進,迎接大數(shù)據(jù)帶來的機遇與挑戰(zhàn)?為此,筆者談幾點思考:
1.補充和加強數(shù)學基礎和計算機應用課程
在大數(shù)據(jù)背景的沖擊下,統(tǒng)計學教育首先要面臨兩大沖擊。一是大數(shù)據(jù)背景下的統(tǒng)計模型將會跳出原有的傳統(tǒng)統(tǒng)計模型框架,需要更廣泛的學習一些數(shù)學概念,如拓撲、幾何和隨機場,這些數(shù)學知識將會在龐大數(shù)據(jù)分析的背景下扮演重要的角色。二是算法和計算機上的實現(xiàn)是傳統(tǒng)教育面對的更大挑戰(zhàn),大數(shù)據(jù)環(huán)境下的數(shù)據(jù)是海量的,同時又是結構化、半結構化、非結構化的混合數(shù)據(jù),處理這些技術需要先進的計算機技術平臺。在大數(shù)據(jù)和信息化的時代背景下,在目前醫(yī)學生的通識教育中,是否應該加強數(shù)學基礎及計算機應用等相關課程的教育?值得思考。
2.滲透大數(shù)據(jù)基本知識和統(tǒng)計思維
統(tǒng)計思維的培養(yǎng),是提高學生處理數(shù)據(jù)和運用數(shù)據(jù)分析實際問題能力的重要一環(huán)。在大數(shù)據(jù)時代,并非所有的醫(yī)學健康問題都通過大數(shù)據(jù)方式去處理,基于小樣本的分析仍然是最基本和最有效的實現(xiàn)方式。因此,傳統(tǒng)統(tǒng)計學基礎和原理仍然為醫(yī)學統(tǒng)計學教育的核心和重點。與此同時,結合大數(shù)據(jù)技術的特點,對統(tǒng)計學的基本知識進行拓展教育,有計劃地將大數(shù)據(jù)的統(tǒng)計分析思維滲透在教學工作中。將大數(shù)據(jù)的基礎知識,如數(shù)據(jù)來源、數(shù)據(jù)結構和格式、收集和篩選,在教學中進行適當補充。引導學生將已有的統(tǒng)計學基本原理和方法運用到大數(shù)據(jù)處理中。
3.擴充實驗教學內(nèi)容,夯實基本軟件操作
統(tǒng)計學是一門處理數(shù)據(jù)的方法學科,重在應用。因此,在系統(tǒng)統(tǒng)計原理教學的基礎上,更加側重實踐性和應用性的訓練。在目前的統(tǒng)計學教學中,學生普遍比較缺乏的不能將醫(yī)學實際問題正確的轉化為統(tǒng)計學問題,不能根據(jù)資料根據(jù)資料的設計類型、性質(zhì)和分析目的靈活選用合適的統(tǒng)計分析方法。通過綜合性的實際案例,將醫(yī)學科研中的實際問題納入教學,使學生虛擬的置身于科研一線,去感受和完成科學研究中的統(tǒng)計學應用。大數(shù)據(jù)時代,數(shù)據(jù)、資料的產(chǎn)生方式發(fā)生了很大變化,因此,需要增加部分大數(shù)據(jù)方面的數(shù)據(jù)、資料收集和整理方法的訓練內(nèi)容。大數(shù)據(jù)背景下,數(shù)據(jù)中除了一些結構性數(shù)據(jù)外,更多的是半結構和非結構化數(shù)據(jù),很難用傳統(tǒng)的二維數(shù)據(jù)表顯示方式予以直觀化。因此,除了目前常用的統(tǒng)計圖、統(tǒng)計表外,還應該逐步補充一些比較復雜的數(shù)據(jù)透視化技術方面的教學,如探索性可視化描述工具、Tableau、TIBCO和QlinkView以及敘事可視化工具等。
在大數(shù)據(jù)時代,在統(tǒng)計學的教與學中,不應要求死記有關概念、定理和計算公式,而應加強統(tǒng)計學基礎性原理與知識的教學,凸出統(tǒng)計學理論與方法的應用性,建立起大數(shù)據(jù)統(tǒng)計思維。學習統(tǒng)計學是為了應用和解決實際問題。對教師來說,教好醫(yī)學統(tǒng)計學的標志是教會學生運用統(tǒng)計思維思考問題和選擇合適的統(tǒng)計方法解決實際健康決策及健康管理問題。對學生來說,學好統(tǒng)計學的標志是建立統(tǒng)計思維,能夠以問題為導向,在統(tǒng)計思想的引導下,選擇合適或最優(yōu)的統(tǒng)計方法,或者通過創(chuàng)新統(tǒng)計方法,有效地解決實際問題。
大數(shù)據(jù)已經(jīng)成為助力互聯(lián)網(wǎng)+發(fā)展的重要手段,成為創(chuàng)客實現(xiàn)夢想的必經(jīng)途徑,其已經(jīng)成為我們生活中不可缺少的一部分,大數(shù)據(jù)正在以一種前所未有的態(tài)勢推動著各行各業(yè)的發(fā)展,其蓬勃發(fā)展的態(tài)勢也標志著大數(shù)據(jù)時代的來臨。
統(tǒng)計學時展
一、引言
大數(shù)據(jù)時代以迅雷不及掩耳之勢席卷世界,在全球范圍內(nèi)掀起了前所未有的數(shù)據(jù)革命浪潮。相對于政府單位的統(tǒng)計數(shù)據(jù)來說,大數(shù)據(jù)主要利用的是多層次、多樣化的數(shù)據(jù)采集方式,整合了多種數(shù)據(jù)的開發(fā)優(yōu)勢,并且利用現(xiàn)代科學技術手段和高速處理以及信息架構數(shù)據(jù)等資源,兼具極高的使用價值和判斷決策能力。一方面,統(tǒng)計調(diào)查數(shù)據(jù)的多樣化發(fā)展趨勢和電子商務產(chǎn)業(yè)的不斷發(fā)展,為統(tǒng)計數(shù)據(jù)的使用方式和生產(chǎn)方式制造了不小的麻煩,不斷地挑戰(zhàn)者政府部門數(shù)據(jù)管理系統(tǒng)和統(tǒng)計數(shù)據(jù)的概念。另一方面,信息技術、網(wǎng)絡發(fā)展以及空間信息技術的不斷進步,為統(tǒng)計生產(chǎn)力的升級發(fā)展提供了廣闊的視角和空間。數(shù)據(jù)量急劇增長的電子化、信息化和產(chǎn)業(yè)化數(shù)據(jù),都成為了統(tǒng)計數(shù)據(jù)發(fā)展的重要來源。種類不斷增多的“大數(shù)據(jù)”資源,正在成為政府統(tǒng)計部門利用研究的重要領域。
二、大數(shù)據(jù)與統(tǒng)計學的區(qū)別
統(tǒng)計知識在大數(shù)據(jù)的利用研究中有多樣化的應用形式,主要是對“大數(shù)據(jù)”進行肢解,對爆炸增長的數(shù)據(jù)信息進行搜索、分類以及整合主要依賴于統(tǒng)計學。因此,大數(shù)據(jù)的相關研究在一定程度上運用了統(tǒng)計學的知識。但是,大數(shù)據(jù)的使用尚未被統(tǒng)計學這門學科充分利用,這主要是因為大數(shù)據(jù)的運用方式,使用模式和統(tǒng)計學之間存在著重要差異。統(tǒng)計學主要利用的是樣本統(tǒng)計資源,樣本主要在根據(jù)既定的概率標準從總體中抽樣調(diào)查,但是隨機抽樣調(diào)查是帶有成本屬性的,例如消耗時間、資本投入的成本等。在樣本數(shù)量逐漸增加的情況下,樣本估計的誤差范圍是伴隨著總體樣本數(shù)量的增大而逐漸增加的,這是樣本統(tǒng)計學不能忽視的缺點。大數(shù)據(jù)時代最具代表性的就是海量的信息數(shù)據(jù)化以及即時電子商務信息,大數(shù)據(jù)在整體上呈現(xiàn)出“總體樣本數(shù)據(jù)化”的趨勢,這樣的特征恰好可以補充樣本統(tǒng)計的弊端。大數(shù)據(jù)環(huán)境下的整體樣本統(tǒng)計即使可以囊括全部的樣本容量,但是因為很多情況下數(shù)據(jù)具有非結構性和半數(shù)據(jù)化的特征,而且大量的數(shù)據(jù)資源呈現(xiàn)的是重視尾部分布的狀態(tài),方差、標準差等標準化的方法變得毫無意義,整體依靠性和不穩(wěn)定性經(jīng)常會超越經(jīng)典時間內(nèi)的時間序列的整體假設性,所以概率論的應用范圍呈現(xiàn)狹窄化的發(fā)展趨勢。因此,統(tǒng)計學在利用大數(shù)據(jù)進行樣本統(tǒng)計的過程中,可以對整體上的數(shù)據(jù)資源進行融合和選擇,這和樣本統(tǒng)計中的數(shù)據(jù)化處理技術存在異曲同工之妙。
三、大數(shù)據(jù)時代統(tǒng)計學教育的發(fā)展
1.全面培養(yǎng)人才素質(zhì)
統(tǒng)計學專業(yè)的學生需要具備良好與人交往能力。統(tǒng)計學的學生很多都是理科出身的學生,不善于交際。但是在日常的工作中,有數(shù)據(jù)經(jīng)驗的科學家應該經(jīng)常和每個部門的工作人員交流,協(xié)同工作。怎么樣才能讓頗具專業(yè)性的數(shù)據(jù)分析結果讓普通的老百姓也可以讀懂,讓每個部門的工作人員都能無障礙地理解,這是不容易做到的。要訓練自己的交往能力和溝通技能,主動地參加演講活動是不錯的渠道,演講活動鍛煉了演講者的自信,在整個演講的過程中,能否清晰地表達自己的思想以及給人以信服力是至關重要的。需要培養(yǎng)數(shù)據(jù)常識,廣其見聞。數(shù)據(jù)科學家經(jīng)常面對各種各樣的海量數(shù)據(jù),并需要從這些數(shù)據(jù)中挖掘出有價值的信息,這就需要數(shù)據(jù)科學家具有強烈的數(shù)據(jù)敏感性。對數(shù)據(jù)的敏感程度的訓練不是一蹴而就的,要經(jīng)過長時間的積累和數(shù)據(jù)分析工作的磨練,同時也可以根據(jù)閱讀數(shù)據(jù)分析材料積累閱歷,提升對數(shù)據(jù)資源的敏感程度。
2.培養(yǎng)應用型人才
大數(shù)據(jù)時代培養(yǎng)的數(shù)據(jù)科學家需要兩方面的基本素質(zhì),第一是概念性,也就前面所說的數(shù)據(jù)科學家需要掌握的基本素養(yǎng)和專業(yè)知識;第二是實踐性,也就是本文中我們提及的應用型人才,也就是實際操作中處理數(shù)據(jù)的能力。在高校開展大數(shù)據(jù)分析研究生學科,最大的問題是沒有可用的數(shù)據(jù),這就需要高效與大數(shù)據(jù)企業(yè)合作,進行研究生的聯(lián)合培養(yǎng),注重學生的實際操作能力,這里面涉及到我們的應用統(tǒng)計學專業(yè)碩士的雙導師培養(yǎng)制度,一名校內(nèi)導師一名校外導師,校內(nèi)導師注重學生的概念性,校外導師注重學生的實踐性,學生通過在校外導師單位的實習,從而熟悉并且掌握實際工作中所需要的技能。
3.促進統(tǒng)計與數(shù)學、計算機學科合作
“大數(shù)據(jù)”時代需要的海量數(shù)據(jù)分析資源僅僅憑借統(tǒng)計學科單一學科的發(fā)展是不能滿足發(fā)展需求的,大數(shù)據(jù)的數(shù)據(jù)結構性特征已經(jīng)拋棄了傳統(tǒng)意義上的數(shù)據(jù)分析模式的非智能化框架,而且數(shù)據(jù)分析需要利用新型的數(shù)據(jù)運算方式以及計算機技能分析,這也是進行數(shù)據(jù)分析工作的攔路虎。所以,數(shù)據(jù)科學家的成長僅僅依靠單一的統(tǒng)計學科知識的學習是遠遠不夠的,其需要的是數(shù)學、計算機和統(tǒng)計學三門學科融合發(fā)展,緊密結合。三門學科之間交叉發(fā)展,融會貫通,這樣既可以發(fā)揮學科的優(yōu)勢資源,同時也能彌補其他學科的弊端。
四、結語
數(shù)據(jù)信息的爆炸式增長使我們在使用統(tǒng)計數(shù)據(jù)處理信息時需要更多的數(shù)據(jù)資源,更有甚者,在很多情況下可以利用全面化的數(shù)據(jù),數(shù)據(jù)資源不再是制約統(tǒng)計分析的唯一因素,大數(shù)據(jù)前提下的統(tǒng)計學效用和粘合度預測的準確程度不斷提升,而且可以發(fā)現(xiàn)諸多在樣本統(tǒng)計基礎上未能顯現(xiàn)的細節(jié)。統(tǒng)計學關鍵優(yōu)勢就是“見微知著”,也是統(tǒng)計學在數(shù)據(jù)環(huán)境下的約束性妥協(xié)。在海量數(shù)據(jù)洶涌襲來的年代,充分發(fā)揮統(tǒng)計學的優(yōu)勢,和大數(shù)據(jù)資源整合發(fā)展,實現(xiàn)“以小見大”和“由繁入簡”的有效結合。
摘要:我們已經(jīng)進入大數(shù)據(jù)時代,統(tǒng)計學作為處理和分析數(shù)據(jù)的科學,必然受到大數(shù)據(jù)的影響。目前我國統(tǒng)計學專業(yè)課程設置和教學內(nèi)容改革還處于探索階段,統(tǒng)計學教育現(xiàn)狀存在亟待解決的問題,統(tǒng)計學教育的改革勢在必行。本文在分析大數(shù)據(jù)時代特征的前提下,分析了我國統(tǒng)計學教育的現(xiàn)狀與挑戰(zhàn)性問題,討論了統(tǒng)計學教育改革的內(nèi)容、方法、借鑒和適應時代要求的變革問題。
關鍵詞:統(tǒng)計學;教育改革;大數(shù)據(jù)
一、引言
最早提出大數(shù)據(jù)時代到來的機構是全球知名的麥肯錫咨詢公司,該公司在一份研究報告中指出:“數(shù)據(jù)已經(jīng)滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產(chǎn)因素,人們對于海量數(shù)據(jù)的挖掘和運用,預示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來”。
大數(shù)據(jù)是隨著互聯(lián)網(wǎng)技術的廣泛應用帶來的數(shù)據(jù)量和數(shù)據(jù)類型激增而衍生出來的一種現(xiàn)象,但大數(shù)據(jù)一詞不僅指規(guī)模大、種類多的數(shù)據(jù)集,還包括對這種數(shù)據(jù)集進行采集、處理與分析以提取有價值信息和直接創(chuàng)造價值的技術構架和技術過程。大數(shù)據(jù)的第一個特征是數(shù)據(jù)量巨大。截止到2012年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。第二個特征是數(shù)據(jù)類型繁多、異構性突出,包括網(wǎng)絡日志、音頻、視頻、圖片、地理位置信息等等。第三個特征是數(shù)據(jù)價值密度較低,數(shù)據(jù)中存在大量重復性和無價值性信息或噪聲。如何通過強大的計算技術和統(tǒng)計分析等方法迅速完成數(shù)據(jù)的價值提純,是大數(shù)據(jù)時代亟待解決的難題。第四個特征是處理速度快、時效性要求高。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。
目前,不同的學科領域?qū)Υ髷?shù)據(jù)概念有著不盡相同的解釋,但各種解釋中大致可以從兩個方面去理解。首先,大數(shù)據(jù)概念體現(xiàn)在數(shù)據(jù)量的巨大、種類的眾多及產(chǎn)生速度的飛快,同時產(chǎn)生的數(shù)據(jù)集極有可能包含著各種半結構化和非結構化數(shù)據(jù);其次,大數(shù)據(jù)概念還體現(xiàn)在對數(shù)據(jù)進行處理的手段和流程方面,由于數(shù)據(jù)量的龐大和類型復雜,利用常規(guī)的統(tǒng)計軟件已經(jīng)無法對當今的數(shù)據(jù)進行及時有效的存儲、分析及處理。因此,所謂的大數(shù)據(jù)并不是單純指數(shù)據(jù)流量的巨大,還指其結構的復雜和種類的多樣,在數(shù)據(jù)處理和分析上需要采用高端計算平臺或高級統(tǒng)計軟件,以及海量數(shù)據(jù)中存在著可挖掘的潛在的大量價值信息與知識。
近年來,隨著高速計算機的應用、信息技術的快速發(fā)展,特別是云計算技術的發(fā)展,使大數(shù)據(jù)的存儲和分析技術得到迅速發(fā)展,目前的核心技術有MapReduce、GFS、BigTable、Hadoop,以及數(shù)據(jù)可視化等。在數(shù)據(jù)搜集上,可方便地通過在線互聯(lián)網(wǎng)數(shù)據(jù)庫獲取二手數(shù)據(jù)或一手實時數(shù)據(jù)。在數(shù)據(jù)分析上,傳統(tǒng)統(tǒng)計學方法采取的是基于統(tǒng)計模型的樣本數(shù)據(jù)分析,而大數(shù)據(jù)分析技術則是通過高端計算平臺,對大數(shù)據(jù)中的信息進行挖掘。
統(tǒng)計學作為對數(shù)據(jù)進行處理和分析的科學,必然受到大數(shù)據(jù)的影響。在大數(shù)據(jù)時代,統(tǒng)計學教育必須與時俱進,跟上時展步伐。近年來,有不少文獻討論了大數(shù)據(jù)環(huán)境下我國統(tǒng)計學教育的改革問題(例如[1]-[5]),本文在分析大數(shù)據(jù)時代特征的前提下,進一步討論我國統(tǒng)計學教育的現(xiàn)狀與挑戰(zhàn)、統(tǒng)計學教育改革的內(nèi)容、方法、借鑒和適應時代要求的變革問題。
二、統(tǒng)計學教育的現(xiàn)狀與挑戰(zhàn)
2013年,教育部對我國統(tǒng)計學專業(yè)設置進行一次新的調(diào)整,將原來的既可授予理學學位,也可授予經(jīng)濟學學位的統(tǒng)計學專業(yè)劃分為統(tǒng)計學、應用統(tǒng)計學和經(jīng)濟統(tǒng)計學三個本科專業(yè)[6]。根據(jù)教育部高等學校統(tǒng)計類專業(yè)教學指導委員會2013年11月公布的數(shù)據(jù),當時全國有194所高校開設了統(tǒng)計學專業(yè),156所高校開設了應用統(tǒng)計學專業(yè),164所高校開設了經(jīng)濟統(tǒng)計學專業(yè)[6]。目前,全國開設這三個統(tǒng)計學專業(yè)的高校個數(shù)和在校學生人數(shù)與2013年相比都有不少的增加。
面對大數(shù)據(jù)時代,我們目前的統(tǒng)計學教育無論在培養(yǎng)目標和教學內(nèi)容上,還是在教育方式和人才培養(yǎng)模式上,都存在著亟待解決的挑戰(zhàn)性問題。例如,在專業(yè)培養(yǎng)目標和人才培養(yǎng)過程中,我們比較重視課程層面上的評價,比較輕視專業(yè)層面上的整體評價,缺乏對學生綜合能力的反饋機制。
關于教學內(nèi)容,目前三個統(tǒng)計學專業(yè)在統(tǒng)計理論和應用統(tǒng)計兩個方面有不同的側重。統(tǒng)計理論主要包括:抽樣理論、實驗設計、估汁理論、假設險驗、決策理論、貝葉斯統(tǒng)計、半?yún)?shù)和非參數(shù)統(tǒng)計、序貫分析、多元統(tǒng)計分析、時間序列分析、小樣本理論和大樣本理論等。在數(shù)據(jù)分析中,現(xiàn)今的統(tǒng)計方法基本以結構化數(shù)據(jù)為主要處理對象,而對非結構化和半結構化數(shù)據(jù)的分析和工具涉及較少。因此,現(xiàn)今統(tǒng)計學課程及內(nèi)容已不能滿足從事非結構型和半結構型的大數(shù)據(jù)研究和商業(yè)應用對人才培養(yǎng)的需要,必須進行必要的改革。
對于教育方式,鑒于大數(shù)據(jù)時代要求,統(tǒng)計分析人員需要具備較高的數(shù)學和現(xiàn)代統(tǒng)計學基礎,具有較高的軟件操作能力,掌握一定的大數(shù)據(jù)收集、整理、分析、處理和挖掘數(shù)據(jù)的技能。日本學者城田真琴認為:“數(shù)據(jù)科學家要有計算機科學專業(yè)背景,數(shù)學、統(tǒng)計方面的素養(yǎng)和使用數(shù)據(jù)挖掘軟件的技能,善于利用數(shù)據(jù)可視化的手法展現(xiàn)晦澀難懂的信息,而且具備相應的專業(yè)知識、眼界和視野,具有適應社會發(fā)展和創(chuàng)造價值的能力”?,F(xiàn)今的統(tǒng)計學教育方式還不能很好適應大數(shù)據(jù)時代數(shù)據(jù)科學人才培養(yǎng)需要,必須進行必要及時的調(diào)整和變革。
對人才培養(yǎng)模式,大數(shù)據(jù)時代不僅要求培養(yǎng)具有數(shù)據(jù)處理和分析所需的基本素質(zhì)與技能,更重視培養(yǎng)從海量數(shù)據(jù)中發(fā)現(xiàn)和挖掘價值信息、把握市場機遇、創(chuàng)造利潤的潛在能力。面對大數(shù)據(jù)時代的諸多挑戰(zhàn),現(xiàn)代統(tǒng)計技術、數(shù)據(jù)挖掘方法、計算機信息技術、軟件工具和理念的日新月異,培養(yǎng)統(tǒng)計人才的教育模式也需要相應變化,統(tǒng)計學教育只有與時俱進,主動做出全面的調(diào)整和變革才能適應新時代知識進步和激烈人才市場競爭的需要,積極迎接大數(shù)據(jù)時代的挑戰(zhàn)。
大數(shù)據(jù)時代對統(tǒng)計學教師有更高的要求,統(tǒng)計學教師需要與時俱進,跟上時代步伐。隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算等信息技術的發(fā)展,對數(shù)據(jù)的分析和處理的技術也隨之要求更高,統(tǒng)計學教師固有的知識體系已不能滿足培養(yǎng)現(xiàn)代統(tǒng)計人才的需要,必須進一步深化和更新原有的統(tǒng)計學理論知識,而且還需要學習掌握計算機技術、互聯(lián)網(wǎng)、數(shù)據(jù)庫和信息科學等有關知識和技術,同時還要熟悉處理非結構型和半結構型數(shù)據(jù)的知識和技能,以適應現(xiàn)代統(tǒng)計學教育對教師的知識結構和基本素質(zhì)的要求。
大數(shù)據(jù)時代對統(tǒng)計專業(yè)的學生也提出了更高的要求,他們不僅需要掌握現(xiàn)代統(tǒng)計理論、統(tǒng)計方法和專業(yè)統(tǒng)計軟件,還要學會如何分析、處理來自互聯(lián)網(wǎng)或各種實際問題中的海量數(shù)據(jù),如何利用統(tǒng)計軟件和互聯(lián)網(wǎng)技術進行數(shù)據(jù)操作,如何借助軟件技術和統(tǒng)計準則判斷數(shù)據(jù)質(zhì)量,如何進行模型選擇和評價模型方法的有效性,如何準確清晰地呈現(xiàn)統(tǒng)計分析結果和結論,等等。
2014年11月,美國統(tǒng)計學會了統(tǒng)計學本科專業(yè)指導性教學綱要 [7],該教學綱要對統(tǒng)計學專業(yè)提出四個方面的要求:(1)具有扎實的數(shù)學和統(tǒng)計學基礎、強大的統(tǒng)計計算和編程能力,熟練使用統(tǒng)計軟件和數(shù)據(jù)庫;(2)分析來自現(xiàn)實問題的真實數(shù)據(jù),真實數(shù)據(jù)是統(tǒng)計專業(yè)教育的重要組成部分;(3)掌握多樣化的統(tǒng)計模型方法;(4)具有通過語言、圖表和動畫等方式解釋數(shù)據(jù)分析結果的能力。美國是統(tǒng)計學教育和人才培養(yǎng)最先進的國家之一,該指導性教學綱要代表著美國統(tǒng)計學專業(yè)培養(yǎng)人才的基本要求和發(fā)展方向,對我國統(tǒng)計教育的改革具有重要的參考價值。以該指導性教學綱要為參考依據(jù),對照我國目前的統(tǒng)計學本科專業(yè)教育,無論是在培養(yǎng)目標和課程設置方面,還是在教學內(nèi)容和教學方法方面,都存在著亟待解決的挑戰(zhàn)性問題。
三、統(tǒng)計學教育的改革
大數(shù)據(jù)時代的統(tǒng)計學教育不僅是各種統(tǒng)計方法、數(shù)據(jù)挖掘方法和信息技術手段的延續(xù)或發(fā)展,更主要的是這些方法的集成應用和在實際數(shù)據(jù)分析中的真實體驗。過去,企業(yè)數(shù)據(jù)庫價格昂貴,在統(tǒng)計學教育的教學案例或?qū)嶒炚n教學中,很少采用真實和海量的數(shù)據(jù)庫資源,基本都是采用過時或虛擬的數(shù)據(jù)。今天,像百度大數(shù)據(jù)引擎這樣的數(shù)據(jù)庫的逐步對外開放,將有助于開展“線上大數(shù)據(jù)統(tǒng)計實驗”教學。為了適應大數(shù)據(jù)時代要求,有必要利用網(wǎng)絡資源以及各種數(shù)據(jù)處理軟件,搭建線上大數(shù)據(jù)分析實驗教學平臺,全面開展大數(shù)據(jù)統(tǒng)計實驗教學的改革。實際上,借助大數(shù)據(jù)分析平臺,本科階段的統(tǒng)計學教育就可以融人聯(lián)機分析和數(shù)據(jù)的可視化教學。其次,要時刻關注大數(shù)據(jù)分析理論的進展,及時將新理論新方法融入課堂教學內(nèi)容。
需要指出的是,在大數(shù)據(jù)時代,經(jīng)典統(tǒng)計理論和方法并沒有過時,但需要進行改進和進一步發(fā)展。這是因為,網(wǎng)上采集的巨型數(shù)據(jù)集往往存在大量的重復性和無價值數(shù)據(jù)信息,使得大數(shù)據(jù)價值密度降低。在對這些數(shù)據(jù)進行分析處理之前往往需要通過去噪、分層、截斷、聚類等方法的預處理,將其變成便于進行分析處理的小數(shù)據(jù),繼而借助于經(jīng)典統(tǒng)計方法進行分析和處理。因而在大數(shù)據(jù)時代仍然需要采用傳統(tǒng)統(tǒng)計學的小樣本理論和方法。所以,即便是在大數(shù)據(jù)時代,經(jīng)典統(tǒng)計方法仍然是進行統(tǒng)計分析的基石,其核心地位不可動搖。所以,在大數(shù)據(jù)時代仍然要強化統(tǒng)計學的基本理論和方法,尤其是在長期發(fā)展和實踐應用中經(jīng)過驗證的、成熟有效的經(jīng)典和現(xiàn)代統(tǒng)計方法,在大數(shù)據(jù)時代仍然沒有過時,但需要結合大數(shù)據(jù)分析的需要對經(jīng)典統(tǒng)計方法進行必要的發(fā)展和改進。
大數(shù)據(jù)科學需要統(tǒng)計學與數(shù)學、計算機等學科的結合。亞馬遜大數(shù)據(jù)科學家John Rauser 認為:“數(shù)據(jù)科學家是統(tǒng)計學家和計算機工程師的結合體”。為了滿足大數(shù)據(jù)時代的要求,統(tǒng)計學專業(yè)的課程設置需要進行必要的調(diào)整。應根據(jù)新時代人才培養(yǎng)的要求,增設與大數(shù)據(jù)前沿領域發(fā)展相關的課程,如計算機網(wǎng)絡和大數(shù)據(jù)相關的軟件應用,同時要加大實驗課和社會實踐課的比重,引導學生理解和掌握大數(shù)據(jù)概念、理論、技術和方法,培養(yǎng)其運用大數(shù)據(jù)的相關分析工具解決實際問題的能力。對于理論課程,除基本統(tǒng)計理論外,還應開設一些較為現(xiàn)代和深入的課程,如現(xiàn)代貝葉斯方法、神經(jīng)網(wǎng)絡、數(shù)據(jù)挖掘、應用隨機過程論等。另外,還應開設與大數(shù)據(jù)分析相關的關聯(lián)規(guī)則、決策樹、機器學習、支持向量機等課程。
為了培養(yǎng)與時代適應的統(tǒng)計學人才,統(tǒng)計學專業(yè)教師應不斷更新自身的知識結構和價值觀念,改變認識數(shù)據(jù)、收集數(shù)據(jù)和分析數(shù)據(jù)的思維,主動學習和補充互聯(lián)網(wǎng)、現(xiàn)代數(shù)據(jù)分析技術、數(shù)據(jù)庫和數(shù)據(jù)挖掘技術,使自己的知識體系不斷更新和提升,跟上時展的步伐。
在大數(shù)據(jù)時代,要注意培養(yǎng)學生適應社會的能力。統(tǒng)計專業(yè)人才培養(yǎng)模式應以提高本專業(yè)學生數(shù)據(jù)分析方面的能力,開闊他們的視野,培養(yǎng)其適應社會的能力。應積極引導學生進入實訓場所動手操作和鍛煉,嘗試以企事業(yè)單位的財政、金融、保險、統(tǒng)計、咨詢和信息公司等部門為主構建專業(yè)性教育實踐基地。鼓勵學生到大數(shù)據(jù)相關的機構部門、產(chǎn)業(yè)園區(qū)和企業(yè)中去調(diào)查研究和實踐。此外,統(tǒng)計專業(yè)應積極同其他專業(yè)進行合作,聯(lián)合培養(yǎng)適應新時代要求的數(shù)據(jù)分析人才。鑒于大數(shù)據(jù)對數(shù)據(jù)分析人員在計算機技術、行業(yè)認知、業(yè)務知識、數(shù)據(jù)分析工具和方法的要求提高,統(tǒng)計學科應主動與計算機、經(jīng)濟學、管理學等相關學科合作,培養(yǎng)學生的計算機能力、專業(yè)素質(zhì)和業(yè)務修養(yǎng)。
“它山之石可以攻玉”,關于統(tǒng)計學專業(yè)的課程設置,可以參考和借鑒美國統(tǒng)計學會公布的統(tǒng)計學本科專業(yè)指導性教學綱要。根據(jù)該教學綱要,統(tǒng)計專業(yè)的課程設置應該涵蓋五個模塊[7]:(1)統(tǒng)計方法與統(tǒng)計理論。建立統(tǒng)計模型并對模型的輸出結果進行評價,熟悉統(tǒng)計推斷,能夠從數(shù)據(jù)分析中得出恰當?shù)慕Y論。(2)數(shù)據(jù)操作和統(tǒng)計計算。熟練使用一款專業(yè)統(tǒng)計軟件進行探索性數(shù)據(jù)分析,發(fā)現(xiàn)和清洗數(shù)據(jù)中的錯誤記錄,具有編程能力和算法思維,可以進行各種數(shù)據(jù)操作,還應掌握統(tǒng)計計算技術,能夠進行模擬研究。(3)數(shù)學基礎。熟練掌握微積分、線性代數(shù)、矩陣論、概率論和數(shù)理統(tǒng)計的基礎知識。(4)實踐訓練和表達能力。具有良好的表達和交流能力,善于通過圖示和動畫等聽眾易于理解的方式展示分析結論,并且具有團隊合作精神和項目領導能力。(5)特定領域的知識。掌握特定應用領域的知識,并用統(tǒng)計學特有的思維方法來分析和解決特定領域的實際問題。
大數(shù)據(jù)時代是以數(shù)據(jù)為中心的時代,統(tǒng)計學專業(yè)的教育改革必須適應這個時代的要求。統(tǒng)計數(shù)據(jù)分析中軟件應用能力至關重要。在眾多統(tǒng)計軟件中推薦使用R和SAS軟件,因為R是免費開源軟件,其統(tǒng)計建模、統(tǒng)計計算和可視化功能強大,更新迅速,是最新統(tǒng)計方法的主要平臺,非常有利于培養(yǎng)學生的編程能力和知識更新能力,而SAS軟件被很多公司用于數(shù)據(jù)管理和數(shù)據(jù)分析,在實際應用領域具有長期而深遠的影響,是數(shù)據(jù)分析不可或缺的專業(yè)統(tǒng)計軟件。當然,教學中也可以嘗試使用其他專業(yè)統(tǒng)計軟件,例如經(jīng)濟統(tǒng)計專業(yè)學生也可使用SPSS軟件,但最好會使用SAS或R軟件。在加強軟件使用和編程能力的基礎上,應加強學生統(tǒng)計計算和統(tǒng)計模擬能力的培養(yǎng)。在大數(shù)據(jù)時代,強調(diào)統(tǒng)計計算的重要性是大勢所趨。統(tǒng)計模擬技術是伴隨著高速計算機和信息技術的快速發(fā)展而廣泛應用的現(xiàn)代技術,可用來解決傳統(tǒng)學科領域中無法解決的問題。例如,在計算技術飛速發(fā)展的今天,貝葉斯統(tǒng)計方法過去曾經(jīng)面臨的計算瓶頸正在逐漸消失,基于馬爾科夫鏈蒙特卡洛(MCMC)技術的統(tǒng)計模擬方法在數(shù)據(jù)分析中的強大威力正在日益顯現(xiàn)[8]。
摘要:移動互聯(lián)網(wǎng)技術與信息技術的飛速發(fā)展加快了大數(shù)據(jù)時代的來臨,而大數(shù)據(jù)時代的來臨在給統(tǒng)計學帶來更多發(fā)展機遇的同時,也給統(tǒng)計學帶來了更多嚴峻的挑戰(zhàn)。為幫助統(tǒng)計學有效應對這些挑戰(zhàn),本文對大數(shù)據(jù)時代給統(tǒng)計學帶來了的挑戰(zhàn)及大數(shù)據(jù)時代背景下統(tǒng)計學應采取的有效改革策略進行了詳細的探究。
關鍵詞:統(tǒng)計學;大數(shù)據(jù)時代;挑戰(zhàn);改革
前言
在這個信息爆炸的二十一世紀,大數(shù)據(jù)幾乎無處不在,交通行業(yè)、圖書館、高校學生檔案管理、企業(yè)財務數(shù)據(jù)、地方文獻等等都是擁有龐大信息量的場所。大數(shù)據(jù)的產(chǎn)生與發(fā)展使得統(tǒng)計學挑戰(zhàn)與機遇并存,傳統(tǒng)統(tǒng)計學方法已不適用于大數(shù)據(jù)處理,難以滿足大數(shù)據(jù)處理需求,而大數(shù)據(jù)處理分析需要以統(tǒng)計學為基礎。所以對大數(shù)據(jù)時代下統(tǒng)計學所面臨的挑戰(zhàn)進行研究具有重要意義。
一、大數(shù)據(jù)時代給統(tǒng)計學帶來的挑戰(zhàn)
大數(shù)據(jù)時代給統(tǒng)計學所帶來的挑戰(zhàn)是多方面的,但集中表現(xiàn)在數(shù)據(jù)的生產(chǎn)、處理與應用方式上以及統(tǒng)計學教育方法、內(nèi)容和人才培養(yǎng)上。在統(tǒng)計學中,數(shù)據(jù)的生產(chǎn)主要是通過相關統(tǒng)計部門,如社會保障機構等開展相應的統(tǒng)計工作來獲得統(tǒng)計數(shù)據(jù),對于數(shù)據(jù)的預處理方式主要是數(shù)據(jù)清洗、數(shù)據(jù)矯正、數(shù)據(jù)填補等[1]。而在大數(shù)據(jù)時代中,對于數(shù)據(jù)的獲取則是借助先進儀器設備如傳感器、測量儀等來實現(xiàn)的,數(shù)據(jù)處理是通過各種軟件,編寫數(shù)據(jù)庫實現(xiàn)的。
二、基于大數(shù)據(jù)時代背景下統(tǒng)計學的改革策略
1.提高統(tǒng)計人員綜合素質(zhì)
大數(shù)據(jù)時代背景下,統(tǒng)計學工作的開展與進行對統(tǒng)計人員素質(zhì)提出了更高的要求,只有統(tǒng)計人員具備較高的道德素質(zhì)、職業(yè)素質(zhì)才能幫助統(tǒng)計學較好的應對大數(shù)據(jù)時代給統(tǒng)計學所帶來的各種挑戰(zhàn)[2]。從企事業(yè)單位和高職高校教育機構兩方面入手:企事業(yè)單位應定期開展崗位培訓工作與思想道德教育活動,增強統(tǒng)計人員專業(yè)技能,提高統(tǒng)計人員思想認識,鼓勵統(tǒng)計人員不斷學習新的統(tǒng)計知識理論,掌握新的統(tǒng)計方法,熟練新型統(tǒng)計工具的操作流程,在企業(yè)內(nèi)部為統(tǒng)計人員工作營造良好統(tǒng)計氛圍,促進全體統(tǒng)計人員素質(zhì)全面提升。對于高校等教育機構,應重視起對統(tǒng)計學專業(yè)學生素質(zhì)的培養(yǎng)與提升,從學生入學開始,從大一開始,在統(tǒng)計學專業(yè)課教學過程中,為學生營造良好的課堂氛圍,加強教師對學生的引導與教育,通過對統(tǒng)計學專業(yè)課程的不斷學習與統(tǒng)計學專業(yè)理論知識的不斷掌握,加深學生對統(tǒng)計學的認識與理解,幫助學生充分意識到統(tǒng)計學是一門需要細心、耐心與專心,需要迎合時展,依據(jù)社會實際需求來進行學習的一門專業(yè),從而讓學生形成自主意識,以主動方式來不斷提升自身素質(zhì)[3]。
2.加強統(tǒng)計人員對新技術的掌握
大數(shù)據(jù)時代之下,新的數(shù)據(jù)處理技術、分析工具、處理設備不斷出現(xiàn),這些新的數(shù)據(jù)處理技術與工具,對于統(tǒng)計學來說既是一種挑戰(zhàn)也是一種機遇,挑戰(zhàn)是因為統(tǒng)計人員對這些新的技術與工具還不夠了解,還沒有掌握這些新技術,機遇表現(xiàn)在這些新技術可以成為推動統(tǒng)計學適應大數(shù)據(jù)時展的有利支撐[4]。但前提是統(tǒng)計學人員對這些新技術有足夠的了解與掌握。所以,基于大數(shù)據(jù)時代背景下,統(tǒng)計學的改革還需要重視起對統(tǒng)計人員新技術的培訓工作,加強統(tǒng)計人員對新技術的學習與掌握。企業(yè)應積極引進新型數(shù)據(jù)處理技術與設備,并以專題講座、培訓、實訓等方式為統(tǒng)計人員提供學習的機會與平臺,通過他們對新數(shù)據(jù)處理技術的學習使統(tǒng)計學更好的服務于大數(shù)據(jù)時代。
3.加快統(tǒng)計學課程教學改革
高職高校等教育機構應與時俱進,跟隨大數(shù)據(jù)時展腳步加快統(tǒng)計學課程教學改革,摒棄傳統(tǒng)落后的教學理念、方式方法,完善統(tǒng)計學教學設備設施,改善統(tǒng)計學教學環(huán)境與教學條件,引進先進統(tǒng)計學教學方法,并在實際改革過程中將統(tǒng)計學教學內(nèi)容和教學方法與大數(shù)據(jù)充分融合,使統(tǒng)計學教學內(nèi)容與教學方法與大數(shù)據(jù)處理分析相協(xié)調(diào)、相適應[5]。統(tǒng)計學課程教學改革,包括課程改革與教學改革兩部分,只有從課程和教學兩方面來對統(tǒng)計學進行改革,才能真正提高統(tǒng)計學對大數(shù)據(jù)時代的適應性,才能使統(tǒng)計學更好的應對大數(shù)據(jù)時代帶來的各種挑戰(zhàn),更好的把握大數(shù)據(jù)時代帶來的發(fā)展機遇。
對于統(tǒng)計學課程改革需要按照新課程標準要求,對課程教學模式、課程目標、課程結構安排,課程內(nèi)容規(guī)劃等進行有效整改,進一步提高課程結構安排的合理性,課程目標的科學性與課程內(nèi)容規(guī)劃的完整性,保證統(tǒng)計學課程重點突出。對于統(tǒng)計學教學改革,需要教師提高自身教學水平,轉變教學理念,采用新的教學方法,構建科學的教學模式,重視實踐實訓教學,提高學生實踐操作能力。
三、總結
綜上所述,大數(shù)據(jù)時代的來臨是時展的必然趨勢,統(tǒng)計學應客觀看待大數(shù)據(jù)時代給其所帶來的各種挑戰(zhàn),并從統(tǒng)計學教育、企業(yè)統(tǒng)計人員等各方面來提高統(tǒng)計學對大數(shù)據(jù)時代的適應性,促進大數(shù)據(jù)與統(tǒng)計學相互協(xié)調(diào)發(fā)展,充分把握與利用大數(shù)據(jù)時代給統(tǒng)計學帶來的機遇,讓統(tǒng)計學成為推動大數(shù)據(jù)處理與分析的有力工具,大數(shù)據(jù)時代成為加快統(tǒng)計學教育改革的高效平臺。
[摘 要]由于科技進步,大型網(wǎng)絡電商不斷興起,博客、微博、微信等社交平臺逐漸建立,龐大的數(shù)據(jù)量隨之出現(xiàn),大數(shù)據(jù)時代到來的信號已經(jīng)發(fā)出。隨著大數(shù)據(jù)時代的來臨,統(tǒng)計學受到了重大的沖擊。因為傳統(tǒng)的統(tǒng)計學教育主要應用抽樣技術,即在總體中隨機抽取部分數(shù)據(jù)樣本進行處理、分析。然而,隨著大數(shù)據(jù)的興起,數(shù)據(jù)量不斷增多,數(shù)據(jù)的總體性不斷強化,對統(tǒng)計學人才的要求也越來越高。所以,在大數(shù)據(jù)時代下,統(tǒng)計學的發(fā)展受到了制約。但另一方面,大數(shù)據(jù)也給統(tǒng)計學的發(fā)展提供了一些機遇,促進統(tǒng)計學的改革創(chuàng)新。為了促進統(tǒng)計學的發(fā)展,培養(yǎng)出更多適應大數(shù)據(jù)時代的新型統(tǒng)計人才,本文對統(tǒng)計學在大數(shù)據(jù)時代面臨的機遇、挑戰(zhàn)和發(fā)展趨勢進行了系統(tǒng)的研究。
[關鍵詞]統(tǒng)計學;大數(shù)據(jù);機遇;挑戰(zhàn);發(fā)展趨勢
統(tǒng)計學是指通過應用數(shù)學以及其他學科的專業(yè)知識,來搜索、整理、分析、評估數(shù)據(jù),從而達到推斷、預測所研究對象的未來發(fā)展情況的一門綜合性學科。隨著大數(shù)據(jù)時代的來臨,全球的數(shù)據(jù)量急速增長,這使在短期內(nèi)完成收集、整理、分析數(shù)據(jù)的任務,變得十分困難,同時也影響到了統(tǒng)計學的正常教學。但是,大數(shù)據(jù)時代也為統(tǒng)計學提供了眾多的數(shù)據(jù)研究對象,為統(tǒng)計學的發(fā)展提供了一個良好的平臺。在這個平臺上,統(tǒng)計學遇到了許多機遇,比如:統(tǒng)計學科體系得到延伸。在大數(shù)據(jù)時代下,只要相關人員把握住這些機遇,順應大數(shù)據(jù)的脈絡走向,那么統(tǒng)計學的發(fā)展趨勢必將趨于良好。
1 統(tǒng)計學在大數(shù)據(jù)時代面臨的機遇
1.1 統(tǒng)計學應用范圍的增大
以往傳統(tǒng)的統(tǒng)計是根據(jù)所要研究的問題而去收集相關數(shù)據(jù),再進行整理、分析、最后得出結論。這種統(tǒng)計,一方面,無法保證收集到的數(shù)據(jù)即是所需要的數(shù)據(jù),也就是說數(shù)據(jù)的時效性得不到保證;另一方面,在大數(shù)據(jù)時代下,數(shù)據(jù)量巨大,欲收集到某一方面的代表性數(shù)據(jù)或者全部數(shù)據(jù)是十分困難的一件事,這就導致相關人員的工作量巨增,工作壓力增大。然而,在大數(shù)據(jù)時代下,統(tǒng)計學不僅僅根據(jù)問題研究數(shù)據(jù),還根據(jù)數(shù)據(jù)挖掘其背后的信息。這一研究方向的轉變意味著大數(shù)據(jù)帶給統(tǒng)計學新的機遇。隨著社會的發(fā)展,許多新型產(chǎn)業(yè)應運而生,但是多數(shù)人不了解這些產(chǎn)業(yè)的運營情況以及促進這些產(chǎn)業(yè)發(fā)展的奧秘。在大數(shù)據(jù)背景下,通過分析、研究新型數(shù)據(jù)往往可以解開一個產(chǎn)業(yè)的“秘密”,或者是將數(shù)據(jù)涉及的信息全面地展現(xiàn)出來,從而促進相關產(chǎn)業(yè)的發(fā)展。因此,統(tǒng)計學應用范圍的增大對產(chǎn)業(yè)的發(fā)展具有重大意義。
1.2 統(tǒng)計效率的提高
傳統(tǒng)的統(tǒng)計在收集數(shù)據(jù)方面,常常會出現(xiàn)數(shù)據(jù)滯后、失效等情況,而在大數(shù)據(jù)時代下,數(shù)據(jù)量大,數(shù)據(jù)的更新速度快,因此,收集到的數(shù)據(jù)的質(zhì)量得到了大幅度提升。不僅如此,在大數(shù)據(jù)時代下,數(shù)據(jù)及時性的特點,給數(shù)據(jù)收集提供了極大的便利,比如:相關人員可以定期進行數(shù)據(jù)收集,這樣不僅能減少工作量,還能確保數(shù)據(jù)的時效性和準確性。另外,在統(tǒng)計的過程中,數(shù)據(jù)多樣性的特點,給數(shù)據(jù)分析提供了極大的便利,比如:大數(shù)據(jù)可以被反復應用在不同方面的研究中。因為,數(shù)據(jù)的多樣性就決定了數(shù)據(jù)應用范圍的廣泛性,特別是在數(shù)據(jù)的統(tǒng)計方面。因此,統(tǒng)計數(shù)據(jù)時就不該將數(shù)據(jù)局限于一種用途,而應該深度挖掘數(shù)據(jù)的應用價值,將數(shù)據(jù)應用于各類相關的研究方面,從而達到降低相關人士的工作量、控制統(tǒng)計成本、提高統(tǒng)計效率的目的。
1.3 統(tǒng)計學科體系的延伸
在統(tǒng)計學中引入大數(shù)據(jù),雖然會給統(tǒng)計學帶來一些挑戰(zhàn),但是同時也會給統(tǒng)計學帶來機遇?,F(xiàn)今,大數(shù)據(jù)逐漸進入統(tǒng)計學科,數(shù)據(jù)的龐大性使樣本統(tǒng)計中的樣本選取和標準確定受到了極大的影響。再加上,在大數(shù)據(jù)時代下,數(shù)據(jù)具備總體的特征,簡單的抽樣調(diào)查無法滿足新時代對統(tǒng)計的要求。因此,傳統(tǒng)統(tǒng)計中的樣本統(tǒng)計會朝著總體統(tǒng)計的方向發(fā)展,統(tǒng)計學科體系將會成為樣本統(tǒng)計與總體統(tǒng)計齊發(fā)展的體系,以此掩蓋樣本統(tǒng)計中的不足,保證統(tǒng)計的有效性。
2 統(tǒng)計學在大數(shù)據(jù)時代面臨的挑戰(zhàn)
2.1 樣本選取及其標準確定的難度增大
樣本統(tǒng)計是現(xiàn)今統(tǒng)計學中最重要的統(tǒng)計方法,統(tǒng)計學正是通過運用該方法對客觀事物的數(shù)據(jù)展開數(shù)量特點及數(shù)量間關系的研究。樣本的選取和其標準的確定,是考察樣本統(tǒng)計是否具備價值的重要依據(jù)。隨著大數(shù)據(jù)時代的來臨,樣本選取和其標準的確定,變得越來越困難。一方面,大數(shù)據(jù)意味著數(shù)據(jù)量不僅十分巨大,甚至大到超乎想象,而且數(shù)據(jù)還有分散性和多樣性的特點。這使在選取樣本的過程時,收集數(shù)據(jù)的難度系數(shù)將變高,標準將很難界定,工作量將加大;另一方面,在大數(shù)據(jù)背景下,人們面對海量數(shù)據(jù),不會只想知道出現(xiàn)這些數(shù)據(jù)的原因,還會想了解這些數(shù)據(jù)代表的涵義。這不僅改變了傳統(tǒng)統(tǒng)計對數(shù)據(jù)的訴求,還迫使統(tǒng)計學進行改革、創(chuàng)新。另外,隨著眾多電商和社交網(wǎng)絡的興起,互聯(lián)網(wǎng)上的數(shù)據(jù)量不斷增多,其研究價值也越來越高。但是,網(wǎng)絡數(shù)據(jù)大都屬于非結構化數(shù)據(jù),而統(tǒng)計學研究的是結構化數(shù)據(jù)。因此,在運用樣本選取方法的過程中,難免會錯失很多有價值的數(shù)據(jù),使樣本選取不夠全面??傊?,大數(shù)據(jù)時代給統(tǒng)計學帶來了挑戰(zhàn)。具體的挑戰(zhàn)體現(xiàn)在:能否將非結構化數(shù)據(jù)轉化為結構化數(shù)據(jù)和是否能找到準確分析非結構化數(shù)據(jù)的方法。
2.2 統(tǒng)計軟件及統(tǒng)計方法欠缺
統(tǒng)計軟件是基于計算機運算環(huán)境下,信息計算機技術迅速發(fā)展而研制出來的。它主要用于提升統(tǒng)計學的數(shù)據(jù)分析和處理的效率,提高一般性的統(tǒng)計實踐操作質(zhì)量,并通過設置統(tǒng)計模型來簡化統(tǒng)計的復雜操作。在大數(shù)據(jù)時代,常見的統(tǒng)計軟件有Eviews、SPSS、SAS、Stata等,但是這些軟件要運用于大數(shù)據(jù),在存儲、傳輸方面還有欠缺,它們還需要得到進一步的完善和升級。可是,完成升級、完善統(tǒng)計軟件的任務相對困難,并且無法與互聯(lián)網(wǎng)、電子商務等公司相提并論。另外,在大數(shù)據(jù)背景下,數(shù)據(jù)不僅具備海量化,多樣化的特點,而且其獲取途徑眾多,因此,分析、研究數(shù)據(jù)變得困難,再加上,我國的統(tǒng)計方法相對欠缺,所以,統(tǒng)計學在大數(shù)據(jù)時代下面臨著挑戰(zhàn)。
3 統(tǒng)計學在大數(shù)據(jù)時代下的發(fā)展趨勢
3.1 加大應用型統(tǒng)計教學力度
統(tǒng)計學和其他理論型學科不同,它是一門實用性極強的學科,無論是非統(tǒng)計學人士,還是統(tǒng)計人員,或多或少的都需要掌握統(tǒng)計學的應用方法和技巧。在大數(shù)據(jù)時代,數(shù)據(jù)具有多樣性、總體性、分散性及海量性等特點,因此,欲從數(shù)據(jù)背后得到精確結論,必須對所研究數(shù)據(jù)進行全面且精準的統(tǒng)計分析。另外,根據(jù)大數(shù)據(jù)的這些特點,不難看出,新時代對統(tǒng)計人才的要求越來越嚴,對統(tǒng)計學教育也更加重視,因此,在統(tǒng)計學教學過程中,加大應用型統(tǒng)計的教學力度必不可少。應用型統(tǒng)計是指輕理論、重實踐的統(tǒng)計教學。這種教學類型,在提高學生的實踐操作能力,幫助積累實踐經(jīng)驗,掌握統(tǒng)計技巧方面,具有重大意義。教師加大應用型統(tǒng)計學的教學力度,主要從三方面入手。第一,加大數(shù)據(jù)收集的教學力度。收集數(shù)據(jù)是統(tǒng)計的基礎步驟,也是初步判斷統(tǒng)計結論是否有效的參考因素。就某種意義而言,只有加強對數(shù)據(jù)收集的教學力度,才能保證學生在大數(shù)據(jù)時代下,能收集到保質(zhì)保量的數(shù)據(jù)。第二,加強數(shù)據(jù)整理的教學力度。由于,在大數(shù)據(jù)背景下,收集到的數(shù)據(jù)具有多樣化、海量化的特點,所以如何高效地整理這些數(shù)據(jù)成為一大難題。正因為如此,才在高校中呼吁教師加大對數(shù)據(jù)整理的教學力度。第三,加大數(shù)據(jù)透視的教學力度。數(shù)據(jù)的透視是指通過數(shù)據(jù)透視化技術,來使非結構化數(shù)據(jù)直觀化的一項教學內(nèi)容。因為在大數(shù)據(jù)時代下,會出現(xiàn)許多非結構化數(shù)據(jù),而傳統(tǒng)的統(tǒng)計方法只能統(tǒng)計結構化數(shù)據(jù),所以,加強數(shù)據(jù)透視的教學力度,有助于提高統(tǒng)計的高效性,幫助培養(yǎng)統(tǒng)計人才。
3.2 提高大數(shù)據(jù)統(tǒng)計思維
無論是在傳統(tǒng)的統(tǒng)計學教育中,還是在大數(shù)據(jù)時代下,統(tǒng)計思維一直都是教師著重培養(yǎng)的一方面。良好的統(tǒng)計思維,不僅能提高學生收集、整理數(shù)據(jù)的能力,還是將理論有效地付諸實踐的重要保證。從另一角度看,如果統(tǒng)計人員不具備統(tǒng)計思維,那么在海量的大數(shù)據(jù)下,就無法準確分辨出所需的數(shù)據(jù),也就無法高效地完成工作。傳統(tǒng)的統(tǒng)計思維包括平均思維、變異思維、普遍聯(lián)系思維、動態(tài)思維等,面對大數(shù)據(jù)時代下,數(shù)據(jù)的混雜性和總體性,提高統(tǒng)計思維還需注重培養(yǎng)學生的大數(shù)據(jù)統(tǒng)計思維。大數(shù)據(jù)思維不僅具備容錯性和復雜性,其還強調(diào)數(shù)據(jù)之間聯(lián)系和注重相關數(shù)據(jù)間的分析。
3.3 加強基礎性統(tǒng)計知識教學力度
現(xiàn)今,統(tǒng)計學教學現(xiàn)狀不容樂觀,學生在學習統(tǒng)計學時,普遍會出現(xiàn)基礎知識薄弱,畏難情緒較嚴重的現(xiàn)象。為了改善統(tǒng)計學教學現(xiàn)狀,緩解大數(shù)據(jù)時代下統(tǒng)計學的危機,教師應加大基礎性統(tǒng)計知識的教學力度,確保每位學生都能掌握良好的統(tǒng)計學知識,從而促進統(tǒng)計學的發(fā)展。由于統(tǒng)計學中的概念、公式較多,而且較抽象,學生不易理解,所以,教師要盡量做到深入淺出,保證學生準確掌握相關知識。但是,不是所有教學內(nèi)容都可以做到深入淺出,所以,教師應重視基礎知識的教學。只有在學生對統(tǒng)計學的基礎概念、公式、原理等都充分了解的情況下,才能為后續(xù)的學習打下堅實的基礎,才能提高后續(xù)教學的效率。大數(shù)據(jù)時代的到來,促使統(tǒng)計學進行改革。在改革后,統(tǒng)計學的教學要求更嚴,教學內(nèi)容更深,所以,不具備良好的統(tǒng)計學基礎是無法完成學業(yè)的,更無法促進統(tǒng)計學的發(fā)展,培養(yǎng)出新型統(tǒng)計學人才。
3.4 重視復合型人才培養(yǎng)
統(tǒng)計學不僅能為數(shù)學、物理等學科提供數(shù)據(jù)分析方法,還在生活、經(jīng)濟等領域具備重大意義。以前,數(shù)據(jù)簡單化,來源較單一,所以對統(tǒng)計人才的要求并不高。然而,隨著大數(shù)據(jù)時代的來臨,統(tǒng)計人才不再是單純具備良好統(tǒng)計知識的人,而是復合型人才。在大數(shù)據(jù)時代下,許多數(shù)據(jù)比較混亂、龐雜,只有具備良好的編程技能、統(tǒng)計能力的人,才能將其收集、整理為有價值的數(shù)據(jù)。在大數(shù)據(jù)時代下,行業(yè)間競爭十分激烈,數(shù)據(jù)的統(tǒng)計工作也變得十分艱辛,只有具備大數(shù)據(jù)專業(yè)知識,超強的數(shù)據(jù)分析、處理能力的人,才能在這個時代具備強大的競爭力。在大數(shù)據(jù)時代,統(tǒng)計不是單純的加減運算,只有具備統(tǒng)計思維、數(shù)據(jù)甄別能力、計算機專業(yè)技術的復合人才,才能高效地進行統(tǒng)計工作。因此,在大數(shù)據(jù)背景下,培養(yǎng)復合型人才十分必要。
4 結 語
統(tǒng)計學作為教育階段最重要的學科之一,不僅能促進物理、數(shù)學等學科的發(fā)展,在推動政府的情報決策、工商業(yè)的發(fā)展方面也具有重大意義。地方政府在進行市場經(jīng)濟的宏觀調(diào)控、指導、規(guī)劃等方面離不開統(tǒng)計,也只有對數(shù)據(jù)開展精細的分析、統(tǒng)計工作,才能得到更具說服力、更具價值的結論,實踐于生活中才更有利。而且,在人口普查、環(huán)境評估等方面也會經(jīng)常運用到統(tǒng)計學。由此可見,統(tǒng)計學十分重要。雖然,我國的統(tǒng)計學教學現(xiàn)狀不容樂觀,在大數(shù)據(jù)背景下,統(tǒng)計學還面臨眾多挑戰(zhàn),但是,相關人員更應看見其中的機遇,把握好時機,共同努力,攜手推進統(tǒng)計學的發(fā)展。
【摘要】隨著信息技術的不斷發(fā)展,大數(shù)據(jù)的時代已然來臨,大數(shù)據(jù)對人們的生活生產(chǎn)都產(chǎn)生了巨大的影響。大數(shù)據(jù)給統(tǒng)計學的發(fā)展也帶來了許多挑戰(zhàn)與機遇,基于大數(shù)據(jù)背景下的統(tǒng)計學在當前不斷地發(fā)展。本文對大數(shù)據(jù)和統(tǒng)計學的概念進行了分析,對大數(shù)據(jù)時代下的統(tǒng)計學進行了詳細的介紹,并提出了一些大數(shù)據(jù)時代下的統(tǒng)計學的未來的展望。
【關鍵詞】大數(shù)據(jù)統(tǒng)計學應用
大數(shù)據(jù),主要是指龐大的數(shù)據(jù)資訊,由于其數(shù)據(jù)之龐大,人們不能利用當下主流的軟件在一定時間內(nèi)對其進行提取、分析從而幫助決策者決策的資訊;統(tǒng)計學,主要是對數(shù)據(jù)進行分析、整理,再以較為直觀的方式呈現(xiàn)出數(shù)據(jù)的特征,以供人們、參考、決策。隨著信息技術的不斷發(fā)展,當今時代已是大數(shù)據(jù)的時代,大數(shù)據(jù)在全世界范圍內(nèi)都得到了不同程度的發(fā)展,傳統(tǒng)統(tǒng)計學由于自身具有的單調(diào)性,被人們將其與大數(shù)據(jù)緊密結合,并且在各個領域中加以利用。大數(shù)據(jù)時代下的統(tǒng)計學應用已經(jīng)成為了一種發(fā)展的潮流。社會在不斷發(fā)展著,信息也在不斷地進步,許多人都開始注意到數(shù)據(jù)的重要性。就目前的情況而言,實用的數(shù)據(jù)很多,我們可以對其進行利用,從而提高生產(chǎn)力的發(fā)展水平,并且解決一些民生方面的問題。因此大數(shù)據(jù)時代的統(tǒng)計學應用十分重要。
1統(tǒng)計學與大數(shù)據(jù)的簡單概述
1.1統(tǒng)計學概述及其性質(zhì)
統(tǒng)計學是一門主要對數(shù)據(jù)進行收集并通過直觀的方式將其表現(xiàn)出來的一門科學。在傳統(tǒng)的統(tǒng)計學中有兩種主要的統(tǒng)計方法,即推斷統(tǒng)計和描述統(tǒng)計法。在推斷統(tǒng)計中,主要是通過對已知樣本進行推斷,推斷出總體參數(shù),將推斷出的數(shù)據(jù)用概率的方式表示出來。描述統(tǒng)計則是對所收集的數(shù)據(jù)進行處理,將其結果用統(tǒng)計圖等圖表形式直觀地表現(xiàn)出來。
統(tǒng)計學有包含如下幾個基本性質(zhì):
統(tǒng)計學的主要目的是對數(shù)據(jù)進行研究。統(tǒng)計學所研究的數(shù)據(jù)并不是抽象的,而是客觀真實存在的數(shù)據(jù)。這些數(shù)據(jù)有大有小,可以是微觀的粒子,也可是廣闊無垠的宇宙;甚至可以追溯至遠古時期的人類發(fā)展以及未來的發(fā)展。
統(tǒng)計學的主要研究方法是歸納與推斷。統(tǒng)計學主要通過對樣本數(shù)據(jù)進行延伸,將其上升至整體,從而得出一般結論。也就是我們所說的通過現(xiàn)象對其本質(zhì)進行研究。這個方法主要是有小到大,由個體到整體。
統(tǒng)計學的研究結論往往是不確定的。在統(tǒng)計學中對數(shù)據(jù)的提取主要是通過抽樣進行的,抽樣數(shù)據(jù)并不是整體數(shù)據(jù),它只能代表整體數(shù)據(jù)的一部分。因此,不可避免的,統(tǒng)計學研究結論會帶有不確定性,這也是傳統(tǒng)統(tǒng)計學中不可避免的缺點。
統(tǒng)計學最重要的特點是其聯(lián)系范圍的廣闊性。在大部分學科中,以及人們的生產(chǎn)生活中,脫離不了數(shù)據(jù),而數(shù)據(jù)必須要通過統(tǒng)計才能發(fā)揮其作用,因此,統(tǒng)計學與各個學科聯(lián)系緊密,也與人們生產(chǎn)生活息息相關。
1.2大數(shù)據(jù)的產(chǎn)生與發(fā)展
當今時代是互聯(lián)網(wǎng)高速發(fā)展的時代,也屬于信息發(fā)展的時代。由于信息量的龐大,不可避免地會出現(xiàn)各種各樣的數(shù)據(jù)。大數(shù)據(jù)就是信息高速發(fā)展的產(chǎn)物,它包括了各種各樣數(shù)據(jù)的交匯,它不是傳統(tǒng)意義上單一的數(shù)據(jù)。我們可以將大數(shù)據(jù)看成是各種數(shù)據(jù)的集合,通過對各類數(shù)據(jù)進行整合、交叉運用,在云計算基礎上對數(shù)據(jù)進行處理和運用,并且形成一種可供我們利用的智力資源和強大的知識服務能力。
大數(shù)據(jù)雖然數(shù)據(jù)量大,但是價值密度低,數(shù)據(jù)類型多且復雜,但是處理的速度快,這也是大數(shù)據(jù)的四大特點。從中我們不難看出大數(shù)據(jù)十分注重對海量數(shù)據(jù)的處理,在預測方面具有十分的優(yōu)勢。與目前擁有的其他技術相比,大數(shù)據(jù)所具有的“速度”“廉價”“優(yōu)化”這三個方面所綜合起來的成本是最低的。在我們的生產(chǎn)生活中,大數(shù)據(jù)給我們提供的可量化維度是以前所不具有的,它對我們的生活生產(chǎn)帶來了許多方便,在新發(fā)明和新服務方面起到了不可替代的作用。
大數(shù)據(jù)不僅給我們帶來了機遇也帶來了挑戰(zhàn)。大數(shù)據(jù)的數(shù)據(jù)量之龐大,有更多的數(shù)據(jù)需要我們分析,傳統(tǒng)的抽樣方法已不再適用。在大數(shù)據(jù)面前,對數(shù)據(jù)精度的要求有所減少,進而更加注重對整體信息的獲?。晃覀円灿芍白⒅厥聞罩g的因果關系轉而注重事務之間的相互聯(lián)系,從中獲取對我們更具價值的信息。
目前,在我國許多企業(yè)中對大數(shù)據(jù)利用的能力還不足,產(chǎn)生了效率低、成本高、耗能高等問題。如何對大數(shù)據(jù)進行利用并推動企業(yè)發(fā)展是我們當下所面臨的問題,在大數(shù)據(jù)背景下,對海量數(shù)據(jù)進行高效合理的利用對未來大數(shù)據(jù)的發(fā)展十分重要。
1.3大數(shù)據(jù)的研究動向與信息問題
1.3.1大數(shù)據(jù)的研究動向
當前,國外一些機構對大數(shù)據(jù)環(huán)境下的發(fā)展提出了一些極具挑戰(zhàn)性的問題。比如如何對高度分布的數(shù)據(jù)資源進行處理,對數(shù)據(jù)來源的追蹤,對樣本的核實等等。他們在大數(shù)據(jù)的處理方法上進行了改進,開發(fā)了一系列的算法。在我國,也十分重視對大數(shù)據(jù)的研究。對大數(shù)據(jù)的研究還專門召開了會議進行討論,國家設立了專項的研究計劃,設立了專項的研究基金。而大數(shù)據(jù)最終的服務對象是廣大的企業(yè),因此,在企業(yè)方面也開展了合作計劃。大數(shù)據(jù)的研究并不能只依靠單一的統(tǒng)計學,其他學科也應該重視大數(shù)據(jù)對自身學科發(fā)展的影響。在計算機領域,相關的計算機人才除了掌握扎實計算機技能,也應該對大數(shù)據(jù)有所掌握。計算機與統(tǒng)計學關系緊密,因此,計算機領域在大數(shù)據(jù)與統(tǒng)計學中也扮演了重要的角色。
1.3.2大數(shù)據(jù)的信息問題
當今時代是數(shù)據(jù)信息的時代,大數(shù)據(jù)所包含的數(shù)據(jù)量十分龐大,人們需要對這些數(shù)據(jù)研究就必須將這些數(shù)據(jù)相互融合起來。將數(shù)據(jù)融合就需要清楚數(shù)據(jù)的來源以及如何對這些數(shù)據(jù)進行獲取的。在獲取數(shù)據(jù)的過程中,數(shù)據(jù)的來源復雜并且數(shù)量龐大,不可避免地就會出現(xiàn)一些問題。比如原始數(shù)據(jù)遭到破壞,因為大數(shù)據(jù)主要注重對數(shù)據(jù)整體的獲取,因此,在某些數(shù)據(jù)上出現(xiàn)問題在所難免,甚至所取得的數(shù)據(jù)不是原始數(shù)據(jù),而是經(jīng)過分析推斷后的預測數(shù)據(jù)。因此,我們要引起足夠的重視,重視數(shù)據(jù)的獲取,避免取得一些遭到破壞的數(shù)據(jù)。
另一方面,在大數(shù)據(jù)的獲取過程中也很容易造成數(shù)據(jù)的缺失。而數(shù)據(jù)缺失的最直接的結果就是影響數(shù)據(jù)的分析。有些不同領域的研究卻需要相同的數(shù)據(jù),這就造成了數(shù)據(jù)的重疊,比如經(jīng)濟和保險,兩者分屬于不同的領域,但是在具體的研究過程中某些數(shù)據(jù)的利用是相同的。在我們對數(shù)據(jù)進行分析時,要特別注意兩個方面的數(shù)據(jù)。一方面是觀察得到的數(shù)據(jù),另一方面是實驗得到的數(shù)據(jù)。這兩個數(shù)據(jù)所包含的具體信息是不同的,但是卻仍然會使得一些人對數(shù)據(jù)產(chǎn)生錯誤的認知。這是因為數(shù)據(jù)本身是具有特定的范圍的,我們對數(shù)據(jù)進行收集的同時,實際上也就確定了這一屬性,所以當我們需要一些超出這個范圍的含義就需要我們對這些數(shù)據(jù)進行推斷。
2大數(shù)據(jù)時代的統(tǒng)計學的具體應用
2.1大數(shù)據(jù)時代的統(tǒng)計學在企業(yè)中的應用
在企業(yè)的生產(chǎn)、經(jīng)濟活動中,統(tǒng)計學都占據(jù)著十分重要的地位。企業(yè)通過對統(tǒng)計方法的利用,建立了風險監(jiān)測體系。但是單純運用傳統(tǒng)的統(tǒng)計方法是遠遠不夠的,企業(yè)往往會將大數(shù)據(jù)與統(tǒng)計學相互結合,從而對公司進行實時的監(jiān)管。在企業(yè)的生產(chǎn)活動中,涉及了許多方面的數(shù)據(jù),包括各個月份、各個季度的總體收入,各個具體項的收入情況,整體支出情況、具體項的支出情況等等,這就包含了十分龐大的數(shù)據(jù)量。因此,在企業(yè)中往往利用大數(shù)據(jù)對整體的數(shù)據(jù)進行把握,在根據(jù)統(tǒng)計方法進行分析、總結,以此對企業(yè)進行實時的監(jiān)管,并建立了相對完整的風險監(jiān)測體系。
2.2大數(shù)據(jù)時代的統(tǒng)計學在農(nóng)業(yè)中的應用
農(nóng)業(yè)的生產(chǎn)與我們息息相關,我們可以以水稻為例,對其進行具體的分析。影響水稻產(chǎn)量的原因有許多,氣候、土壤、環(huán)境、營養(yǎng)等都是影響水稻產(chǎn)量的重要因素。但是由于技術的發(fā)展,水稻在全國范圍內(nèi)十分廣闊地種植,利用傳統(tǒng)的統(tǒng)計學方法勢必不能對影響水稻產(chǎn)量的因素進行很好的分析。但是將統(tǒng)計學與大數(shù)據(jù)相結合,卻能夠?qū)τ绊懫洚a(chǎn)量的原因進行很好的把握。當前,由于科學技術的發(fā)展,我們可以對水稻的種植環(huán)境進行各個方面的監(jiān)測,比如土壤、水分、養(yǎng)料等,從而得到一系列的數(shù)據(jù),這些數(shù)據(jù)數(shù)量龐大并且數(shù)據(jù)種類繁多,傳統(tǒng)的抽樣方法不能夠?qū)ζ溥M行整體的把握,只有對整體數(shù)據(jù)進行分析,將其原因進行統(tǒng)計才能真正得出影響水稻產(chǎn)量的因素。這是大數(shù)據(jù)時代的統(tǒng)計學在農(nóng)業(yè)方面的典型應用,通過對整體數(shù)據(jù)的把握,并對其進行統(tǒng)計分析,從而得出我們想要的結果。
2.3大數(shù)據(jù)時代的統(tǒng)計學在其他學科方面的應用
大數(shù)據(jù)給人們的生產(chǎn)生活都帶來了影響,各行各業(yè)的勞動者也紛紛通過對數(shù)據(jù)的利用來帶動行業(yè)的發(fā)展,通過對數(shù)據(jù)的利用達到解決問題的目的。隨著科技的發(fā)展,我們在出行之前會習慣性地對交通、天氣等狀況進行查詢。事實上,我們所利用的這些軟件都與大數(shù)據(jù)和統(tǒng)計學息息相關。交通狀況主要是對該路況進行實時的監(jiān)測,比如人流量、車流量等,通過對這些數(shù)據(jù)的實時監(jiān)測,再將其進行統(tǒng)計分析,得到具體的交通狀況,并且以直觀的圖表方式呈現(xiàn)給我們。還有我們都十分熟悉的翻譯軟件,我們?nèi)粘5膶W習中,會使用到一些翻譯軟件,實際上這些翻譯軟件也和大數(shù)據(jù)、統(tǒng)計學息息相關。在這些軟件當中,儲存了十分龐大的詞匯量,當我們使用翻譯功能是,會統(tǒng)計出最常用的句子,并且按檢索次數(shù)呈現(xiàn)出來。這些都是大數(shù)據(jù)下背景下的統(tǒng)計學的應用,這些應用都給我們的生活帶來了便利。
3統(tǒng)計學在大數(shù)據(jù)時代下的機遇與挑戰(zhàn)
3.1統(tǒng)計學與大數(shù)據(jù)的聯(lián)系十分緊密
統(tǒng)計學主要是對數(shù)據(jù)進行研究,通過對數(shù)據(jù)的研究分析進而得出結論。在統(tǒng)計學中,研究的數(shù)據(jù)范疇十分廣,包括定量數(shù)據(jù)、定性數(shù)據(jù)、截面數(shù)據(jù)、實驗數(shù)據(jù)等等,都是統(tǒng)計學所要研究的數(shù)據(jù)對象。而大數(shù)據(jù)就是各種數(shù)據(jù)的集合,它包含了各式各樣的數(shù)據(jù)類型,簡單的、復雜的。統(tǒng)計學與大數(shù)據(jù)都主要是圍繞數(shù)據(jù)進行展開的,這是統(tǒng)計學與大數(shù)據(jù)之間的一種內(nèi)在聯(lián)系。因此,我們可以將統(tǒng)計學與大數(shù)據(jù)相結合,改變傳統(tǒng)統(tǒng)計學中對數(shù)據(jù)抽樣研究的方法,轉變成對整體的數(shù)據(jù)進行研究,從而得出更能為我們所利用的研究結果。
3.2大數(shù)據(jù)使傳統(tǒng)統(tǒng)計學得到改進和補充
傳統(tǒng)的統(tǒng)計學中,在對數(shù)據(jù)量大的數(shù)據(jù)處理中存在著明顯的不足,其數(shù)據(jù)處理過程中,往往存在滯后性和低頻性等問題。我們以經(jīng)濟學里的消費物價指數(shù),也就是CPI為例。我們所得到的CPI報表中,往往在時間上存在著一定的滯后性,本月的CPI數(shù)據(jù)只能在下個月才能得到相關的數(shù)據(jù)報表。由于時間上存在著滯后性,許多政策的制定都會受到影響,不能根據(jù)情況及時的做出調(diào)整。而大數(shù)據(jù)就隨時提供當前階段的“價格指數(shù)”,對市場進行實時的監(jiān)測,它的時間頻率甚至甚至可以小到以天為單位,提供每天的價格指數(shù)。借助大數(shù)據(jù),可以對市場價格進行實時的監(jiān)測,我們可以對市場價格作出合理的調(diào)節(jié),從而減少出現(xiàn)通貨膨脹和通貨緊縮的情況發(fā)生。我們可以利用大數(shù)據(jù)對信息全面掌控和對總體覆蓋的優(yōu)勢,對數(shù)據(jù)進行全面地分析,從而補充傳統(tǒng)統(tǒng)計學中的不足。
3.3統(tǒng)計學思想在大數(shù)據(jù)時代中的轉變
在當前的統(tǒng)計學中,由于整體數(shù)據(jù)量龐大,我們往往會通過樣本對整體進行分析。在這一過程中,往往十分重視樣本數(shù)據(jù)的精確程度,傳統(tǒng)統(tǒng)計學重視樣本的數(shù)據(jù)的精確程度。而大數(shù)據(jù)往往相反,大數(shù)據(jù)呈現(xiàn)的是一個整體,由于整體數(shù)據(jù)十分龐大,對于其數(shù)據(jù)的精確程度勢必不能很好的把握,因此,大數(shù)據(jù)重視整體數(shù)據(jù)的情況,對于其樣本精確程度并沒有做很高的要求。在大數(shù)據(jù)中,我們的立足點是整體數(shù)據(jù)而不拘泥于某個樣本,看中的也是整體數(shù)據(jù)所呈現(xiàn)出來的價值,大數(shù)據(jù)中“樣本即是整體”的概念與傳統(tǒng)統(tǒng)計學重視樣本的概念不同,大數(shù)據(jù)的這一整體概念對統(tǒng)計學的思想有著十分重要的影響。
3.4統(tǒng)計學與大數(shù)據(jù)互相促進,共同發(fā)展
當前所處的時代是大數(shù)據(jù)發(fā)展的時代,大數(shù)據(jù)的發(fā)展十分迅猛,這給統(tǒng)計學的發(fā)展帶來重大的影響,使統(tǒng)計學的發(fā)展具有劃時代的意義。傳統(tǒng)的統(tǒng)計學通過樣本對整體進行把握,大數(shù)據(jù)對其進行突破,通過對整體數(shù)據(jù)的把握,得出一系列更具效益的結論。而在統(tǒng)計學中,其對數(shù)據(jù)的細致分析,準確推斷,對統(tǒng)計理論的應用和掌握也十分值得借鑒。只有將二者進行結合,才能發(fā)揮更大的作用。我們應該充分利用大數(shù)據(jù)所帶來的巨大信息量,運用統(tǒng)計的方法對其進行整體感知,在大數(shù)據(jù)時代的發(fā)展中,迎接它所帶來的機遇和挑戰(zhàn)。只有將大數(shù)據(jù)和統(tǒng)計學進行有效的結合,才能給我們的生活生產(chǎn)的發(fā)展做出貢獻。
4結語
一個新事物的到來,必然會對傳統(tǒng)的事物產(chǎn)生影響。大數(shù)據(jù)時代的到來也對統(tǒng)計學產(chǎn)生了深刻的影響,大數(shù)據(jù)給統(tǒng)計學帶來了新的生命力。目前很多學科的發(fā)展都融入了大數(shù)據(jù)的潮流之中,作為與大數(shù)據(jù)聯(lián)系緊密的統(tǒng)計學如果不進行改革創(chuàng)新,那么終將會被邊緣化,阻礙自身的發(fā)展。大數(shù)據(jù)給統(tǒng)計學帶來了挑戰(zhàn),但是不可否認的是大數(shù)據(jù)也給統(tǒng)計學的發(fā)展帶來了機遇,我們在抓住機遇的同時還應該意識到傳統(tǒng)的統(tǒng)計學中,一些方法已經(jīng)不能滿足當今數(shù)據(jù)的分析?;谶@一現(xiàn)狀,統(tǒng)計學家不能盲目將傳統(tǒng)的數(shù)據(jù)環(huán)境當成研究的目的,而是應該積極融入到新事物當中,迎接挑戰(zhàn),使大數(shù)據(jù)時代下的統(tǒng)計學能夠得到更好的應用和發(fā)展。
摘要:大數(shù)據(jù)給應用統(tǒng)計學專業(yè)帶來機遇與挑戰(zhàn)。本文針對應用統(tǒng)計學專業(yè)的自身特點和大數(shù)據(jù)下的新特點,剖析了現(xiàn)有教學體系中存在的問題,探討和改革了應用統(tǒng)計學專業(yè)人才培養(yǎng)目標定位、課程調(diào)整與設置、教學內(nèi)容、教學手段等。
關鍵詞:大數(shù)據(jù);應用統(tǒng)計學;教學改革
一、研究背景
自2002年桂林理工大學在廣西開辦了第一個統(tǒng)計學本科專業(yè)以來,針對當時理學學位的統(tǒng)計學專業(yè)培養(yǎng)的學生雖然數(shù)理基礎相對扎實,但普遍統(tǒng)計思想不夠,實際應用能力較弱的現(xiàn)狀和特點,對統(tǒng)計學專業(yè)進行了全方位的改革研究,確立了"數(shù)學與統(tǒng)計學相融,從培養(yǎng)學生扎實的數(shù)理基礎和極強的統(tǒng)計分析應用能力有機相結合的理念出發(fā),構建了新的課程體系和教學內(nèi)容,取得了系列研究成果。2009年研究成果開創(chuàng)“應用性、實驗性、案例性”一體化的統(tǒng)計學專業(yè)課程體系和教學模式,獲得廣西高等教育自治區(qū)級教學成果二等獎[1],并在其后分別把統(tǒng)計學學科建成廣西重點學科和廣西高等學校優(yōu)勢特色專業(yè),以及把應用統(tǒng)計實驗室建成廣西高等學校重點實驗室。
雖然我校統(tǒng)計學專業(yè)的教學改革和建設取得了許多成果,但近幾年,我們也逐漸感覺到在大數(shù)據(jù)新形勢下,我校應用統(tǒng)計學專業(yè)的教學體系還有一些不適應的地方,且某些問題還有日益凸顯的趨勢,我們原來的某些研究成果已不再適應新時代的要求,這就迫使我們繼續(xù)進行改革研究,探討在大數(shù)據(jù)背景的新形勢下,如何培養(yǎng)統(tǒng)計學專業(yè)復合型和應用型人才,如何準確把握統(tǒng)計學的發(fā)展方向與發(fā)展形勢,如何調(diào)整人才培養(yǎng)模式,如何調(diào)整相關課程和課程內(nèi)容,以培養(yǎng)適應大數(shù)據(jù)背景下社會經(jīng)濟發(fā)展需要的統(tǒng)計學專業(yè)人才。
許多國家越來越重視數(shù)據(jù)在大數(shù)據(jù)時代重要作用,我國也不例外,2012年9月,國家統(tǒng)計局第7次局務會提出,盡快開展在政府統(tǒng)計中應用大數(shù)據(jù)的研究。2013年可以看作是我國政府統(tǒng)計之大數(shù)據(jù)元年。2015年9月《國務院關于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知》(國發(fā)〔2015〕50號)[2]頒布,標志著我國正逐步進入大數(shù)據(jù)建設的新時代,為此,國家統(tǒng)計局積極推動大數(shù)據(jù)在各方面的應用與實踐。而大數(shù)據(jù)的核心是數(shù)據(jù),應用統(tǒng)計學學科是與數(shù)據(jù)分析處理聯(lián)系最為緊密的應用性學科,因此,應用統(tǒng)計學專業(yè)的教學體系應順應大數(shù)據(jù)發(fā)展的趨勢。在大數(shù)據(jù)背景下,應用統(tǒng)計學專業(yè)在繼承傳統(tǒng)數(shù)據(jù)分析技術的基礎上,對所需的數(shù)據(jù)處理技能提出的需求更高了。這就是說,大數(shù)據(jù)對應用統(tǒng)計學的培養(yǎng)目標,以及教學內(nèi)容等的沖擊無疑是最大且不可避免的,這給應用統(tǒng)計學專業(yè)帶來了巨大的挑戰(zhàn),同時也為應用統(tǒng)計學學科的發(fā)展帶來了前所未有的機遇。
大數(shù)據(jù)逼迫人們改變分析、處理數(shù)據(jù)的手段、思維和理念,這就逼迫應用統(tǒng)計學專業(yè)改革必須引入新手段、新思維和新理念。培養(yǎng)應用統(tǒng)計學人才必須與時俱進,才能不斷適應大數(shù)據(jù)新時代的要求,這關系到應用統(tǒng)計學專業(yè)培養(yǎng)的人才能否適應和滿足社會的需求,因此,這一研究是十分必要、十分迫切且有著重要的理論和實際應用意義。
二、大數(shù)據(jù)背景下應用統(tǒng)計學專業(yè)的改革探討
1.培養(yǎng)目標的轉變。大數(shù)據(jù)時代給應用統(tǒng)計學帶來機遇與挑戰(zhàn),同時引發(fā)了對應用統(tǒng)計學培養(yǎng)目標的新思考。目前應用統(tǒng)計學專業(yè)教學體系的培養(yǎng)目標是,培養(yǎng)學生收集、整理和分析數(shù)據(jù)的能力的“應用型”專業(yè)人才。然而,在大數(shù)據(jù)背景下,除了要求學生具備數(shù)據(jù)收集、處理和分析的能力外,還要對其應用領域的背景知識有所了解,這就要求應用統(tǒng)計學培養(yǎng)“復合型”專業(yè)人才。因此,如何從培養(yǎng)“應用型”向“復合型”人才進行轉變,是在大數(shù)據(jù)背景下應用統(tǒng)計學專業(yè)培養(yǎng)目標必須解決的首要問題。在定位應用統(tǒng)計學專業(yè)的人才培養(yǎng)目標是培養(yǎng)“復合型”專業(yè)人才后,就得重新探索教學體系的調(diào)整和設計。傳統(tǒng)的應用統(tǒng)計學專業(yè)教學體系專業(yè)的主干課程有數(shù)理統(tǒng)計、抽樣技術與方法、回歸分析、計量經(jīng)濟學、多元統(tǒng)計分析、統(tǒng)計軟件等。而在大數(shù)據(jù)下,強調(diào)對全數(shù)據(jù)開展分析,不需進行隨機抽樣,即不是在給定的精確下,利用樣本推斷和分析總體;同時,大數(shù)據(jù)注重數(shù)據(jù)之間的相關關系,而不是像傳統(tǒng)統(tǒng)計那樣強調(diào)數(shù)據(jù)之間的因果關系。現(xiàn)有的教學體系沒有涉及這些內(nèi)容,與大數(shù)據(jù)時代的要求有些不相適應。因此,我們必須創(chuàng)新傳統(tǒng)的應用統(tǒng)計學專業(yè)教學體系,重視大數(shù)據(jù)的不同的分析方法、分析技術,在課程設置、教學內(nèi)容等都要圍繞著數(shù)據(jù)的分析方法和技術展開。
2.教學內(nèi)容改革探討。雖然在大數(shù)據(jù)時代下,必然要對數(shù)據(jù)收集、分析方法等進行改革和創(chuàng)新,但與此同時我們也清楚地意識到,對大數(shù)據(jù)的搜集、分類、分析等都仍需要依賴傳統(tǒng)的統(tǒng)計學方法,因此,大數(shù)據(jù)分析離不開傳統(tǒng)統(tǒng)計學,大數(shù)據(jù)分析是對傳統(tǒng)統(tǒng)計學的補充而不是替代,建立在樣本統(tǒng)計和預測分析之上的傳統(tǒng)統(tǒng)計學仍發(fā)揮著主導作用。所以,在應用統(tǒng)計學專業(yè)的改革中,我們強調(diào)深化基礎,培養(yǎng)擁有厚基礎、寬口徑的學生。加深應用統(tǒng)計學基礎理論知識學習,夯實數(shù)學基礎知識,讓學生學好數(shù)學分析、高等代數(shù)、概率論、數(shù)理統(tǒng)計等基礎課程,打好理論基礎,通過這些課程的學習不但打好學生的數(shù)理基礎知識,培養(yǎng)他們的抽象思維能力和邏輯推理能力,因為只有理論基礎打牢了,才有后勁,才能更好地學習新知識,適應新形勢下的要求。同時,在大數(shù)據(jù)背景下,應用統(tǒng)計學專業(yè)課程教學要培養(yǎng)寬口徑的統(tǒng)計學復合型人才,由于一些大數(shù)據(jù)充滿了各種隨機的、非隨機的誤差和偏倚,不滿足傳統(tǒng)的統(tǒng)計方法和理論對數(shù)據(jù)的苛刻要求,不能用傳統(tǒng)的統(tǒng)計方法進行分析。因此,必須對現(xiàn)有的應用統(tǒng)計學專業(yè)的課程體系、教學內(nèi)容等作出相應的調(diào)整和改革。這就需要對應用統(tǒng)計學專業(yè)課程內(nèi)容進行協(xié)調(diào)和整合,在精選知識、內(nèi)容銜接與交叉融合上狠下工夫。探索在一些課程中,增加介紹一些大數(shù)據(jù)方面的概念和應用,例如在時間序列分析、多元統(tǒng)計分析、統(tǒng)計預測與決策分析等課程內(nèi)容中引入大數(shù)據(jù)分析的理論和實踐案例。大數(shù)據(jù)對統(tǒng)計學專業(yè)人才提出了更高的要求,除了應具備數(shù)據(jù)收集、處理和分析的能力以外,還應具備很強的自我學習、自我提高的能力,以適應大數(shù)據(jù)時代數(shù)據(jù)量大、總類繁多、時效性高等發(fā)展特點。這就要求學生自主學習、閱讀大數(shù)據(jù)等相關資料,掌握國內(nèi)外最新動態(tài)和進展,這可通過布置課外作業(yè)、課外讀書報告和課外論文檢查學生自主閱讀學習的效果。同時,特別要注重課程的開放性教學和研究,以適應大數(shù)據(jù)時代的要求。(1)樣本概念的深化。全樣本(總體)研究是大數(shù)據(jù)方法的重要特點。過去,由于缺少收集和分析數(shù)據(jù)的各種工具,數(shù)據(jù)收集、處理能力受到限制,因此,產(chǎn)生了隨機抽樣的理論方法,從而達到用較少的樣本推斷、預測總體的目的。然而,大數(shù)據(jù)時代數(shù)據(jù)收集、處理的方式和技術都發(fā)生了翻天覆地的改變,現(xiàn)在我們可以通過數(shù)據(jù)庫、互聯(lián)網(wǎng)、各種通訊工具等獲得各種各樣的海量數(shù)據(jù)。這時,隨機抽樣在某些情況下就失去了它原有的意義、地位和作用。方便、廉價的數(shù)據(jù)收集,數(shù)據(jù)處理、存儲能力的提高,使得全數(shù)據(jù)分析模式成為可能。因此,大數(shù)據(jù)背景下不需隨機抽取,可用總體進行分析,也可用與分析目的相關的數(shù)據(jù)進行分析。所以,在大數(shù)據(jù)時代,傳統(tǒng)應用統(tǒng)計學面臨著新的任務和挑戰(zhàn),首先要改變對樣本、對不確定性等的重新認識,轉變抽樣調(diào)查的功能和地位,建立新的收集、梳理、分類數(shù)據(jù)的方法。大數(shù)據(jù)的分析和處理與傳統(tǒng)樣本數(shù)據(jù)的分析和處理的方法有許多不同,傳統(tǒng)的統(tǒng)計學的理論和方法是以隨機樣本來推斷總體,即它的理論和方法幾乎都是建立在樣本的基礎上的,是建立在隨機抽樣基礎之上的統(tǒng)計推斷,其理論基于"樣本數(shù)據(jù)-分布理論-概率保證-總體推斷",這種用樣本推斷總體的理論和方法,不可避免的會出現(xiàn)誤差。而大數(shù)據(jù)時代的特點是信息處理迅速、獲得途徑廣泛、價值密度低,這樣在處理數(shù)據(jù)時就不需要進行隨機抽樣,可以全體數(shù)據(jù)作為樣本,而即大數(shù)據(jù)關注的不是隨機樣本,而是總體,這不同于傳統(tǒng)的統(tǒng)計推斷分析,大數(shù)據(jù)時代可以收集全數(shù)據(jù)進行分析,這一特點剛好能彌補樣本統(tǒng)計必然會帶來誤差的劣勢。因此,應用統(tǒng)計學應該補充、適應大數(shù)據(jù)時代的全數(shù)據(jù)分析模式,將大數(shù)據(jù)總體統(tǒng)計的思想、思維和方法納入到教學體系和教學內(nèi)容,從傳統(tǒng)的樣本統(tǒng)計轉向樣本統(tǒng)計和總體統(tǒng)計相結合,這是應用統(tǒng)計學發(fā)展的必然趨勢。探討在什么課程、如何引入全樣本統(tǒng)計尤其重要。我們研究實踐了在抽樣技術與應用等課程教學中,新增大數(shù)據(jù)背景下的全樣本理念,闡明樣本統(tǒng)計和總體統(tǒng)計的差別、如何搜集大數(shù)據(jù),以及大數(shù)據(jù)樣本常存在缺乏代表性、信息冗余、存在噪聲、呈現(xiàn)重尾分布、長相依和不平穩(wěn)性時如何選用合適的統(tǒng)計分析方法,以盡量避免分析結果的系統(tǒng)偏差等。(2)相關分析與因果分析并重。在傳統(tǒng)統(tǒng)計分析中,因果關系占據(jù)重要的地位。我們可以根據(jù)概率P值進行因果關系檢驗,從而確定兩個變量之間是否存在著顯著的因果關系。即傳統(tǒng)統(tǒng)計分析是建立在假設的基礎上揭示數(shù)據(jù)相互之間是否存在因果關系,因此,傳統(tǒng)統(tǒng)計分析比較注重因果分析。但大數(shù)據(jù)時代由于數(shù)據(jù)海量、結構復雜、要求數(shù)據(jù)處理速度快等特點,造成因果分析往往不可行。而相關關系分析不需要建立在假設的基礎之上往往可行,且相關關系分析不易受偏見的影響而發(fā)生錯誤。因此,大數(shù)據(jù)改變了傳統(tǒng)統(tǒng)計注重因果關系檢驗的思維,注重相關關系分析,而不是因果關系分析,大數(shù)據(jù)時代的重要特點是注重相關分析,以及建立在相關分析基礎上的預測分析。側重相關性研究的思想是大數(shù)據(jù)方法的重要特點,大數(shù)據(jù)時代相關分析方法的重要性日益凸顯。大數(shù)據(jù)時代,相關分析的運用范圍之廣、重要性之大引起了我們的重視和研究,我們在教學中從傳統(tǒng)的注重因果分析向相關分析與因果分析并重轉變。傳統(tǒng)的相關分析基本上是線性相關分析,大數(shù)據(jù)研究的相關分析不僅是線性相關,更多的是非線性相關關系。傳統(tǒng)的統(tǒng)計研究方法,如建立各種回歸方程、估計模型參數(shù)、假設檢驗等因為大數(shù)據(jù)的特點而無法實施。針對大數(shù)據(jù)的相關關系分析不同于傳統(tǒng)的相關關系的分析,我們在教學中重點不是做傳統(tǒng)的邏輯推演,而是重點闡明如何搜索、分類、歸納、分析大數(shù)據(jù),以及如何找出數(shù)據(jù)之間的相關性并據(jù)此進行預測。闡明大數(shù)據(jù)時代相關分析思維的重要性,以及相關分析在特征選擇、變量依賴關系識別中的實用性。
摘 要:隨著科學技術的迅速發(fā)展,大數(shù)據(jù)時代來臨,從科學角度看,大數(shù)據(jù)通過對信息的整合分析處理,形成快捷全新的數(shù)據(jù)分析方法,這為大數(shù)據(jù)與統(tǒng)計學架起互通的橋梁。大數(shù)據(jù)時代的變革為統(tǒng)計學發(fā)展起到了重要的推動作用,未來挑戰(zhàn)與機遇同在。文章首先對大數(shù)據(jù)時代下的統(tǒng)計學做出概述,接著陳述統(tǒng)計學在大數(shù)據(jù)時代影響下的變革,再次分析大數(shù)據(jù)時代下統(tǒng)計學面臨的挑戰(zhàn),最后解讀大數(shù)據(jù)時代下統(tǒng)計學的發(fā)展與機遇,以期為相關領域的研究提供有價值的參考。
關鍵詞:大數(shù)據(jù)時代;統(tǒng)計學;發(fā)展
一、大數(shù)據(jù)時代下統(tǒng)計學概念概述
教科書上對統(tǒng)計學給出了這樣的定義“有效搜集整理分析隨機性數(shù)據(jù),對考察問題給出推斷與預測,最終為行動提供數(shù)據(jù)支持”,這就是統(tǒng)計學。從根本上看,統(tǒng)計學是一門與數(shù)據(jù)有關的學科。眾所周知,美國總統(tǒng)奧巴馬通過數(shù)據(jù)團隊的幫助得到連任的機會,阿里巴巴的馬云很早就把大數(shù)據(jù)作為企業(yè)發(fā)展戰(zhàn)略。隨著我們走進大數(shù)據(jù)時代,網(wǎng)絡科技給搜集數(shù)據(jù)帶來方便,傳統(tǒng)的設備已經(jīng)無法容納大量的數(shù)據(jù),我們對其進行更新,通過對大數(shù)據(jù)的分析,我們?yōu)樯鐣鬟f出有效的、有價值的信息,這一切為社會的發(fā)展起到了不可替代的推動作用。
統(tǒng)計是社會各界乃至各環(huán)節(jié)不可或缺的因素,在商品交換過程中,統(tǒng)計有先導作用,市場經(jīng)濟信息也需要統(tǒng)計學的幫助,大數(shù)據(jù)時代,我們的統(tǒng)計數(shù)據(jù)不再局限于隨機抽樣調(diào)查,電話調(diào)查等高成本的搜集方式,通過互聯(lián)網(wǎng)及移動終端,我們可以獲得更多數(shù)據(jù)樣本,可以說我們的社會進入高速發(fā)展的時期,大數(shù)據(jù)時代下的統(tǒng)計學也進入全新的發(fā)展階段。
二、統(tǒng)計學在大數(shù)據(jù)時代影響下的變革
1.從樣本的角度看,樣本概念得到深化
我們知道統(tǒng)計學離不開樣本,有效的樣本能夠正確反映情況,大數(shù)據(jù)時代樣本概念與傳統(tǒng)不再相同,通常我們得到諸多網(wǎng)絡數(shù)據(jù),一種為靜態(tài),即直接在客戶端創(chuàng)建的數(shù)據(jù),無需提取即可使用,成本低,另一種為動態(tài)數(shù)據(jù),即數(shù)據(jù)隨著時間的推移而變化,最終表現(xiàn)為所有數(shù)據(jù)的總和,可見此時的樣本不局限于隨機抽樣,直接可以做選定分析。
2.從類型方面看,呈擴大之勢
在過去數(shù)據(jù)通常指結構化數(shù)據(jù),有固定的標準,大數(shù)據(jù)時代數(shù)據(jù)不僅局限于固定的結構,還有異構數(shù)據(jù),再有存儲方式也發(fā)生了改變,大數(shù)據(jù)可以直接將探測的信號容納進去,由網(wǎng)絡系統(tǒng)作為工具,可以識別各類結構或非結構的數(shù)據(jù)并進行快速存儲。
3.收集概念得到擴展
傳統(tǒng)的統(tǒng)計過程中,我們有目的的進行數(shù)據(jù)收集,效率低,成本高,隨著大數(shù)據(jù)時代來臨,我們將收集步驟化,第一預先處理好數(shù)據(jù)的識別與處理,第二做好分析,提煉出所需要的信息,最后做好存儲,就這么簡單。面對大量的數(shù)據(jù),我們的分析、識別等都需要注意,大數(shù)據(jù)不代表萬能,我們還是要注意數(shù)據(jù)的安全性,盡量控制收集成本。
4.數(shù)據(jù)來源較傳統(tǒng)不同
曾經(jīng)我們根據(jù)研究目的去做統(tǒng)計收集數(shù)據(jù),這些數(shù)據(jù)源都是已知的,在核對方面相對容易。大數(shù)據(jù)時代,我們得到數(shù)據(jù)變得容易,但通過互聯(lián)網(wǎng)收集數(shù)據(jù)后,目的性變?nèi)?,大多?shù)記錄沒有源頭,很難識別記錄身份,可見,大數(shù)據(jù)時代做好數(shù)據(jù)來源登記開始變得重要。
5.量化方式也發(fā)生變化
對于傳統(tǒng)的結構化數(shù)據(jù),量化方式是成熟的,可以將收集到數(shù)據(jù)直接分析得出結果,大數(shù)據(jù)時代,很多異化結構數(shù)據(jù)幾乎無法做直接分析取得結論,當下,很多結算及專家在研究處理非機構化數(shù)據(jù),力爭將大數(shù)據(jù)時代統(tǒng)計推向新的高端。
6.分析思維發(fā)生改變
從分析過程看,傳統(tǒng)分析需要進行三步走,即定性、定量,最終定性。大數(shù)據(jù)時代,統(tǒng)計分析過程僅需要兩步即定量、定性;從證實分析方面看,傳統(tǒng)思路為假設、驗證,事實證明傳統(tǒng)證實分析有很大誤差,而大數(shù)據(jù)時代,我們的思維為發(fā)現(xiàn),總結,這是整合,發(fā)現(xiàn)最終定論的過程,在此過程中會有很多發(fā)現(xiàn)。
7.統(tǒng)計軟件變得越來越多
傳統(tǒng)統(tǒng)計學中,我們比較熟悉的軟件有SPSS、SAS、STATA等,大數(shù)據(jù)時代,我們分析技術為非關系型,主要以數(shù)據(jù)中心為基礎,將軟件與大數(shù)據(jù)結合,分析過程得到很大簡化。綜上,大數(shù)據(jù)時代給了我們更多的主動權,這些更促使我們推動大數(shù)據(jù)時代統(tǒng)計的發(fā)展進步。
三、大數(shù)據(jù)時代下統(tǒng)計學面臨的挑戰(zhàn)
大數(shù)據(jù)時代給我們帶來了更多的好處,統(tǒng)計學的大數(shù)據(jù)化是大勢所趨,但傳統(tǒng)與更新的交錯間還有一些不相容的方面,對于革新我們還是要從各個方面做謹慎考慮與慎重調(diào)整。
首先從樣本標準的角度看,大數(shù)據(jù)時代我們可以輕松得到很多樣本,此量大到可以視為總體,隨著互聯(lián)網(wǎng)科技的不斷發(fā)展,大樣本標準也應隨著發(fā)展,傳統(tǒng)統(tǒng)計學將界限定在30,大于30為大樣本,小于30為小樣本,大數(shù)據(jù)時代這個界限略顯低,沒辦法清除干凈干擾信息,這會影響分析結果,因此,加強數(shù)據(jù)來源的同時還要更新大樣本標準,將更大規(guī)模的樣本數(shù)量代替舊有的數(shù)量,以適應大數(shù)據(jù)時代的要求。
其次從樣本選取與形式的角度看,傳統(tǒng)統(tǒng)計學固定結構化數(shù)據(jù)內(nèi)藏著一定的統(tǒng)計規(guī)律,盡管我們能夠發(fā)現(xiàn)研究對象的數(shù)量關系,但并不是所有的事物都有量化指標,一些被量化的指標也不一定能夠清楚的解讀研究對象,目前大數(shù)據(jù)采集數(shù)據(jù)超過80%為有結構數(shù)據(jù),傳統(tǒng)的統(tǒng)計數(shù)據(jù)庫沒有辦法對這些數(shù)據(jù)做很好的處理,而大數(shù)據(jù)通過建立非結構數(shù)據(jù)庫,對數(shù)據(jù)做有效轉化,發(fā)揮多元化分析作用,無形中降低了樣本的選取標準,將統(tǒng)計范圍擴大化。
最后統(tǒng)計軟件的開發(fā)是一項挑戰(zhàn)。我們常用的統(tǒng)計軟件主要以構建模型之間的變量與數(shù)量關系的方式分析研究對象,如我們熟悉的SPSS等。大數(shù)據(jù)時代,我們很多以數(shù)據(jù)為基礎做非關系分析技術,谷歌利用MAPREDUCE實現(xiàn)了月處理400PB數(shù)據(jù)的工作量,雅虎也利用云計算平臺實現(xiàn)了100PB的存儲工作,未來大量的數(shù)據(jù)處理需要更快捷更科學的軟件,對于軟件的研發(fā)與升級將是一種挑戰(zhàn)。
四、大數(shù)據(jù)時代下統(tǒng)計學的發(fā)展與機遇
1.大數(shù)據(jù)時代下統(tǒng)計質(zhì)量更高
從國際數(shù)據(jù)標準SDDS中得到的統(tǒng)計質(zhì)量標準可以看到,適用、準確、時效、平衡是統(tǒng)計質(zhì)量的內(nèi)涵。其中適用是指統(tǒng)計信息符合要求,統(tǒng)計信息最大化的滿足客戶的用途,大數(shù)據(jù)的覆蓋很大程度上促進適用功能的提升;傳統(tǒng)角度我們說時效性主要指統(tǒng)計的時間更短,讓客戶及時了解統(tǒng)計信息,大數(shù)據(jù)時代網(wǎng)絡化完全滿足時效性各類要求;準確是指估值與真值之間的差別,數(shù)據(jù)中存在誤差在一定范圍內(nèi)屬于正常,大數(shù)據(jù)時代我們的全面性最大程度包容了誤差,也縮小的了誤差,統(tǒng)計更加真實可信;平衡性也被稱之為協(xié)調(diào)性,大數(shù)據(jù)時代,數(shù)據(jù)結果的核對與檢驗都經(jīng)得起客戶的不斷核查,可以使數(shù)據(jù)的平衡性得到很大提升。
2.大數(shù)據(jù)時代統(tǒng)計成本降低
首先,從數(shù)據(jù)收集角度看,大數(shù)據(jù)時代可以不再依靠人力做電話調(diào)查或問卷調(diào)查,甚至有些普查動用全國力量,耗費大量人力財力,通過互聯(lián)網(wǎng)、移動通信等,我們大大降低人力成本,數(shù)據(jù)收集快,成本低,準確性也高;其次從數(shù)據(jù)利用角度看,傳統(tǒng)統(tǒng)計過程中,一旦資料過期就需要再起啟動抽樣分析過程,對外公布手段也有局限性,大數(shù)據(jù)時代,我們收集數(shù)據(jù)更輕松,且數(shù)據(jù)可多次被利用,綜合比算,數(shù)據(jù)的成本大大降低。
3.大數(shù)據(jù)時代統(tǒng)計學作用范圍擴大
傳統(tǒng)統(tǒng)計學有各種局限性,比如受成本、觀念等影響,統(tǒng)計學主要用于行業(yè)與部分統(tǒng)計,隨著大數(shù)據(jù)時代的來臨,統(tǒng)計學被應用到各行各業(yè),比如、金融、醫(yī)學、計算機行業(yè)等,從這個角度看,社會的新計劃讓信息傳遞發(fā)生質(zhì)變,統(tǒng)計學作用價值得到認可并服務擴大,這樣推動自身發(fā)展的同時更服務社會服務人民,為整個國家發(fā)展進步起到不可估量的作用。
摘 要:隨著社會經(jīng)濟的迅速發(fā)展,科技信息技術的進步,大數(shù)據(jù)走入了我們的日常生活,大數(shù)據(jù)的統(tǒng)計與分析影響著各行各業(yè)的發(fā)展。因此,對大數(shù)據(jù)的統(tǒng)計顯得格外重要,在大數(shù)據(jù)時代研究統(tǒng)計學的發(fā)展也顯得尤為重要。
關鍵詞:大數(shù)據(jù);統(tǒng)計學;發(fā)展
由于科學技術的不斷發(fā)展,大數(shù)據(jù)席卷了全球,各行各業(yè)在經(jīng)營管理中都離不開大數(shù)據(jù)的統(tǒng)計與分析,對于政府單位來說,大數(shù)據(jù)更如經(jīng)常便飯,大數(shù)據(jù)主要利用多樣式和多層次的采集方式進行數(shù)據(jù)采集,在分析數(shù)據(jù)時利用現(xiàn)代科學技術手段和高速處理數(shù)據(jù)的信息系統(tǒng),分析的數(shù)據(jù)結果為公司或者政府單位的決策做參照。大數(shù)據(jù)的發(fā)展給統(tǒng)計學不僅帶來了機遇,更重要的還有挑戰(zhàn)。一方面信息技術和網(wǎng)絡科技的發(fā)展為數(shù)據(jù)收集和整理帶來了便利,另一方面由于近幾年電子商務的迅速崛起,數(shù)據(jù)量更加的繁雜,所以又給數(shù)據(jù)統(tǒng)計時帶來了麻煩,種類不斷增多的大數(shù)據(jù)資源,正在成為政府統(tǒng)計部門分析研究的重要領域。
一、大數(shù)據(jù)與統(tǒng)計學的區(qū)別
我們就大數(shù)據(jù)自身而言,要想在信息化迅猛發(fā)展、數(shù)字爆炸式增長的現(xiàn)代信息平臺中尋找到自己想要的有效數(shù)據(jù),就必須依靠數(shù)據(jù)統(tǒng)計來完成。這就充分證明了關于大數(shù)據(jù)的相關研究是要和統(tǒng)計學緊密的聯(lián)系在一起的。但是其與統(tǒng)計學也存在巨大的差別,它的使用模式和運用方式是不一樣的。統(tǒng)計學需要依靠樣本抽樣的方法來進行數(shù)據(jù)整體和提煉的,這就意味著會有人力、物力以及財力的投入,其成本相對于大數(shù)據(jù)來說是比較高的而且過程是相對比較繁瑣的。而大數(shù)據(jù)主要依靠網(wǎng)絡信息平臺,在海量的電子數(shù)據(jù)信息中查找自己所需要的數(shù)據(jù),具有來源廣、數(shù)據(jù)量大、整體性的特點,其是以整體的數(shù)據(jù)作為一個大樣本進行工作的,數(shù)據(jù)相對于統(tǒng)計學來說更加的精確化及標準化。因此,統(tǒng)計學和大數(shù)據(jù)的結合過程中,要充分發(fā)揮大數(shù)據(jù)全面性和統(tǒng)計學高效性的特點,在利用統(tǒng)計學進行大數(shù)據(jù)樣本的統(tǒng)計過程中要對整體的數(shù)據(jù)資源進行選擇和篩選,這樣能避免樣本統(tǒng)計的弊端,還可以把樣本統(tǒng)計的優(yōu)勢發(fā)揮到極致。
二、大數(shù)據(jù)時代下統(tǒng)計學教育的發(fā)展
(一)培養(yǎng)全方面素質(zhì)人才
統(tǒng)計學專業(yè)的學生與文管專業(yè)的還不一樣,文學專業(yè)的以及管理專業(yè)的學生都比較善于交際,善于溝通,而統(tǒng)計學是理科專業(yè),很多學生只善于埋頭做題計算,這樣的話在以后的工作崗位就會感覺吃力,因為做數(shù)據(jù)統(tǒng)計,必須要與其他部門學會溝通,協(xié)同工作這樣才能把數(shù)據(jù)統(tǒng)計和分析的準確。要鍛煉自己的交際能力和溝通能力,針對不同數(shù)據(jù)信息做出不同的溝通與交流,從數(shù)據(jù)中挖出有價值的信息,需要本身具有數(shù)據(jù)敏感性,但是對數(shù)據(jù)的敏感程度也不是先天所帶來的,更不是一朝一夕就能鍛煉出來的,而是要經(jīng)過時間的積累和數(shù)據(jù)分析工作的磨練,同時也可以根據(jù)案例型的數(shù)據(jù)分析材料,積累閱歷,提升對數(shù)據(jù)資源的敏感程度。
(二)培養(yǎng)統(tǒng)計學專業(yè)的應用型人才
大數(shù)據(jù)時代下培養(yǎng)的統(tǒng)計學應用型人才應該具有兩方面的基本素質(zhì),第一是概念性的,也就是說統(tǒng)計學的相關人才應該掌握統(tǒng)計學基本理論知識和基本素養(yǎng),這是基本要求,也是培養(yǎng)統(tǒng)計學人才的前提。第二就是實踐性,也就是本文中我們提及的統(tǒng)計學專業(yè)的應用型人才,就是在實際操作中處理數(shù)據(jù)分析數(shù)據(jù)的能力,應用型人才需要利用理論知識解決實際問題,也需要有較多的經(jīng)驗與閱歷,不能只會紙上談兵。在高校開展大數(shù)據(jù)分析學科中,最大的問題就是沒有真是可用的案例和數(shù)據(jù),這就需要學校與公司企業(yè)走合作道路,這樣一來不僅可以得到真實有效的數(shù)據(jù),還能將學生送到企業(yè)去實習,進行校企聯(lián)合,注重學生的實際操作能力,這是培養(yǎng)統(tǒng)計學專業(yè)應用型人才的關鍵點,也是統(tǒng)計學專業(yè)人才培養(yǎng)模式中的重點。
(三)促進統(tǒng)計學與信息計算科學的融合
在大數(shù)據(jù)的分析與研究時,僅僅憑借統(tǒng)計學科的支撐是不夠的,大數(shù)據(jù)的數(shù)據(jù)結構性特征已經(jīng)拋棄了傳統(tǒng)意義上的數(shù)據(jù)分析模式的非智能化框架,而且數(shù)據(jù)分析需要利用新型的數(shù)據(jù)運算方式以及計算機技能分析,這也是進行數(shù)據(jù)分析的問題所在,因此要想做好數(shù)據(jù)統(tǒng)計和數(shù)據(jù)分析工作,只單單依靠單一的統(tǒng)計學科知識的人學習是遠遠不夠的,其需要的是數(shù)學,信息技術,統(tǒng)計學三門學科的融合發(fā)展,緊密結合三門學科之間的交叉發(fā)展,融會貫通,利用各科優(yōu)勢資源相互彌補不足,這樣才能為大數(shù)據(jù)的收集,統(tǒng)計,分析做出科學準確的結果。
三、結語
學習統(tǒng)計學的優(yōu)勢在于:我們可以利用統(tǒng)計學進行大數(shù)據(jù)的有效整合和利用,使得我們在使用數(shù)據(jù)時可以更加的便利和高效。隨著信息科學技術的進一步發(fā)展,來自各方面的數(shù)據(jù)出現(xiàn)井噴的狀態(tài),這就增添了我們在數(shù)據(jù)統(tǒng)計和信息處理時的困難。在現(xiàn)在這個信息化數(shù)據(jù)爆炸式增長的形勢下,我們要充分全面的利用各方面的數(shù)據(jù)資源才能充分發(fā)揮統(tǒng)計學的優(yōu)勢,做好預測和分析,同時充分將統(tǒng)計學的優(yōu)點與完備的大數(shù)據(jù)資源實現(xiàn)有效的整合,讓統(tǒng)計變得通俗易懂。
摘要:隨著大數(shù)據(jù)時代的到來,統(tǒng)計學專業(yè)教育教學將面臨大數(shù)據(jù)的信息與識別、大數(shù)據(jù)的數(shù)據(jù)產(chǎn)生方式與抽樣方法、大數(shù)據(jù)的統(tǒng)計整理與統(tǒng)計分析等方面的挑戰(zhàn)。中西部地區(qū)二三本高校統(tǒng)計學專業(yè)教育教學,在院校構成與專業(yè)方向、學歷教育層次、學生培養(yǎng)規(guī)模、學科建設、師資力量、課程設置與教育教學手段等方面具有自身的特征和不足,與大數(shù)據(jù)時代的發(fā)展方向和需要存在較大差距。為此,應注意從以下五個方面進行改進和完善:普及大數(shù)據(jù)知識,積極引導學生認識和熟悉大數(shù)據(jù);認清教育教學與大數(shù)據(jù)之間的關系,正確定位專業(yè)發(fā)展目標和方向;改革和創(chuàng)新現(xiàn)有課程設置,豐富和完善計算機與統(tǒng)計軟件類課程;提升統(tǒng)計學專業(yè)授課教師的職稱與學歷,革新知識容量和結構;加強統(tǒng)計專業(yè)教育教學的組織支持和制度保障。
關鍵詞:大數(shù)據(jù);中西部二三本高校;統(tǒng)計學專業(yè);教育教學
一、前言
隨著大數(shù)據(jù)時代的到來,大數(shù)據(jù)已成為變革組織、變革經(jīng)濟和變革價值的力量。鑒于大數(shù)據(jù)發(fā)展對經(jīng)濟社會和生產(chǎn)生活的影響愈加深入,我國高等教育領域和統(tǒng)計學專業(yè)領域的相關專家學者進行大量的思考,并形成一些思想和成果。但是,有關大數(shù)據(jù)時代背景下統(tǒng)計學專業(yè)教育教學的研究成果相對較少。從研究主題和關注領域來看,不同學者的研究成果差異較為明顯,但大致可以分為以下幾類:一是大數(shù)據(jù)時代統(tǒng)計學面臨的機遇與挑戰(zhàn);二是大數(shù)據(jù)時代背景下統(tǒng)計學教育教學應該如何改革和創(chuàng)新;三是高職院校統(tǒng)計學教育教學領域中某一問題;四是其他一些具體或個別問題。從研究結論來看,大數(shù)據(jù)時代的來臨,統(tǒng)計學研究方法、統(tǒng)計學專業(yè)教育教學方式與內(nèi)容、教師知識結構、人才培養(yǎng)模式與方案等,均面臨諸多挑戰(zhàn),同時也會帶來變革與創(chuàng)新的機遇。
與多數(shù)著名財經(jīng)類高校和一本高校相比,我國中西部地區(qū)不少二三本高校在師資力量、專業(yè)建設、學科建設、人才培養(yǎng)方面,還存在不少缺陷和不足。所以,作為與大數(shù)據(jù)研究技術和方法緊密的統(tǒng)計學專業(yè),二三本高校更應該對其進行認真思考和科學定位與設計,從而避免在未來更加落后和遭到淘汰。本文基于上述背景和現(xiàn)實需要,對中西部地區(qū)二三本高校統(tǒng)計學專業(yè)教育教學進行認真思考和更進一步的探討。
二、中西部地區(qū)二三本高校統(tǒng)計學專業(yè)教育教學的現(xiàn)狀
(一)院校構成與專業(yè)方向
目前,開設統(tǒng)計學專業(yè)教育教學的中西部二本高校主要以地方財經(jīng)類院校、師范院校和部分理工類院校為主。從專業(yè)方向來看,地方財經(jīng)類院校主要以社會經(jīng)濟統(tǒng)計、金融統(tǒng)計、風險管理與精算學為統(tǒng)計學專業(yè)的方向;師范類院校則主要依托數(shù)學系,一般是從概率論、數(shù)理統(tǒng)計、多元統(tǒng)計等相關課程的教學中衍生而來,通常以數(shù)理統(tǒng)計為專業(yè)方向;而理工類院校則以數(shù)理統(tǒng)計或者應用統(tǒng)計為主要研究方向,同時兼顧本院校的專業(yè)構成和傳統(tǒng)研究領域,如生物衛(wèi)生統(tǒng)計等。多數(shù)三本院校沒有開設統(tǒng)計學專業(yè),考慮到招生的便利性和就業(yè)前景,開設統(tǒng)計學專業(yè)的三本院校通常以社會經(jīng)濟統(tǒng)計、金融統(tǒng)計為專業(yè)方向。
(二)學歷教育層次
從學歷教育層次來看,多數(shù)地方財經(jīng)類院校統(tǒng)計學專業(yè)以本科和碩士研究生層次為主,個別傳統(tǒng)悠久、實力較為雄厚的財經(jīng)類院校上升到博士研究生的層次;師范類院校和部分理工類院校則以本專科層次為主,少部分院校則開展了碩士研究生層次的教育,或者與擁有碩士學位授予權的院校開展碩士研究生的聯(lián)合培養(yǎng)。開設統(tǒng)計學專業(yè)的三本院校一般會開展本科學歷層次的教育,畢業(yè)后通常授予經(jīng)濟學學位。除了上述幾類開展統(tǒng)計學專業(yè)教育教學的二三本高校外,還有個別省市的統(tǒng)計學院(學校)。但是該類院校一般隸屬于省統(tǒng)計局,通常以國民經(jīng)濟統(tǒng)計和核算為專業(yè)方向,在較長的歷史時期開展中專層次的教育,近十年來多數(shù)學校則實現(xiàn)??茖哟螌W歷教育的轉變,只有少部分學校上升至本科層次的學歷教育。
(三)學生培養(yǎng)規(guī)模
從學生培養(yǎng)規(guī)模來看,就本科學歷層次而言,地方財經(jīng)類高校統(tǒng)計學專業(yè)每年招生規(guī)模一般為100人左右,師范類院校一般為150人左右,部分理工類院校招生規(guī)模和三本院校一般為50人左右,與一本高校相比,招生規(guī)模偏小。統(tǒng)計學專業(yè)研究生教育,包括應用統(tǒng)計碩士(專業(yè)學位)和學術型研究生兩大類,多數(shù)地方財經(jīng)類院校開展統(tǒng)計學專業(yè)普通研究生的教育。目前,全國共計80余所高校開展應用統(tǒng)計碩士教育,中西部地區(qū)高校有31所,其中二本高校12所(包括8所財經(jīng)類院校、4所師范大學),近年來應用統(tǒng)計碩士招生規(guī)模和學術型研究生基本持平。8所財經(jīng)類院校中,西安財經(jīng)大學招生規(guī)模最大,應用統(tǒng)計碩士招生規(guī)模和學術型研究生分別達到25人和30人,山西財經(jīng)大學、安徽財經(jīng)大學、江西財經(jīng)大學三所院校兩類研究生招生人數(shù)為20人左右,而蘭州商學院、貴州財經(jīng)學院、新疆財經(jīng)學院招生人數(shù)為10人左右,河南財經(jīng)政法大學招生人數(shù)則不足5人。4所師范類院校中,河南師范大學兩類研究生招生人數(shù)為10人左右,安徽師范大學、湖南師范大學招生人數(shù)為5人,廣西師范大學應用碩士招生則高于學術型研究生,兩者之和為20人左右。其余的財經(jīng)類院校和師范類院校研究生招生規(guī)模存在與上述學校類似的特點。
(四)學科建設
統(tǒng)計學專業(yè)學科建設的效果,可以通過教育部學位中心公布的學科排名和近年來中國大學統(tǒng)計學專業(yè)排名進行評判。2012年教育部開展第四輪學科評估,教育部學位中心公布一級學科最終排名結果。在該次統(tǒng)計學科評估中,全國具有“博士一級”授權的56所高校中有46所參評,還有部分具有“博士二級”授權和碩士授權的高校參加評估,參評高校共計87所。所以,最終的統(tǒng)計學學科排名結果顯示,中西部地區(qū)有12所一本高校、23所二本高校參加該次評估,學科整體水平得分在74分以下,排在第22名之后。其中,西南大學得分為72分,居于中西部二本高校之首,山西財經(jīng)大學、西安財經(jīng)學院得分為70分,其余二本高校得分為69分、68分、66分、65分和64分的分別有4、4、3、9、1所高校。三本高校因為不具備統(tǒng)計學學科碩士授予權,所以沒有參加該次學科評估排名。
此外,在2014年5月,中國校友會網(wǎng)公布2014中國大學統(tǒng)計學專業(yè)排名。該專業(yè)排名將學科專業(yè)分為4個星級(最高為6星級,最低為3星級),學科專業(yè)層次分為頂尖學科專業(yè)、一流學科專業(yè)、高水平學科專業(yè)、知名學科專業(yè)四類,辦學類型分為研究型、行業(yè)特色研究型、區(qū)域研究型、區(qū)域特色研究型、專業(yè)型和應用型六類。在該統(tǒng)計學專業(yè)排名中,參評高校有87所。其中,中西部地區(qū)有17家二本高校參評,學科專業(yè)星級均為3星級,學科專業(yè)層次為中國知名學科專業(yè);辦學類型方面,只有太原理工大學為區(qū)域研究型,其余16家院校均為專業(yè)型;辦學層次方面,太原理工大學、西北師范大學、武漢科技大學和長沙理工大學被評為中國知名大學,其余13家院校沒有相應歸屬。除了上述排名外,中國金蘋果科教評教網(wǎng),也公布2012-2013中國大學本科教育統(tǒng)計學類專業(yè)排行榜,有94所高校參評。但是,只能查詢到該排行榜前20名的高校,所以本文沒有采用該結果對中西部地區(qū)開設統(tǒng)計學專業(yè)的二三本高校學科建設情況進行評判。
(五)師資力量
從師資力量來看,中西部地區(qū)二三本高校統(tǒng)計學專業(yè)仍然相對薄弱,特別是三本高校師資力量配置尤為薄弱。就中西部地方財經(jīng)類院校、師范院校和部分理工類院校而言,與同領域一本高校相比,其師資力量配置比較完備,院系設置和師資規(guī)模、結構類似,差異主要體現(xiàn)在教師的職稱結構、學歷結構和科研實力方面。其中,這些差異一方面在于國家人事制度和管理體制,另一方面在于學校所能提供的薪酬待遇和教學科研平臺相對有限,不能吸引更多的高層次人才。而三本高校則與同領域二本高校相比,其師資力量配置不健全,師資規(guī)模、結構仍有較為明顯的缺陷與不足,與同領域一本高校相比差距很大。造成這種差異的原因除了上述兩個方面外,還與三本高校對教育教學的短視和其天生的缺陷有很大關系。
目前,每個省都制定了本省《事業(yè)單位專業(yè)技術崗位結構比例控制標準》,將“教育事業(yè)單位”中的“高等院?!狈譃椤?11工程”重點建設院校、與教育部共建院校、設有博士點和其他省部共建院校、設有碩士點院校、其他本科院校、省管高等??茖W校、高職高專院校、成人??茖W校和技師學院等若干類。對高級職稱人員所占最高比例要求依次逐步降低,“211工程”重點建設院校正高級、副高級職稱所占比例為15%和30%左右,分別高于高職高專院校、成人??茖W校和技師學院10~15個百分點;對中級職稱人員所占最高比例依次逐漸上升但差異較小,“211工程”重點建設院校為45%左右,低于高職高專院校、成人??茖W校和技師學院5個百分點左右;對初級職稱人員所占最高比例則依次逐步提高,“211工程”重點建設院校一般不超過10%,低于高職高專院校、成人??茖W校和技師學院僅20個百分點。國家人事制度和管理政策中關于不同院校職稱結構的要求,在一定程度上對二三本高校廣大教師尤其是中青年教師的晉升成為一種障礙,限制他們的職業(yè)生涯發(fā)展和提升。
中西部地區(qū)二三本高校院校所提供的教學科研平臺受到局限,一方面與學校當前自身實力有關,另一方面也與教育行業(yè)所存在的歧視和潛規(guī)則有關。廣大一本高校由于自身具備較強的實力,在學術、縱向科研項目申報、橫向課題申請、對外學術交流方面具有先天的優(yōu)勢。在職稱、學歷和相應材料質(zhì)量接近或相同的情況,相應的雜志社優(yōu)先發(fā)表著名高校和一本高校教師的學術論文,尤其是一些排名榜首的期刊幾乎不發(fā)表第一作者單位為二三本高校的教師的學術論文,行政主管部門和企業(yè)也優(yōu)先審批這些高校的項目,從而形成明顯的虹吸效應和馬太效應,對廣大二三本高校造成嚴重的歧視和不公。不少青年教師在二三本高校工作若干年之后,如果職稱和學歷得到足夠提升之后,比如獲取博士學位、博士后順利出站和評完高級職稱后,多數(shù)選擇一本高?;虮绢I域內(nèi)著名高校作為新的就業(yè)崗位,從而規(guī)避和去除教學科研平臺帶來的限制。
高校院校所提供的薪酬待遇,一方面與學校自身所獲取的教育經(jīng)費、學校所處的階段及其發(fā)展目標和方向有關,另一方面與學校所擁有的產(chǎn)業(yè)和創(chuàng)收項目有很大關系。中西部地區(qū)廣大二本高校所獲取的教育經(jīng)費主要以學生繳納的學費、所在省市行政主管部門劃撥的財政事業(yè)經(jīng)費為主,兩者占教育經(jīng)費總額的80%左右,甚至更高。中西部地區(qū)多數(shù)省市經(jīng)濟社會水平在全國處于中下游水平,財政收入規(guī)模相對較小并且增速相對緩慢,而教育經(jīng)費支出占財政支出的比重比較穩(wěn)定,所以中西部地區(qū)廣大二本高校所能獲得財政撥款增長較為緩慢,從而影響到學校發(fā)展目標的實現(xiàn)速度和進度。而廣大三本高校的教育經(jīng)費幾乎全部來源于學生繳納的學費,當前公立高校每個學生財政型教育經(jīng)費提高到12000元左右,三本高校生均教育經(jīng)費投入水平與公立高校相比處于劣勢。隨著近年來物價水平的持續(xù)上漲和人力資源成本的逐漸提高,三本高校出于生存的需要,近年來對招聘教師的職稱、學歷和薪酬待遇沒有進行明顯提升。因此,畢業(yè)于全國“985”高校、成績相對優(yōu)異的統(tǒng)計學專業(yè)研究生,尤其是博士研究生,綜合考慮薪酬待遇和職業(yè)生涯規(guī)劃的需要,就業(yè)時首選一本高校,其次是二本高校,不愿意或者不樂意到三本高校來就業(yè),從而造成三本高校統(tǒng)計學專業(yè)師資規(guī)模、職稱與學歷結構很難得到提升與改善。
(六)課程設置與教育教學手段
從課程設置與教育教學手段來看,與廣大一本高校和著名財經(jīng)類高校相比,中西部地區(qū)二三本高校統(tǒng)計學專業(yè)基本類似和比較接近,但是三本高校的差距依然較大。就中西部地區(qū)二三本高校而言,由于師資力量和學生基礎、接受能力的差異,在統(tǒng)計學專業(yè)不少課程尤其是專業(yè)核心課程的教學過程中,教師對課程知識、原理、方法的理解與講解方面,與廣大一本高校和著名財經(jīng)類高校仍然有明顯差距,從而對學生的啟發(fā)與引導仍顯得較為薄弱。就中西部地區(qū)三本高校而言,除存在上述類似問題之外,還存在因人設課、因事設課、變相壓縮學時等現(xiàn)象,統(tǒng)計軟件類課程的種類和學時量與一二本高校相比差距明顯,課程設置仍然需要健全和完善。比如,本科生通常課程教學每個學時為50分鐘,每學期正常上課教學時間為18周,加上兩周的考試時間,一般每學期教育教學期限為20周。但是有不少三本高校在統(tǒng)計學專業(yè)教學過程中將每學時減少為45分鐘,每學期正常上課教學時間和考試時間合計僅為18周。此外,對于一些統(tǒng)計學專業(yè)的專業(yè)基礎課和專業(yè)核心課,不少一本高校與二本高校通常進行每周4學時的授課,選修課程的設置也突出統(tǒng)計學專業(yè)的特色和需要。但是,有不少三本高校則進行每周3學時的授課,因人設課現(xiàn)象較為嚴重,要么短期聘用校外兼職教師進行授課,而選修課程的設置也脫離統(tǒng)計學專業(yè)學生學習和未來發(fā)展的需要,不能激發(fā)學生的興趣和求知欲,教學效果較差。
三、中西部地區(qū)二三本高校統(tǒng)計學專業(yè)教育教學的定位和出路
(一)普及大數(shù)據(jù)知識,積極引導學生認識和熟悉大數(shù)據(jù)
大數(shù)據(jù)是一個新生事物,全球80%左右的大數(shù)據(jù)產(chǎn)生于近四年。大數(shù)據(jù)正在處于推廣和發(fā)展階段,其未來的影響也會更加深遠和廣泛。大數(shù)據(jù)在給統(tǒng)計學帶來機遇的同時,也帶來不少挑戰(zhàn)。統(tǒng)計學家、統(tǒng)計學專業(yè)的授課教師,必須在傳統(tǒng)統(tǒng)計數(shù)據(jù)環(huán)境的基礎上,積極學數(shù)據(jù)這個新生事物,學會適應新的大數(shù)據(jù)環(huán)境,從而拓展統(tǒng)計學的新應用領域,創(chuàng)造和發(fā)現(xiàn)適應大數(shù)據(jù)的新統(tǒng)計方法。就目前中西部地區(qū)二三本高校統(tǒng)計學專業(yè)教育教學的實際來看,不少教師聽說過大數(shù)據(jù)的提法,但對大數(shù)據(jù)的概念、特征、意義、分析方法,以及如何處理大數(shù)據(jù)和大數(shù)據(jù)的未來發(fā)展方向,認識不是很清晰和深刻。所以,對中西部地區(qū)二三本高校統(tǒng)計學專業(yè)的廣大教師而言,不但要積極學習和熟悉大數(shù)據(jù),更重要的是利用課堂和課余時間,有計劃、有步驟地向統(tǒng)計學專業(yè)的學生積極宣傳和介紹大數(shù)據(jù)的有關概念、知識和方法,使學生對大數(shù)據(jù)有一個清晰、客觀、正確的認識和觀念,早日將其引導到大數(shù)據(jù)的發(fā)展之路上來。
(二)認清教育教學與大數(shù)據(jù)之間的關系,正確定位專業(yè)發(fā)展目標和方向
由上述分析可知,中西部地區(qū)二三本高校統(tǒng)計學專業(yè)教育主要以本科層次為主,一些實力較強的二本高校開展了碩士研究生層次的教育,個別高校開展博士研究生層次的教育。本科教育是通才教育,強調(diào)扎實地學好基礎課程,為以后工作或者研究打好基礎,而研究生教育則強調(diào)提高獨立研究、獨立創(chuàng)新的能力。從知識結構和層次來看,統(tǒng)計學專業(yè)本科生所學知識和課程的涉及范圍較寬,但深度不夠,而研究生層次的教育與大數(shù)據(jù)的距離更為接近,更能滿足大數(shù)據(jù)分析對于統(tǒng)計方法和技術的要求。
統(tǒng)計學專業(yè)的培養(yǎng)目標是培養(yǎng)應用型統(tǒng)計專業(yè)人才,即培養(yǎng)具有良好的數(shù)學或數(shù)學與經(jīng)濟學素養(yǎng),掌握統(tǒng)計學的基本理論和方法,能熟練地運用計算機分析數(shù)據(jù),能在企業(yè)、事業(yè)單位和經(jīng)濟、管理部門從事統(tǒng)計調(diào)查、統(tǒng)計信息管理、數(shù)量分析等開發(fā)、應用和管理工作,或在科研、教育部門從事研究和教學工作的高級專門人才。而對大數(shù)據(jù)進行分析,需要將統(tǒng)計學、計算機、數(shù)學和社會科學等多學科進行融合。因此,大數(shù)據(jù)時代,統(tǒng)計學專業(yè)的培養(yǎng)目標要轉向培養(yǎng)復合型專業(yè)人才。這使得傳統(tǒng)的統(tǒng)計學專業(yè)培養(yǎng)目標面臨兩個方面的轉變,一是注重統(tǒng)計學與其他專業(yè)之間的融合,二是如何實現(xiàn)由應用型人才向復合型人才的轉變。
中西部地區(qū)二三本高校由于師資力量、課程體系設置、教育投入規(guī)模等方面的不足與局限,在較短的一段時期內(nèi)實現(xiàn)上述兩個方面的轉變有較大困難。根據(jù)不同學歷層次教育與大數(shù)據(jù)之間的聯(lián)系和自身高校的實際,當前中西部地區(qū)二三本高校統(tǒng)計學專業(yè)教育教學應以原先的培養(yǎng)目標為主,在現(xiàn)有課程設置和師資力量方面率先進行改革和創(chuàng)新,在不斷夯實和提升自身實力的基礎實現(xiàn)這兩個轉變。
(三)改革和創(chuàng)新現(xiàn)有課程設置,豐富和完善計算機與統(tǒng)計軟件類課程
在大數(shù)據(jù)背景下,統(tǒng)計學專業(yè)課程設置應進行改革和創(chuàng)新,根據(jù)大數(shù)據(jù)的發(fā)展方向和要求,提升現(xiàn)有課程或開設新的課程。根據(jù)中西部地區(qū)二三本高校統(tǒng)計學專業(yè)教育教學的實際,改革和創(chuàng)新現(xiàn)有課程設置,主要從以下三個方面做起。
一是加強對數(shù)據(jù)收集部分內(nèi)容的講解與訓練。就統(tǒng)計數(shù)據(jù)的收集而言,一般在統(tǒng)計學課程中的“統(tǒng)計調(diào)查”與“抽樣與抽樣分別”部分進行講解和說明,為此,不少學校開設市場調(diào)查分析與預測或者抽樣技術的課程。大數(shù)據(jù)時代,大數(shù)據(jù)的產(chǎn)生方式更加豐富和多樣化,數(shù)據(jù)的抽樣方法也發(fā)生很大變化。在當前大數(shù)據(jù)抽樣技術不甚明朗的情況下,應繼續(xù)加強對傳統(tǒng)抽樣方法與技術的講解深度和訓練力度,同時注重補充有關GDP核算、普查和CPI、PMI等重要指標數(shù)據(jù)抽樣技術的有關知識和實踐操作規(guī)程。
二是有針對性地增加計算機類相關課程。目前,中西部地區(qū)二三本高校統(tǒng)計學專業(yè)開設的計算機類課程主要以計算機基礎課程、計算機高級語言和計算機網(wǎng)絡課程為主,遠不能適應和滿足大數(shù)據(jù)對統(tǒng)計學專業(yè)的要求。為此,需要在課程設置中增加Office辦公軟件、專業(yè)數(shù)據(jù)語言等課程,使統(tǒng)計學專業(yè)學生具備大數(shù)據(jù)分析對計算機操作的基礎技能。
三是健全和完善統(tǒng)計軟件類課程。目前,中西部地區(qū)二三本高校統(tǒng)計學專業(yè)開設的計算機類課程主要為R語言、SPSS或者SAS、E-views,一般來講,以其中兩個軟件的教學為主。但其存在的最大問題是軟件課程授課教師相對較少,學生對軟件的學習和操作訓練不夠系統(tǒng)和完備,不少學校統(tǒng)計軟件課程只是針對基礎統(tǒng)計學、計算經(jīng)濟學基礎、多元統(tǒng)計的部分內(nèi)容來進行。所以,健全和完善統(tǒng)計軟件類課程首先體現(xiàn)在加強對現(xiàn)有統(tǒng)計軟件所學內(nèi)容的廣度和深度以及訓練方面,其次應增設3門以上的軟件課程供學生選擇和學習,加強實踐操作技能的培養(yǎng)和提升。
(四)提升統(tǒng)計學專業(yè)授課教師的職稱與學歷,革新知識容量和結構
無論是形成大數(shù)據(jù)的思維模式和普及大數(shù)據(jù)知識,還是改革和創(chuàng)新現(xiàn)有的課程設置,最終主要靠統(tǒng)計學專業(yè)授課教師來開展和執(zhí)行。所以,提升統(tǒng)計學專業(yè)授課教師的素質(zhì)是關鍵。職稱反映著高校教師在學科建設和教學科研領域的積累與付出,學歷則代表著教師在專業(yè)領域和科研能力方面的突破與提升。所以,應對大數(shù)據(jù)時代統(tǒng)計學專業(yè)教育教學面臨的挑戰(zhàn),實現(xiàn)上述途徑的方式,一方面,中西部二三本高校需要提升現(xiàn)有統(tǒng)計學專業(yè)授課教師的職稱與學歷,改造和提升現(xiàn)有教師的規(guī)模及其專業(yè)結構、學歷結構和職稱結構,擴大計算機和數(shù)據(jù)庫類課程教師、統(tǒng)計軟件類課程教師的力量。另一方面,現(xiàn)有的教師尤其是專業(yè)基礎課和專業(yè)核心課程的教師,要積極學數(shù)據(jù)的有關知識和方法,不斷提升自身處理和解決大數(shù)據(jù)有關問題的能力。
(五)加強統(tǒng)計專業(yè)教育教學的組織支持和制度保障
改革和創(chuàng)新現(xiàn)有的課程設置,豐富和完善計算機與統(tǒng)計軟件類課程,需要增加這些課程的內(nèi)容和學時,并且聘用更多資歷更高的教師。所有這一切,都需要在統(tǒng)計學專業(yè)教育教學的軟硬件建設方面投入更多的資金、人力與物力,而這與學校對統(tǒng)計學專業(yè)學科建設與教學建設的重視和大力支持是密不可分的。為此,中西部地區(qū)二三本高校統(tǒng)計學專業(yè)的教育教學,在未來仍然需要繼續(xù)加大投入,同時輔之以積極和良好的人事政策支持與后勤保障。所以,大數(shù)據(jù)時代中西部地區(qū)二三本高校統(tǒng)計學專業(yè)教育教學的革新和突破,離不開所在院校的組織支持和制度保障。
摘要:統(tǒng)計學是培養(yǎng)經(jīng)管類專業(yè)學生定量分析能力的重要課程,大數(shù)據(jù)時代的到來對統(tǒng)計學提出了新的要求。本文圍繞大數(shù)據(jù)時代對經(jīng)管類專業(yè)數(shù)據(jù)分析人才的需求,以專業(yè)特色為導向,運用“知識+能力+應用”模式進行統(tǒng)計學模塊化、層次化課程體系構建。
關鍵詞:大數(shù)據(jù);經(jīng)管類專業(yè);課程體系
大數(shù)據(jù)時代給社會經(jīng)濟發(fā)展帶來了機遇和挑戰(zhàn),社會各行各業(yè)對數(shù)據(jù)分析需求大幅上升,需要借助數(shù)據(jù)分析實現(xiàn)數(shù)據(jù)的增值,挖掘數(shù)據(jù)背后的潛在價值,為其經(jīng)營管理決策、投資決策提供智力支持。隨著社會經(jīng)濟發(fā)展對具有數(shù)據(jù)管理和數(shù)據(jù)分析能力的應用創(chuàng)新型經(jīng)濟管理人才的需求逐漸攀升,也引發(fā)了對高校經(jīng)管類專業(yè)學生能力的更高要求。面對紛繁復雜的社會經(jīng)濟環(huán)境,經(jīng)管類專業(yè)學生必須能夠廣泛應用定量分析技術,能夠從海量數(shù)據(jù)中獲取有效數(shù)據(jù),運用科學的方法從這些數(shù)據(jù)中提取出有用信息,建立相應的模型,作出最優(yōu)決策。
統(tǒng)計學是培養(yǎng)經(jīng)管類專業(yè)學生定量分析能力的一門重要課程,是眾多高等院校經(jīng)管類專業(yè)的專業(yè)基礎必修課,是以后深入學習相關定量方法類課程(諸如計量經(jīng)濟學、管理運籌學、市場調(diào)查與預測等)的基礎。因此,統(tǒng)計學課程體系設置是否合理,將直接影響到學生獲取有效數(shù)據(jù)和分析數(shù)據(jù)應用能力的培養(yǎng),進而影響學生定量分析能力的培養(yǎng)。
一、經(jīng)管類專業(yè)統(tǒng)計學課程體系存在的問題
1.課程教學定位模糊。我國高等院校經(jīng)管類專業(yè)統(tǒng)計學教學中的最大弊端在于一直按照前蘇聯(lián)劃分方式將其歸類為一門偏重于簡單數(shù)據(jù)整理課程,而將相應的統(tǒng)計分析所采用方法和理論歸為數(shù)理統(tǒng)計,因此在教學中不重視對后者的學習。然而,西方發(fā)達國家的統(tǒng)計學課程是同時包括這兩個部分內(nèi)容的,尤其是后一個部分內(nèi)容是定量分析的重要基礎。因此,在傳統(tǒng)統(tǒng)計學教學定位下,學生只認識了基本理論與概念,卻掌握不了處理和分析數(shù)據(jù)的能力,這與經(jīng)管類專業(yè)應用型人才培養(yǎng)目標相背離,難以適應大數(shù)據(jù)時代社會各領域?qū)?jīng)濟管理人才素質(zhì)的新需求。
2.課程體系有待完善,與經(jīng)管類專業(yè)融合不夠。目前,大多數(shù)高等院校經(jīng)管類專業(yè)統(tǒng)計學課程設置只涉及理論統(tǒng)計學這一領域,未將統(tǒng)計分析方法與相關經(jīng)管類專業(yè)知識有機結合。在這樣的課程體系安排下,學生雖然掌握了統(tǒng)計基本理論和方法,但難以體會到統(tǒng)計在本專業(yè)學習中的應用價值,當面臨現(xiàn)實的經(jīng)濟、管理問題卻無能為力,不會運用所學統(tǒng)計方法,結合專業(yè)知識對實際問題進行定量分析。這種狀況與經(jīng)管類人才定量分析能力培養(yǎng)目的相違背,難以實現(xiàn)具有創(chuàng)新能力的經(jīng)管類人才的培養(yǎng)目標。
因此,如能結合經(jīng)管類專業(yè)特點,對統(tǒng)計學的課程體系進行優(yōu)化建設,勢必能夠培養(yǎng)出具有定量分析技能,滿足社會需求和企業(yè)需求,符合大數(shù)據(jù)時代人才素質(zhì)要求的經(jīng)濟管理人才。
二、大數(shù)據(jù)時代經(jīng)管類專業(yè)統(tǒng)計學課程體系構建
1.明確課程教學定位。目前,統(tǒng)計學教學中偏重于統(tǒng)計學基本概念、基本模型和基本方法的理論知識學習,系統(tǒng)性較強,有利于學生全面了解統(tǒng)計學的知識體系,但是對統(tǒng)計思維能力的培養(yǎng)和統(tǒng)計方法的應用重視不夠,這不僅會讓學生望而生畏,從而失去學習的主動性與積極性,更為重要的是學生不能夠?qū)W以致用,在自己本專業(yè)深入學習過程中不會運用統(tǒng)計學知識來解決實際的經(jīng)濟管理問題,而在教與學中出現(xiàn)的這些問題源頭在于教學定位不夠準確。因此,本文提出新的課程教學定位:以應用創(chuàng)新型人才培養(yǎng)為導向,提高經(jīng)管類專業(yè)學生定量分析能力為目標,結合經(jīng)濟學科和管理學科的特點,通過統(tǒng)計學的理論教學、案例分析、課程設計、實驗(踐)等教學環(huán)節(jié),培養(yǎng)學生統(tǒng)計思維能力和統(tǒng)計應用能力,具備運用統(tǒng)計學理論與方法,研究社會經(jīng)濟管理領域有關數(shù)據(jù)收集、整理、分析等解決實際問題的綜合能力,以適應大數(shù)據(jù)時代對經(jīng)濟管理人才的新需求。
2.課程體系優(yōu)化建設。根據(jù)新的教學定位,統(tǒng)計學課程體系優(yōu)化建設的基本思路:一是課程體系設置要強調(diào)基礎知識、注重靈活應用、突出定量分析的教學理念和教學目標;二是課程結構上,突出專業(yè)針對性,強調(diào)統(tǒng)計學科和經(jīng)濟學科、管理學科的有機結合,使課程特色化;三是建立實踐教學體系,加強學生實踐能力的鍛煉,為學生提供綜合素質(zhì)和能力提高的實訓平臺;四是將統(tǒng)計分析軟件的運用融入到課程體系之中,加強統(tǒng)計分析軟件的技能培養(yǎng)。
因此,本文將運用模塊化系統(tǒng)集成思想,根據(jù)經(jīng)濟與管理類各專業(yè)的要求,提出按專業(yè)分模塊,按模塊分層次,按層次定內(nèi)容的改革方案,構建“課程體系課程子系統(tǒng)課程模塊具體內(nèi)容”的遞階控制結構模型,具體如圖1所示。
在統(tǒng)計學課程體系優(yōu)化建設中,我們運用系統(tǒng)科學的方法構建出模塊化、層次化集成的課程體系在整體功能上達到了最佳狀態(tài)。
課程基礎子系統(tǒng)是統(tǒng)計學理論基礎和統(tǒng)計思維培養(yǎng)階段,由統(tǒng)計學基本原理和基本理論構成,體現(xiàn)了“厚基礎”的功能。課程應用子系統(tǒng)和課程案例子系統(tǒng)是統(tǒng)計分析能力訓練階段,首先結合認知性案例模塊系統(tǒng)介紹統(tǒng)計分析方法,讓經(jīng)管類專業(yè)學生了解統(tǒng)計分析方法的基本原理,其次進一步結合專業(yè)特色案例模塊和統(tǒng)計分析軟件模塊,通過分專業(yè)教學方式,使不同專業(yè)學生能夠體會到統(tǒng)計學在本專業(yè)中的應用,增強學生的學習興趣,體現(xiàn)了“強能力”的功能。課程實踐子系統(tǒng)是統(tǒng)計應用能力實踐階段,是培養(yǎng)大數(shù)據(jù)時代應用型經(jīng)管人才的重要環(huán)節(jié)。課程實踐主要包括課堂實踐和實驗室模擬,課外實踐主要包括社會實踐活動、實訓實習和相關競賽,通過課程實踐和課外實踐兩大平臺訓練學生運用所學統(tǒng)計調(diào)查、統(tǒng)計整理和統(tǒng)計分析等知識解決實際問題的綜合能力。課程選修子系統(tǒng)是統(tǒng)計應用能力擴展階段,該階段在學生掌握統(tǒng)計學相關知識的基礎上,通過選修統(tǒng)計預測與統(tǒng)計決策兩大模塊,進一步培養(yǎng)學生的定量分析能力。
三、結束語
大數(shù)據(jù)時代經(jīng)管類專業(yè)統(tǒng)計學課程體系構建,應注重強化基礎理論,突出知識的實用性和創(chuàng)新性,做到統(tǒng)計知識與實例分析相結合,與軟件應用相結合,理論教學與實踐教學相結合,與實際應用相結合。根據(jù)經(jīng)管類各專業(yè)特色,以“知識+能力+應用”模式進行模塊化、層次化課程體系設置,從本質(zhì)上提升學生的數(shù)據(jù)素養(yǎng)和信息素養(yǎng),提高解決實際問題的定量分析能力,以適應大數(shù)據(jù)時代對人才素質(zhì)的新需求,使具有數(shù)據(jù)管理和數(shù)據(jù)分析能力的經(jīng)濟管理人才在就業(yè)市場上更具有競爭力。