99热精品69堂国产-97超级碰在线精品视频-日韩欧美中文字幕在线视频-欧美日韩大尺码免费专区-最新国产三级在线不卡视频-在线观看成人免费视频-亚洲欧美国产精品完整版-色综久久天天综合绕视看-中文字幕免费在线看线人-久久国产精品99精品国产

歡迎來(lái)到優(yōu)發(fā)表網(wǎng)!

購(gòu)物車(0)

期刊大全 雜志訂閱 SCI期刊 期刊投稿 出版社 公文范文 精品范文

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文

時(shí)間:2022-05-21 11:09:17

序論:在您撰寫統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文時(shí),參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的1篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:探究大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)學(xué)發(fā)展的新認(rèn)識(shí)

摘 要:隨著信息化時(shí)代的發(fā)展,數(shù)據(jù)的形式多樣化,數(shù)據(jù)結(jié)構(gòu)具有復(fù)雜性特征。這標(biāo)志著大數(shù)據(jù)時(shí)代的到來(lái),這一時(shí)代的數(shù)據(jù)具有處理速度快、數(shù)據(jù)量大、樣本復(fù)雜但價(jià)值密度低的特點(diǎn)。大數(shù)據(jù)時(shí)代的到來(lái),高校應(yīng)對(duì)其產(chǎn)生新的認(rèn)識(shí),并根據(jù)實(shí)際狀況及時(shí)調(diào)整統(tǒng)計(jì)學(xué)專業(yè)的建設(shè)策略,使統(tǒng)計(jì)人才的培養(yǎng)能夠適應(yīng)時(shí)代的需求。

關(guān)鍵詞:大數(shù)據(jù)時(shí)代;統(tǒng)計(jì)學(xué);影響

隨著大數(shù)據(jù)時(shí)代的到來(lái),各企業(yè)采用了新的策略,獲得了更多的利潤(rùn)。對(duì)于統(tǒng)計(jì)專業(yè)來(lái)說(shuō),改變發(fā)展策略,使培養(yǎng)出來(lái)的專業(yè)人才能夠適應(yīng)大數(shù)據(jù)背景的需求是其主要任務(wù)。目前,高校統(tǒng)計(jì)學(xué)專業(yè)逐漸認(rèn)識(shí)到大數(shù)據(jù)時(shí)代綜合性人才培養(yǎng)的重要性,并對(duì)專業(yè)建設(shè)進(jìn)行了相關(guān)改革。

一、大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)學(xué)的影響

大數(shù)據(jù)時(shí)代的到來(lái)對(duì)現(xiàn)代統(tǒng)計(jì)專業(yè)的發(fā)展造成了新的沖擊,要確保培養(yǎng)出來(lái)的人才能夠起到應(yīng)有的作用,首先要了解大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)專業(yè)所造成的影響。

(一)大數(shù)據(jù)時(shí)代使數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)性質(zhì)發(fā)生變化

網(wǎng)絡(luò)技術(shù)以及基于網(wǎng)絡(luò)技術(shù)的電子商務(wù)等新的數(shù)據(jù)記錄模式標(biāo)志著大數(shù)據(jù)時(shí)代的到來(lái)。大數(shù)據(jù)時(shí)代,不再依賴于抽樣調(diào)查的記錄模式,網(wǎng)站瀏覽、視頻監(jiān)控都將形成大量數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)結(jié)構(gòu)甚至是數(shù)據(jù)性質(zhì)發(fā)生了變化。大量的數(shù)據(jù)信息對(duì)于需求者來(lái)說(shuō),如何甄別其可用價(jià)值成為關(guān)鍵。傳統(tǒng)的數(shù)據(jù)可以二維表格顯示和整理。但大數(shù)據(jù)時(shí)代所產(chǎn)生的數(shù)據(jù)具有多樣化和復(fù)雜化特征,往往包含了大量的音頻、視頻、HTML等。這要求大數(shù)據(jù)的收集具有較強(qiáng)的目的性,才能實(shí)現(xiàn)其價(jià)值。

(二)大數(shù)據(jù)時(shí)代要求統(tǒng)計(jì)分析方法和統(tǒng)計(jì)思維更新

大數(shù)據(jù)時(shí)代的主要特征為數(shù)據(jù)多且復(fù)雜,數(shù)據(jù)分析要求分析者對(duì)總體進(jìn)行分析。在這一背景下,參數(shù)統(tǒng)計(jì)不再具有意義,假設(shè)檢驗(yàn)法也隨著總體分析而失去價(jià)值。數(shù)據(jù)的復(fù)雜化對(duì)傳統(tǒng)大數(shù)據(jù)統(tǒng)計(jì)思維造成了巨大的沖擊,要求統(tǒng)計(jì)者具有活躍的思維。只有對(duì)傳統(tǒng)數(shù)據(jù)的改變進(jìn)行分析,并且樹立新的統(tǒng)計(jì)方法。

二、大數(shù)據(jù)時(shí)代下的統(tǒng)計(jì)學(xué)發(fā)展新策略

為適應(yīng)大數(shù)據(jù)時(shí)代的需求,統(tǒng)計(jì)學(xué)專業(yè)的發(fā)展勢(shì)必要對(duì)傳統(tǒng)模式進(jìn)行改革。目前,多數(shù)高校統(tǒng)計(jì)學(xué)專業(yè)已經(jīng)認(rèn)識(shí)到大數(shù)據(jù)對(duì)于其發(fā)展帶來(lái)的沖擊。為此,本文提出了以下策略,以及能夠幫助統(tǒng)計(jì)學(xué)取得更好發(fā)展。

(一)加強(qiáng)統(tǒng)計(jì)應(yīng)用性教學(xué)

根據(jù)大數(shù)據(jù)時(shí)代數(shù)據(jù)的總體分析特征,數(shù)據(jù)分析人員應(yīng)掌握全面的分析方法。在人才培養(yǎng)過(guò)程中,應(yīng)致力于培養(yǎng)實(shí)踐分析能力,提高數(shù)據(jù)和資料收集能力,并且培養(yǎng)其強(qiáng)烈的數(shù)據(jù)價(jià)值觀,使其能夠從眾多數(shù)據(jù)中找到所需的。另外,對(duì)傳統(tǒng)模式進(jìn)行改革,增加大數(shù)據(jù)統(tǒng)計(jì)內(nèi)容,以適應(yīng)時(shí)代的需求?;诖髷?shù)據(jù)的結(jié)構(gòu)特點(diǎn),實(shí)施資料透視化教學(xué),提高分析者對(duì)復(fù)雜數(shù)據(jù)的分析能力。

(二)培養(yǎng)大數(shù)據(jù)統(tǒng)計(jì)思維

在人才培養(yǎng)過(guò)程中,新的統(tǒng)計(jì)思維的培養(yǎng)具有重要意義,即強(qiáng)調(diào)數(shù)據(jù)分析實(shí)踐能力的提高。統(tǒng)計(jì)思維的培養(yǎng)有助于數(shù)據(jù)分析者對(duì)復(fù)雜的數(shù)據(jù)進(jìn)行區(qū)分,從而整理有效信息。在大數(shù)據(jù)時(shí)代,不僅要以傳統(tǒng)的平均思維、動(dòng)態(tài)思維和變異思維為基礎(chǔ),還要注重基于整體分析的大數(shù)據(jù)思維。另外,還要培養(yǎng)數(shù)據(jù)分者的復(fù)雜性思維,以應(yīng)對(duì)復(fù)雜的數(shù)據(jù)庫(kù)??傊?,大數(shù)據(jù)時(shí)代需要數(shù)據(jù)分析者具有全面的、創(chuàng)新性的思維。

(三)強(qiáng)化基礎(chǔ)性統(tǒng)計(jì)知識(shí)

統(tǒng)計(jì)學(xué)自身具有復(fù)雜性,其改變多且抽象。基礎(chǔ)的統(tǒng)計(jì)知識(shí)是進(jìn)一步掌握大數(shù)據(jù)分析思維的基礎(chǔ),可見學(xué)習(xí)基礎(chǔ)性統(tǒng)計(jì)知識(shí)的重要性是不言而喻的。為此,應(yīng)該采取深入淺出的方法,利用多媒體等方式使復(fù)雜的數(shù)據(jù)統(tǒng)計(jì)清晰化、簡(jiǎn)單化。結(jié)合具體的案例使數(shù)據(jù)分析者正確認(rèn)識(shí)統(tǒng)計(jì)概念、掌握統(tǒng)計(jì)原理和方法。此外大數(shù)據(jù)分析不再是一種專業(yè),而是更傾向于一種技術(shù),這要求我們將大數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)以外的相關(guān)知識(shí)相互聯(lián)系。注重真實(shí)相關(guān)與偽相關(guān)的講解,強(qiáng)調(diào)商務(wù)智能的開發(fā)和分析。只有具有堅(jiān)實(shí)的基礎(chǔ),才能確保數(shù)據(jù)分析者大數(shù)據(jù)分析思維的養(yǎng)成,適應(yīng)現(xiàn)代社會(huì)的需求。

(四)加強(qiáng)復(fù)合型人才培養(yǎng)

為適應(yīng)大數(shù)據(jù)時(shí)代的需求,復(fù)合型人才的培養(yǎng)是關(guān)鍵。所謂復(fù)合型人才,是指其不但要具有專業(yè)的數(shù)據(jù)分析能力,還要相應(yīng)的具備管理以及其從事專業(yè)的技術(shù)。大數(shù)據(jù)時(shí)代,高校應(yīng)建立全面的人才培養(yǎng)模式,注重培養(yǎng)人才的數(shù)據(jù)分析能力、編程能力等,使其真正了解大數(shù)據(jù),懂得如何利用大數(shù)據(jù)對(duì)其所處的行業(yè)起到積極作用才是關(guān)鍵??傊?,大數(shù)據(jù)時(shí)代對(duì)綜合性人才具有更高的需求,大數(shù)據(jù)時(shí)代不僅培養(yǎng)的是一種能力,而且是一種思維,是對(duì)全新模式下的數(shù)據(jù)的分析和利用。高校作為人才培養(yǎng)的重要基地,其教學(xué)模式的改革、對(duì)大數(shù)據(jù)時(shí)代所需教學(xué)模式的認(rèn)識(shí)是高校的主要任務(wù)。

三、總結(jié)

統(tǒng)計(jì)學(xué)是經(jīng)濟(jì)學(xué)的基礎(chǔ)課程,傳統(tǒng)的統(tǒng)計(jì)人才培養(yǎng)具有定向性。而隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)產(chǎn)生的形式多樣,且具有復(fù)雜性。大數(shù)據(jù)分析不僅是作為一種專業(yè)存在,而是應(yīng)以一項(xiàng)必備的技術(shù)而存在。大數(shù)據(jù)時(shí)代,傳統(tǒng)的統(tǒng)計(jì)思維和統(tǒng)計(jì)方法發(fā)生了改變,統(tǒng)計(jì)人才培養(yǎng)方式的改革也就勢(shì)在必行。(作者單位:海南師范大學(xué))

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)面臨的機(jī)遇與挑戰(zhàn)

【摘要】大數(shù)據(jù)給統(tǒng)計(jì)學(xué)帶來(lái)了機(jī)遇、挑戰(zhàn)和緊迫感。本文描述大數(shù)據(jù)的環(huán)境,利用大數(shù)據(jù)的目的和大數(shù)據(jù)帶來(lái)的變革;介紹國(guó)內(nèi)外有關(guān)大數(shù)據(jù)的研究動(dòng)向;探討大數(shù)據(jù)包含的信息,大數(shù)據(jù)的預(yù)處理、抽樣和分析方法。

【關(guān)鍵詞】大數(shù)據(jù) 抽樣 數(shù)據(jù)分析方法論

當(dāng)今時(shí)代,一方面人們?cè)谥鲃?dòng)地獲取數(shù)據(jù)。各個(gè)科學(xué)領(lǐng)域都在大量地獲取數(shù)據(jù),自然科學(xué)領(lǐng)域收集著從宏觀的天文數(shù)據(jù)到微觀的基因數(shù)據(jù),經(jīng)濟(jì)、金融和人文社會(huì)科學(xué)收集著大量的觀察和調(diào)查數(shù)據(jù)。另一方面人們?cè)诒粍?dòng)地囤積數(shù)據(jù)。隨著計(jì)算機(jī)互聯(lián)網(wǎng)、搜索引擎、電子商務(wù)、多種傳感器和多媒體技術(shù)的發(fā)展和廣泛使用,各種形式的數(shù)據(jù)如江河流水般地涌來(lái)。當(dāng)今數(shù)據(jù)的獲取和規(guī)模發(fā)生了根本的變化,統(tǒng)計(jì)學(xué)面臨著新的機(jī)遇和挑戰(zhàn),需要在方法論上有所突破。

一、大數(shù)據(jù)及其目的

狹義地講,大數(shù)據(jù)是一個(gè)大樣本和高維變量的數(shù)據(jù)集合。針對(duì)樣本大的問題,統(tǒng)計(jì)學(xué)可以采用抽樣減少樣本量,達(dá)到需要的精度。目前大數(shù)據(jù)的環(huán)境包括了:數(shù)據(jù)流環(huán)境:數(shù)據(jù)快速不斷涌來(lái),現(xiàn)有存儲(chǔ)設(shè)備和計(jì)算能力難以應(yīng)付這種洪水般的數(shù)據(jù)流;磁盤存儲(chǔ)環(huán)境:數(shù)據(jù)已不能完全存儲(chǔ)在內(nèi)存中,需要硬盤存儲(chǔ);分布存儲(chǔ)環(huán)境:數(shù)據(jù)分布存儲(chǔ)在多個(gè)計(jì)算機(jī)中;多線條環(huán)境:數(shù)據(jù)存儲(chǔ)在一個(gè)計(jì)算機(jī)中,多個(gè)處理器共享內(nèi)存。

大數(shù)據(jù)的目的是將數(shù)據(jù)轉(zhuǎn)化為知識(shí),探索數(shù)據(jù)的產(chǎn)生機(jī)制,進(jìn)行預(yù)測(cè)和制定政策。把信息轉(zhuǎn)變?yōu)橛杏玫闹R(shí)還需漫長(zhǎng)的時(shí)間?!邦A(yù)測(cè)”不同于“制定政策”。一個(gè)兒童的鞋子越大,可以預(yù)測(cè)他掌握的詞匯量越多;但是,制定政策強(qiáng)制他穿大鞋子并不能提高他的詞匯量。

二、大數(shù)據(jù)帶來(lái)的變革

大數(shù)據(jù)給我們的時(shí)代帶來(lái)了變革。目前,人們習(xí)慣于根據(jù)“研究問題”來(lái)驅(qū)動(dòng)“收集數(shù)據(jù)”。今后,大數(shù)據(jù)到處可得,人們將會(huì)用“數(shù)據(jù)”驅(qū)動(dòng)“研究問題”。就像我們出遠(yuǎn)門前常常查詢目的地的天氣、交通和賓館那樣,未來(lái)人們?cè)谘芯亢蜎Q策前將會(huì)通過(guò)查詢數(shù)據(jù)做決定。目前已經(jīng)有科學(xué)家開始使用軟件搜索和匯總已中的成果。大數(shù)據(jù)中包含有各種不同目的的數(shù)據(jù)集,綜合利用它們可以做出原來(lái)目的之外的意外成果。例如,將醫(yī)院病歷數(shù)據(jù)與信用卡消費(fèi)數(shù)據(jù)結(jié)合,我們能發(fā)現(xiàn)食品與健康的相關(guān)關(guān)系,指導(dǎo)人們進(jìn)行健康飲食。假若再加上手機(jī)和GPS等數(shù)據(jù),還能隨時(shí)對(duì)人們進(jìn)行體檢,指導(dǎo)健身,減少猝死,幫助醫(yī)生診斷疾病等,應(yīng)用大數(shù)據(jù)可以設(shè)想的用途不計(jì)其數(shù)。

三、大數(shù)據(jù)的處理、抽樣與分析

(一)數(shù)據(jù)的預(yù)處理

大數(shù)據(jù)的預(yù)處理包括數(shù)據(jù)清洗、不完全數(shù)據(jù)填補(bǔ)、數(shù)據(jù)糾偏與矯正。利用隨機(jī)抽樣數(shù)據(jù)矯正雜亂的、非標(biāo)準(zhǔn)的數(shù)據(jù)源。統(tǒng)計(jì)機(jī)構(gòu)的數(shù)據(jù)是經(jīng)過(guò)嚴(yán)格抽樣設(shè)計(jì)獲取的,具有總體的代表性和系統(tǒng)誤差小的優(yōu)勢(shì),但是數(shù)據(jù)獲取和更新的周期長(zhǎng),盡管調(diào)查項(xiàng)目有代表性,但難以無(wú)所不包。而互聯(lián)網(wǎng)數(shù)據(jù)的獲取速度快、量大、項(xiàng)目繁細(xì),但是難以避免數(shù)據(jù)獲取的偏倚性。將統(tǒng)計(jì)機(jī)構(gòu)的數(shù)據(jù)作為金標(biāo)準(zhǔn)和框架對(duì)互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行矯正,將互聯(lián)網(wǎng)數(shù)據(jù)作為補(bǔ)充資源對(duì)統(tǒng)計(jì)機(jī)構(gòu)的數(shù)據(jù)進(jìn)行實(shí)時(shí)更新,也許是解決問題的一個(gè)思路。

(二)大數(shù)據(jù)環(huán)境的抽樣

大數(shù)據(jù)的抽樣方法有待研究?!皹颖尽辈槐厥褂盟小皵?shù)據(jù)”,不管鍋有多大,只要充分?jǐn)噭?,品嘗一小勺就知道其滋味。針對(duì)大數(shù)據(jù)流環(huán)境,需要探索從源源不斷的數(shù)據(jù)流中抽取足以滿足統(tǒng)計(jì)目的和精度的樣本。需要研究新的適應(yīng)性、序貫性和動(dòng)態(tài)的抽樣方法。根據(jù)已獲得的樣本逐步調(diào)整感興趣的調(diào)查項(xiàng)目和抽樣對(duì)象,使得最近頻繁出現(xiàn)的熱門數(shù)據(jù),也是感興趣的數(shù)據(jù)進(jìn)入樣本。建立數(shù)據(jù)流的緩沖區(qū),記錄新發(fā)生數(shù)據(jù)的頻數(shù),動(dòng)態(tài)調(diào)整不在樣本中的數(shù)據(jù)進(jìn)入樣本的概率。

(三)大數(shù)據(jù)的分析與整合

針對(duì)大數(shù)據(jù)的高維問題,需要研究降維和分解的方法。探討壓縮大數(shù)據(jù)的方法,直接對(duì)壓縮的數(shù)據(jù)核進(jìn)行傳輸、運(yùn)算和操作。除了常規(guī)的統(tǒng)計(jì)分析方法,包括高維矩陣、降維方法、變量選擇之外,需要研究大數(shù)據(jù)的實(shí)時(shí)分析、數(shù)據(jù)流算法。不用保存數(shù)據(jù),僅掃描一遍數(shù)據(jù)的數(shù)據(jù)流算法,考慮計(jì)算機(jī)內(nèi)存和外存的數(shù)據(jù)傳送問題、分布數(shù)據(jù)和并行計(jì)算的方法。如何無(wú)信息損失或無(wú)統(tǒng)計(jì)信息損失地分解大數(shù)據(jù)集,獨(dú)立并行地在分布計(jì)算機(jī)環(huán)境進(jìn)行推斷,各個(gè)計(jì)算機(jī)的中間計(jì)算結(jié)果能相互聯(lián)系溝通,構(gòu)造全局統(tǒng)計(jì)結(jié)果。研究多個(gè)數(shù)據(jù)資源的融合算法。研究利用數(shù)據(jù)流尋找模型變化時(shí)間點(diǎn)的動(dòng)態(tài)變化模型。

在大數(shù)據(jù)環(huán)境,很多數(shù)據(jù)集不再有標(biāo)識(shí)個(gè)體的關(guān)鍵字,傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)連接方法不再適用,需要探討利用數(shù)據(jù)庫(kù)之間的重疊項(xiàng)目來(lái)結(jié)合不同的數(shù)據(jù)庫(kù),利用變量間的條件獨(dú)立性整合多個(gè)不同變量集的數(shù)據(jù)為一個(gè)完整變量集的大數(shù)據(jù)庫(kù)的方法。探索不必經(jīng)過(guò)整合多數(shù)據(jù)庫(kù),直接利用局部數(shù)據(jù)進(jìn)行推斷和各推斷結(jié)果傳播的方法。另一方面,利用統(tǒng)計(jì)性質(zhì)無(wú)信息損失地分解和壓縮大數(shù)據(jù)。

四、結(jié)束語(yǔ)

一個(gè)新生事物的出現(xiàn)將必定導(dǎo)致傳統(tǒng)觀念和技術(shù)的革命。數(shù)碼照相機(jī)的出現(xiàn)導(dǎo)致傳統(tǒng)相片膠卷和影像業(yè)的已近消亡。如果大數(shù)據(jù)包含了所有父親和兒子的身高數(shù)據(jù),只要計(jì)算給定的父親身高下所有兒子的平均身高就可以預(yù)測(cè)其兒子身高了。模型不再重要,當(dāng)年統(tǒng)計(jì)學(xué)最得意的回歸預(yù)測(cè)方法將被淘汰。大數(shù)據(jù)的到來(lái)將對(duì)傳統(tǒng)的統(tǒng)計(jì)方法進(jìn)行考驗(yàn)。統(tǒng)計(jì)學(xué)會(huì)不會(huì)象科學(xué)哲學(xué)那樣,只佩戴著歷史的光環(huán),而不再主導(dǎo)和引領(lǐng)人們分析和利用大數(shù)據(jù)資源?,F(xiàn)在其他學(xué)科和行業(yè)涌入大數(shù)據(jù)的熱潮,如果統(tǒng)計(jì)學(xué)不抓緊參與的話,將面臨著被邊緣化的危險(xiǎn)?,F(xiàn)今統(tǒng)計(jì)學(xué)的目標(biāo)是通過(guò)獲取數(shù)據(jù)和分析數(shù)據(jù)發(fā)現(xiàn)真理(總體的參數(shù)和性質(zhì)),統(tǒng)計(jì)方法和理論對(duì)數(shù)據(jù)有過(guò)高的要求。而大數(shù)據(jù)充滿了各種隨機(jī)的、非隨機(jī)的誤差和偏倚,不能滿足這些苛刻的要求。按照波普的科學(xué)劃界準(zhǔn)則,只要我們能從大數(shù)據(jù)中提煉出具有可證偽的結(jié)論,那么這個(gè)結(jié)論還是科學(xué)的,可以用于知識(shí)積累。這些可證偽的大數(shù)據(jù)結(jié)論可作為進(jìn)一步科學(xué)研究的假說(shuō),以數(shù)據(jù)驅(qū)動(dòng)研究。我們?cè)诳吹酱髷?shù)據(jù)給統(tǒng)計(jì)學(xué)帶來(lái)了機(jī)遇的同時(shí),也應(yīng)該看到現(xiàn)在的統(tǒng)計(jì)方法普遍只適用于全部數(shù)據(jù)放在單個(gè)計(jì)算機(jī)內(nèi)存的環(huán)境,分布式大數(shù)據(jù)和數(shù)據(jù)流的環(huán)境給統(tǒng)計(jì)學(xué)帶來(lái)了挑戰(zhàn)。統(tǒng)計(jì)學(xué)家不應(yīng)該固守傳統(tǒng)數(shù)據(jù)的環(huán)境,必須積極學(xué)習(xí)新生事物,適應(yīng)新的大數(shù)據(jù)環(huán)境,擴(kuò)展統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域,創(chuàng)造出迎合大數(shù)據(jù)的新統(tǒng)計(jì)方法,“機(jī)遇”與“挑戰(zhàn)”并存。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:統(tǒng)計(jì)學(xué)在股票價(jià)格統(tǒng)計(jì)數(shù)據(jù)中的應(yīng)用

[摘 要]以股票當(dāng)中基本的股票價(jià)格計(jì)算數(shù)據(jù)著手,重點(diǎn)研究統(tǒng)計(jì)學(xué)在股票價(jià)格計(jì)算數(shù)據(jù)整理運(yùn)算進(jìn)程中有關(guān)的運(yùn)用。全面地說(shuō)明了如何計(jì)算股票價(jià)格的三種平均數(shù)和計(jì)算的公式;股票價(jià)格統(tǒng)計(jì)數(shù)據(jù)整理運(yùn)算進(jìn)程當(dāng)中的取樣研究以及股票價(jià)格統(tǒng)計(jì)數(shù)據(jù)的四個(gè)計(jì)算方法;依次列出在各個(gè)國(guó)家之間具有比較高影響力的幾個(gè)股票價(jià)格統(tǒng)計(jì)數(shù)據(jù)在運(yùn)算進(jìn)程中統(tǒng)計(jì)學(xué)的有關(guān)運(yùn)用。

[關(guān)鍵詞]統(tǒng)計(jì)學(xué);股票的價(jià)格;股票的價(jià)格統(tǒng)計(jì)數(shù)據(jù)

隨著社會(huì)進(jìn)步,股票已深入人們的生活當(dāng)中,只有正確地對(duì)待股票與統(tǒng)計(jì)學(xué)之間的聯(lián)系,這樣能更全面利用統(tǒng)計(jì)學(xué)知識(shí)掌握股票交易市場(chǎng)的變動(dòng)規(guī)律,從而促進(jìn)個(gè)人與團(tuán)體的利益一致性。

在平時(shí)常見的文章中我們能經(jīng)常碰到的是統(tǒng)計(jì)學(xué)的取樣數(shù)據(jù)分析、回歸分析、標(biāo)準(zhǔn)差等在股票技術(shù)分析、投資收益、風(fēng)險(xiǎn)預(yù)測(cè)中的常見實(shí)際運(yùn)用,在其實(shí)際運(yùn)用中股票價(jià)格統(tǒng)計(jì)數(shù)據(jù)也是統(tǒng)計(jì)學(xué)里的一個(gè),統(tǒng)計(jì)學(xué)在實(shí)際運(yùn)用中有著廣泛的作用,本篇文章是從股票中最基本的股票價(jià)格統(tǒng)計(jì)數(shù)據(jù)開始,側(cè)重以統(tǒng)計(jì)學(xué)在股票價(jià)格統(tǒng)計(jì)數(shù)據(jù)整理運(yùn)算過(guò)程中的實(shí)際運(yùn)用進(jìn)行分析、談?wù)摗?

1 統(tǒng)計(jì)學(xué)在股票中的定義

統(tǒng)計(jì)學(xué)通過(guò)收集相關(guān)的資料,剖析資料和數(shù)據(jù)得到的結(jié)果的一組概論,準(zhǔn)則與辦法。統(tǒng)計(jì)分析數(shù)據(jù)有描寫和推測(cè)統(tǒng)計(jì)兩種方法。

(1)看大盤:匯集股票的相關(guān)材料,即調(diào)查統(tǒng)計(jì)。從頭到尾,即全方位的去調(diào)查;有重點(diǎn)的看,即重點(diǎn)的調(diào)查;隨機(jī)的查看,即采樣調(diào)查;查找各種各樣的有象征性的個(gè)人股票,也是典型的調(diào)查。

(2)股票板塊:以某一標(biāo)志將股票進(jìn)行分類,也就是分組統(tǒng)計(jì)。例如鋼鐵板塊等。

(3)陰陽(yáng)燭:交易成功量與交易成功價(jià)格的高低決定其趨勢(shì),即是頻數(shù)分布。

(4)牛市:股價(jià)呈飆升趨勢(shì),即是正J型分布。

(5)熊市:股票呈下跌趨勢(shì),即反J型分布。

(6)摸高,回落:股票飆升,至某一點(diǎn)時(shí)受到阻力后呈下跌趨勢(shì),即是偏態(tài)分布。

(7)探底,反彈:股票價(jià)格下跌,到某一地方撐持后上升,也就U型的分布。

(8)股票指數(shù):加權(quán)平均數(shù)的運(yùn)算,是質(zhì)量指標(biāo)指數(shù)。股票的價(jià)格是質(zhì)量指標(biāo),成交的數(shù)量或發(fā)行量是數(shù)量指標(biāo)。

(9)黑股:存在感過(guò)低,易失諸交臂。

(10)均線:股價(jià)算術(shù)的平均數(shù)。一般為加權(quán)平均。

(11)震蕩空間:股票價(jià)格的波動(dòng)曲線的均值偏差,也就是標(biāo)準(zhǔn)偏差。

2 股票的價(jià)格統(tǒng)計(jì)數(shù)據(jù)

2.1 股票的價(jià)格均值

股票價(jià)格的均數(shù)是反饋不同股票價(jià)格上下浮動(dòng)的基準(zhǔn)。股票價(jià)格均數(shù)是由證券交易場(chǎng)所、金融類服務(wù)公司、銀行或新聞媒體整理而成的。為了能時(shí)刻了解各種股票而聯(lián)合形成的行情市場(chǎng)整體的價(jià)格水平和完整市場(chǎng)總和的變化方向。

2.2 簡(jiǎn)易的算術(shù)股票價(jià)錢均值

1981年6月,查爾斯?亨利?道在《客戶午后通訊》首次了一組之后被稱作“道?瓊斯工業(yè)股的股票價(jià)格平均數(shù)值”,也是全球上最早股票價(jià)格平均數(shù)值。

2.3 加權(quán)指數(shù)

加權(quán)指數(shù)是依據(jù)各種樣本股票的銷售數(shù)量或者是交易成交的數(shù)量依照權(quán)術(shù)來(lái)進(jìn)行加權(quán)指數(shù)運(yùn)算的股票交易價(jià)格的均值。因此銷售的數(shù)量是權(quán)數(shù)的加權(quán)均值的股票交易價(jià)格,即是抽樣股票的市場(chǎng)價(jià)值總和除以抽樣股票的銷售數(shù)量;以成交數(shù)量作為權(quán)數(shù)的加權(quán)均值股票價(jià)格,就相當(dāng)于是抽樣股票的全部金額除以抽樣股票的成交數(shù)量。

2.4 修正股票交易價(jià)格的均值

修正股票交易價(jià)格均值是通過(guò)簡(jiǎn)便的數(shù)字運(yùn)算的基本上,如果有分割股票、增加投資、發(fā)行新股的時(shí)候,經(jīng)過(guò)改動(dòng)除數(shù),讓股票的交易價(jià)格的均值沒有任何影響。做法是以新的股票交易價(jià)格的全部金額除以舊的股票交易價(jià)格的平均數(shù)值,因此得出新的除數(shù),然后再以運(yùn)算期的股票交易價(jià)格總金額去除以新的除數(shù),就可以得出修正的股票交易價(jià)格的平均數(shù)值。

2.5 股票價(jià)格的波動(dòng)情形

股票的價(jià)格指標(biāo)是本期股票的交易價(jià)格和某個(gè)前期之間相對(duì)比的相對(duì)數(shù)變化,是因?yàn)樽C券交易的場(chǎng)所或者是金融中介機(jī)構(gòu)經(jīng)過(guò)對(duì)股票交易場(chǎng)所里有一些具有象征性的企業(yè)所發(fā)出的股票交易價(jià)格,進(jìn)行平均運(yùn)算和發(fā)展變化情況相比后整理出一個(gè)可以提供了解股票出價(jià)、發(fā)價(jià)或者是價(jià)格的指示數(shù)字。整理過(guò)程包括五個(gè)方面:①挑選一些具有象征性的股票,當(dāng)作整理過(guò)程中指示數(shù)字的樣品股票。②按照規(guī)定的時(shí)間去股票交易場(chǎng)所上去收集樣品股票的交易價(jià)格,俗稱采樣。③選擇一個(gè)基礎(chǔ)期,基礎(chǔ)期的股價(jià)交易價(jià)格水準(zhǔn)是100或者是1000。④要運(yùn)用科學(xué)的方法以及高科技的手段運(yùn)算出股票的指數(shù)數(shù)值。⑤要對(duì)外公布。

3 股票交易價(jià)格的運(yùn)算

3.1 算術(shù)平均數(shù)

簡(jiǎn)易的算術(shù)平均數(shù)是在運(yùn)算出抽樣股票單個(gè)價(jià)格指數(shù)的基本上,加上總和算出平均值的一種運(yùn)算方式。現(xiàn)在運(yùn)用這個(gè)方法計(jì)算的有算術(shù)平均股價(jià)指數(shù)、英國(guó)的《金融時(shí)報(bào)》精算股價(jià)指數(shù)等。

3.2 綜合平均法

綜合平均法是各自把前期和本期的股票交易價(jià)格實(shí)行求和,之后把本期的股票交易價(jià)格和前期的股票交易價(jià)格的總金額相對(duì)比,從而得出股票交易價(jià)格指標(biāo)的一個(gè)運(yùn)算方式?,F(xiàn)在運(yùn)用這個(gè)辦法的有美國(guó)的紐約證券所整理的股票交易價(jià)格指標(biāo),等等。

3.3 幾何平均法

幾何平均法是各自把本期和前期的股票交易價(jià)格互相乘后開方,之后再用本期和前期的相比較從而得出指標(biāo)的一個(gè)運(yùn)算方法。

4 綜合加權(quán)法

(1)以樣品股票前期的成交量或者是銷售量為權(quán)數(shù)?,F(xiàn)在應(yīng)用這個(gè)方法運(yùn)算有上海綜合股票交易價(jià)格指數(shù)等。

(2)以樣品股票本期的成交量為權(quán)數(shù)?,F(xiàn)在應(yīng)用這個(gè)方法運(yùn)算的有我國(guó)滬深300指數(shù)等。

(3)以樣品本期銷售量為權(quán)數(shù)?,F(xiàn)在應(yīng)用這個(gè)方法運(yùn)算的有標(biāo)準(zhǔn)普爾股票交易價(jià)格指數(shù)、深圳綜合指數(shù)等。

(4)加權(quán)幾何平均法。在股票交易價(jià)格指標(biāo)的運(yùn)算當(dāng)中,大家為了能夠知道交易在本期與前期中區(qū)別,提議出了加權(quán)幾何平均法。現(xiàn)在使用這個(gè)方法運(yùn)算的僅有英國(guó)倫敦《金融日?qǐng)?bào)》工業(yè)普通的股票指數(shù)和美國(guó)價(jià)值線工業(yè)指數(shù)。

5 結(jié) 論

成功創(chuàng)立一種模型可以取得金融領(lǐng)域的頂尖榮譽(yù),表現(xiàn)出了金融與數(shù)學(xué)的統(tǒng)計(jì)是有著不可分割聯(lián)系。統(tǒng)計(jì)學(xué)和其他有關(guān)的學(xué)術(shù)在證券交易場(chǎng)所起著非常重要的作用,人們?cè)谝郧斑\(yùn)用簡(jiǎn)易的計(jì)算和算術(shù)方式已然無(wú)法去滿足逐漸困難的金融領(lǐng)域的進(jìn)展。近這幾年,許多學(xué)院也都創(chuàng)立了金融系和管理系;北方工業(yè)學(xué)院的統(tǒng)計(jì)學(xué)學(xué)科創(chuàng)立了許多證券期貨的模擬工作間;設(shè)立有關(guān)學(xué)科的就特別多了。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:大數(shù)據(jù)背景下統(tǒng)計(jì)學(xué)專業(yè)教學(xué)改革初探

摘要:大數(shù)據(jù)時(shí)代的到來(lái),給與之密切相關(guān)的統(tǒng)計(jì)學(xué)專業(yè)帶來(lái)了前所未有的機(jī)遇與挑戰(zhàn)。本文針對(duì)統(tǒng)計(jì)學(xué)專業(yè)的自身特點(diǎn),分析了專業(yè)中存在的問題,并從人才培養(yǎng)目標(biāo)的定位,課程的調(diào)整與設(shè)置,教學(xué)手段創(chuàng)新和完善教學(xué)評(píng)估體系等幾個(gè)方面提出了一些合理化的建議。

關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);教學(xué)改革

一、引言

最早提出“大數(shù)據(jù)”時(shí)代到來(lái)的是全球知名咨詢公司麥肯錫,現(xiàn)在的社會(huì)是一個(gè)高速發(fā)展的社會(huì),科技發(fā)達(dá),信息流通,人們之間的交流越來(lái)越密切,生活也越來(lái)越方便,大數(shù)據(jù)就是這個(gè)高科技時(shí)代的產(chǎn)物。大數(shù)據(jù)具有以下的鮮明特點(diǎn):第一個(gè)特征是數(shù)據(jù)量大。第二個(gè)特征是數(shù)據(jù)類型繁多,多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高的要求。第三個(gè)特征是數(shù)據(jù)價(jià)值密度相對(duì)較低,如何通過(guò)強(qiáng)大的機(jī)器算法更迅速地完成數(shù)據(jù)的價(jià)值“提純”,是大數(shù)據(jù)時(shí)代亟待解決的難題。第四個(gè)特征是處理速度快,時(shí)效性要求高,這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。

統(tǒng)計(jì)學(xué)專業(yè)是與數(shù)據(jù)分析處理聯(lián)系最為緊密的學(xué)科之一。大數(shù)據(jù)時(shí)代的到來(lái)不僅為統(tǒng)計(jì)學(xué)專業(yè)的發(fā)展帶來(lái)的前所未有的機(jī)遇,同時(shí)也帶來(lái)了巨大挑戰(zhàn)。傳統(tǒng)的統(tǒng)計(jì)學(xué)專業(yè)已不再適應(yīng)大數(shù)據(jù)時(shí)代的信息爆發(fā)式增長(zhǎng)的要求,這就要求我們應(yīng)該對(duì)統(tǒng)計(jì)學(xué)專業(yè)進(jìn)行重新定位,并在此基礎(chǔ)上調(diào)整相關(guān)課程,改革傳統(tǒng)的教學(xué)手段以及完善教學(xué)評(píng)價(jià)體系,以適應(yīng)大數(shù)據(jù)時(shí)代的到來(lái)。

二、統(tǒng)計(jì)學(xué)專業(yè)改革的建議

(一)人才培養(yǎng)目標(biāo)的重新定位

如果說(shuō)以往的統(tǒng)計(jì)學(xué)專業(yè)是以培養(yǎng)簡(jiǎn)單的“應(yīng)用型”人才為目標(biāo),那么隨著大數(shù)據(jù)時(shí)代的到來(lái),社會(huì)不僅僅需要會(huì)應(yīng)用基礎(chǔ)統(tǒng)計(jì)知識(shí)處理相關(guān)領(lǐng)域的問題的單一的應(yīng)用型人才,而是對(duì)人才提出了更高的要求:大數(shù)據(jù)時(shí)代下的統(tǒng)計(jì)學(xué)專業(yè)的人才除了應(yīng)該具備基礎(chǔ)的數(shù)據(jù)收集,處理和分析的能力之外,還應(yīng)該了解相關(guān)應(yīng)用領(lǐng)域的背景知識(shí),而且應(yīng)具備很強(qiáng)的自我學(xué)習(xí)能力,以適應(yīng)大數(shù)據(jù)時(shí)代數(shù)據(jù)量大,總類繁多,時(shí)效性高等發(fā)展特點(diǎn)。因此,統(tǒng)計(jì)學(xué)人才培養(yǎng)目標(biāo)應(yīng)該重新作出調(diào)整,應(yīng)該以培養(yǎng)全新的“復(fù)合型”統(tǒng)計(jì)人才為新的目標(biāo)。

(二)課程設(shè)置的調(diào)整

隨著人才培養(yǎng)目標(biāo)的重新定位,隨之而來(lái)的就是應(yīng)該對(duì)不再適應(yīng)時(shí)展要求的課程進(jìn)行必要的調(diào)整。

首先,大數(shù)據(jù)的分析和處理與以往的經(jīng)典分析方法有很大不同,以往的統(tǒng)計(jì)分析方法主要是建立在抽樣基礎(chǔ)之上,而大數(shù)據(jù)時(shí)代信息處理迅速,信息獲得途徑廣泛,而且信息價(jià)值密度低,這就要求數(shù)據(jù)處理時(shí),可以以全體作為樣本,而不是進(jìn)行抽樣;分析時(shí)必須考慮所有數(shù)據(jù)而不是剔除所謂的異常數(shù)據(jù)。因此,以往的經(jīng)典統(tǒng)計(jì)分析方法已不再適應(yīng)大數(shù)據(jù)的處理和分析,必須適當(dāng)?shù)恼{(diào)整經(jīng)典分析方法的課程設(shè)置,增加新的適用于大數(shù)據(jù)分析的課程。

其次,隨著數(shù)據(jù)量的爆發(fā)式增長(zhǎng),所有的統(tǒng)計(jì)工作對(duì)計(jì)算機(jī)的依賴程度越來(lái)越高,這就要求統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生不僅掌握統(tǒng)計(jì)學(xué)專業(yè)的基礎(chǔ)知識(shí),同時(shí)應(yīng)該熟練掌握計(jì)算機(jī)專業(yè)知識(shí)相關(guān)知識(shí),因此,在課程安排時(shí),應(yīng)注意計(jì)算機(jī)相關(guān)課程的適當(dāng)增加。

基于上述原因,可以考慮增加如下課程:機(jī)器學(xué)習(xí),模擬算法,數(shù)據(jù)挖掘,R語(yǔ)言軟件分析等課程,同時(shí)適當(dāng)降低傳統(tǒng)分析方法課程的學(xué)時(shí)比重。此外,為了使學(xué)生能夠?qū)ο嚓P(guān)應(yīng)用領(lǐng)域的背景知識(shí)有所了解,可適當(dāng)增設(shè)與應(yīng)用領(lǐng)域相關(guān)的通識(shí)課程。

(三)教學(xué)模式與手段的創(chuàng)新

以往的教學(xué)模式,通常是以課堂教學(xué),掌握書本經(jīng)典理論為主。雖然,傳統(tǒng)教學(xué)手段有著學(xué)生理論基礎(chǔ)扎實(shí)等諸多優(yōu)點(diǎn),但是同時(shí)也存才學(xué)生過(guò)于偏重理論知識(shí)的掌握,動(dòng)手能力不足,理論與實(shí)踐脫節(jié)等缺點(diǎn)。隨著社會(huì)的發(fā)展,尤其統(tǒng)計(jì)學(xué)專業(yè)自身具有鮮明的應(yīng)用專業(yè)特點(diǎn)。只采用傳統(tǒng)的教學(xué)模式和手段顯然不再適合大數(shù)據(jù)時(shí)代的需要;同時(shí),隨著大數(shù)據(jù)時(shí)代的到來(lái),多媒體手段日益豐富多彩,為傳統(tǒng)教學(xué)的創(chuàng)新提供了必要的支持。因此,為了適應(yīng)大數(shù)據(jù)時(shí)代人才的要求,必須改革傳統(tǒng)的教學(xué)手段和模式,在傳統(tǒng)教學(xué)基礎(chǔ)上,加大實(shí)驗(yàn)教學(xué)的比重,在傳統(tǒng)教學(xué)外,增加社會(huì)實(shí)踐環(huán)節(jié),引入微課慕課,翻轉(zhuǎn)課堂等全新教學(xué)模式,以提高學(xué)生的學(xué)習(xí)興趣,鍛煉學(xué)生理論應(yīng)用于實(shí)踐的能力,從而為以后使用大數(shù)據(jù)時(shí)代的工作打下堅(jiān)實(shí)的基礎(chǔ)。

(四)教學(xué)評(píng)價(jià)體系的完善

傳統(tǒng)的教學(xué)評(píng)價(jià)體系,通常是采用書面考核的方式對(duì)學(xué)生的學(xué)習(xí)進(jìn)行評(píng)價(jià),隨著時(shí)代的發(fā)著,單純的筆試評(píng)價(jià)不足以衡量學(xué)生的全面能力,最后導(dǎo)致出現(xiàn)高分低能的情況的出現(xiàn)。

為了適應(yīng)大數(shù)據(jù)時(shí)代對(duì)人才多方面能力的需求,必須對(duì)傳統(tǒng)的考核評(píng)價(jià)體系做出適當(dāng)?shù)恼{(diào)整,以評(píng)價(jià)學(xué)生的多方面能力,尤其是動(dòng)手能力,學(xué)習(xí)能力和應(yīng)用相關(guān)理論處理實(shí)際問題的能力。具體可以采用多種考核方法相結(jié)合的方式。如:增加平時(shí)的考核力度,增加實(shí)踐項(xiàng)目的考核,通過(guò)布置適當(dāng)?shù)捻?xiàng)目論文,采用答辯的形式,以鍛煉學(xué)生適應(yīng)以后工作,獨(dú)立分析解決問題的能力。

此外,傳統(tǒng)教學(xué)評(píng)價(jià)體系通常是單方面的,只有對(duì)學(xué)生成績(jī)的評(píng)價(jià),為了適應(yīng)大數(shù)據(jù)時(shí)代的到來(lái),全面提高教學(xué)質(zhì)量,可采取雙向教學(xué)評(píng)價(jià)體系,如:增加學(xué)生對(duì)教學(xué)環(huán)節(jié)的評(píng)價(jià)體系。以及教師間同行間的評(píng)價(jià)體系等。

三、啟示

通過(guò)以上分析表明,為適應(yīng)大數(shù)據(jù)時(shí)代數(shù)據(jù)分析處理的要求,對(duì)統(tǒng)計(jì)學(xué)專業(yè)必然要進(jìn)行必要的全面的改革,如:需要重新對(duì)專業(yè)驚醒合理的定位,重新制定人才培養(yǎng)目標(biāo),調(diào)整專業(yè)課程設(shè)置,改革傳統(tǒng)的教學(xué)模式和手段等等。但是,統(tǒng)計(jì)學(xué)專業(yè)改革是循序漸進(jìn)的過(guò)程,不可能一蹴而就,不是一朝一夕就能實(shí)現(xiàn)的,因此,必須制定長(zhǎng)期改革方案,以及有效的檢驗(yàn)機(jī)制,避免在改革項(xiàng)目太多而適得其反。可以采用先試點(diǎn),再推廣的方式,或者先局部進(jìn)行改革試驗(yàn),再進(jìn)行多方面的改革。例如可以先重新制定合理的人才培養(yǎng)方案,只進(jìn)行適當(dāng)?shù)恼n程調(diào)整。穩(wěn)定后,在進(jìn)行考核方式,評(píng)價(jià)體系等其他方面的改革。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)專業(yè)教學(xué)體系的改革

摘要:大數(shù)據(jù)時(shí)代的到來(lái)對(duì)統(tǒng)計(jì)學(xué)提出了新的要求。本文從統(tǒng)計(jì)學(xué)專業(yè)發(fā)展的新特點(diǎn)出發(fā),剖析了現(xiàn)有教學(xué)體系中存在的問題,提出了明確專業(yè)培養(yǎng)目標(biāo),重新設(shè)計(jì)主干課程內(nèi)容;轉(zhuǎn)變固有思維方式,推進(jìn)統(tǒng)計(jì)學(xué)教學(xué)改革;創(chuàng)新實(shí)踐教學(xué)模式,加強(qiáng)實(shí)踐教學(xué)開展等統(tǒng)計(jì)學(xué)專業(yè)教學(xué)體系改革的發(fā)展方向。

關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);教學(xué)體系改革

一、大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)專業(yè)發(fā)展的新特點(diǎn)

(一)數(shù)據(jù)化的信息收集

傳統(tǒng)的統(tǒng)計(jì)研究主要是對(duì)已收集的數(shù)據(jù)進(jìn)行各種技術(shù)分析,包括描述性分析、推斷性分析、截面分析、時(shí)間序列分析等,側(cè)重點(diǎn)在于技術(shù)分析手段的使用上。然而大數(shù)據(jù)時(shí)代,關(guān)注的是信息本身。現(xiàn)代信息系統(tǒng)的使用使大數(shù)據(jù)成為可能,文字、地理方位、溝通等,任何事物都可以量化,一切現(xiàn)象都可以用數(shù)據(jù)或表格來(lái)詮釋。因此,大數(shù)據(jù)背景下世界是由各種信息和數(shù)據(jù)所構(gòu)成的。

(二)全數(shù)據(jù)模式的研究對(duì)象

在信息處理能力受限制的過(guò)去,人們?nèi)鄙儆脕?lái)分析所收集數(shù)據(jù)的工具,因此產(chǎn)生了隨機(jī)抽樣。隨機(jī)抽樣法的目的是用最少的數(shù)據(jù)獲得最多的關(guān)于總體的信息,從而使用樣本對(duì)總體進(jìn)行推斷。然而,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)處理的方式和技術(shù)發(fā)生了巨大的改變,人們可以通過(guò)互聯(lián)網(wǎng)、數(shù)據(jù)庫(kù)以及各種通訊工具獲得海量數(shù)據(jù),這時(shí)隨機(jī)抽樣就失去了它原來(lái)的意義。簡(jiǎn)單廉價(jià)的數(shù)據(jù)收集方法,足夠的數(shù)據(jù)處理和存儲(chǔ)能力,使得全數(shù)據(jù)模式成為可能。因此,大數(shù)據(jù)背景下樣本即為總體。放棄隨機(jī)抽樣分析的捷徑,采用所有數(shù)據(jù)的方法,可以發(fā)現(xiàn)一些隱藏在海量數(shù)據(jù)下的細(xì)節(jié)。

(三)混雜性的數(shù)據(jù)處理思維

傳統(tǒng)的統(tǒng)計(jì)學(xué)處理數(shù)據(jù)的步驟是首先對(duì)數(shù)據(jù)進(jìn)行整理和清洗,剔除不完整的或者異常值,然后再利用樣本信息,在允許的誤差范圍內(nèi)對(duì)總體進(jìn)行推斷和分析,即通過(guò)調(diào)整精確度的大小來(lái)對(duì)總體進(jìn)行研究和分析。然而,在大數(shù)據(jù)背景下,來(lái)自各個(gè)時(shí)間和空間的數(shù)據(jù)來(lái)源紛雜,格式廣泛,在萃取或處理數(shù)據(jù)的時(shí)候,很難做到把所有的數(shù)據(jù)都進(jìn)行仔細(xì)地清洗。這種情況下,必須接受數(shù)據(jù)的混亂和不確定性,因?yàn)閿?shù)據(jù)多比少好,因此更多的數(shù)據(jù)信息比更加智能、更加精確的算法系統(tǒng)還重要。當(dāng)擁有大量數(shù)據(jù)的時(shí)候,可以忽略一部分精確性,但并不是說(shuō)不需要精確性,而是數(shù)據(jù)規(guī)模不斷擴(kuò)大時(shí),確切的數(shù)量已經(jīng)不再那么重要了,可以通過(guò)大規(guī)模的數(shù)據(jù)來(lái)發(fā)現(xiàn)事物背后的規(guī)律。

(四)相關(guān)關(guān)系的基礎(chǔ)分析方法

傳統(tǒng)的統(tǒng)計(jì)中,大部分相關(guān)關(guān)系分析僅限于尋求線性關(guān)系,或是在建立假設(shè)的基礎(chǔ)上揭示數(shù)據(jù)相互之間的因果關(guān)系,例如Granger檢驗(yàn)就是依據(jù)時(shí)間序列數(shù)據(jù)對(duì)變量之間的因果關(guān)系進(jìn)行的判斷,但往往會(huì)產(chǎn)生一些虛假的因果關(guān)系。這是因?yàn)榻y(tǒng)計(jì)關(guān)系并沒有蘊(yùn)含多少真實(shí)的因果關(guān)系。在大數(shù)據(jù)背景下,數(shù)據(jù)點(diǎn)以數(shù)量級(jí)方式增長(zhǎng),用數(shù)據(jù)驅(qū)動(dòng)的相關(guān)關(guān)系分析不再需要建立在假設(shè)的基礎(chǔ)上,所以相關(guān)關(guān)系分析不容易受偏見的影響而發(fā)生錯(cuò)誤。大數(shù)據(jù)時(shí)代相關(guān)關(guān)系通過(guò)回答“是什么”的問題,為人們認(rèn)識(shí)世界提供了一種新的視角。因此,相關(guān)關(guān)系統(tǒng)計(jì)分析是大數(shù)據(jù)預(yù)測(cè)的基礎(chǔ)。

二、統(tǒng)計(jì)學(xué)專業(yè)教學(xué)體系中存在的問題

大數(shù)據(jù)背景下傳統(tǒng)的統(tǒng)計(jì)學(xué)專業(yè)教學(xué)體系存在的問題凸顯,具體體現(xiàn)在以下幾個(gè)方面。

(一)培養(yǎng)目標(biāo)無(wú)法適應(yīng)大數(shù)據(jù)時(shí)代的社會(huì)需求

傳統(tǒng)的統(tǒng)計(jì)學(xué)專業(yè)教學(xué)體系的培養(yǎng)目標(biāo)是通過(guò)統(tǒng)計(jì)專業(yè)核心課程內(nèi)容的介紹,鍛煉學(xué)生收集、整理和分析數(shù)據(jù)的能力,培養(yǎng)“應(yīng)用型”統(tǒng)計(jì)專業(yè)人才。然而,大數(shù)據(jù)的出現(xiàn),使得通過(guò)數(shù)據(jù)分析獲得知識(shí)、商機(jī)和社會(huì)服務(wù)的能力,從以往局限于少數(shù)的學(xué)術(shù)精英圈子擴(kuò)大到了普通的社會(huì)機(jī)構(gòu)、企業(yè)和政府部門,各行各業(yè)對(duì)統(tǒng)計(jì)數(shù)據(jù)、統(tǒng)計(jì)分析的需要使得統(tǒng)計(jì)學(xué)專業(yè)受到了前所未有的關(guān)注。大數(shù)據(jù)背景下,要求統(tǒng)計(jì)學(xué)作為一種分析工具,能夠與其他專業(yè)相互銜接,相互服務(wù),培養(yǎng)“復(fù)合型”專業(yè)人才。因此,傳統(tǒng)的統(tǒng)計(jì)學(xué)專業(yè)教學(xué)體系培養(yǎng)目標(biāo)存在兩個(gè)方面的挑戰(zhàn):第一,如何協(xié)調(diào)統(tǒng)計(jì)與其他專業(yè)之間的關(guān)系;第二,如何從“應(yīng)用型”向“復(fù)合型”人才進(jìn)行轉(zhuǎn)變。

(二)忽視數(shù)據(jù)的收集和創(chuàng)新

傳統(tǒng)的統(tǒng)計(jì)學(xué)專業(yè)教學(xué)體系重視數(shù)據(jù)的分析技術(shù),更多的課程設(shè)置是圍繞著數(shù)據(jù)分析方法和技術(shù)展開的,例如多元統(tǒng)計(jì)分析、時(shí)間序列分析、統(tǒng)計(jì)預(yù)測(cè)與決策分析等?;A(chǔ)的數(shù)據(jù)收集部分只在統(tǒng)計(jì)學(xué)原理中有一章的內(nèi)容介紹,而且是作為非重點(diǎn)一帶而過(guò)的。大數(shù)據(jù)以海量的數(shù)據(jù)為分析研究的對(duì)象,將一切社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行量化,重視的是信息的收集和數(shù)據(jù)的創(chuàng)新,包括數(shù)據(jù)的再利用,數(shù)據(jù)的重組,數(shù)據(jù)的擴(kuò)展,數(shù)據(jù)的折舊以及數(shù)據(jù)的開放等各個(gè)方面。這些內(nèi)容在原有的教學(xué)體系中是沒有體現(xiàn)的。

(三)與大數(shù)據(jù)時(shí)代脫節(jié)的教學(xué)內(nèi)容

傳統(tǒng)的統(tǒng)計(jì)學(xué)專業(yè)教學(xué)體系仍然固守著原有的教學(xué)內(nèi)容,在近二十年內(nèi)變化不大。專業(yè)的主干課程有統(tǒng)計(jì)學(xué)原理、國(guó)民經(jīng)濟(jì)核算、計(jì)量經(jīng)濟(jì)學(xué)、抽樣技術(shù)與方法等。而在大數(shù)據(jù)背景下,教學(xué)內(nèi)容以全數(shù)據(jù)模式為研究對(duì)象,強(qiáng)調(diào)對(duì)所有的數(shù)據(jù)進(jìn)行分析,而不是開展隨機(jī)抽樣;允許不精確的存在,而不是在給定的精確程度下對(duì)總體進(jìn)行推斷和分析;關(guān)注海量數(shù)據(jù)之間的相關(guān)關(guān)系,而不是強(qiáng)調(diào)數(shù)據(jù)之間的因果聯(lián)系。這些內(nèi)容都無(wú)法在現(xiàn)有的教學(xué)體系中體現(xiàn),因此,傳統(tǒng)的專業(yè)教學(xué)體系與大數(shù)據(jù)時(shí)代是脫節(jié)的。

(四)實(shí)踐教學(xué)環(huán)節(jié)薄弱

隨著“應(yīng)用型”統(tǒng)計(jì)專業(yè)人才培養(yǎng)目標(biāo)的提出,學(xué)校對(duì)實(shí)踐教學(xué)的重視增強(qiáng),與過(guò)去相比,現(xiàn)有的專業(yè)教學(xué)體系中已經(jīng)增加了實(shí)踐教學(xué)環(huán)節(jié)。但是,在大數(shù)據(jù)背景下,實(shí)踐教學(xué)仍然是統(tǒng)計(jì)學(xué)專業(yè)教學(xué)體系中的薄弱環(huán)節(jié)。主要表現(xiàn)在兩個(gè)方面:(1)以模型驅(qū)動(dòng)為主的實(shí)踐教學(xué)模式已不適應(yīng)大數(shù)據(jù)時(shí)代的要求。現(xiàn)有的實(shí)踐教學(xué)內(nèi)容并不是從數(shù)據(jù)出發(fā),而是通過(guò)尋求一些適合模型的數(shù)據(jù)來(lái)“證明”這個(gè)模型的確有意義。這種思維方式與大數(shù)據(jù)時(shí)代的要求是不適應(yīng)的,因?yàn)閯?chuàng)造模型的目的是適應(yīng)現(xiàn)實(shí)數(shù)據(jù),而不是由模型驅(qū)動(dòng)。(2)以SPSS、Eviews為主的軟件教學(xué)已無(wú)法處理大數(shù)據(jù)?,F(xiàn)有的實(shí)踐教學(xué)中,主要講授的是傳統(tǒng)的統(tǒng)計(jì)分析軟件SPSS和Eviews,因?yàn)檫@兩種軟件發(fā)展成熟,操作簡(jiǎn)單,可以處理一般的計(jì)量模型和時(shí)間序列。但是,大數(shù)據(jù)時(shí)代數(shù)據(jù)是海量的、復(fù)雜的,用簡(jiǎn)單的軟件已無(wú)法處理和實(shí)施。

三、統(tǒng)計(jì)學(xué)專業(yè)教學(xué)體系改革的方向

根據(jù)以上分析,時(shí)代的發(fā)展對(duì)統(tǒng)計(jì)學(xué)專業(yè)提出了更高的要求,現(xiàn)有的教學(xué)體系中存在的各種問題即為統(tǒng)計(jì)學(xué)專業(yè)教學(xué)體系改革的方向。

(一)準(zhǔn)確定位統(tǒng)計(jì)學(xué)專業(yè)的人才培養(yǎng)目標(biāo),重新設(shè)計(jì)主干課程的教學(xué)內(nèi)容

大數(shù)據(jù)時(shí)代要求培養(yǎng)“復(fù)合型”統(tǒng)計(jì)專業(yè)人才,因此教學(xué)體系的培養(yǎng)目標(biāo)要從簡(jiǎn)單的“應(yīng)用型”向“復(fù)合型”轉(zhuǎn)變?!皬?fù)合型”統(tǒng)計(jì)專業(yè)人才要求學(xué)生除了具備數(shù)據(jù)收集、處理和分析的能力外,還要對(duì)統(tǒng)計(jì)學(xué)應(yīng)用領(lǐng)域的背景知識(shí)有一定的了解。因此,按這個(gè)培養(yǎng)目標(biāo),需要對(duì)現(xiàn)有教學(xué)體系中的主干課程重新進(jìn)行調(diào)整和設(shè)計(jì)。專業(yè)主干課程分為方法和應(yīng)用兩個(gè)方面。方法類的課程除了原有的計(jì)量經(jīng)濟(jì)學(xué)、時(shí)間序列分析、多元統(tǒng)計(jì)分析等外,又增加了機(jī)器學(xué)習(xí)、模擬算法、數(shù)據(jù)挖掘、R軟件分析(或SAS軟件分析)等處理復(fù)雜大數(shù)據(jù)的方法的課程。應(yīng)用類課程在保留原有的國(guó)民經(jīng)濟(jì)核算,金融統(tǒng)計(jì),證券投資,會(huì)計(jì)學(xué)基礎(chǔ)外,增加一些統(tǒng)計(jì)學(xué)應(yīng)用領(lǐng)域的基礎(chǔ)知識(shí)課程,例如商業(yè)統(tǒng)計(jì)、生物統(tǒng)計(jì)、保險(xiǎn)與精算統(tǒng)計(jì)等。此外,適當(dāng)調(diào)整各專業(yè)主干課程的課時(shí),一些課程可以增加課時(shí),如軟件分析、數(shù)據(jù)挖掘等,一些課程可以縮減課時(shí),僅作一些簡(jiǎn)單的介紹,如抽樣技術(shù)等。

(二)轉(zhuǎn)變固有的思維方式,在大數(shù)據(jù)背景下積極推進(jìn)教學(xué)改革

大數(shù)據(jù)時(shí)代,數(shù)據(jù)更多、更雜,傳統(tǒng)統(tǒng)計(jì)學(xué)思維方式受到了極大的挑戰(zhàn)。因此,以大數(shù)據(jù)為背景,轉(zhuǎn)變固有的思維方式,從以統(tǒng)計(jì)技術(shù)方法為中心轉(zhuǎn)換到以信息數(shù)據(jù)為中心,推進(jìn)統(tǒng)計(jì)學(xué)專業(yè)教學(xué)改革十分重要。具體來(lái)說(shuō),可以弱化傳統(tǒng)的推理論證的教學(xué)模式,強(qiáng)化數(shù)據(jù)收集、數(shù)據(jù)處理和數(shù)據(jù)分析的能力培養(yǎng);強(qiáng)調(diào)數(shù)據(jù)本身的價(jià)值,讓數(shù)據(jù)說(shuō)話,用簡(jiǎn)單的方法了解數(shù)據(jù)背后所隱藏的信息和規(guī)律;使用項(xiàng)目式訓(xùn)練,讓學(xué)生從項(xiàng)目中真正體驗(yàn)數(shù)據(jù)化處理的整個(gè)過(guò)程,達(dá)到理論和方法的結(jié)合;加強(qiáng)課堂教學(xué)與實(shí)驗(yàn)教學(xué)的統(tǒng)一和貫通,如在傳統(tǒng)的教學(xué)過(guò)程中,將統(tǒng)計(jì)學(xué)原理、多元統(tǒng)計(jì)分析結(jié)合SPSS軟件介紹,而時(shí)間序列分析又采用Eviews進(jìn)行介紹,造成學(xué)生疲于學(xué)習(xí)各種軟件,實(shí)際上SAS、R等統(tǒng)計(jì)軟件可以實(shí)現(xiàn)所有的功能,用一種軟件與課堂教學(xué)融合貫通能幫助學(xué)生更好更深地掌握軟件的使用。

(三)創(chuàng)新實(shí)踐教學(xué)模式,加強(qiáng)實(shí)踐教學(xué)的開展

從以模型驅(qū)動(dòng)的實(shí)踐教學(xué)模式轉(zhuǎn)變?yōu)橐詳?shù)據(jù)驅(qū)動(dòng)的教學(xué)模式,構(gòu)造課堂案例教學(xué)、實(shí)驗(yàn)教學(xué)、課后項(xiàng)目式訓(xùn)練、校外實(shí)習(xí)基地鍛煉四位一體的創(chuàng)新型實(shí)踐教學(xué)模式。計(jì)算機(jī)快速發(fā)展的今天使得大數(shù)據(jù)成為現(xiàn)實(shí),在處理數(shù)據(jù)的時(shí)候,根據(jù)數(shù)據(jù)的特征創(chuàng)造出新的計(jì)算方法來(lái)滿足實(shí)際需要,這就是數(shù)據(jù)驅(qū)動(dòng)模式。在實(shí)踐教學(xué)的過(guò)程中,要強(qiáng)調(diào)統(tǒng)計(jì)數(shù)據(jù)、計(jì)算機(jī)編程以及統(tǒng)計(jì)分析軟件的結(jié)合。目前,R軟件和SAS軟件顯示出了強(qiáng)大的數(shù)據(jù)處理和數(shù)據(jù)分析功能,實(shí)踐教學(xué)環(huán)節(jié)中可以把這兩種中的一種融入到專業(yè)課程中去,將計(jì)算機(jī)軟件與課堂教學(xué)結(jié)合起來(lái)。此外,課后的項(xiàng)目式訓(xùn)練和校外實(shí)習(xí)可以帶動(dòng)學(xué)生了解和掌握整個(gè)數(shù)據(jù)分析實(shí)踐的流程,激發(fā)學(xué)生學(xué)習(xí)的興趣,在實(shí)踐教學(xué)的過(guò)程中要多鼓勵(lì)、多開展。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)

摘 要:大數(shù)據(jù)對(duì)于統(tǒng)計(jì)學(xué)的影響日趨加深,促使負(fù)擔(dān)著培育數(shù)據(jù)采集的統(tǒng)計(jì)學(xué)教育也面臨著嚴(yán)峻的挑戰(zhàn),為了和新的外部趨勢(shì)相適應(yīng),統(tǒng)計(jì)教育應(yīng)該主動(dòng)進(jìn)行改革。然而,對(duì)于大數(shù)據(jù)會(huì)給統(tǒng)計(jì)學(xué)帶來(lái)什么挑戰(zhàn),統(tǒng)計(jì)學(xué)在新形勢(shì)下怎樣變革,卻很少有人給予關(guān)注,文章從大數(shù)據(jù)和統(tǒng)計(jì)學(xué)的聯(lián)系和差異、大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)和新形勢(shì)下統(tǒng)計(jì)學(xué)的改革三個(gè)方面來(lái)討論這一問題。

關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);新形勢(shì)

大數(shù)據(jù)是互聯(lián)網(wǎng)時(shí)代的新型產(chǎn)物,這一理念是在一九八零年由美國(guó)的未來(lái)學(xué)家埃爾夫托夫勒提出的。到了二十一世紀(jì),隨著互聯(lián)網(wǎng)技術(shù)的普及和運(yùn)用,全世界的數(shù)據(jù)量大概每2年翻一倍,這說(shuō)明人類在最近兩年產(chǎn)生的數(shù)據(jù)量等同于以往產(chǎn)生數(shù)據(jù)量的總和。大數(shù)據(jù)雖然在我國(guó)發(fā)展較晚,但是從起步之后就一直蓬勃發(fā)展,尤其是最近幾年,新的大數(shù)據(jù)采集、發(fā)掘、儲(chǔ)存、探析類企業(yè)和組織逐漸建成,大數(shù)據(jù)在我國(guó)各行各業(yè)的使用日趨廣泛,遍及信息、金融、商品銷售等行業(yè)。

一、大數(shù)據(jù)和統(tǒng)計(jì)學(xué)之間的聯(lián)系和差異

統(tǒng)計(jì)教育是以統(tǒng)計(jì)學(xué)理論和統(tǒng)計(jì)學(xué)在相應(yīng)領(lǐng)域的使用為主的教育內(nèi)容,所以想要分析大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)教育所面對(duì)的挑戰(zhàn)和改革,首先應(yīng)該搞清大數(shù)據(jù)和統(tǒng)計(jì)學(xué)二者的概念,明白兩者之間的聯(lián)系和差異。

大數(shù)據(jù)和統(tǒng)計(jì)學(xué)之間是有密切聯(lián)系的。首先,大數(shù)據(jù)雖然是通過(guò)巨型數(shù)據(jù)采集構(gòu)成,構(gòu)成主要涵蓋非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),和通常結(jié)構(gòu)化數(shù)據(jù)不一樣,但是它的根本依然沒有離開數(shù)據(jù)的屬性,統(tǒng)計(jì)學(xué)依然可以把大數(shù)據(jù)看做探究的主要方面。第二,大數(shù)據(jù)對(duì)于數(shù)據(jù)的通常處理過(guò)程是:搜集―統(tǒng)計(jì)解析―發(fā)掘―找到需要的信息,而統(tǒng)計(jì)活動(dòng)的主要順序則是:統(tǒng)計(jì)設(shè)計(jì)―數(shù)據(jù)采集―數(shù)據(jù)整理―數(shù)據(jù)解析―發(fā)現(xiàn)數(shù)量聯(lián)系和規(guī)律,二者對(duì)于數(shù)據(jù)的處理方式在某些方面雖然有部分差異,但是基本過(guò)程也有很多相似的地方。第三,一方面統(tǒng)計(jì)學(xué)為大數(shù)據(jù)的研究提供基本方式,比如大量的觀察、數(shù)據(jù)分組、相關(guān)解析等也是分析大數(shù)據(jù)的主要方式,另一方面因?yàn)樵诖髷?shù)據(jù)探究和處理過(guò)程中應(yīng)該借助新的信息技術(shù),所以大數(shù)據(jù)的發(fā)展在很大范圍里提升了統(tǒng)計(jì)學(xué)探究設(shè)施和方式,使現(xiàn)代信息設(shè)備和互聯(lián)網(wǎng)技術(shù)在統(tǒng)計(jì)學(xué)的使用更加廣泛。

大數(shù)據(jù)和統(tǒng)計(jì)學(xué)的主要差別體現(xiàn)在探究目標(biāo)、數(shù)據(jù)處理對(duì)象和解析技藝上。大數(shù)據(jù)通過(guò)發(fā)現(xiàn)數(shù)據(jù)機(jī)遇和數(shù)據(jù)價(jià)值,尋求數(shù)據(jù)回報(bào)為最終目標(biāo),數(shù)據(jù)所觸及的范圍比較寬泛,運(yùn)用遍布互聯(lián)網(wǎng)、經(jīng)濟(jì)分析、財(cái)產(chǎn)管理、商業(yè)投資和醫(yī)療器械等方面,處理的數(shù)據(jù)主要是海量、全面性的非架構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。然而統(tǒng)計(jì)學(xué)以發(fā)現(xiàn)數(shù)據(jù)后映射物體的自身關(guān)聯(lián)和規(guī)律為目的,處理的數(shù)據(jù)主要為數(shù)量不大的結(jié)構(gòu)化數(shù)據(jù),使用概率論、非全面調(diào)查、抽樣推斷和相應(yīng)回歸解析等數(shù)理統(tǒng)計(jì)理論為探究方式。所以,相對(duì)于統(tǒng)計(jì)學(xué),大數(shù)據(jù)不但在技術(shù)和工具的運(yùn)用里更為全面和智能,和互聯(lián)網(wǎng)技術(shù)的聯(lián)結(jié)的也變的十分緊密,而且在所處理的數(shù)據(jù)種類和探究目標(biāo)上都和統(tǒng)計(jì)學(xué)有所區(qū)別。

二、大數(shù)據(jù)時(shí)代給統(tǒng)計(jì)學(xué)帶來(lái)的挑戰(zhàn)

大數(shù)據(jù)和統(tǒng)計(jì)學(xué)雖然密切相關(guān),但是兩者在探究目標(biāo)、數(shù)據(jù)處理和解析設(shè)備方面卻有著很大的不同,人類步入信息時(shí)代之后,隨著非結(jié)構(gòu)化、半結(jié)構(gòu)化的大數(shù)據(jù)的比例急速上漲,互聯(lián)網(wǎng)技術(shù)在數(shù)據(jù)采集和處理中的運(yùn)用日漸寬泛,大家對(duì)數(shù)據(jù)價(jià)值和數(shù)據(jù)回報(bào)的追求更加猛烈。怎樣汲取大數(shù)據(jù)探究里的價(jià)值理論,使受教育者把握良好、先進(jìn)、適用的數(shù)據(jù)搜集、解析和處理的技術(shù)。在大數(shù)據(jù)時(shí)代統(tǒng)計(jì)教育將會(huì)面對(duì)的挑戰(zhàn)主要表現(xiàn)為以下幾點(diǎn)。

(一)對(duì)教育內(nèi)容的挑戰(zhàn)

當(dāng)下統(tǒng)計(jì)學(xué)專業(yè)教育內(nèi)容主要是概率論和數(shù)理統(tǒng)計(jì)、抽樣抽查、統(tǒng)計(jì)形式和有關(guān)的統(tǒng)計(jì)運(yùn)用學(xué)科,基本以結(jié)構(gòu)化數(shù)據(jù)為主要的處理對(duì)象,而對(duì)非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的解析和設(shè)備的運(yùn)用則觸及很少。然而,依據(jù)大數(shù)據(jù)時(shí)代對(duì)數(shù)據(jù)處理高端人士素養(yǎng)和技術(shù)的需求,目前統(tǒng)計(jì)學(xué)的內(nèi)容已經(jīng)不可以滿足非結(jié)構(gòu)和半結(jié)構(gòu)的海量數(shù)據(jù)探究和商業(yè)運(yùn)用對(duì)人才培育的需求。所以,統(tǒng)計(jì)學(xué)的教育應(yīng)該看清形勢(shì),以對(duì)統(tǒng)計(jì)專業(yè)人士的現(xiàn)實(shí)需要為核心,不停地提升原來(lái)的科目?jī)?nèi)容,開設(shè)新的課程,才可以確保教育內(nèi)容跟上大數(shù)據(jù)時(shí)代前行的步伐。

(二)對(duì)教育方法的挑戰(zhàn)

目前統(tǒng)計(jì)學(xué)教育模式以課堂教育為中心,主要以老師講解為主,注重理論,忽略應(yīng)用,注重方式講解,忽略技能培育,并且教育方式單調(diào),教育方法陳舊,教育組織的合作觀念較弱。所以現(xiàn)在的統(tǒng)計(jì)學(xué)教育方法已經(jīng)不適合大數(shù)據(jù)時(shí)代對(duì)全面性數(shù)據(jù)處理和分析人才的素養(yǎng)需求,應(yīng)該在教學(xué)方法上展開調(diào)適和改革。

(三)對(duì)人才培育方式的挑戰(zhàn)

目前統(tǒng)計(jì)學(xué)教育方式以給予學(xué)生知識(shí),培育政府、企業(yè)、事業(yè)單位需求的統(tǒng)計(jì)任務(wù)人才和學(xué)校、科研組織需求的統(tǒng)計(jì)教育和研究人員為主要內(nèi)容和目的,另外大多高校老師綜合素養(yǎng)不夠,本專業(yè)之外的知之甚少,實(shí)驗(yàn)室的建成和設(shè)施的更新速度落后,形成培育出的學(xué)生偏重于公式推導(dǎo)、運(yùn)算和數(shù)學(xué)模型解析,知識(shí)構(gòu)架以數(shù)理認(rèn)知為主,在經(jīng)濟(jì)學(xué)、管理學(xué)、計(jì)算機(jī)學(xué)等領(lǐng)域的認(rèn)知較少,知識(shí)探究和觀察的目光短淺,解決現(xiàn)實(shí)困難的能力不足。大數(shù)據(jù)時(shí)代雖然需要統(tǒng)計(jì)人才擁有數(shù)據(jù)處理和解析所需求的基礎(chǔ)素養(yǎng)和技術(shù),但是更加側(cè)重它從海量的數(shù)據(jù)里掌控市場(chǎng)機(jī)遇,發(fā)現(xiàn)和發(fā)掘商業(yè)價(jià)值,為所處行業(yè)制造利益的內(nèi)在潛力、奮發(fā)精神和探究欲望。

三、新形勢(shì)下統(tǒng)計(jì)學(xué)的改革

信息時(shí)代對(duì)于統(tǒng)計(jì)人員的素質(zhì)提出了更高的需求,統(tǒng)計(jì)學(xué)的教育方式也需要進(jìn)行部分改革。

首先,統(tǒng)計(jì)人員應(yīng)該提升對(duì)于新技術(shù)的敏感性。因?yàn)樾畔⒓夹g(shù)的不斷發(fā)展、不斷更新,這就需要統(tǒng)計(jì)人員具備職業(yè)敏感性,及時(shí)學(xué)習(xí)和理解新技能,能在大數(shù)據(jù)的環(huán)境下熟練運(yùn)用專業(yè)技能。其次,統(tǒng)計(jì)人員應(yīng)該提升團(tuán)隊(duì)合作意識(shí)。作為統(tǒng)計(jì)人員不僅要做好本職工作,還要及時(shí)了解團(tuán)隊(duì)內(nèi)部各成員的工作進(jìn)展?fàn)顩r,相互學(xué)習(xí)、互相共享信息資源。最后,統(tǒng)計(jì)人員應(yīng)該具備自主創(chuàng)新能力。信息化社會(huì)的知識(shí)更新十分迅速,統(tǒng)計(jì)人員唯有不斷學(xué)習(xí)、不斷革新,才能夠適應(yīng)大數(shù)據(jù)時(shí)代的需求。

結(jié)語(yǔ)

大數(shù)據(jù)和統(tǒng)計(jì)學(xué)兩者在本質(zhì)、探究目標(biāo)、數(shù)據(jù)處理對(duì)象和技能工具等部分,有聯(lián)系也有差異。大數(shù)據(jù)時(shí)代的到來(lái)不但對(duì)統(tǒng)計(jì)學(xué)的固定探究方式和價(jià)值觀念帶來(lái)一定的沖擊,并且致使統(tǒng)計(jì)學(xué)教育面對(duì)在教師知識(shí)結(jié)構(gòu)、教育內(nèi)容、教育方式和人才培育方式等方面的眾多挑戰(zhàn)。所以,為了適應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展潮流和培育更加有效、素養(yǎng)更高、適應(yīng)能力更強(qiáng)的統(tǒng)計(jì)專業(yè)人才,統(tǒng)計(jì)學(xué)教師和統(tǒng)計(jì)教育都需要跟上時(shí)代,積極做出對(duì)應(yīng)的調(diào)整和改革。(作者單位:太原市統(tǒng)計(jì)局調(diào)查監(jiān)測(cè)中心)

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:統(tǒng)計(jì)學(xué)方法在數(shù)據(jù)挖掘中的應(yīng)用探究

摘 要:隨著我國(guó)經(jīng)濟(jì)發(fā)展水平的不斷提高,各行各業(yè)得到了顯著發(fā)展,數(shù)據(jù)統(tǒng)計(jì)學(xué)方法也變得日趨多樣,數(shù)據(jù)挖掘是建立在數(shù)據(jù)庫(kù)與人工智能基礎(chǔ)上發(fā)展起來(lái)的一種高新技術(shù),其功能是從眾多的數(shù)據(jù)當(dāng)中挖掘到最有價(jià)值的信息,進(jìn)而實(shí)現(xiàn)對(duì)數(shù)據(jù)資源的高效利用。聚類分析能夠被當(dāng)成一種數(shù)據(jù)分析工具,能真實(shí)反映出數(shù)據(jù)分布情況,本文主要對(duì)統(tǒng)計(jì)學(xué)在數(shù)據(jù)挖掘中的應(yīng)用進(jìn)行了探討,從而表現(xiàn)統(tǒng)計(jì)學(xué)在數(shù)據(jù)挖掘應(yīng)用中的重要性。

關(guān)鍵詞:統(tǒng)計(jì)學(xué)方法;數(shù)據(jù)挖掘;應(yīng)用分析

數(shù)據(jù)挖掘就是指從眾多實(shí)際應(yīng)用數(shù)據(jù)中獲取批量大、有噪聲、且隨機(jī)性強(qiáng)的數(shù)據(jù),將潛在的信息與數(shù)據(jù)提取出來(lái),就是從數(shù)據(jù)中挖掘有價(jià)值的知識(shí),而大多數(shù)原始數(shù)據(jù)具有一定的結(jié)構(gòu)化特征,比如,關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù);也可以通過(guò)文本、圖形、圖像等半結(jié)構(gòu)化發(fā)掘有用知識(shí),這些知識(shí)可以是數(shù)學(xué)的也可以是非數(shù)學(xué)形式的;數(shù)據(jù)挖掘能以歸納形式存在,能夠被廣泛應(yīng)用到信息查詢、信息管理、信息決策控制中,方便數(shù)據(jù)的維護(hù)與管理。由此可見,數(shù)據(jù)挖掘是一門交叉性強(qiáng)的學(xué)科,加強(qiáng)對(duì)其的研究非常有意義,下面將對(duì)統(tǒng)計(jì)方法在數(shù)據(jù)挖掘中的具體應(yīng)用進(jìn)行分析。

一、數(shù)據(jù)挖掘與統(tǒng)計(jì)學(xué)的關(guān)系

(一)數(shù)據(jù)挖掘的內(nèi)涵

通常來(lái)說(shuō),數(shù)據(jù)挖掘的定義較為模糊,沒有明確界定,大部分對(duì)其的定義只是停留在其背景與觀點(diǎn)的內(nèi)容上。通過(guò)對(duì)不同觀點(diǎn)的統(tǒng)一整理,人們最終將其描述為:從大量多樣化的信息中發(fā)現(xiàn)隱晦性、規(guī)律性等潛在信息,并對(duì)這些信息進(jìn)行創(chuàng)造、加工的過(guò)程。數(shù)據(jù)挖掘作為一門重要的交叉學(xué)科,能夠?qū)?shù)據(jù)庫(kù)、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等眾多的科學(xué)融入到一起,從而實(shí)現(xiàn)技術(shù)與理論的創(chuàng)新與發(fā)展[1]。其中,數(shù)據(jù)庫(kù)、人工智能與統(tǒng)計(jì)學(xué)是數(shù)據(jù)挖掘當(dāng)中的三大支柱理論。數(shù)據(jù)挖掘的目的是從數(shù)據(jù)庫(kù)當(dāng)中發(fā)掘各種隱含的知識(shí)與信息,此過(guò)程的方法非常多,有統(tǒng)計(jì)學(xué)知識(shí)、遺傳算法、粗集方法、決策法、模糊邏輯法等,還可以應(yīng)用向鄰近的可視技術(shù)、模式識(shí)別技術(shù)等,在以上所有技術(shù)的支持上能夠使數(shù)據(jù)挖掘更為科學(xué)、有序。

(二)數(shù)據(jù)挖掘與統(tǒng)計(jì)學(xué)間的關(guān)系

通常來(lái)說(shuō),統(tǒng)計(jì)學(xué)的主要功能是對(duì)統(tǒng)計(jì)原理與統(tǒng)計(jì)方法進(jìn)行研究的科學(xué)。具體來(lái)說(shuō)就是指對(duì)數(shù)字資料進(jìn)行的收集、整理、排序、分析、利用的過(guò)程,數(shù)字資料是各種信息的歸納與總結(jié),可以將其作為特性原理的認(rèn)知、推理方法[2]。而統(tǒng)計(jì)學(xué)則表示的是使用專業(yè)的統(tǒng)計(jì)學(xué)、概率理論原理等對(duì)各種屬性關(guān)系的統(tǒng)計(jì)與分析過(guò)程,通過(guò)分析成功找到屬性間的關(guān)聯(lián)與發(fā)展的規(guī)律。在此過(guò)程中,統(tǒng)計(jì)分析方法是數(shù)據(jù)挖掘最為重要的手段之一。

在數(shù)據(jù)挖掘這一課題被提出來(lái)之前,統(tǒng)計(jì)分析技術(shù)對(duì)于人們來(lái)說(shuō)更熟悉,也是人們?nèi)粘i_展工作、尋找數(shù)據(jù)間規(guī)律最常使用的方法。但是不能簡(jiǎn)單的將數(shù)據(jù)挖掘作為統(tǒng)計(jì)學(xué)的延伸與替代工具,而是要將兩者的區(qū)別認(rèn)識(shí)到位,再結(jié)合兩者間的不同特點(diǎn)分析其應(yīng)用特點(diǎn)[3]。大部分的統(tǒng)計(jì)學(xué)分析技術(shù)都是建立在數(shù)學(xué)理論與技巧上的,預(yù)測(cè)通常較為準(zhǔn)確,效果能夠讓大部分人滿意。數(shù)據(jù)挖掘能夠充分借鑒并吸收統(tǒng)計(jì)學(xué)技術(shù),在融入到自身特點(diǎn)以后成為一種數(shù)據(jù)挖掘技術(shù)。

統(tǒng)計(jì)學(xué)與數(shù)據(jù)挖掘存在的目標(biāo)都是一致的,就是不斷對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行發(fā)掘。鑒于統(tǒng)計(jì)學(xué)與數(shù)據(jù)挖掘在目標(biāo)上的一致性,致使很多研究學(xué)者與專家將數(shù)據(jù)挖掘作為了統(tǒng)計(jì)學(xué)的一個(gè)分支機(jī)構(gòu)[4]。但是這種認(rèn)知非常不正確,因?yàn)閿?shù)據(jù)挖掘不僅體現(xiàn)在與統(tǒng)計(jì)學(xué)的關(guān)系上還體現(xiàn)在思想、工具與方法上,尤其是在計(jì)算機(jī)科學(xué)領(lǐng)域?qū)?shù)據(jù)挖掘起到的作用非常大。比如,通過(guò)借助數(shù)據(jù)庫(kù)技術(shù)與人工智能的學(xué)習(xí),能夠關(guān)注到更多統(tǒng)計(jì)學(xué)與數(shù)據(jù)挖掘上的共通點(diǎn),但是兩者存在的差異依然非常大。數(shù)據(jù)挖掘就是指對(duì)大量的數(shù)據(jù)信息不斷挖掘的過(guò)程,DM能夠?qū)?shù)據(jù)模式內(nèi)的數(shù)據(jù)關(guān)系進(jìn)行充分挖掘,并對(duì)觀測(cè)到的數(shù)據(jù)庫(kù)處理有著極高的關(guān)注度。

二、數(shù)據(jù)挖掘的主要過(guò)程

從數(shù)據(jù)本身出發(fā)探討數(shù)據(jù)挖掘過(guò)程,數(shù)據(jù)挖掘的過(guò)程分為信息的收集、數(shù)據(jù)集成、數(shù)據(jù)處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘?qū)嵤┑冗^(guò)程。

首先,要將業(yè)務(wù)對(duì)象確定下來(lái),明確不同業(yè)務(wù)定義,并認(rèn)清數(shù)據(jù)挖掘的目的,這是做好數(shù)據(jù)挖掘最關(guān)鍵的一步,也是最重要的一步,雖然挖掘的結(jié)果不能被準(zhǔn)確預(yù)測(cè)到,但卻需要對(duì)問題的可預(yù)見性進(jìn)行探索[5]。其次,還要做好數(shù)據(jù)準(zhǔn)備工作,包含數(shù)據(jù)清理、數(shù)據(jù)變換等工作,數(shù)據(jù)清理的實(shí)際意義是將噪聲與空缺值補(bǔ)全,針對(duì)這一問題,可以使用平滑技術(shù),而空缺值的處理則是屬性中最常見的,可以將統(tǒng)計(jì)中最可能出現(xiàn)的值作為一個(gè)空缺值[6]。

信息收集指的是按照特定的數(shù)據(jù)分析對(duì)象,可以將分析中需要的特征信息抽象出來(lái),并在此基礎(chǔ)上選擇出較為科學(xué)、適合的信息收集方法,將全部的信息全部錄入到特定的數(shù)據(jù)庫(kù)中。如果數(shù)據(jù)量較大,則可以選擇一個(gè)專門的管理數(shù)據(jù)的倉(cāng)庫(kù),實(shí)現(xiàn)對(duì)信息的有效保護(hù)與管理;數(shù)據(jù)集成就是指將來(lái)源不同、格式不同、性質(zhì)不同、特點(diǎn)不同的數(shù)據(jù)集成到一起,進(jìn)而為企業(yè)提供更為全面、系統(tǒng)的數(shù)據(jù)共享平臺(tái);數(shù)據(jù)變換就是通過(guò)聚集、概化、規(guī)范化等方式對(duì)數(shù)據(jù)進(jìn)行挖掘,對(duì)于一些實(shí)用數(shù)據(jù),則可以通過(guò)分層與分離方式實(shí)現(xiàn)對(duì)數(shù)據(jù)的轉(zhuǎn)換;數(shù)據(jù)挖掘就是結(jié)合數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)信息點(diǎn),并選擇正確的分析方法實(shí)現(xiàn)對(duì)有價(jià)值數(shù)據(jù)的挖掘,事例推理、規(guī)則推理、遺傳算法等都是應(yīng)用較多的方法[7]。

三、統(tǒng)計(jì)學(xué)方法中的聚類分析

在統(tǒng)計(jì)學(xué)聚類方法基礎(chǔ)上能夠構(gòu)建出潛在的概率分布假設(shè),可以使用試圖優(yōu)化的方法構(gòu)建數(shù)據(jù)與統(tǒng)計(jì)模型的擬合效果?;诮y(tǒng)計(jì)學(xué)聚類方法當(dāng)中,Cobweb方法是在1987年由Fisher提出的,能夠以分類樹作為層次聚類創(chuàng)建的方法,在分類樹上,每一個(gè)節(jié)點(diǎn)都能代表著一個(gè)概念,該方法就是對(duì)節(jié)點(diǎn)概率描述的過(guò)程。Cobweb方法還使用了啟發(fā)式估算方式,使用分類效用對(duì)分類樹的構(gòu)建進(jìn)行指導(dǎo),從而實(shí)現(xiàn)對(duì)最高分類的劃分目的,能夠?qū)⒉煌诸悓?duì)象全部歸類到一個(gè)類別中,并依據(jù)這些內(nèi)容創(chuàng)建出一個(gè)新的類別。但是這種方法也存在一定局限性,局限性在于假設(shè)的屬性概率分布都是獨(dú)立的,并不能始終處于成立狀態(tài)中。

只有在掌握了Cobweb算法以后才能對(duì)概念聚類算法的特點(diǎn)進(jìn)行探究。Cobweb算法能夠以分類樹方式創(chuàng)建層次聚類,可以將概率表現(xiàn)為p(Ai=Vii/Ck)條件概率,其中,Ai=Vij是一個(gè)類別下的,同屬于一個(gè)值對(duì),Ck是概念類中的一種。在給出一個(gè)特定的對(duì)象以后,Cobweb能夠?qū)⑷繉?duì)象整合到一個(gè)節(jié)點(diǎn)上,從而計(jì)算出分類效應(yīng),分?jǐn)?shù)最高的效用就是對(duì)象所在的節(jié)點(diǎn)位置[8]。如果對(duì)象構(gòu)建失去節(jié)點(diǎn),則Cobweb能夠給出一個(gè)新的節(jié)點(diǎn),并對(duì)其進(jìn)行分類使用,這種節(jié)點(diǎn)計(jì)算方法起步較晚,能夠?qū)ΜF(xiàn)有的節(jié)點(diǎn)與計(jì)算相互對(duì)比,從而劃分出最高的分類指標(biāo),將全部對(duì)象統(tǒng)一到已有的分類中,從而構(gòu)建出一個(gè)新的類別。

Classitci是Cobw eb方法的一種延伸與發(fā)展,能夠使用其完成聚類數(shù)據(jù)的處理,在該方法下,節(jié)點(diǎn)中的每一個(gè)存儲(chǔ)屬性都是處于連續(xù)分布狀態(tài)中,能夠?qū)⑵渥鳛榉诸愋Ч拚姆椒ǎ⒁远攘康男问奖憩F(xiàn)出來(lái),這種度量基礎(chǔ)上能夠?qū)崿F(xiàn)連續(xù)性的積分,從而降低分散發(fā)生率,該方法是積分過(guò)程而不是對(duì)屬性的求和過(guò)程。

Auto Class方法也是一種應(yīng)用較為普遍的聚類方法,該方法主要采用統(tǒng)計(jì)分析對(duì)結(jié)果類的數(shù)目進(jìn)行估算,還可以通過(guò)模型搜索方式分析空間中各種分類的可能性,還能夠自動(dòng)對(duì)模型數(shù)量與模型形態(tài)進(jìn)行描述。在一定類別空間中,不同的類別內(nèi)屬性存在關(guān)聯(lián)性,不同的類別間具有相互繼承性,在層次結(jié)構(gòu)當(dāng)中,共享模型參數(shù)是非常重要的。

還有一種使用較為普遍的模型是混合模型,混合模型在統(tǒng)計(jì)學(xué)聚類方法上使用也非常普遍。該方法最為基本的思想就是概率分布決定著每一種聚類狀態(tài),并且模型中的每一個(gè)數(shù)據(jù)都是由多個(gè)概率在分布狀態(tài)下產(chǎn)生的?;旌夏P瓦€能夠作為一種半?yún)?shù)密度評(píng)估方法,其能夠?qū)?shù)估計(jì)與非參數(shù)估計(jì)的優(yōu)點(diǎn)全部集中到一起,并將參數(shù)估計(jì)法與非參數(shù)估價(jià)法的諸多優(yōu)點(diǎn)融合到一起,因?yàn)槟P途哂幸欢◤?fù)雜性,為此,不能將其限制在概率密度函數(shù)表達(dá)形式上,這種復(fù)雜性決定了模型與求解存在關(guān)聯(lián),與樣本集合的聯(lián)系非常少。通過(guò)以上的研究可以了解到,數(shù)據(jù)發(fā)掘中應(yīng)用聚類方法非常有效,并且較為常見。比如,構(gòu)建出Cobweb模型與混合模型,采用Clara與Clarans方法中的抽樣技術(shù),將Denclue方法用在概率密度函數(shù)中。

結(jié)束語(yǔ)

統(tǒng)計(jì)學(xué)方法自產(chǎn)生開始已經(jīng)有非常久遠(yuǎn)的歷史,將嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)邏輯作為基礎(chǔ),將分類算法假定作為獨(dú)立條件,屬性值之前能夠相互保持獨(dú)立,對(duì)假定進(jìn)行計(jì)算,當(dāng)假定成立時(shí),可以再與其他分類算法進(jìn)行對(duì)比,這種分類算法準(zhǔn)確性非常高。為此,其不僅能夠?qū)B續(xù)值進(jìn)行預(yù)測(cè),還可以通過(guò)線性回歸方程對(duì)系數(shù)進(jìn)行比較,從而歸納出結(jié)果。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:淺析大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)的發(fā)展

摘 要:大數(shù)據(jù)已經(jīng)承成為助力互聯(lián)網(wǎng)+發(fā)展的重要手段,成為創(chuàng)客實(shí)現(xiàn)夢(mèng)想星天地的必要途徑,其已經(jīng)成為我們生活中不可缺少的一部分,大數(shù)據(jù)正在以一種前所未有的態(tài)勢(shì)推動(dòng)著各行各業(yè)的發(fā)展,其蓬勃發(fā)展態(tài)勢(shì)也標(biāo)志大數(shù)據(jù)時(shí)代的襲來(lái)。

關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué)

大數(shù)據(jù)時(shí)代以迅雷不及掩耳之勢(shì)席卷世界,在全球范圍內(nèi)掀起了前所未有的數(shù)據(jù)革命浪潮。相對(duì)于政府單位的統(tǒng)計(jì)數(shù)據(jù)來(lái)說(shuō),大數(shù)據(jù)主要利用的是多層次、多樣化的數(shù)據(jù)采集方式,整合了多種數(shù)據(jù)的開發(fā)優(yōu)勢(shì),并且利用現(xiàn)代科學(xué)技術(shù)手段和高速處理以及信息架構(gòu)數(shù)據(jù)等資源,兼具極高的使用價(jià)值和判斷決策能力。一方面,統(tǒng)計(jì)調(diào)查數(shù)據(jù)的多樣化發(fā)展趨勢(shì)和電子商務(wù)產(chǎn)業(yè)的不斷發(fā)展,為統(tǒng)計(jì)數(shù)據(jù)的使用方式和生產(chǎn)方式制造了不小的麻煩,不斷地挑戰(zhàn)者政府部門數(shù)據(jù)管理系統(tǒng)和統(tǒng)計(jì)數(shù)據(jù)的概念。另一方面,信息技術(shù)、網(wǎng)絡(luò)發(fā)展以及空間信息技術(shù)的不斷進(jìn)步,為統(tǒng)計(jì)生產(chǎn)力的升級(jí)發(fā)展提供了廣闊的視角和空間。數(shù)據(jù)量急劇增長(zhǎng)的電子化、信息化和產(chǎn)業(yè)化數(shù)據(jù),都成為了統(tǒng)計(jì)數(shù)據(jù)發(fā)展的重要來(lái)源。種類不斷增多的“大數(shù)據(jù)”資源,正在成為政府統(tǒng)計(jì)部門利用研究的重要領(lǐng)域。

一、大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的區(qū)別

統(tǒng)計(jì)知識(shí)在大數(shù)據(jù)的利用研究中有多樣化的應(yīng)用形式,主要是對(duì)“大數(shù)據(jù)”進(jìn)行肢解,對(duì)爆炸增長(zhǎng)的數(shù)據(jù)信息進(jìn)行搜索、分類以及整合主要依賴于統(tǒng)計(jì)學(xué)。因此,大數(shù)據(jù)的相關(guān)研究在一定程度上運(yùn)用了統(tǒng)計(jì)學(xué)的知識(shí)。但是,大數(shù)據(jù)的使用尚未被統(tǒng)計(jì)學(xué)這門學(xué)科充分利用,這主要是因?yàn)榇髷?shù)據(jù)的運(yùn)用方式,使用模式和統(tǒng)計(jì)學(xué)之間存在著重要差異。統(tǒng)計(jì)學(xué)主要利用的是樣本統(tǒng)計(jì)資源,樣本主要在根據(jù)既定的概率標(biāo)準(zhǔn)從總體中抽樣調(diào)查,但是隨機(jī)抽樣調(diào)查是帶有成本屬性的,例如消耗時(shí)間、資本投入的成本等。在樣本數(shù)量逐漸增加的情況下,樣本估計(jì)的誤差范圍是伴隨著總體樣本數(shù)量的增大而逐漸增加的,這是樣本統(tǒng)計(jì)學(xué)不能忽視的缺點(diǎn)。大數(shù)據(jù)時(shí)代最具代表性的就是海量的信息數(shù)據(jù)化以及即時(shí)電子商務(wù)信息,大數(shù)據(jù)在整體上呈現(xiàn)出“總體樣本數(shù)據(jù)化”的趨勢(shì),這樣的特征恰好可以補(bǔ)充樣本統(tǒng)計(jì)的弊端。大數(shù)據(jù)環(huán)境下的整體樣本統(tǒng)計(jì)即使可以囊括全部的樣本容量,但是因?yàn)楹芏嗲闆r下數(shù)據(jù)具有非結(jié)構(gòu)性和半數(shù)據(jù)化的特征,而且大量的數(shù)據(jù)資源呈現(xiàn)的是重視尾部分布的狀態(tài),方差、標(biāo)準(zhǔn)差等標(biāo)準(zhǔn)化的方法變得毫無(wú)意義,整體依靠性和不穩(wěn)定性經(jīng)常會(huì)超越經(jīng)典時(shí)間內(nèi)的時(shí)間序列的整體假設(shè)性,所以概率論的應(yīng)用范圍呈現(xiàn)狹窄化的發(fā)展趨勢(shì)。因此,統(tǒng)計(jì)學(xué)在利用大數(shù)據(jù)進(jìn)行樣本統(tǒng)計(jì)的過(guò)程中,可以對(duì)整體上的數(shù)據(jù)資源進(jìn)行融合和選擇,這和樣本統(tǒng)計(jì)中的數(shù)據(jù)化處理技術(shù)存在異曲同工之妙。

二、大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)教育的發(fā)展

1.全面培養(yǎng)人才素質(zhì)

統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生需要具備良好與人交往能力。統(tǒng)計(jì)學(xué)的學(xué)生很多都是理科出身的學(xué)生,不善于交際。但是在日常的工作中,有數(shù)據(jù)經(jīng)驗(yàn)的科學(xué)家應(yīng)該經(jīng)常和每個(gè)部門的工作人員交流,協(xié)同工作。怎么樣才能讓頗具專業(yè)性的數(shù)據(jù)分析結(jié)果讓普通的老百姓也可以讀懂,讓每個(gè)部門的工作人員都能無(wú)障礙地理解,這是不容易做到的。要訓(xùn)練自己的交往能力和溝通技能,主動(dòng)地參加演講活動(dòng)是不錯(cuò)的渠道,演講活動(dòng)鍛煉了演講者的自信,在整個(gè)演講的過(guò)程中,能否清晰地表達(dá)自己的思想以及給人以信服力是至關(guān)重要的。需要培養(yǎng)數(shù)據(jù)常識(shí),廣其見聞。數(shù)據(jù)科學(xué)家經(jīng)常面對(duì)各種各樣的海量數(shù)據(jù),并需要從這些數(shù)據(jù)中挖掘出有價(jià)值的信息,這就需要數(shù)據(jù)科學(xué)家具有強(qiáng)烈的數(shù)據(jù)敏感性。對(duì)數(shù)據(jù)的敏感程度的訓(xùn)練不是一蹴而就的,要經(jīng)過(guò)長(zhǎng)時(shí)間的積累和數(shù)據(jù)分析工作的磨練,同時(shí)也可以根據(jù)閱讀數(shù)據(jù)分析材料積累閱歷,提升對(duì)數(shù)據(jù)資源的敏感程度。

2.培養(yǎng)應(yīng)用型人才

大數(shù)據(jù)時(shí)代培養(yǎng)的數(shù)據(jù)科學(xué)家需要兩方面的基本素質(zhì),第一是概念性,也就前面所說(shuō)的數(shù)據(jù)科學(xué)家需要掌握的基本素養(yǎng)和專業(yè)知識(shí);第二是實(shí)踐性,也就是本文中我們提及的應(yīng)用型人才,也就是實(shí)際操作中處理數(shù)據(jù)的能力。在高校開展大數(shù)據(jù)分析研究生學(xué)科,最大的問題是沒有可用的數(shù)據(jù),這就需要高效與大數(shù)據(jù)企業(yè)合作,進(jìn)行研究生的聯(lián)合培養(yǎng),注重學(xué)生的實(shí)際操作能力,這里面涉及到我們的應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)碩士的雙導(dǎo)師培養(yǎng)制度,一名校內(nèi)導(dǎo)師一名校外導(dǎo)師,校內(nèi)導(dǎo)師注重學(xué)生的概念性,校外導(dǎo)師注重學(xué)生的實(shí)踐性,學(xué)生通過(guò)在校外導(dǎo)師單位的實(shí)習(xí),從而熟悉并且掌握實(shí)際工作中所需要的技能。

3.促進(jìn)統(tǒng)計(jì)與數(shù)學(xué)、計(jì)算機(jī)學(xué)科合作

“大數(shù)據(jù)”時(shí)代需要的海量數(shù)據(jù)分析資源僅僅憑借統(tǒng)計(jì)學(xué)科單一學(xué)科的發(fā)展是不能滿足發(fā)展需求的,大數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)性特征已經(jīng)拋棄了傳統(tǒng)意義上的數(shù)據(jù)分析模式的非智能化框架,而且數(shù)據(jù)分析需要利用新型的數(shù)據(jù)運(yùn)算方式以及計(jì)算機(jī)技能分析,這也是進(jìn)行數(shù)據(jù)分析工作的攔路虎。所以,數(shù)據(jù)科學(xué)家的成長(zhǎng)僅僅依靠單一的統(tǒng)計(jì)學(xué)科知識(shí)的學(xué)習(xí)是遠(yuǎn)遠(yuǎn)不夠的,其需要的是數(shù)學(xué)、計(jì)算機(jī)和統(tǒng)計(jì)學(xué)三門學(xué)科融合發(fā)展,緊密結(jié)合。三門學(xué)科之間交叉發(fā)展,融會(huì)貫通,這樣既可以發(fā)揮學(xué)科的優(yōu)勢(shì)資源,同時(shí)也能彌補(bǔ)其他學(xué)科的弊端。

三、結(jié)語(yǔ)

數(shù)據(jù)信息的爆炸式增長(zhǎng)使我們?cè)谑褂媒y(tǒng)計(jì)數(shù)據(jù)處理信息時(shí)需要更多的數(shù)據(jù)資源,更有甚者,在很多情況下可以利用全面化的數(shù)據(jù),數(shù)據(jù)資源不再是制約統(tǒng)計(jì)分析的唯一因素,大數(shù)據(jù)前提下的統(tǒng)計(jì)學(xué)效用和粘合度預(yù)測(cè)的準(zhǔn)確程度不斷提升,而且可以發(fā)現(xiàn)諸多在樣本統(tǒng)計(jì)基礎(chǔ)上未能顯現(xiàn)的細(xì)節(jié)。統(tǒng)計(jì)學(xué)關(guān)鍵優(yōu)勢(shì)就是“見微知著”,也是統(tǒng)計(jì)學(xué)在數(shù)據(jù)環(huán)境下的約束性妥協(xié)。在海量數(shù)據(jù)洶涌襲來(lái)的年代,充分發(fā)揮統(tǒng)計(jì)學(xué)的優(yōu)勢(shì),和大數(shù)據(jù)資源整合發(fā)展,實(shí)現(xiàn)“以小見大”和“由繁入簡(jiǎn)”的有效結(jié)合。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:淺談大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)和機(jī)遇

摘 要:文章通過(guò)闡述大數(shù)據(jù)及其目的,分析大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的對(duì)比,對(duì)大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)與機(jī)遇展開探討研究,旨在為相關(guān)人員基于大數(shù)據(jù)及其目的、大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的對(duì)比的大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)和機(jī)遇研究適用提供一些思路。

關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);挑戰(zhàn);機(jī)遇;營(yíng)銷

引言

國(guó)際數(shù)據(jù)公司的相關(guān)研究指出,2011年全球數(shù)據(jù)生產(chǎn)量達(dá)1.8ZB,且全球信息總量每隔兩年增長(zhǎng)一倍[1]。在大數(shù)據(jù)時(shí)代下,對(duì)于統(tǒng)計(jì)學(xué)發(fā)展而言,挑戰(zhàn)與機(jī)遇并存,挑戰(zhàn)指的是現(xiàn)階段傳統(tǒng)統(tǒng)計(jì)學(xué)相關(guān)方法難以適用大數(shù)據(jù),機(jī)遇指的是基于統(tǒng)計(jì)學(xué),大數(shù)據(jù)展開數(shù)據(jù)處理、分析,促使大數(shù)據(jù)具備可視化特性。由此可見,研究大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)和機(jī)遇有著十分重要的現(xiàn)實(shí)意義。

1.大數(shù)據(jù)及其目的

現(xiàn)階段,關(guān)于大數(shù)據(jù)仍舊沒有一個(gè)十分明確的界定,大數(shù)據(jù)起初是源自于技術(shù)領(lǐng)域。在信息量不斷擴(kuò)大的情況下,使得常規(guī)電腦原有存儲(chǔ)空間已不能對(duì)新處理數(shù)據(jù)進(jìn)行承載,新興數(shù)據(jù)處理技術(shù)得以產(chǎn)生,好比雅虎的Hadoop平臺(tái)、谷歌的MapReduce等。此類技術(shù)能夠?qū)┗瘜哟谓Y(jié)構(gòu)、一致性予以消除,促進(jìn)數(shù)據(jù)無(wú)需通過(guò)常規(guī)數(shù)據(jù)庫(kù)表格進(jìn)行排列,極大程度地提升了人們可處理的數(shù)據(jù)量[1]。

2.大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的對(duì)比

2.1樣本統(tǒng)計(jì)與全樣本統(tǒng)計(jì)的區(qū)別

樣本統(tǒng)計(jì)屬于統(tǒng)計(jì)學(xué)不可或缺的依賴,樣本指的是結(jié)合相應(yīng)的概率自總體中隨機(jī)篩選并視作總體代表的集合內(nèi)容,值得一提的是隨機(jī)抽樣是需要成本的,包括社會(huì)關(guān)系、資金成本或者時(shí)間成本等。基于樣本數(shù)量提升有限前提下,樣本估計(jì)誤差會(huì)隨著總體數(shù)量增多而增大,這亦是樣本統(tǒng)計(jì)無(wú)法避免的不足。大數(shù)據(jù)時(shí)代下,龐大的數(shù)據(jù)信息應(yīng)運(yùn)而生,數(shù)據(jù)信息發(fā)展表現(xiàn)出總體即是樣本的態(tài)勢(shì),該屬性很好的消除了樣本統(tǒng)計(jì)這一不足。大數(shù)據(jù)時(shí)代下的全樣本統(tǒng)計(jì),通常情況下可對(duì)完全總體進(jìn)行覆蓋,然而受大部分?jǐn)?shù)據(jù)屬于半結(jié)構(gòu)、半結(jié)構(gòu)數(shù)據(jù)影響,使得概率論應(yīng)用遭受一定的制約[2]。鑒于此,將全樣本統(tǒng)計(jì)應(yīng)用到統(tǒng)計(jì)學(xué)中,應(yīng)當(dāng)就總體數(shù)據(jù)展開相應(yīng)的歸納、篩選,即好比在樣本統(tǒng)計(jì)中展開數(shù)據(jù)預(yù)處理。

2.2預(yù)測(cè)分析與非預(yù)測(cè)分析的區(qū)別

統(tǒng)計(jì)學(xué)的創(chuàng)立,是為了對(duì)變量相互相關(guān)關(guān)系展開分析,因此獲取數(shù)據(jù)是發(fā)生于變量確定之后的,數(shù)據(jù)分析價(jià)值是能夠被預(yù)測(cè)的。相較于統(tǒng)計(jì)學(xué)的預(yù)測(cè)分析,龐大數(shù)據(jù)將互聯(lián)網(wǎng)、傳感器作為載體,存在于分析需求之前,因此構(gòu)建于大數(shù)據(jù)上的分析多為非預(yù)測(cè)性分析。在統(tǒng)計(jì)學(xué)中,出現(xiàn)大數(shù)據(jù)無(wú)法有效應(yīng)用局面,這是由于不具備非預(yù)測(cè)分析所需的龐大數(shù)據(jù),龐大數(shù)據(jù)產(chǎn)生與數(shù)據(jù)中心、存儲(chǔ)系統(tǒng)存在緊密的聯(lián)系,并非短期產(chǎn)生。也就是說(shuō),統(tǒng)計(jì)學(xué)中大數(shù)據(jù)的應(yīng)用發(fā)展,說(shuō)明了非預(yù)測(cè)分析正逐步取代傳統(tǒng)統(tǒng)計(jì)學(xué)預(yù)測(cè)分析,數(shù)據(jù)多次利用正逐步取代傳統(tǒng)數(shù)據(jù)一次性利用的。

3.大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)與機(jī)遇

3.1數(shù)據(jù)生產(chǎn)、處理與應(yīng)用的轉(zhuǎn)變

相關(guān)統(tǒng)計(jì)部門經(jīng)開展嚴(yán)格的統(tǒng)計(jì)設(shè)計(jì)工作,獲得相關(guān)的統(tǒng)計(jì)數(shù)據(jù),數(shù)據(jù)的預(yù)處理分別有數(shù)據(jù)清洗、非全面數(shù)據(jù)填補(bǔ)以及數(shù)據(jù)矯正等。大數(shù)據(jù)時(shí)代下的統(tǒng)計(jì)手段尚不十分明確,自大數(shù)據(jù)流環(huán)境而言,要不斷探索新型抽樣方法,并確保抽樣方法的實(shí)時(shí)、連貫及可行性。除去傳統(tǒng)的統(tǒng)計(jì)分析方法,還應(yīng)當(dāng)開發(fā)大數(shù)據(jù)動(dòng)態(tài)分析、數(shù)據(jù)流算法等[3]。

3.2大數(shù)據(jù)時(shí)代對(duì)市場(chǎng)營(yíng)銷的機(jī)遇

3.2.1大數(shù)據(jù)營(yíng)銷的特點(diǎn)與價(jià)值

大數(shù)據(jù)營(yíng)銷的特點(diǎn):I.數(shù)據(jù)采集多平臺(tái)化特點(diǎn),即大數(shù)據(jù)時(shí)代下,大數(shù)據(jù)的數(shù)據(jù)大多來(lái)源于不同的領(lǐng)域、不同的渠道。II.時(shí)效性特點(diǎn),隨著信息技術(shù)的急速發(fā)展,互聯(lián)網(wǎng)用戶消費(fèi)、購(gòu)物行為方式往往會(huì)瞬間出現(xiàn)轉(zhuǎn)變。國(guó)際先進(jìn)大數(shù)據(jù)營(yíng)銷企業(yè)AdTime基于此大數(shù)據(jù)營(yíng)銷特點(diǎn),采取了時(shí)間營(yíng)銷措施,即采取相應(yīng)的技術(shù)方式全面獲悉用戶所需,于第一時(shí)間對(duì)用戶當(dāng)下的需求進(jìn)行回應(yīng),以使用戶在下決心購(gòu)買的最佳時(shí)間及時(shí)看到對(duì)應(yīng)的產(chǎn)品廣告。III.個(gè)性化特點(diǎn),在大數(shù)據(jù)時(shí)代下,廣告商傳統(tǒng)媒體導(dǎo)向的營(yíng)銷理念逐步由受眾導(dǎo)向取代,現(xiàn)如今,廣告商可應(yīng)用大數(shù)據(jù)了解用戶的地理方位,需求內(nèi)容等信息,達(dá)到對(duì)用戶個(gè)性化營(yíng)銷的目的。

大數(shù)據(jù)營(yíng)銷的價(jià)值:I.升級(jí)營(yíng)銷與用戶的匹配度,大數(shù)據(jù)營(yíng)銷不僅可提供給企業(yè)了解用戶有效的途徑,還能夠于網(wǎng)絡(luò)環(huán)境下,選取相關(guān)技術(shù)方法達(dá)到對(duì)用戶精確定位的目的,從而開展好營(yíng)銷工作,升級(jí)營(yíng)銷與用戶的匹配度。II.改善用戶體驗(yàn),大數(shù)據(jù)營(yíng)銷促使企業(yè)真正意義上認(rèn)識(shí)到用戶及其所使用企業(yè)產(chǎn)品情況,以給予用戶最人性化的提醒。

3.2.2大數(shù)據(jù)營(yíng)銷的應(yīng)用

(1)與消費(fèi)者建立緊密關(guān)系

現(xiàn)如今,我國(guó)一些企業(yè)營(yíng)銷行為仍舊處于個(gè)性化定位信息、創(chuàng)意設(shè)計(jì)階段,而無(wú)法對(duì)不同消費(fèi)者展開個(gè)性化的營(yíng)銷活動(dòng)。大數(shù)據(jù)時(shí)代下,經(jīng)采用相關(guān)數(shù)據(jù)分析技術(shù)方法,基于對(duì)消費(fèi)群體喜好、傳媒接觸習(xí)慣等展開有效的分析,達(dá)到特定營(yíng)銷活動(dòng)明確開展的目的,實(shí)現(xiàn)企業(yè)精心開展的營(yíng)銷活動(dòng)精準(zhǔn)的輻射至目標(biāo)消費(fèi)群體處,與消費(fèi)者建立緊密關(guān)系,極大的改善營(yíng)銷效率、質(zhì)量[4]。

(2)掌握競(jìng)爭(zhēng)對(duì)手?jǐn)?shù)據(jù)

企業(yè)通過(guò)對(duì)競(jìng)爭(zhēng)對(duì)手?jǐn)?shù)據(jù)的有效掌握,獲悉競(jìng)爭(zhēng)對(duì)手發(fā)展?fàn)顩r,基于此幫助企業(yè)制定科學(xué)合理的產(chǎn)品價(jià)格,提升企業(yè)產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì)。與此同時(shí),企業(yè)務(wù)必要全面實(shí)施以事實(shí)為前提的決策手段,廣泛地應(yīng)用數(shù)據(jù)分析方式對(duì)企業(yè)每一個(gè)發(fā)展運(yùn)營(yíng)步驟進(jìn)行優(yōu)化,經(jīng)對(duì)企業(yè)一系列數(shù)據(jù)的充分優(yōu)化、對(duì)接,促使業(yè)務(wù)環(huán)節(jié)中潛在的價(jià)值得以被有效挖掘,降低生產(chǎn)成本,知己知彼,促使企業(yè)在日趨白熱化的市場(chǎng)競(jìng)爭(zhēng)中占據(jù)有利位置。

(3)挖掘企業(yè)內(nèi)部數(shù)據(jù)

“市場(chǎng)未動(dòng),數(shù)據(jù)先行”儼然轉(zhuǎn)變?yōu)閲?guó)際上企業(yè)有效運(yùn)營(yíng)發(fā)展的一致認(rèn)識(shí),為了提升企業(yè)管理效率,要求企業(yè)要充分挖掘企業(yè)內(nèi)部數(shù)據(jù),并展開有效的整合、分析,以為企業(yè)相關(guān)人員做決策提供有利的參考依據(jù),提升決策準(zhǔn)確性,促進(jìn)企業(yè)可持續(xù)發(fā)展。

3.2.4 企業(yè)的應(yīng)用案例――以亞馬遜為例

在應(yīng)用大數(shù)據(jù)開展市場(chǎng)營(yíng)銷方面,美國(guó)亞馬遜公司一直處于領(lǐng)先地位。亞馬遜研發(fā)出“用戶未下單,先發(fā)貨”功能,即結(jié)合用戶的購(gòu)物需求數(shù)據(jù)信息,分析用戶想要購(gòu)買的產(chǎn)品,達(dá)到用戶未下單,提前發(fā)貨的目的。此外,亞馬遜通過(guò)對(duì)用戶檢索信息的分析,評(píng)估流感的傳播,但這僅僅為海量檢索數(shù)據(jù)中的一項(xiàng)用途,相同的數(shù)據(jù)能夠應(yīng)用于預(yù)測(cè)大選結(jié)果、預(yù)測(cè)某類產(chǎn)品市場(chǎng)行情等等,極大地降低了統(tǒng)計(jì)成本[5]。

3.3大數(shù)據(jù)時(shí)代對(duì)市場(chǎng)營(yíng)銷的挑戰(zhàn)

3.3.1信息收集

大數(shù)據(jù)并非就是對(duì)數(shù)據(jù)信息展開盲目的收集,即便收集了再多的數(shù)據(jù),倘若這些數(shù)據(jù)并非是市場(chǎng)營(yíng)銷所需要的,如此便會(huì)導(dǎo)致前期收集來(lái)的數(shù)據(jù)信息,變成一堆“數(shù)據(jù)垃圾”。鑒于此,為了避免這一情況發(fā)生,務(wù)必要充分分析業(yè)務(wù)需求,再對(duì)自身存在價(jià)值的數(shù)據(jù)展開收集、歸納,如此方可實(shí)現(xiàn)大數(shù)據(jù)的有效收集應(yīng)用。

3.3.2經(jīng)驗(yàn)與數(shù)據(jù)

數(shù)據(jù)采集完畢后,面對(duì)參差不齊的數(shù)據(jù),還應(yīng)當(dāng)做好數(shù)據(jù)評(píng)估工作,評(píng)估對(duì)何種目標(biāo)受眾開展市場(chǎng)營(yíng)銷工作。鑒于此,要求采取科學(xué)合理的手段,將這些參差不齊的數(shù)據(jù)整合成可被市場(chǎng)營(yíng)銷實(shí)踐應(yīng)用的,經(jīng)結(jié)合過(guò)去的經(jīng)驗(yàn),與采集數(shù)據(jù)進(jìn)行有機(jī)融合,實(shí)現(xiàn)對(duì)目標(biāo)受眾的有效分析確定。

3.3.3分析與優(yōu)化

數(shù)據(jù)分析,一方面是實(shí)現(xiàn)數(shù)據(jù)優(yōu)化,一方面是進(jìn)行決策層面上的調(diào)整、轉(zhuǎn)變。此環(huán)節(jié)對(duì)于專業(yè)人才的需求提出了嚴(yán)苛的挑戰(zhàn)。數(shù)據(jù)分析、數(shù)據(jù)優(yōu)化對(duì)于專業(yè)人才的知識(shí)框架要求大不相同,這要求相關(guān)企業(yè)不僅要培養(yǎng)專業(yè)的數(shù)據(jù)分析人才,還要打造數(shù)據(jù)優(yōu)化人才隊(duì)伍。

3.4大數(shù)據(jù)營(yíng)銷的未來(lái)發(fā)展趨勢(shì)

信息技術(shù)不斷發(fā)展,單一媒體導(dǎo)向的“消費(fèi)者碎片化”儼然無(wú)法達(dá)到企業(yè)對(duì)于數(shù)據(jù)多樣性的需求。大數(shù)據(jù)時(shí)代下,媒體的跨界融合實(shí)現(xiàn)對(duì)“碎片化”受眾的充分聚合。在科學(xué)技術(shù)技術(shù)不斷進(jìn)步的背景下,跨媒介、跨平臺(tái)、跨終端的多途徑將不斷被開拓,將使龐大的數(shù)據(jù)信息獲取多維度的整合,并且在多樣化網(wǎng)絡(luò)環(huán)境下,消費(fèi)者主觀信息與客觀數(shù)據(jù)有機(jī)融合,構(gòu)筑全面用戶數(shù)據(jù)庫(kù)環(huán)節(jié),將成為未來(lái)大數(shù)據(jù)營(yíng)銷發(fā)展的必然趨勢(shì)[6]。

4.結(jié)束語(yǔ)

總而言之,大數(shù)據(jù)為傳統(tǒng)統(tǒng)計(jì)學(xué)帶來(lái)了嚴(yán)峻的考驗(yàn),也為傳統(tǒng)統(tǒng)計(jì)學(xué)有效發(fā)展創(chuàng)造了良好的契機(jī)。在大數(shù)據(jù)時(shí)展潮流中,我們應(yīng)當(dāng)充分的認(rèn)識(shí)到大數(shù)據(jù)對(duì)于傳統(tǒng)統(tǒng)計(jì)學(xué)而言,是補(bǔ)充而不是更替,構(gòu)建于樣本統(tǒng)計(jì)、預(yù)測(cè)分析內(nèi)容上的傳統(tǒng)統(tǒng)計(jì)學(xué),仍舊于社會(huì)統(tǒng)計(jì)、經(jīng)濟(jì)分析中占據(jù)著主導(dǎo)位置。大數(shù)據(jù)時(shí)代下,為了實(shí)現(xiàn)企業(yè)市場(chǎng)營(yíng)銷的有效開展,相關(guān)人員務(wù)必要不斷專研研究、總結(jié)經(jīng)驗(yàn),全面分析大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的對(duì)比,充分認(rèn)識(shí)大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的挑戰(zhàn)和機(jī)遇,“與消費(fèi)者建立緊密關(guān)系”、“掌握競(jìng)爭(zhēng)對(duì)手?jǐn)?shù)據(jù)”、“挖掘企業(yè)內(nèi)部數(shù)據(jù)”等,積極促進(jìn)企業(yè)市場(chǎng)營(yíng)銷的科學(xué)合理化。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:大數(shù)據(jù)與統(tǒng)計(jì)學(xué)分析方法比較

摘要:

基于理念分析和比較研究方法,對(duì)大數(shù)據(jù)的分析方法和傳統(tǒng)統(tǒng)計(jì)學(xué)分析方法的關(guān)聯(lián)性和差異進(jìn)行了對(duì)比分析,從方法的基本思想、量化形式、數(shù)據(jù)來(lái)源、分析范式、分析方法、分析視角等角度揭示了兩種社會(huì)科學(xué)分析方法存在的聯(lián)系與差異。

關(guān)鍵詞:

大數(shù)據(jù);統(tǒng)計(jì)學(xué);研究方法

隨著信息技術(shù)的日益發(fā)展與普及,信息以及數(shù)據(jù)在社會(huì)經(jīng)濟(jì)發(fā)展過(guò)程中發(fā)揮的作用越來(lái)越重要?,F(xiàn)如今,“大數(shù)據(jù)”時(shí)代已經(jīng)來(lái)臨,于是如何更有效地利用數(shù)據(jù)快速做出科學(xué)決策也已成為眾多企業(yè)甚至是國(guó)家所共同關(guān)注的焦點(diǎn)問題。在數(shù)據(jù)處理和分析方法方面,《統(tǒng)計(jì)學(xué)》以及在其基礎(chǔ)上發(fā)展而來(lái)的實(shí)證統(tǒng)計(jì)方法是當(dāng)前的主流,這些方法可以幫助數(shù)據(jù)持有者從大量的數(shù)據(jù)中挖掘有價(jià)值的信息,并為其相關(guān)決策提供理論支撐和方法支持。然而,傳統(tǒng)的實(shí)證統(tǒng)計(jì)方法在最新出現(xiàn)的大數(shù)據(jù)情境下,卻呈現(xiàn)出了諸多缺陷,例如傳統(tǒng)數(shù)據(jù)收集方法無(wú)法實(shí)現(xiàn)大規(guī)模(甚至是總體)數(shù)據(jù)的收集,傳統(tǒng)統(tǒng)計(jì)方法和分析軟件無(wú)法處理大規(guī)模數(shù)據(jù),等等。于是,在將傳統(tǒng)統(tǒng)計(jì)學(xué)方法應(yīng)用于最新的大數(shù)據(jù)情境和問題之前,需要首先明確大數(shù)據(jù)所要求的處理方法與傳統(tǒng)的統(tǒng)計(jì)學(xué)處理方法存在哪些關(guān)聯(lián)和區(qū)別,然后才能夠決定是否可以應(yīng)用既有統(tǒng)計(jì)學(xué)理論和方法來(lái)處理某些大數(shù)據(jù)問題。

1大數(shù)據(jù)的界定

根據(jù)一位美國(guó)學(xué)者的研究,大數(shù)據(jù)可以被定義為:it means data that’s too big, too fast, or too hard for existing tools to process。也就是說(shuō),該學(xué)者認(rèn)為:在關(guān)于大數(shù)據(jù)的所有定義中,他傾向于將之定義為那類“太大”、“太快”,或現(xiàn)存工具“太難”處理的數(shù)據(jù)。一般而言,大數(shù)據(jù)的特征可以概括為四個(gè)V:一是量大(Volume);二是流動(dòng)性大(Velocity),典型的如微博;三是種類多(Variety),多樣性,有結(jié)構(gòu)化數(shù)據(jù),也有半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);四是價(jià)值大(Value),這些大規(guī)模數(shù)據(jù)可以為持有企業(yè)或者組織創(chuàng)造出巨大的商業(yè)或社會(huì)價(jià)值。

Victor在其最新著作《大數(shù)據(jù)時(shí)代――生活、工作與思維的大變革》中指出,大數(shù)據(jù)時(shí)代,思維方式要發(fā)生3個(gè)變革:第一,要分析與事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量數(shù)據(jù)樣本;要總體,不要樣本。第二,要樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性。第三,不再探求難以捉摸的因果關(guān)系,應(yīng)該更加注重相關(guān)關(guān)系。這些變革反映出了大數(shù)據(jù)處理方式與傳統(tǒng)統(tǒng)計(jì)學(xué)分析方法的很多關(guān)聯(lián)以及主要不同。因此,下面我們分別針對(duì)兩者的聯(lián)系和區(qū)別進(jìn)行討論。

2大數(shù)據(jù)與統(tǒng)計(jì)學(xué)分析方法的聯(lián)系

從18世紀(jì)中葉至今,統(tǒng)計(jì)學(xué)已經(jīng)經(jīng)歷了兩百多年的發(fā)展歷程,不論是基礎(chǔ)理論還是社會(huì)應(yīng)用都極其堅(jiān)實(shí)而豐富。大數(shù)據(jù)作為一種新興的事物規(guī)律認(rèn)知和挖掘思維,也將會(huì)對(duì)人類的價(jià)值體系、知識(shí)體系和生活方式產(chǎn)生重要影響,甚至引發(fā)重大改變。作為兩種認(rèn)知世界和事物規(guī)律的基本方法,它們?cè)谝韵聝蓚€(gè)方面存在緊密關(guān)聯(lián)。

(1)挖掘事物規(guī)律的基本思想一致。統(tǒng)計(jì)學(xué)(statistics)探索事物規(guī)律的基本方法是:通過(guò)利用概率論建立數(shù)學(xué)模型,收集所觀察系統(tǒng)的數(shù)據(jù),進(jìn)行量化分析和總結(jié),做出推斷和預(yù)測(cè),為相關(guān)決策提供依據(jù)和參考。對(duì)于大數(shù)據(jù),維克托指出,大數(shù)據(jù)思維的來(lái)臨使人類第一次有機(jī)會(huì)和條件,在非常多的領(lǐng)域和非常深入的層次獲得和使用全面數(shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù),深入探索現(xiàn)實(shí)世界的規(guī)律,獲取過(guò)去不可能獲取的知識(shí)。通過(guò)這兩個(gè)定義可以看出,不論是傳統(tǒng)的統(tǒng)計(jì)學(xué)方法還是新興的大數(shù)據(jù)分析方法,都是以數(shù)據(jù)為基礎(chǔ)來(lái)揭示事物特征以及發(fā)展趨勢(shì)的。

(2)均采用量化分析方式。大數(shù)據(jù)分析的基礎(chǔ)是數(shù)據(jù)化,也就是一種把各種各樣現(xiàn)象轉(zhuǎn)變?yōu)榭芍票矸治龅牧炕问降倪^(guò)程。不論是傳統(tǒng)統(tǒng)計(jì)學(xué)中所應(yīng)用的數(shù)據(jù)(定性和定量數(shù)據(jù)),還是大數(shù)據(jù)時(shí)代即將被轉(zhuǎn)化和采用其他形式數(shù)據(jù)(如文字、圖像等),最終都是通過(guò)量化分析方法來(lái)揭示數(shù)據(jù)中所蘊(yùn)含的事物特征與發(fā)展趨勢(shì)。

3大數(shù)據(jù)與統(tǒng)計(jì)學(xué)分析方法的區(qū)別

(1)基礎(chǔ)數(shù)據(jù)不同。在大數(shù)據(jù)時(shí)代,我們可以獲得和分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)抽樣。這意味著,與傳統(tǒng)統(tǒng)計(jì)學(xué)數(shù)據(jù)相比,大數(shù)據(jù)不僅規(guī)模大,變化速度快,而且數(shù)據(jù)來(lái)源、類型、收集方法都有根本性變化。

①在數(shù)據(jù)來(lái)源方面,在大數(shù)據(jù)背景下,我們需要的紛繁多樣的數(shù)據(jù)可以分布于全球多個(gè)服務(wù)器上,因此我們可以獲得體量巨大的數(shù)據(jù),甚至是關(guān)于總體的所有數(shù)據(jù)。而統(tǒng)計(jì)學(xué)中的數(shù)據(jù)多是經(jīng)由抽樣調(diào)查而獲得的局部數(shù)據(jù),因此我們能夠掌握的事“小數(shù)據(jù)量”。這種情況下,因?yàn)樾枰治龅臄?shù)據(jù)很少,所以必須盡可能精確的量化我們的數(shù)據(jù)。綜上,大數(shù)據(jù)情況下,分析人員可以擁有大量數(shù)據(jù),因而不需要對(duì)一個(gè)現(xiàn)象刨根問底,只需要掌握事物大體的發(fā)展方向即可;然而傳統(tǒng)的小數(shù)據(jù)情況下則需要十分注意所獲得數(shù)據(jù)的精確度。

②在數(shù)據(jù)類型與收集方面,在既往模式下,數(shù)據(jù)的收集是耗時(shí)且耗力的,大數(shù)據(jù)時(shí)代所提出的“數(shù)據(jù)化”方式,將使得對(duì)所需數(shù)據(jù)的收集變得更加容易和高效。除了傳統(tǒng)的數(shù)字化數(shù)據(jù),就連圖像、方位、文本的字、詞、句、段落等等,世間萬(wàn)物都可以成為大數(shù)據(jù)范疇下的數(shù)據(jù)。屆時(shí),一切自然或者社會(huì)現(xiàn)象的事件都可以被轉(zhuǎn)化為數(shù)據(jù),我們會(huì)意識(shí)到本質(zhì)上整個(gè)世界都是由信息構(gòu)成的。

(2)分析范式不同。在小數(shù)據(jù)時(shí)代,我們往往是假想世界是如何運(yùn)行的,然后通過(guò)收集和分析數(shù)據(jù)來(lái)驗(yàn)證這種假想。也就是說(shuō),傳統(tǒng)統(tǒng)計(jì)實(shí)證分析的基本范式為:(基于文獻(xiàn))提出理論假設(shè)-收集相關(guān)數(shù)據(jù)并進(jìn)行統(tǒng)計(jì)分析-驗(yàn)證理論假設(shè)的真?zhèn)?。然而,在不久的將?lái),我們將會(huì)在大數(shù)據(jù)背景下探索世界,不再受限制于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見,我們對(duì)事物的研究始于數(shù)據(jù),并可以發(fā)現(xiàn)以前不曾發(fā)現(xiàn)的聯(lián)系。換言之,大數(shù)據(jù)背景下,探索事物規(guī)律的范式可以概括為:數(shù)據(jù)觀察與收集――數(shù)據(jù)分析――描述事物特征/關(guān)系。

(3)數(shù)據(jù)分析方法不同。傳統(tǒng)統(tǒng)計(jì)學(xué)主要是基于樣本的“推斷分析”,而大數(shù)據(jù)情境下則是基于總體數(shù)據(jù)的“實(shí)際分析”,即直接得出總體特征,并可以分析出這些特征出現(xiàn)的概率。

(4)分析視角不同。傳統(tǒng)的實(shí)證統(tǒng)計(jì)意在弄清事物之間的內(nèi)在聯(lián)系和作用機(jī)制,但大數(shù)據(jù)思維模式認(rèn)為因果關(guān)系是沒有辦法驗(yàn)證的,因此需要關(guān)注的是事物之間的相關(guān)關(guān)系。大數(shù)據(jù)并沒有改變因果關(guān)系,但使因果關(guān)系變得意義不大,因而大數(shù)據(jù)的思維是告訴我們“是什么”而不是“為什么”。換言之,大數(shù)據(jù)思維認(rèn)為相關(guān)關(guān)系盡管不能準(zhǔn)確地告知我們某事件為何會(huì)發(fā)生,但是它會(huì)提醒我們這件事情正在發(fā)生,因此相關(guān)關(guān)系的發(fā)現(xiàn)就可以產(chǎn)生經(jīng)濟(jì)和社會(huì)價(jià)值了。

4結(jié)語(yǔ)

綜上,相對(duì)于傳統(tǒng)而言,大數(shù)據(jù)思維主要包括三個(gè)重大轉(zhuǎn)變。首先,要分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析捎來(lái)能夠的數(shù)據(jù)樣本;其次,研究人員應(yīng)樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性;最后,認(rèn)知世界的思想發(fā)生了轉(zhuǎn)變,不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。以上三個(gè)轉(zhuǎn)變構(gòu)成了大數(shù)據(jù)思維的核心。在統(tǒng)計(jì)學(xué)的進(jìn)一步應(yīng)用和發(fā)展完善過(guò)程中,需要結(jié)合以上轉(zhuǎn)變所產(chǎn)生的挑戰(zhàn),思考有效的統(tǒng)計(jì)學(xué)發(fā)展對(duì)策。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:統(tǒng)計(jì)學(xué)與大數(shù)據(jù)

摘 要:21世紀(jì),隨著互聯(lián)網(wǎng)和信息技術(shù)的飛快發(fā)展,數(shù)據(jù)正在成為巨大的經(jīng)濟(jì)資產(chǎn),成為新世紀(jì)的礦產(chǎn)和資源,為企業(yè)帶來(lái)全新的創(chuàng)業(yè)方向、商業(yè)模式和投資機(jī)會(huì)。21世紀(jì)的學(xué)科不是經(jīng)濟(jì)學(xué),也不是醫(yī)學(xué),是統(tǒng)計(jì)學(xué)在大數(shù)據(jù)時(shí)代的崛起。

關(guān)鍵詞:統(tǒng)計(jì)學(xué);大數(shù)據(jù);利用;發(fā)展

統(tǒng)計(jì)學(xué)是通過(guò)搜索、整理、分析數(shù)據(jù)等手段,以達(dá)到推斷所測(cè)對(duì)象的本質(zhì),甚至預(yù)測(cè)對(duì)象未來(lái)的一門綜合性科學(xué)。其中用到了大量的數(shù)學(xué)及其它學(xué)科的專業(yè)知識(shí),它的使用范圍幾乎覆蓋了社會(huì)科學(xué)和自然科學(xué)的各個(gè)領(lǐng)域。隨著統(tǒng)計(jì)學(xué)發(fā)展的同時(shí),一個(gè)大規(guī)模生產(chǎn)、分享和應(yīng)用數(shù)據(jù)的時(shí)代正在開啟:大數(shù)據(jù)的真實(shí)價(jià)值就像漂浮在海洋中的冰山,絕大部分的數(shù)據(jù)都隱藏在表面下等著人類去探索。

1 利用所有的數(shù)據(jù)

在傳統(tǒng)的統(tǒng)計(jì)學(xué)中,由于記錄,存儲(chǔ),分析數(shù)據(jù)的工具不夠好,所以總是傾向于從總體中抽取樣本來(lái)分析,因?yàn)榻y(tǒng)計(jì)學(xué)的一個(gè)目的就是用盡可能少的數(shù)據(jù)來(lái)證實(shí)可能重大的發(fā)現(xiàn)。統(tǒng)計(jì)學(xué)家證明:采樣分析的準(zhǔn)確性隨著采樣隨機(jī)性的增大而大幅度提高,但是與樣本數(shù)量的增大關(guān)系不大。當(dāng)樣本數(shù)量達(dá)到了某個(gè)值的時(shí)候,從新個(gè)體身上得到的信息會(huì)越來(lái)越少,就同經(jīng)濟(jì)學(xué)中的邊際遞減效應(yīng)一樣。

在大數(shù)據(jù)時(shí)代,不使用隨機(jī)分析的方法,而是采用所有的數(shù)據(jù)。即“樣本=總體”。統(tǒng)計(jì)抽樣其實(shí)只是為了在技術(shù)受限的特定時(shí)期,解決當(dāng)時(shí)存在的一些特定問題而產(chǎn)生的。慢慢的,就會(huì)拋棄樣本分析。

2 接受不精確

對(duì)小數(shù)據(jù)而已,統(tǒng)計(jì)學(xué)已經(jīng)可以把數(shù)據(jù)處理的很好了,但是在大數(shù)據(jù)時(shí)代,太多的數(shù)據(jù)使原始統(tǒng)計(jì)方法捉襟見肘,因?yàn)閿?shù)據(jù)量的大增會(huì)使得結(jié)果不太精確。執(zhí)迷于精確性是信息缺乏時(shí)代和模擬時(shí)代的產(chǎn)物,只有接受不精確性才能進(jìn)入我們從未涉足的鄰域。接受不精確是從“小數(shù)據(jù)”到“大數(shù)據(jù)”的重要轉(zhuǎn)變之一。因?yàn)閾碛懈蟮臄?shù)據(jù)量所帶來(lái)的利益遠(yuǎn)遠(yuǎn)超過(guò)增加一點(diǎn)精確性,所以也就能夠接受不精確的存在了。要想得到大規(guī)模數(shù)據(jù)帶來(lái)的好處,混亂應(yīng)該是一種標(biāo)準(zhǔn)途徑,而不應(yīng)該是盡量避免。

3 追求相關(guān)關(guān)系而不是確定因果

在小數(shù)據(jù)時(shí)代,相關(guān)關(guān)系也是有的。統(tǒng)計(jì)分析的目的在于如何根據(jù)統(tǒng)計(jì)數(shù)據(jù)確定變量之間的關(guān)系形態(tài)及其關(guān)聯(lián)的程度,并探索其內(nèi)在的數(shù)量規(guī)律。人們?cè)趯?shí)踐中發(fā)現(xiàn),變量之間的關(guān)系分為兩種:函數(shù)關(guān)系和相關(guān)關(guān)系。相關(guān)與回歸是處理變量之間的一種統(tǒng)計(jì)方法。變量之間存在的不確定的數(shù)量關(guān)系,稱為相關(guān)關(guān)系。一般來(lái)說(shuō),可以用散點(diǎn)圖和相關(guān)系數(shù)來(lái)描述和測(cè)度相關(guān)關(guān)系。

相關(guān)關(guān)系的核心是量化兩個(gè)數(shù)據(jù)之間的數(shù)理關(guān)系,它沒有絕對(duì),只有可能性。大數(shù)據(jù)的相關(guān)分析法更準(zhǔn)確,更快,而且不易受偏見的影響。知道是什么就夠了,沒必要知道是什么。通過(guò)探求“是什么”而不是“為什么”,相關(guān)關(guān)系幫我們更好的了解這個(gè)世界。如果凡事皆有因果的話,那么我們就沒有決定任何事的自由了。

4 數(shù)據(jù)的來(lái)源并非那么簡(jiǎn)單

在一般看來(lái),要想得到一些你所需要的數(shù)據(jù)是需要通過(guò)各種不同方法測(cè)量或是記錄才能得到,而有時(shí)候,數(shù)據(jù)會(huì)從你意想不到的地方得到。也許你精心地設(shè)計(jì)了你的實(shí)驗(yàn)或是探究,但是到了真正操作才會(huì)發(fā)現(xiàn)事情并不像你想象的那么簡(jiǎn)單。

首先,由于在大數(shù)據(jù)時(shí)代,數(shù)據(jù)不是那么的有規(guī)律,所以才要考慮數(shù)據(jù)的一系列問題。這些數(shù)據(jù)或是資料是不是一定要自己去得到,或是可以參考別人已經(jīng)有過(guò)的結(jié)果,這樣可以節(jié)省精力和時(shí)間。如果是參考別人的數(shù)據(jù)要考慮時(shí)效性和使用范圍。也許不是專門為你的設(shè)想而準(zhǔn)備的數(shù)據(jù)。大的數(shù)據(jù)庫(kù)有著小數(shù)據(jù)庫(kù)所沒有的價(jià)值,大數(shù)據(jù)的核心就是挖掘出大的數(shù)據(jù)庫(kù)所擁有的獨(dú)特的價(jià)值。

5 數(shù)據(jù)的利用方式

在統(tǒng)計(jì)學(xué)中,對(duì)數(shù)據(jù)的利用不僅包括對(duì)數(shù)據(jù)求平均值,方差,分位點(diǎn),可以的話還要得到數(shù)據(jù)中的某種關(guān)系或是聯(lián)系,如父母的身高會(huì)不會(huì)對(duì)下一代產(chǎn)生影響,不僅要分析父母的身高,還要分析孩子的身高,從中發(fā)現(xiàn)有沒有相關(guān)關(guān)系,得出自己的結(jié)論。

在大數(shù)據(jù)時(shí)代,數(shù)據(jù)沒這么簡(jiǎn)單的讓你下手,所以對(duì)數(shù)據(jù)的利用方法也隨著情況的不同而不同。數(shù)據(jù)的用途已經(jīng)從基本的用途移動(dòng)到了二級(jí)用途,使得數(shù)據(jù)隨著時(shí)間的推移而變得更有價(jià)值。明白了隱藏在冰山下面的絕大部分?jǐn)?shù)據(jù)的價(jià)值后,創(chuàng)新型企業(yè)就能夠提取其潛在價(jià)值并獲得潛在的巨大收益。盡管如此,數(shù)據(jù)再利用的重要性還沒有被充分認(rèn)識(shí)到。要解鎖這些數(shù)據(jù),就必須通過(guò)新一代統(tǒng)計(jì)人員的不懈努力并借助新一代的方法和工具。

隨著大數(shù)據(jù)的出現(xiàn),數(shù)據(jù)的總和比部分更有價(jià)值。將數(shù)據(jù)的總體組合在一起,重組組合本身的價(jià)值也比單個(gè)更大。如果決定使用有生產(chǎn)價(jià)值的數(shù)據(jù),就需要不斷的更新數(shù)據(jù)庫(kù)并淘汰無(wú)用的信息。即使數(shù)據(jù)基于基本用途的價(jià)值會(huì)減少,但潛在價(jià)值卻仍然強(qiáng)大。潛在的數(shù)據(jù)價(jià)值需要通過(guò)創(chuàng)新的分析來(lái)釋放。不出意外,給數(shù)據(jù)的潛在價(jià)值貼上價(jià)格標(biāo)簽會(huì)帶來(lái)無(wú)限商機(jī)。

6 小結(jié)

個(gè)人認(rèn)為統(tǒng)計(jì)學(xué)和數(shù)據(jù)挖掘一起可以更好的利用數(shù)據(jù)。一個(gè)可以對(duì)數(shù)據(jù)進(jìn)行有效合理的分析,一個(gè)可以用多種多樣的算法來(lái)更好地處理數(shù)據(jù)。在大數(shù)據(jù)時(shí)代,重要的是數(shù)據(jù)自身和大數(shù)據(jù)的思維觀念。如果能做到數(shù)據(jù),技能和思維三者具備,就能更好地服務(wù)于大數(shù)據(jù)時(shí)代,就能在大數(shù)據(jù)時(shí)代有非常大的競(jìng)爭(zhēng)優(yōu)勢(shì)。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:大數(shù)據(jù)背景下高職院校統(tǒng)計(jì)學(xué)運(yùn)用SPSS軟件研究

摘 要:廣泛使用電算化處理統(tǒng)計(jì)數(shù)據(jù)的今天,學(xué)習(xí)統(tǒng)計(jì)學(xué)而不會(huì)使用統(tǒng)計(jì)學(xué)軟件,在實(shí)際工作應(yīng)用中寸步難行,本文從教材的選用;強(qiáng)化理論基礎(chǔ),重視實(shí)踐技能;培養(yǎng)學(xué)生職業(yè)能力,激發(fā)學(xué)生學(xué)習(xí)興趣等方面對(duì)大數(shù)據(jù)背景下高職院校統(tǒng)計(jì)學(xué)運(yùn)用SPSS軟件研究進(jìn)行了探討。

關(guān)鍵詞:大數(shù)據(jù);高職院校;統(tǒng)計(jì)學(xué);spss軟件

在2014年11月下《科技風(fēng)》雜志上發(fā)表了“大數(shù)據(jù)背景下高職院校統(tǒng)計(jì)學(xué)的學(xué)習(xí)現(xiàn)狀研究”, 對(duì)大數(shù)據(jù)背景下統(tǒng)計(jì)學(xué)在我國(guó)高職院校開設(shè)的現(xiàn)狀及存在的問題進(jìn)行了剖析,通過(guò)調(diào)查研究發(fā)現(xiàn),目前在大數(shù)據(jù)背景下,高職院校開設(shè)的統(tǒng)計(jì)學(xué)課程運(yùn)用SPSS軟件的應(yīng)用已成為必然。

1 教材的選用

總所周知,《統(tǒng)計(jì)學(xué)》課程是高職院校財(cái)經(jīng)類專業(yè)的學(xué)生中開設(shè)的一門公共專業(yè)基礎(chǔ)課程,也是學(xué)生工作后實(shí)際應(yīng)用比較廣泛的一門學(xué)科,小到自己的日常生活,大到工作都離不開統(tǒng)計(jì)數(shù)字,靠傳統(tǒng)的手工計(jì)算辦法早就行不通了,特別是互聯(lián)網(wǎng)的應(yīng)用,大數(shù)據(jù)背景下,如何在眾多的信息中篩選出有用的信息,在學(xué)生學(xué)習(xí)的過(guò)程中教材和軟件是必不可少的。

目前,統(tǒng)計(jì)學(xué)――基于SPSS系列教材,高等教育出版社、中國(guó)人銀民大學(xué)出版社等都出版過(guò)本科、研究生使用的教材,專門為高職院校財(cái)經(jīng)類的學(xué)生使用而出版的統(tǒng)計(jì)學(xué)教材很少,目前,通過(guò)多方面調(diào)查,筆者認(rèn)為比較適合高職院校選用的是人民郵電出版社的《SPSS統(tǒng)計(jì)分析實(shí)用教程》,由謝蕾蕾、宋志剛、何旭洪主編,2013年出版。這本教材以SPSS16.0為基礎(chǔ),詳細(xì)介紹了多種常用統(tǒng)計(jì)分析方法的原理和實(shí)踐技能。全書分為十一章,主要內(nèi)容包括SPSS簡(jiǎn)介;變量、數(shù)據(jù)文件、系統(tǒng)參數(shù);統(tǒng)計(jì)描述;統(tǒng)計(jì)圖制作;均值比較和T檢驗(yàn);方差分析;相關(guān)分析;回歸分析;聚類分析和判別分析;因子分析和非參數(shù)檢驗(yàn)等,結(jié)合實(shí)際問題詳細(xì)介紹使用SPSS解決這些問題的步驟和結(jié)果。

這本教材克服了在選用傳統(tǒng)統(tǒng)計(jì)學(xué)教材時(shí),只注重理論知識(shí)講授,死記硬背公式。學(xué)生們對(duì)統(tǒng)計(jì)計(jì)算不在望而生畏,對(duì)復(fù)雜的統(tǒng)計(jì)公式及數(shù)字計(jì)算,由于軟件的使用變得簡(jiǎn)單了。因此,現(xiàn)在高職院校的學(xué)生必須要學(xué)習(xí)使用spss軟件,教材是學(xué)生學(xué)習(xí)過(guò)程中不可缺少的,選好教材尤為重要。

2 強(qiáng)化理論基礎(chǔ),重視實(shí)踐技能

2.1 轉(zhuǎn)變教學(xué)觀念,理論引導(dǎo)下,重點(diǎn)強(qiáng)調(diào)應(yīng)用

統(tǒng)計(jì)學(xué)是一門實(shí)踐性較強(qiáng)的學(xué)科,學(xué)生既要掌握扎實(shí)的基礎(chǔ)理論知識(shí),也要熟練運(yùn)用各種計(jì)算工具,才能具備高超的解決實(shí)際工作中問題的能力。這樣,必須對(duì)傳統(tǒng)的高職統(tǒng)計(jì)學(xué)課程進(jìn)行改革。我們學(xué)校在講授這門課時(shí),介紹統(tǒng)計(jì)的基本理論、基本概念、基本方法的同時(shí),側(cè)重對(duì)統(tǒng)計(jì)軟件使用的講解,很好的將二者有機(jī)結(jié)合起來(lái),做到學(xué)以至用。

2.2 以企業(yè)為依托,實(shí)現(xiàn)校企共育

全面建立和完善“校企共育”的人才培養(yǎng)模式,主動(dòng)順應(yīng)黃河三角洲高效生態(tài)經(jīng)濟(jì)區(qū)和山東半島藍(lán)色經(jīng)濟(jì)區(qū)發(fā)展帶來(lái)的產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化升級(jí)和企業(yè)崗位需求變化,推行“基于工作崗位”系統(tǒng)化課程改革,突出學(xué)生職業(yè)崗位能力的培養(yǎng),增強(qiáng)社會(huì)服務(wù)能力,為企、事業(yè)單位提供高素質(zhì)技能型人才。

按照“知能兼?zhèn)?,德業(yè)為本”的財(cái)經(jīng)人才培養(yǎng)要求,以統(tǒng)計(jì)職業(yè)崗位要求為目標(biāo),以就業(yè)為導(dǎo)向,打破傳統(tǒng)學(xué)科體系,建立以知識(shí)、能力、素質(zhì)并重的課程體系及工學(xué)結(jié)合的校內(nèi)外實(shí)踐教學(xué)機(jī)制,構(gòu)建符合統(tǒng)計(jì)職業(yè)培養(yǎng)要求的人才培養(yǎng)模式;采取專職教師“頂崗實(shí)踐”和兼職教師“項(xiàng)目指導(dǎo)”相結(jié)合的方式,建設(shè)一支具有優(yōu)秀專業(yè)帶頭人、品質(zhì)優(yōu)良、專兼結(jié)合的“雙師”素質(zhì)教師比例達(dá)到95%以上的教學(xué)團(tuán)隊(duì);確立與職業(yè)要求相適應(yīng)的教學(xué)標(biāo)準(zhǔn),通過(guò)課堂教學(xué)與崗位實(shí)踐一體化,著力培養(yǎng)學(xué)生的實(shí)踐能力、創(chuàng)造能力,為spss軟件的應(yīng)用提供了有利條件。

3 培養(yǎng)學(xué)生職業(yè)能力,激發(fā)學(xué)生學(xué)習(xí)興趣

3.1 深入企業(yè)工作崗位,由讓他學(xué)變成我要學(xué)

山東鋁業(yè)職業(yè)學(xué)院依托山東鋁業(yè)公司辦學(xué),山東鋁業(yè)公司隸屬于中國(guó)鋁業(yè)公司,是全國(guó)成立的首家職業(yè)教育集團(tuán),我院的學(xué)生,具有其他院校學(xué)生無(wú)可比擬的學(xué)習(xí)優(yōu)勢(shì),我們學(xué)院在學(xué)生學(xué)習(xí)的過(guò)程中,為調(diào)動(dòng)學(xué)生學(xué)習(xí)的積極性,將學(xué)生帶到企業(yè)有關(guān)崗位,如到銷售處,現(xiàn)場(chǎng)看我們的銷售人員如果對(duì)收集來(lái)的數(shù)據(jù)進(jìn)行處理、加工、整理到提取出有用的信息,將spss軟件的應(yīng)用過(guò)程讓學(xué)生親身體會(huì),企業(yè)導(dǎo)師認(rèn)真講解、操作示范,激發(fā)了學(xué)生的學(xué)習(xí)興趣。特別是老師們以通俗易懂的語(yǔ)言對(duì)統(tǒng)計(jì)方法的核心思想進(jìn)行系統(tǒng)講解,輔助以“操作示意圖”的方式對(duì)SPSS軟件的操作進(jìn)行了詳細(xì)介紹,帶領(lǐng)學(xué)生以看圖做題的方式非常簡(jiǎn)單方便地學(xué)會(huì)用SPSS軟件完成各種統(tǒng)計(jì)方法的計(jì)算工作,面對(duì)眾多數(shù)據(jù),同學(xué)們個(gè)個(gè)都想試試,看看雜亂無(wú)章的初始數(shù)據(jù),在spss軟件的操作下,很快得出自己想要的數(shù)據(jù),真的由讓他學(xué)變成我要學(xué)。

3.2 改革考核辦法,注重職業(yè)能力

隨著統(tǒng)計(jì)學(xué)教學(xué)的改革,我們改革了考核辦法,引導(dǎo)教師采用過(guò)程考核的方式促進(jìn)學(xué)生有效學(xué)習(xí)。建立了《山東鋁業(yè)職業(yè)學(xué)院考試管理規(guī)定》和考試模式改革相關(guān)通知和制度,使課程考核方式真實(shí)反映學(xué)生完成實(shí)際工作任務(wù)能力的最佳方式進(jìn)行考試。課程考核采用過(guò)程考核與結(jié)果考核相結(jié)合、理論考核與實(shí)踐考核相結(jié)合的模式,每門課程都進(jìn)行了考核評(píng)價(jià)方案設(shè)計(jì)。目前我院財(cái)經(jīng)專業(yè)以培養(yǎng)職業(yè)能力為核心的教學(xué)方法,得到社會(huì)承認(rèn),培養(yǎng)的學(xué)生已獲得企業(yè)認(rèn)可。

綜上所述,在大數(shù)據(jù)時(shí)代,高職財(cái)經(jīng)學(xué)生spss軟件的應(yīng)用學(xué)習(xí)很好地解決了傳統(tǒng)統(tǒng)計(jì)學(xué)理論與實(shí)際相脫節(jié)的問題,激發(fā)學(xué)生的學(xué)習(xí)興趣,培養(yǎng)學(xué)生解決實(shí)際問題的職業(yè)能力,有利于推動(dòng)學(xué)生就業(yè)。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:淺析大數(shù)據(jù)環(huán)境下的統(tǒng)計(jì)學(xué)課程教學(xué)

【摘要】大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的發(fā)展帶來(lái)了巨大的機(jī)遇與挑戰(zhàn)。文章分析了大數(shù)據(jù)與統(tǒng)計(jì)學(xué)之間的基本關(guān)系,并針對(duì)大數(shù)據(jù)環(huán)境下的統(tǒng)計(jì)學(xué)課程教學(xué)提出了對(duì)策與建議。

【關(guān)鍵詞】大數(shù)據(jù) 統(tǒng)計(jì)學(xué) 挑戰(zhàn) 機(jī)遇 教學(xué)

1.引言

“大數(shù)據(jù)”時(shí)代的來(lái)臨和“大數(shù)據(jù)”處理技術(shù)的發(fā)展深深的影響著統(tǒng)計(jì)學(xué)的發(fā)展。能否利用傳統(tǒng)的統(tǒng)計(jì)理論和統(tǒng)計(jì)方法對(duì)海量的數(shù)據(jù)做出快速、準(zhǔn)確的處理并獲取相關(guān)信息?如何對(duì)傳統(tǒng)的統(tǒng)計(jì)理論與方法進(jìn)行改進(jìn)或探索新的統(tǒng)計(jì)理論和方法來(lái)對(duì)大數(shù)據(jù)進(jìn)行挖掘與處理以獲取信息?如何在“大數(shù)據(jù)”時(shí)代背景下培養(yǎng)符合市場(chǎng)需求的統(tǒng)計(jì)分析師或數(shù)據(jù)分析師?如何將“大數(shù)據(jù)”處理技術(shù)融入相關(guān)統(tǒng)計(jì)學(xué)課程教學(xué)以促進(jìn)數(shù)據(jù)處理與分析技術(shù)的發(fā)展?這些都是我們?cè)诮y(tǒng)計(jì)學(xué)相關(guān)課程教學(xué)過(guò)程中必須思考的一個(gè)問題。

2.大數(shù)據(jù)與統(tǒng)計(jì)學(xué)

“大數(shù)據(jù)”隨著社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、云計(jì)算等的興起而產(chǎn)生。一般認(rèn)為大數(shù)據(jù)具有規(guī)模性、多樣性、實(shí)時(shí)性及價(jià)值性四個(gè)基本特征,包含分析、帶寬和內(nèi)容三個(gè)要素?!按髷?shù)據(jù)”在數(shù)據(jù)來(lái)源、數(shù)據(jù)結(jié)構(gòu)和處理方法方面對(duì)傳統(tǒng)的統(tǒng)計(jì)分析方法產(chǎn)生了沖擊。第一,在大數(shù)據(jù)背景下,數(shù)據(jù)來(lái)源不再是原來(lái)的簡(jiǎn)單抽樣,而是“樣本即總體”,直接將總體作為研究對(duì)象。第二,在大數(shù)據(jù)時(shí)代,研究對(duì)象也不是原來(lái)單一的結(jié)構(gòu)化數(shù)據(jù),由于數(shù)據(jù)的多樣化與規(guī)模化,我們更多的是研究非結(jié)構(gòu)數(shù)據(jù),采用人工智能來(lái)進(jìn)行數(shù)據(jù)挖掘和信息獲取。第三,數(shù)據(jù)處理方法也不是簡(jiǎn)單的采用傳統(tǒng)的假設(shè)檢驗(yàn)方法進(jìn)行研究,特別是對(duì)于統(tǒng)計(jì)學(xué)中的異常點(diǎn),不再采取以往的丟棄或者平滑處理方式。

“大數(shù)據(jù)”處理技術(shù)對(duì)統(tǒng)計(jì)學(xué)的發(fā)展提出了巨大挑戰(zhàn),但我們必須認(rèn)識(shí)到學(xué)科之間的發(fā)展是相互交融的,“大數(shù)據(jù)處理技術(shù)”其本質(zhì)上是數(shù)據(jù)處理與分析技術(shù),其發(fā)展對(duì)統(tǒng)計(jì)學(xué)學(xué)科的發(fā)展也有積極的一面,同時(shí)統(tǒng)計(jì)學(xué)作為一門獨(dú)立的學(xué)科,有其自身獨(dú)特的學(xué)科優(yōu)勢(shì)。首先,海量的數(shù)據(jù)有利于提高各類統(tǒng)計(jì)分析的精度,如減小抽樣誤差等。其次,較之于傳統(tǒng)的統(tǒng)計(jì)學(xué)方法,現(xiàn)有的“大數(shù)據(jù)”分析方法難度較大、成本較高、耗時(shí)較長(zhǎng)。而在實(shí)際的應(yīng)用中,我們關(guān)心的不是數(shù)據(jù)量的多少,而是數(shù)據(jù)量所蘊(yùn)含的信息。傳統(tǒng)的統(tǒng)計(jì)學(xué)分析方法是以較少的數(shù)據(jù)進(jìn)行精確度相對(duì)較高的統(tǒng)計(jì)分析,這是“大數(shù)據(jù)”分析所無(wú)法替代的。另一方面,統(tǒng)計(jì)學(xué)在數(shù)據(jù)收集方法、模型選擇、模型假設(shè)以及模型診斷方面有很大優(yōu)勢(shì)。而且并不是所有的問題都具有海量的數(shù)據(jù),并不是每一個(gè)“大數(shù)據(jù)”問題都適合用現(xiàn)有的“大數(shù)據(jù)處理技術(shù)”來(lái)處理。

3.對(duì)策與建議

3.1 夯實(shí)基礎(chǔ)教學(xué)

針對(duì)以上的分析我們可以看出,大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的發(fā)展既是機(jī)遇,又是挑戰(zhàn)。因此我們?cè)诮虒W(xué)過(guò)程中要夯實(shí)統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)的教學(xué),講清楚統(tǒng)計(jì)學(xué)的基本原理與基本方法,特別是數(shù)據(jù)分析與數(shù)據(jù)處理的基本原理與方法。對(duì)于許多傳統(tǒng)領(lǐng)域,如生物、醫(yī)藥以及質(zhì)量與可靠性工程等,我們面對(duì)的多是“小數(shù)據(jù)”而不是大數(shù)據(jù),因此基于樣本的統(tǒng)計(jì)分析方法仍然是進(jìn)行此類問題研究的最有效的科學(xué)手段。

另一方面,我們要結(jié)合大數(shù)據(jù)技術(shù)的特點(diǎn),對(duì)統(tǒng)計(jì)學(xué)的基本知識(shí)進(jìn)行拓展教育,引導(dǎo)學(xué)生思考怎樣將已有的統(tǒng)計(jì)學(xué)基本原理與方法運(yùn)用到大數(shù)據(jù)處理的技術(shù)研究中。如在大數(shù)據(jù)環(huán)境下怎樣進(jìn)行數(shù)據(jù)的收集、篩選與甄別、存儲(chǔ)與分析等,如何分析并厘清可能的數(shù)據(jù)來(lái)源與范圍,如何建立相關(guān)指標(biāo)體系并對(duì)數(shù)據(jù)進(jìn)行分類,如何制定或調(diào)整相應(yīng)的統(tǒng)計(jì)參考標(biāo)準(zhǔn),以及如何對(duì)依靠非傳統(tǒng)數(shù)據(jù)源加工生產(chǎn)的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行規(guī)范的統(tǒng)計(jì)推斷等。

隨著大數(shù)據(jù)時(shí)代的來(lái)臨,各行各業(yè)對(duì)具有統(tǒng)計(jì)背景知識(shí)人才的需求必定越來(lái)越多。因此,在統(tǒng)計(jì)學(xué)教學(xué)過(guò)程中,一定要結(jié)合各專業(yè)的特點(diǎn),特別是“大數(shù)據(jù)”的特點(diǎn),切實(shí)加強(qiáng)統(tǒng)計(jì)學(xué)的基礎(chǔ)知識(shí)教學(xué)與拓展教學(xué)。

3.2 加強(qiáng)統(tǒng)計(jì)學(xué)專業(yè)軟件教學(xué)

“大數(shù)據(jù)”環(huán)境下,對(duì)統(tǒng)計(jì)人才需求也發(fā)生了變化。面對(duì)海量的數(shù)據(jù)與多樣化的數(shù)據(jù),一名合格的統(tǒng)計(jì)人才或數(shù)據(jù)分析人才不單需要良好的統(tǒng)計(jì)素養(yǎng)與扎實(shí)的統(tǒng)計(jì)基礎(chǔ)知識(shí),更需要具有數(shù)據(jù)的存儲(chǔ)與整理能力、計(jì)算能力以及數(shù)據(jù)分析與處理能力等。這就要求在教學(xué)過(guò)程中,加強(qiáng)統(tǒng)計(jì)軟件或數(shù)學(xué)軟件的教學(xué)。

針對(duì)傳統(tǒng)的“數(shù)學(xué)證明+手工計(jì)算”或“重理論輕專業(yè)統(tǒng)計(jì)軟件”的統(tǒng)計(jì)學(xué)課程教學(xué)模式,可將統(tǒng)計(jì)軟件或數(shù)學(xué)軟件融入課堂教學(xué)并安排一定的課時(shí)上機(jī)學(xué)習(xí)統(tǒng)計(jì)軟件,以此提高學(xué)生數(shù)據(jù)處理能力,加深對(duì)統(tǒng)計(jì)學(xué)基本原理的理解與掌握。

在加強(qiáng)統(tǒng)計(jì)軟件或數(shù)學(xué)軟件,如SPSS、R、SAS以及Matlab的教學(xué)過(guò)程中,要擯棄“會(huì)軟件的操作即會(huì)統(tǒng)計(jì)技術(shù)”的思維,要讓學(xué)生真正掌握相關(guān)操作與相關(guān)算法,深入思考算法的實(shí)現(xiàn)與相關(guān)理論的應(yīng)用。同時(shí)引導(dǎo)學(xué)生思考對(duì)“大數(shù)據(jù)處理”的技術(shù)要求,包括數(shù)據(jù)搜集、發(fā)掘、存儲(chǔ)以及計(jì)算分析過(guò)程中的算法與設(shè)備要求等,引導(dǎo)學(xué)生針對(duì)大數(shù)據(jù)進(jìn)行軟件升級(jí)與開發(fā)。

3.3 突出案例教學(xué)與實(shí)踐教學(xué)

大數(shù)據(jù)的產(chǎn)生和發(fā)展源于規(guī)模經(jīng)濟(jì)問題或超規(guī)模經(jīng)濟(jì)問題的研究。每一個(gè)大數(shù)據(jù)問題的研究都是與實(shí)際經(jīng)濟(jì)或社會(huì)問題緊密相聯(lián)的,因此,在實(shí)際教學(xué)過(guò)程中,要突出案例教學(xué)與實(shí)踐教學(xué),由易到難,通過(guò)案例教學(xué)逐步引入大數(shù)據(jù)的概念以及大數(shù)據(jù)處理的基本技術(shù),提高學(xué)生的分析全局觀以及進(jìn)行實(shí)際數(shù)據(jù)分析與處理的能力。

教學(xué)改革的目的是培養(yǎng)在“大數(shù)據(jù)”時(shí)代背景下,符合市場(chǎng)需求的專業(yè)統(tǒng)計(jì)人才,而合格的專業(yè)統(tǒng)計(jì)人才必須具備良好的統(tǒng)計(jì)實(shí)踐能力。案例教學(xué)與統(tǒng)計(jì)實(shí)踐活動(dòng)是培養(yǎng)學(xué)生統(tǒng)計(jì)實(shí)踐能力的有效途徑。因此,在教學(xué)過(guò)程中,一方面,教師可融合各種與實(shí)際問題相關(guān)的案例進(jìn)行分析和講解,加深學(xué)生對(duì)相關(guān)統(tǒng)計(jì)理論知識(shí)的理解,激發(fā)學(xué)生的學(xué)習(xí)興趣,培養(yǎng)學(xué)生解決實(shí)際問題的能力。另一方面,教師可以組織多種形式的課堂或課堂外的統(tǒng)計(jì)實(shí)踐活動(dòng)以培養(yǎng)學(xué)生統(tǒng)計(jì)實(shí)踐。如,指導(dǎo)學(xué)生針對(duì)他們感興趣的與經(jīng)濟(jì)、社會(huì)發(fā)展相關(guān)的統(tǒng)計(jì)實(shí)際問題展開統(tǒng)計(jì)研究,設(shè)計(jì)調(diào)查問卷,收集數(shù)據(jù)、整理和分析數(shù)據(jù),撰寫研究報(bào)告,實(shí)現(xiàn)對(duì)實(shí)際問題的分析和解決等。

4.結(jié)束語(yǔ)

總之,在“大數(shù)據(jù)”環(huán)境下我們既要積極面對(duì)挑戰(zhàn),又要緊緊抓住機(jī)遇,切實(shí)結(jié)合“大數(shù)據(jù)”的特點(diǎn)和“大數(shù)據(jù)處理技術(shù)”發(fā)展的需求,既加強(qiáng)對(duì)傳統(tǒng)的統(tǒng)計(jì)學(xué)方法、統(tǒng)計(jì)理論的教學(xué),又積極開展 “大數(shù)據(jù)“環(huán)境下的拓展教學(xué),推動(dòng)統(tǒng)計(jì)學(xué)的發(fā)展,在數(shù)據(jù)收集、數(shù)據(jù)分析以及統(tǒng)計(jì)制度等方面進(jìn)行改革和創(chuàng)新。

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:統(tǒng)計(jì)學(xué)如何揭露數(shù)據(jù)造假

阿根廷一直被懷疑有低估其通貨膨脹數(shù)據(jù)的嫌疑,以避免為那些與通貨膨脹指數(shù)掛鉤的政府債券支付高利率。希臘和意大利也被指稱在加入歐元區(qū)前對(duì)預(yù)算赤字?jǐn)?shù)據(jù)進(jìn)行過(guò)粉飾,這種做法使希臘政府從投資者處獲得了較低的借款利率。其他一些國(guó)家也常被懷疑對(duì)增長(zhǎng)數(shù)據(jù)進(jìn)行潤(rùn)色。這個(gè)名單還可以繼續(xù)盤點(diǎn)下去,世界各地許多國(guó)家都有因戰(zhàn)略原因而篡改經(jīng)濟(jì)數(shù)據(jù)的嫌疑,意在吸引投資者或獲取較低成本的債務(wù)融資。

筆者搜集了100多個(gè)國(guó)家近20年的國(guó)際收支平衡數(shù)據(jù),運(yùn)用統(tǒng)計(jì)學(xué)對(duì)這些數(shù)據(jù)進(jìn)行檢驗(yàn)。從理論上來(lái)說(shuō),這些數(shù)據(jù)的首位數(shù)字不應(yīng)呈均勻分布,而應(yīng)出現(xiàn)本福特定律所揭示的特殊分布規(guī)律。根據(jù)本福特統(tǒng)計(jì)定律,較小的數(shù)值(比如1、2和3)在首位數(shù)字中出現(xiàn)的頻率應(yīng)當(dāng)比較高數(shù)值的數(shù)字出現(xiàn)的頻率高。

由于任何數(shù)據(jù)只要數(shù)量足夠大即應(yīng)符合本福特定律,因此該定律可用于檢驗(yàn)自1990年代以來(lái),各國(guó)的審計(jì)和財(cái)務(wù)數(shù)據(jù)是否出現(xiàn)過(guò)篡改。我們利用這一方法來(lái)檢驗(yàn)國(guó)際收支平衡標(biāo)準(zhǔn)化數(shù)據(jù),發(fā)現(xiàn)一系列的國(guó)家都謊報(bào)了宏觀經(jīng)濟(jì)數(shù)據(jù)。盡管這種方法無(wú)法使他們查證某一政府具體在哪一時(shí)點(diǎn)了虛假信息,但仍可通過(guò)某些特征,例如匯率類型或海外資產(chǎn)頭寸,來(lái)對(duì)國(guó)家進(jìn)行分類,從中總結(jié)出一定的規(guī)律。

誰(shuí)是做假賬的家伙?

第一類不符合本福特定律的國(guó)家是采用了“固定匯率”機(jī)制的國(guó)家,在這類國(guó)家中,還有一個(gè)子類,即允許資本自由流動(dòng)的那些國(guó)家,其公布的經(jīng)濟(jì)數(shù)據(jù)的統(tǒng)計(jì)分布偏離了本福特定律,與標(biāo)準(zhǔn)的分布差距的幅度尤其大。這些國(guó)家都有強(qiáng)大的篡改不良數(shù)據(jù)的誘因,因?yàn)槠湄泿乓坏┦艿焦?,就?huì)面臨爆發(fā)經(jīng)濟(jì)危機(jī)的高風(fēng)險(xiǎn)。國(guó)際收支平衡對(duì)于這些國(guó)家來(lái)說(shuō)格外重要,因?yàn)橥顿Y者可以從國(guó)際收支平衡推斷出該國(guó)經(jīng)濟(jì)的對(duì)外失衡程度――例如國(guó)家整體借貸需求以及融資構(gòu)成、是否出現(xiàn)熱錢等。這些問題都會(huì)影響該國(guó)中央銀行在危機(jī)狀態(tài)下保衛(wèi)其貨幣的能力。相反,使用浮動(dòng)匯率制度的國(guó)家,其數(shù)據(jù)分布與本福特定律的吻合程度較高。

另一類首位數(shù)字分布異常的國(guó)家是那些有“經(jīng)常賬戶赤字”的國(guó)家,這類國(guó)家同樣有著對(duì)經(jīng)濟(jì)數(shù)據(jù)進(jìn)行篡改的強(qiáng)大誘因,使其需要對(duì)外偽裝出穩(wěn)健的形象。當(dāng)你向世界其他地區(qū)借款時(shí),你不希望自己看起來(lái)很慘。類似地,那些在凈海外資產(chǎn)項(xiàng)目上負(fù)債最多的國(guó)家,也有著可疑的數(shù)據(jù),可以從中發(fā)現(xiàn)同樣的問題。從地域上來(lái)看,一些非洲國(guó)家和中東地區(qū)國(guó)家的經(jīng)濟(jì)數(shù)據(jù)的首位數(shù)字分布也比較引人懷疑,有的拉美國(guó)家也是如此。但數(shù)據(jù)篡改實(shí)際上是經(jīng)濟(jì)誘因問題,而非文化問題。的確,在經(jīng)濟(jì)困難時(shí)期,國(guó)家經(jīng)濟(jì)數(shù)據(jù)更易遭到篡改。在2008年的最后一個(gè)季度,烏克蘭和斯洛伐克等國(guó)家甚至拒絕公開數(shù)據(jù),預(yù)防爆發(fā)貨幣危機(jī),避免使已發(fā)生的貨幣危機(jī)進(jìn)一步惡化。

最后,如果數(shù)據(jù)造假是個(gè)普遍現(xiàn)象,那么數(shù)字是否還有意義?在任何情況下,投資者對(duì)經(jīng)濟(jì)數(shù)據(jù)都會(huì)留有戒心,持保留態(tài)度。即使是在環(huán)境比較透明的西方國(guó)家,甚至是經(jīng)濟(jì)強(qiáng)健的德國(guó),也會(huì)對(duì)失業(yè)率的定義進(jìn)行調(diào)整,使政府能夠好看一點(diǎn)的經(jīng)濟(jì)數(shù)據(jù)。

(作者為巴黎HEC商學(xué)院經(jīng)濟(jì)學(xué)教授)

統(tǒng)計(jì)學(xué)數(shù)據(jù)分析論文:論文中對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)處理時(shí)需要注意的問題

1 對(duì)基線資料進(jìn)行統(tǒng)計(jì)學(xué)分析

搜集資料應(yīng)嚴(yán)密遵守隨機(jī)抽樣設(shè)計(jì),保證樣本從同質(zhì)的總體中隨機(jī)抽取,除了對(duì)比因素外,其他可能影響結(jié)果的因素應(yīng)盡可能齊同或基本接近,以保證組間的齊同可比性。因此,應(yīng)對(duì)樣本的基線資料進(jìn)行統(tǒng)計(jì)學(xué)分析,以證明組間的齊同可比性。

2 選擇正確的統(tǒng)計(jì)檢驗(yàn)方法

研究目的不同、設(shè)計(jì)方法不同、資料類型不同,選用的統(tǒng)計(jì)檢驗(yàn)方法則不同。例如:2組計(jì)量資料的比較應(yīng)采用t檢驗(yàn);而多組(≥3組)計(jì)量資料的比較應(yīng)采用方差分析(即F檢驗(yàn)),如果組間差異有統(tǒng)計(jì)學(xué)意義,想了解差異存在于哪兩組之間,再進(jìn)一步做q檢驗(yàn)或LSD-t檢驗(yàn)。許多作者對(duì)多組計(jì)量資料進(jìn)行比較時(shí)采用兩兩組間t檢驗(yàn)的方法是錯(cuò)誤的。又如:等級(jí)資料的比較應(yīng)采用Ridit分析或秩和檢驗(yàn)或行平均得分差檢驗(yàn)。許多作者對(duì)等級(jí)資料進(jìn)行比較時(shí)采用檢驗(yàn)的方法是錯(cuò)誤的。

3 假設(shè)檢驗(yàn)的推斷結(jié)論不能絕對(duì)化

假設(shè)檢驗(yàn)的結(jié)論是一種概率性的推斷,無(wú)論是拒絕H0還是不拒絕H0,都有可能發(fā)生錯(cuò)誤(Ⅰ型錯(cuò)誤和Ⅱ型錯(cuò)誤)。因此,假設(shè)檢驗(yàn)的推斷結(jié)論不能絕對(duì)化。

4 P值的大小并不表示實(shí)際差別的大小

研究結(jié)論包括統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論兩部分。統(tǒng)計(jì)結(jié)論只說(shuō)明有無(wú)統(tǒng)計(jì)學(xué)意義,而不能說(shuō)明專業(yè)上的差異大小。P值的大小不能說(shuō)明實(shí)際效果的“顯著”或“不顯著”。統(tǒng)計(jì)結(jié)果的解釋和表達(dá),應(yīng)說(shuō)對(duì)比組之間的差異有(或無(wú))統(tǒng)計(jì)學(xué)意義,而不能說(shuō)對(duì)比組之間有(或無(wú))顯著的差異。P≤0.01比P≤0.05更有理由拒絕H0,并不表示P≤0.01時(shí)比P≤0.05時(shí)實(shí)際差異更大。只有將統(tǒng)計(jì)結(jié)論和專業(yè)知識(shí)有機(jī)地結(jié)合起來(lái),才能得出恰如其分的研究結(jié)論。若統(tǒng)計(jì)結(jié)論與專業(yè)結(jié)論一致,則最終結(jié)論也一致;若統(tǒng)計(jì)結(jié)論與專業(yè)結(jié)論不一致,則最終結(jié)論需根據(jù)專業(yè)知識(shí)而定。判斷被試因素的有效性時(shí),要求在統(tǒng)計(jì)學(xué)上和專業(yè)上都有意義。

5 假設(shè)檢驗(yàn)結(jié)果表達(dá)

P值傳統(tǒng)采用0.05和0.01這2個(gè)界值,現(xiàn)在提倡給出P的具體數(shù)值和檢驗(yàn)統(tǒng)計(jì)量的具體數(shù)值(小數(shù)點(diǎn)后保留3位有效數(shù)字),主要理由是:①以前未推廣統(tǒng)計(jì)軟件之前,需要通過(guò)查表估計(jì)P值,現(xiàn)在使用統(tǒng)計(jì)軟件會(huì)自動(dòng)給出具體的P值和檢驗(yàn)統(tǒng)計(jì)量的具體值(t值、F值、χ2值等)。②方便根據(jù)具體情況判斷問題。例如P = 0.051與P = 0.049都是小概率,不能簡(jiǎn)單地?cái)喽≒ = 0.051無(wú)統(tǒng)計(jì)學(xué)意義而P = 0.049有統(tǒng)計(jì)學(xué)意義。③便于對(duì)同類研究結(jié)果進(jìn)行綜合分析。

6 統(tǒng)計(jì)學(xué)符號(hào)的使用

統(tǒng)計(jì)學(xué)符號(hào)的使用應(yīng)按照GB3358-82《統(tǒng)計(jì)名詞及符號(hào)》的規(guī)定,具體可參閱本刊稿約中的有關(guān)要求。