時間:2023-03-16 16:27:42
序論:在您撰寫多元統(tǒng)計分析論文時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導您走向新的創(chuàng)作高度。
1聚類分析在證券投資中的應用
(1)定義:聚類分析是依據研究對象的特征對其進行分類、減少研究對象的數(shù)目,也叫分類分析和數(shù)值分析,是一種統(tǒng)計分析技術。(2)在證券投資中應用聚類分析,是基于證券投資的各種基本特點而決定的。證券投資中包含著非常多的動態(tài)的變化因素,要認真分析證券投資中各種因素的動態(tài)變化情況,找出合適的方法對這種動態(tài)情況進行把握規(guī)范處理,使投資分析更加的準確、精確。1)彌補影響股票價格波動因素的不確定性證券市場受到非常多方面的影響,具有很大的波動性和不穩(wěn)定性,這種波動性也造成了證券市場極不穩(wěn)定的發(fā)展狀態(tài),這些狀態(tài)的好壞對證券市場投資者和小股民有著非常重要的影響。聚類分析的方法是建立在基礎分析之上的,立足基礎發(fā)展長遠,并對股票的基本層面的因素進行量化分析,并認真分析掌握結果再應用于證券投資實踐中,從股票的基本特征出發(fā),從深層次挖掘股票的內在價值,并將這些價值發(fā)揮到最大的效用。影響證券投資市場波動的因素非常多,通過聚類分析得出的數(shù)據更加的全面科學,對于投資者來說這些數(shù)據是進行理性投資必不可少的參考依據。2)聚類分析深層次分析了與證券市場相關的行業(yè)和公司的成長性聚類分析是一種非常專業(yè)的投資分析方法,它善于利用證券投資過程中出現(xiàn)的各種數(shù)據來對證券所涉及的各種行業(yè)和公司進行具體的行業(yè)分析,這些數(shù)據所產生額模型是證券投資者進行證券投資必不可少的依據。而所謂成長性是一種是一個行業(yè)和一個公司發(fā)展的變化趨勢,聚類分析通過各種數(shù)據總結歸納出某個行業(yè)的發(fā)展歷史和未來發(fā)展趨勢,并不斷的進行自我檢測和自我更新。并且,要在實際生活中更好的利用這種分析方法進行分析研究總結,就要有各種準確的數(shù)據來和不同成長階段的不同參數(shù),但是,獲取這種參數(shù)比較困難,需要在證券市場實際交易和對行業(yè)和公司的不斷調查研究中才能得出正確的數(shù)據。因此,再利用聚類分析法進行行業(yè)和公司分析和證券投資分析時要注重選取正確的、關鍵的指標進行檢查,例如主營收入增長率、凈利潤增長率等指標,這樣才有利于正確預測證券市場上股票的發(fā)展?jié)摿Α?)在實際操作中更加直觀實用聚類分析是根據現(xiàn)代證券市場發(fā)展水平和特點發(fā)展出來的新的分析方法,這種分析方法的出現(xiàn)與現(xiàn)代的基本的投資組合理論形成了比較,突出了聚類分析方法更加貼近實際生活,更加直觀、實用的特點,并且由于技術的發(fā)展,聚類分析方法在實際應用中所受到的局限較小,而且易操作,因此它的適用范圍就比現(xiàn)資理論更加的廣泛。
2主成分分析在證券投資中的應用
(1)定義:在統(tǒng)計分析中,主成分分析是一種分析、簡化數(shù)據集的技術。主成分分析經常用減少數(shù)據集的維數(shù),同時保持數(shù)據集的對方差貢獻最大的特征。主成分分析由卡爾•皮爾遜于1901年發(fā)明,用于分析數(shù)據及建立數(shù)理模型。其方法主要是通過對協(xié)方差矩陣進行特征分解,以得出數(shù)據的主成分(即特征矢量)與它們的權值。(2)主成分分析的應用非常廣泛,判別分析的分析方法就是通過對各種分類數(shù)據的研究,分析出自變量各組間存在的差異,并總結出差異性,判斷哪一個自變量對組間差異的貢獻是否完全,根據這些數(shù)據將自變量的轉變方法進行樣本歸類。1)降低影響證券投資市場變動的因素之間的互相影響在證券市場中有非常多的因素在影響著證券市場的穩(wěn)定,這些因素之間有著非常多的關系,相互影響、相互關聯(lián),但相互之間的影響也存在著非常多的影響。而主成分分析方法就是在對影響證券投資相互關系的因素中進行分析,并對原始數(shù)據指標變量進行認真分析,將其中重要的主成分因素概括出來,并進行轉換形成相互彼此相互獨立的成分,而且經過實踐證明在影響證券市場投資分析中的指標間相關程度越高,主成分分析效果越好。2)通過主成分分析減少指標選擇的工作量主成分分析的目的就是要通過對各種數(shù)據、因素的分析總結出相對各種因素的不同影響程度,總結總體因素中的主要影響成分,并總結出不同層次的影響因素梯度,在分析時采取逐級分析的方法,這樣既可以抓住主要矛盾進行分析,也可以節(jié)省時間,并且提高分析的準確性,減少分析人員的工作量,因此,主成分分析法指標選擇上的優(yōu)勢更加的突出。3)由主成分分析法構造回歸模型更加的精確、節(jié)省時間在進行證券投資因素分析時,為了能夠更加清晰準確的對模型中的相關數(shù)據進行分析,都要對各種數(shù)據進行模型處理,這樣的處理方式可以提高整個證券投資分析的準確性,是模型更加易于做出結構分析、控制和進行證券市場變動的預報。
3因子分析
(1)定義:因子分析是指研究從變量群中提取共性因子的統(tǒng)計技術。最早由英國心理學家C.E.斯皮爾曼提出。因子分析可在許多變量中找出隱藏的具有代表性的因子。將相同本質的變量歸入一個因子,可減少變量的數(shù)目,還可檢驗變量間關系的假設。(2)應用因子分析最主要的作用是確定證券投資組合的模型。因子分析將影響股票價格的各種因素看成是不同的變量,建立股價因子模型,利用各因子不相關性確定股票的分類,再分析股票的發(fā)展?jié)摿Φ幕A上確定出合適的證券投資模型。
4總結
主成分分析法,又稱主分量分析法是指相關的經濟變量間通常存在著起主導作用的決定性因素,通過對原始變量的相關矩陣內部結構進行分析,找出幾個不相關的綜合指標來線性表示原來的變量,主成分之間既互不相關,又盡可能多的包含了原指標集合。這種方法首先由Hotelling提出,其主要思想是降維。Stone(1947)對美國1929-1938年間的17項國民經濟統(tǒng)計指標進行主成分分析,發(fā)現(xiàn)完全可以用三個經濟指標來概括原來的17項指標,大大簡化了數(shù)據分析。M.Scott(1961)對英國157個城鎮(zhèn)的發(fā)展水平進行主成分分析,發(fā)現(xiàn)原57個測度指標完全可以由5個綜合變量替代,既解決了原指標間的信息重疊問題,又簡化了原指標體系的指標結構,主成分分析由此推廣。邱東(1990)系統(tǒng)闡述了主成分分析法的定義、基本思想、基本步驟和特點,認為主成分分析法可以消除評價指標間的相關影響,并且伴隨數(shù)學變換過程生成信息量權數(shù)和系統(tǒng)效應權數(shù),保證了客觀性。同時也指出了主城分析法在計算綜合評價值未充分考慮指標的重要程度等不足,主要適用于被評價對象較多的綜合評價。隨后,眾多學者對此提出了改進:孟生旺(1992)針對原始數(shù)據的標準化處理和主成分個數(shù)的選擇問題,認為標準化不如均值化的無量綱處理方法,提出了非標準化主成分分析法。陳述云等(1995)通過對原始數(shù)據作對數(shù)—中心化轉換,用原始變量的非線性組合表示主成分,同時重點分析樣本協(xié)方差矩陣而非相關系數(shù)矩陣,提出了非線性主成分法。朱泰英等(2004)提出了加權主成分分析法,認為可以將主成分分析法的客觀分析和層次分析法的主觀分析有機結合。王璐等(2006)在對主成分分析法的權數(shù)、降維等問題的研究上,提出了首先要按主成分分析法對指標體系進行分類,得到各方面的評價值后再進行主成分分析,最終得到綜合評價值的二重主成分分析法。段力誌等(2009)在傳統(tǒng)主成分分析法基礎上,首先對原始指標值進行預處理,再借助軟件,將原始數(shù)據轉化為少數(shù)幾個主成分的線性組合,并進行加權變換,得到改進的主成分綜合值。白雪梅等(1995)則分析了“均值化”、“標準化”、“極差正規(guī)化”三種方法的選擇條件是保證方差損失最小。陳衍泰等(2004)認為主成分分析法具有全面性、可比性和客觀合理性等優(yōu)點,比較適合對評價對象進行分類,但需要大量數(shù)據,函數(shù)意義不夠明顯,不能反映客觀發(fā)展水平。蘇為華(2012)提出經典的R型主成分本質是單項指標標準化結果的加權算術平均值,比當量平均法復雜。趙利等(2013)通過主成分分析法對宏觀經濟中影響城鎮(zhèn)勞動就業(yè)因素分析時,提出主成分為宏觀經濟和技術進步,通過VAR模型對主成分進行分析,得出宏觀成分中對城鎮(zhèn)勞動就業(yè)影響最大的是消費、產業(yè)結構和城市化水平,而技術進步成分中影響最大的是技術進步的結論。黃利文(2013)針對主成分分析中存在的未考慮負向因子的影響,以及采用線性加權法時確定權重方法不統(tǒng)一,評價結果非唯一等缺陷,提出了逼近理想點的主成分分析法,更好地反映了原始數(shù)據信息,并較為客觀地給出了綜合評價結果。林海明等(2013)認為主成分分析因缺乏應用條件的考慮而導致評價結果不具合理性甚至錯誤,通過分析因子分析法因子載荷陣的簡單結構、加權算術平均數(shù)的合理性,得出主成分分析的應用條件是:指標是正向、標準化的;主成分載荷陣達到更好的簡單結構時,主成分正向,且主成分與變量顯著相關。
二、因子分析
法因子分析法是指從被評對象的觀察變量的相關度出發(fā),利用降維的思想,把繁雜的變量盡可能歸納為幾個綜合因子進行分析的的一種多變量統(tǒng)計分析方法。其基本思想是:將觀察變量按相關度的高低或聯(lián)系的緊密程度進行分類,類別內部變量相關性高,聯(lián)系緊密,而類別之間的變量則相關度較低,聯(lián)系稀疏,每一類變量則代表一個公共因子。具體步驟為:
三、逼近理想解的排序法
關于醫(yī)學論文數(shù)據、資料的統(tǒng)計分析方法,總結如下:
1.定量資源
對于定量資料,應根據所采用的設計類型、資料所具備的條件和分析目的,選用合適的統(tǒng)計分析方法,不應盲目套用t檢驗和單因索方差分析;
2.定性資源
對于定性資料,應根據所采用的設計類型、定性變量的性質和頻數(shù)所具備的條件以及分析目的,選用合適的統(tǒng)計分析方法,不應盲目套用X-檢驗;
3.回歸分析
對于回歸分析,應結合專業(yè)知識和散布圖,選用合適的回歸類型,不應盲目套用簡單直線回歸分析,對具有重復實驗數(shù)據的回歸分析資料,不應簡單化處理;
4. 多因索、多指標資料
關鍵詞:多元統(tǒng)計分析;教學內容;教學方法
中圖分類號:G424.21 文獻標識碼:A 文章編號:
多元統(tǒng)計分析是統(tǒng)計學中的一個重要分支,是收集、處理和分析多維樣本數(shù)據的統(tǒng)計方法。特別是隨著計算機技術的發(fā)展,計算軟件的普及,多元統(tǒng)計分析已成為分析多元數(shù)據的一個重要工具,在自然科學、管理和社會科學、經濟領域等都有廣泛的應用。
多元統(tǒng)計分析是我校財經管理類本科生大部分專業(yè)的一門必修課程,總學時為45學時,其中理論教學時數(shù)36學時,實踐教學時數(shù)時。該課程涉及到許多數(shù)學知識,有大量的理論和公式推導,且計算量比較大。同時,本課程的學生為財經管理類的本科生,大多數(shù)學基礎不好,且學生基礎差異較大,部分學生感覺本門課程學習有困難。本文根據本學科的特點和學生的實際情況,結合自己從事多元統(tǒng)計教學的實踐和體會,提出幾點思考,以供同行參考,共同探討。
一、重視統(tǒng)計方法的應用
針對財經管理類本科生數(shù)學基礎較弱的情況,在教學過程中,理論推導部分不必講解過多,也不應該過分強調復雜的數(shù)學證明和公式推導。對于多元統(tǒng)計分析的每一種統(tǒng)計方法,重點闡述它們的統(tǒng)計思想,結合實例介紹涉及到的背景,在實際應用中需要解決什么問題,如何用這種統(tǒng)計來解決這些問題,用了這種統(tǒng)計方法后可以得到什么結果。以及各種方法應用的前提條件、適用范圍和局限性等,教學重點從理論轉移到實際應用中。為了加深學生對概念的理解,適當做一些數(shù)學推導,可以省略復雜的證明。例如在聚類分析的教學中, 借助“物以類聚,人以群分”的道理給出了“就近原則”, 聚類分析的基本思想就容易被學生接受, 然后再逐步引入為了實現(xiàn)就近原則的度量遠近的距離及各種具體聚類方法。學生在短時間內就對統(tǒng)計方法有了理解,效果非常明顯。
二、重視各種多元統(tǒng)計方法的聯(lián)系
各種多元統(tǒng)計分析方法雖各自具有不同的特點,但它們彼此之間均有著緊密的聯(lián)系。在解決實際的問題中,也需要用多種方法結合起來解決問題,對于這一點一定要講清楚。在聚類分析和判別分析的介紹中,我們介紹了在度量工具選擇上兩種方法的共同點。同時,聚類分析與判別分析有以下的不同點:①聚類分析可以對樣本進行分類,也可以對指標進行分類;而判別分析只能對樣本進行判別歸類;②聚類分析事先不知道事物的類別,也不知道應分幾類;而判別分析必須事先知道事物的類別;③聚類分析直接對樣本進行分類,而判別分析根據訓練樣本建立判別函數(shù),然后對新的觀測對象進行判別歸類。在實際問題處理中,針對聚類分析歸類,判別分析分類的特點,常常將兩種統(tǒng)計方法結合使用。在因子分析的基本思想、數(shù)學模型、因子載荷矩陣的估計方法、因子得分等幾個環(huán)節(jié)的學習中, 我們隨時將主成分分析的相關內容拿來與之比較分析, 分析了兩種方法在模型、參數(shù)唯一性、取舍因子等問題上的不同與使用環(huán)境等方面的共同之處, 學生不僅對因子分析有了深入理解,而且對主成分分析的內容有所復習,更容易實現(xiàn)對著兩種統(tǒng)計方法的掌握。
三、重視統(tǒng)計軟件地使用
各種多元統(tǒng)計方法解決的是大量多維數(shù)據的分析問題,自然離不開復雜數(shù)據的計算,所以在教學中必須重視統(tǒng)計軟件的學習,完成大量的計算過程。SPSS軟件簡單易學,操作方便、功能強大、應用廣泛,可以進行大部分多元統(tǒng)計分析方法的操作,基本能滿足教學和實踐上計算的需要。且在多元統(tǒng)計分析課程之前,學生已學過SPSS課程,對軟件的應用也基本掌握。在教學過程中,當介紹每一種統(tǒng)計方法的基本思想、原理后,先對教材上的已有詳細步驟和結果的例題進行操作,使學生將統(tǒng)計軟件操作結果與其進行比較。進一步要求學生針對某一專題或結合自身專業(yè),對某一實際問題收集數(shù)據,整理數(shù)據,利用軟件進行具體分析操作,得到自己需要的結果。但是在教學過程中,需要讓學生知道統(tǒng)計軟件只是一種分析工具, 重點還是掌握各種統(tǒng)計分析方法的基本原理和科學選用上。同時,結合自己的一些研究課題,與學生一起探討、研究,培養(yǎng)學生初步的科研能力。
四、合理制定考試方式和內容, 科學評定學生成績
針對多元統(tǒng)計分析課程的特點,本門課程考核不僅要注重基本知識點的掌握,也要包括各種統(tǒng)計方法的理解、分析和應用。在考試的方式上,可以采用閉卷考試,開卷考試和課程論文相結合,從而多角度、全方位對學生的學習成績給予綜合評價。通過以上多種方式,考察學生理解能力、跨學科綜合能力、解決實際問題的能力及創(chuàng)新能力。在考試的內容上,閉卷考試著重考查學生對各種統(tǒng)計方法和理論知識的掌握程度,并對量不大的數(shù)據進行處理;開卷考試以學生上機操作的方式進行,著重考查學生利用統(tǒng)計軟件處理多元數(shù)據的熟練程度,以及對統(tǒng)計軟件輸出結果進行分析判斷和解釋說明的統(tǒng)計素養(yǎng);課程論文側重于考查學生運用多元統(tǒng)計方法解決實際問題的能力及創(chuàng)新能力。總成績則有閉卷考試成績(占60%)、開卷考試(占20%)和課程論文成績(占20%)三部分組成,從而科學評價學生對本門課程的掌握情況。
多元統(tǒng)計分析作為多元數(shù)據處理的一個重要工具, 必將隨著社會的需要而不斷的有廣泛的應用。多元統(tǒng)計分析教學模式的選擇必須根據教學的需要和學生的實際接受水平發(fā)生改變。而作為教師,需要不斷地總結經驗,完善自己的教學,不懈努力,傳授給學生正確的統(tǒng)計思想, 實用的統(tǒng)計方法和綜合的統(tǒng)計能力。
參考文獻:
1何曉群. 多元統(tǒng)計分析[M]. 中國人民大學出版社,2012.
2任雪松,于秀林. 多元統(tǒng)計分析[M]. 中國統(tǒng)計出版社,2011.
3蘇金明,傅榮華等. 統(tǒng)計軟件SPSS系列應用實戰(zhàn)篇[M]. 北京: 電子工業(yè)出版社,2002.
4張文彤,鄺春偉.SPSS統(tǒng)計分析基礎教程[M]. 北京:高等教育出版社,2011.
5呂潔. 多元統(tǒng)計分析課程教學探討[J].中國成人教育,2007 ( 8): 153- 154.
6陶勝,胡明穎. 多元統(tǒng)計分析課程教學研究與實踐[J]. 集美大學學報, 2011( 2): 99- 102.
2012年12月份,我國生產化學農藥原藥(折百)34.2萬噸,同比增長9.97 %。2012年1-12月,全國的產量達35
>> 2014年全國化學農藥原藥產量情況 統(tǒng)計局:2013年11月我國化學農藥產量同比增長2.79% 2012―2015年我國煤礦瓦斯事故統(tǒng)計分析 2008年~2012年我國高校檔案學研究生統(tǒng)計分析 2000—2012年:我國教育技術相關著作統(tǒng)計分析 1998年-2008年我國網球碩博論文統(tǒng)計分析 我國媒介融合研究統(tǒng)計分析 我國能源結構的統(tǒng)計分析 近30年我國綜合檔案館研究論文統(tǒng)計分析 2002年~2011年我國“棄檔”現(xiàn)象研究論文的統(tǒng)計分析 2005年~2015年我國檔案安全應急預案研究文獻統(tǒng)計分析 《檔案管理》2012年載文統(tǒng)計分析 2012年我中心門診使用抗高血壓藥物統(tǒng)計分析 1985~2007年我國國際競爭力論文的統(tǒng)計分析 19877―20166年我國檔案法規(guī)研究期刊論文統(tǒng)計分析 2013年10月中國化學農藥產量同比下調6.08% 基于多元統(tǒng)計分析的我國各省級區(qū)域經濟分析 USPTO中我國專利引用狀況的統(tǒng)計分析 FDI與我國經濟增長之間關系的統(tǒng)計分析 我國入境旅游人數(shù)統(tǒng)計分析與模型預測 常見問題解答 當前所在位置:中國 > 科技 > 2012年我國化學農藥原藥產量統(tǒng)計分析 2012年我國化學農藥原藥產量統(tǒng)計分析 雜志之家、寫作服務和雜志訂閱支持對公帳戶付款!安全又可靠! document.write("作者: 本刊編輯部")
申明:本網站內容僅用于學術交流,如有侵犯您的權益,請及時告知我們,本站將立即刪除有關內容。 2012年12月份,我國生產化學農藥原藥(折百)34.2萬噸,同比增長9.97 %。2012年1-12月,全國的產量達354.9萬噸,同比增長19%。 從各省市的產量來看,2012年1-12月,江蘇省化學農藥原藥(折百)的產量達105.58萬噸,占全國總產量的29.75 %。緊隨其后的是山東省、浙江省和湖北省,分別占總產量的23.25 %、8.47 %和8.34 %。 殺蟲劑原藥產量同比下降11.96% 2012年12月份,我國生產殺蟲劑原藥7.92萬噸,同比下降29.36 %。2012年1-12月,全國的產量達81.34萬噸,同比下降11.96 %。 從各省市的產量來看,2012年1-12月,湖南省殺蟲劑原藥的產量達24.93萬噸,占全國總產量的30.65 %。緊隨其后的是江蘇省、山東省和湖北省,分別占總產量的29.53 %、9.22 %和8.94 %。 殺菌劑原藥產量同比下降7.08 % 2012年12月份,我國生產殺菌劑原藥14383.11 噸,同比增長1.86 %。2012年1-12月,全國的產量達143893 噸,同比下降7.08 %。 從各省市的產量來看,2012年1-12月,江蘇省殺菌劑原藥的產量達60458.42 噸,占全國總產量的42.02 %。緊隨其后的是浙江省、安徽省和寧夏回族自治區(qū),分別占總產量的13.92 %、9.39 %和8.74 %。除草劑原藥產量同比增長42.55% 2012年12月份,我國生產除草劑原藥16.27萬噸,同比增長40.74%。2012年1-12月,全國除草劑原藥的產量達164.79萬噸,同比增長42.55%。 從各省市的產量來看,2012年1-12月,山東省除草劑原藥的產量達67.13萬噸,同比增長88.65%,占全國總產量的40.74%。緊隨其后的是江蘇省、浙江省和湖北省,分別占總產量的20.41%、10.27%和9.18%。(摘編自《中商情報網》)
論文關鍵詞:R軟件,聚類分析,主成分分析,典型相關分析
引言:多元統(tǒng)計分析是統(tǒng)計學的一個重要分支,也稱多變量統(tǒng)計分析;在現(xiàn)實生活中,受多種指標共同作用和影響的現(xiàn)象大量存在,多元統(tǒng)計分析就是研究多個隨機變量之間相互依賴關系及其內在統(tǒng)計規(guī)律的重要學科,由于多元統(tǒng)計分析方法一般涉及復雜的數(shù)學理論,一般無法用手工計算,必須有計算機和統(tǒng)計軟件的支持。
在統(tǒng)計軟件方面,常用的統(tǒng)計軟件有SPSS、SAS、STAT、R、S-PLUS等。R軟件是一個自由、免費、開源的軟件,是一個具有強大統(tǒng)計分析功能和優(yōu)秀統(tǒng)計制圖功能的統(tǒng)計軟件,現(xiàn)已是國內外眾多統(tǒng)計學者喜愛的數(shù)據分析工具。本文結合實例介紹了R軟件在多元統(tǒng)計分析中的應用,具體內容包括R軟件在聚類分析、主成分分析、對應分析等方面的應用。
一 在聚類分析教學中的應用
聚類分析又稱群分析,它是研究(樣品或指標)分類問題的一種多元統(tǒng)計方法,所謂類,通俗地說,就是指相似元素的集合。在社會經濟領域中存在著大量分類問題,比如若對某些大城市的物價指數(shù)進行考察聚類分析,而物價指數(shù)很多,有農用生產物價指數(shù)、服務項目價指數(shù)、食品消費物價指數(shù)、建材零售價格指數(shù)等等。由于要考察的物價指數(shù)很多,通常先對這些物價指數(shù)進行分類??傊?,需要分類的問題很多,因此聚類分析這個有用的工具越來越受到人們的重視,它在許多領域中都得到了廣泛的應用。
聚類分析內容非常豐富,有系統(tǒng)聚類法、有序樣品聚類法、動態(tài)聚類法、模糊聚類法、圖論聚類法、聚類預報法等,具體詳見參考文獻[3]。
R軟件及其相關包提供了各種聚類方法,主要是系統(tǒng)聚類方法、快速聚類方法、模糊聚類方法,常用的是系統(tǒng)聚類方法。
R軟件實現(xiàn)系統(tǒng)聚類的程序如下:
Hclust(d,method=“complete”)
其中d是由“dist”構成的距離結構,具體包括絕對值距離、歐氏距離、切比雪夫距離、馬氏距離、蘭氏距離等,默認為歐氏距離;method包括類平均法、重心法、中間距離法最長距離法最短距離法、離差平方和法等,默認是最長距離法。
例1 下表是山東省2008年各市居民家庭平均每人全年消費性支出,利用所給數(shù)據對各市進行系統(tǒng)聚類。
山東各市居民家庭平均每人全年消費性支出 元/人
地區(qū)
食品
衣著
居住
設備用品
交通通訊
文化教育
醫(yī)療保健
其它
濟南
1628.16
252.86
790.11
285.64
634.83
355.54
394.37
43.9
青島
1999.61
523.76
901.56
297.76
595.34
618.12
260.17
106.42
淄博
1691.6
372.21
844.44
300.46
494.67
580.6
370.84
102.16
棗莊
1370.59
272.95
614.3
227.52
454.73
245.93
220.88
84.2
東營
1580.86
234.17
813.58
253.12
532.19
432.05
275.3
39.1
煙臺
1673.19
337.92
719.28
201.3
414.08
497.57
286.03
77.11
濰坊
1516.36
299.67
1327.72
243.72
583.04
494.65
269.82
92.95
濟寧
1375.4
287.17
722.05
282.16
380.68
412.42
218.11
56.94
泰安
1412.44
225.66
567.66
257.96
411.98
450.57
177.02
70.07
威海
1684.64
517.59
759.36
227.12
424.41
565.75
444.31
77.48
日照
1451.12
351.21
562.91
208.81
457.2
332.16
182.2
37.69
萊蕪
1516.22
198.94
624.72
207.03
464.06
469.35
256.53
36.33
臨沂
1339.69
212.36
625.26
191.34
409.39
314.9
156.01
63.31
德州
1114.47
173.88
553.14
169.23
319.41
220.45
137.97
42.2
聊城
1146.53
182.53
566.92
186.05
317.48
332.64
155.94
54.31
濱州
1177.49
179.96
979.01
206.88
451.85
407.49
298.7
47.51
菏澤
1265.03
170.85
550.68
143.11
329.99
349.41
Abstract: According to the university scientific research data in nearly ten years, the factor analysis and cluster analysis statistical methods in the multivariate statistical analysis are used to carry out the comprehensive evaluation analysis of the college scientific research status and put forward a method for evaluating the state of the research. Research shows that, in some colleges, the first factor is very high, indicating that these colleges in cutting-edge academic research achievements. But at the same time, the third factor is low, indicating that these colleges and enterprises to contact the lack of scientific research. In other colleges, the second factor is very high, indicating that these colleges in the per capita contribution rate, C class paper per capita contribution rate and other aspects to do better. In addition, some of the college's third factor is very high, indicating that these colleges are closely related to the enterprise's scientific research and cooperation. The results of the subsequent cluster analysis also confirmed the rationality of the conclusion of the comprehensive evaluation analysis. Through the study of this paper, it provides a theoretical basis for the scientific management system and evaluation system of scientific research achievements.
關鍵詞: 高校;科研狀況;因子分析;聚類分析;評價
Key words: colleges and universities;research status;factor analysis;cluster analysis;evaluate
中圖分類號:G463 文獻標識碼:A 文章編號:1006-4311(2016)31-0015-04
0 引言
科研能力是衡量一所高??平趟降闹匾獦酥尽D掣咝W鳛槭≈攸c高校有著悠久的辦學歷史,科研水平在省內也是名列前茅,本文針對該高校20個學院的各項科研指標進行多元統(tǒng)計分析,建立了描述科研水平的各類變量,包括各類科研項目的經費總額、各類論文的發(fā)表數(shù)量、論著發(fā)表數(shù)量,投入科研人員數(shù)量等。但由于各學院規(guī)模不一,各學院科研性質也不盡相同,為了保證研究結果的平衡性,本文采用對科研成果人均貢獻率的方式進行研究。然而進行統(tǒng)計分析時,并非變量收集的越多越有利,變量間信息的高度相關、高度重疊會給統(tǒng)計方法的應用帶來許多困難,因此本文借助SPSS統(tǒng)計分析軟件,采用因子分析方法,在眾多變量中提取影響各學院科研狀況的主要因子對問題進行分析,最后通過因子變量的聚類分析對評價結果進行驗證。國內學者目前主要集中對我國體育事業(yè)進行科研狀況分析,如賈志強、鄭巖平對我國1995-2000年籃球科研狀況作了分析。張金、夏秀榮對我國1994-2003年排球科研狀況作了分析。在高??蒲袪顩r分析方面,孟學英、陳春華利用調查問卷方式對我國部分高職院校教師科研狀況做了調查分析。同時國內對多元統(tǒng)計方法的應用也主要集中在醫(yī)療、經濟方面,如孟瑩、謝守祥等利用多元統(tǒng)計分析方法對江蘇省經濟差異化做了分析。王曦、宋劍南利用多元統(tǒng)計分析方法對影響中醫(yī)癥候的主要因素做了研究。利用多元統(tǒng)計分析方法結合高效科研狀況評價分析還鮮有研究。本文結合多元統(tǒng)計分析分析方法對某高校科學地建立高??蒲袠I(yè)績的管理體系及評價體系提供了理論依據。
1 因子分析方法簡介
因子分析是利用降維的思想,由研究原始變量相關矩陣內部的依賴關系出發(fā),把一些具有錯綜復雜關系的變量歸結為少數(shù)幾個綜合因子的一種多變量統(tǒng)計分析方法。因子分析的基本思想是根據相關性大小把原始變量分組,使得同組內的變量之間相關性較高,而不同組的變量之間的相關性則較低。每組變量代表一個基本結構,并用一個不可觀測的綜合變量表示,這個基本結構就稱為公共因子。對于所研究問題的某一具體問題,原始變量可以分解成兩部分之和的形式,一部分是少數(shù)幾個不可測的所謂公共因子的線性函數(shù),另一部分是與公共因子無關的特殊因子。進行因子分析的步驟如下:①根據研究問題選取原始變量。②對原始變量進行標準化并求其相關陣,分析變量之間的相關性。③求解初始公共因子及因子載荷矩陣。④因子旋轉。⑤因子得分。⑥根據因子得分值進行進一步分析。
2 各學院科研狀況的因子分析
2.1 數(shù)據分析和指標選取
本文選用的數(shù)據來源于某高校2006年至2015年的統(tǒng)計數(shù)據。設定數(shù)據中8個指標變量分別是X1:2006-2015年橫向項目金額人均貢獻率(萬元/人);X2:2006-2015年市校級項目金額人均貢獻率(萬元/人);X3:2006-2015年省部級項目金額人均貢獻率(萬元/人);X4:2006-2015年國家級項目金額人均貢獻率(萬元/人);X5:A類論文人均貢獻率(篇/人);X6:B類論文人均貢獻率(篇/人);X7:C類論文人均貢獻率(篇/人);X8:論著數(shù)量人均貢獻率(項/人)。數(shù)據詳情見表1。
在進行數(shù)據分析前,進行KMO檢驗,P值為0.000,檢驗結果是顯著的,同時KMO值達到0.577,結果見表2,表明數(shù)據之間具有一定的相關性,可進行因子分析。
從表3變量共同度表中可以看出因子分析的變量共同度均較高,表明變量中的大部分信息均被因子所提取,說明因子分析的結果是有效的。
2.2 因子提取和因子解釋
現(xiàn)應用主成分分析法來進行因子提取和因子個數(shù)的確定,從表4中可以看出只有前三個因子特征根大于1,并且前三個因子特征值之和接近80%,故提取前三個因子基本包含了全部測評指標的絕大部分信息,因子分析效果較理想。
由于初始載荷陣結構不夠清晰,不便于對因子進行解釋,因此對因子載荷矩陣實行旋轉,達到簡化結構的目的,使各變量在某些因子上有較高載荷,而在其余因子上只有小到中等的載荷。這里采用方差最大正交旋轉法進行因子旋轉。結果見表5。
從旋轉后的因子載荷矩陣來看,第一個主因子在省部級項目金額人均貢獻率、國家級項目金額人均貢獻率、A類論文人均貢獻率、B類論文人均貢獻率上具有較高載荷,第二個主因子在C類論文人均貢獻率、論著數(shù)量人均貢獻率上具有較高載荷,第三個主因子在橫向項目金額人均貢獻率、市校級項目金額人均貢獻率上具有較高載荷。
2.3 因子得分和因子變量
本文采用回歸法估計因子得分系數(shù),并輸出因子得分系數(shù)矩陣見表6。
根據表6可寫出以下因子得分函數(shù):F1=-0.014橫向項目金額人均貢獻率-0.078市校級項目金額人均貢獻率+0.263省部級項目金額人均貢獻率+0.293國家級項目金額人均貢獻率+0.178A類論文人均貢獻率+0.508B類論文人均貢獻率+0.021C類論文人均貢獻率+0.174論著人均貢獻率(1);F2=-0.159橫向項目金額人均貢獻率+0.065市校級項目金額人均貢獻率+0.00省部級項目金額人均貢獻率-0.057國家級項目金額人均貢獻率-0.235A類論文人均貢獻率+0.393B類論文人均貢獻率+0.328C類論文人均貢獻率+0.570論著人均貢獻率(2);F3=0.442橫向項目金額人均貢獻率+0.582市校級項目金額人均貢獻率+0.123省部級項目金額人均貢獻率+0.010國家級項目金額人均貢獻率-0.076A類論文人均貢獻率-0.219B類論文人均貢獻率+0.384C類論文人均貢獻率-0.010論著人均貢獻率(3)
通過上述公式(1)、公式(2)和公式(3)可得到各個學院的因子得分。從而獲得三個因子變量,由于這三個因子變量是線性無關的。因此,可以利用它們對各個學院的科研狀況做統(tǒng)計分析。
3 各學院科研狀況的綜合評價分析
下面利用三個因子變量對2006年-2015年該高校各學院科研狀況做多元統(tǒng)計分析,并對各學院近10年來科研狀況進行綜合評價。
首先畫出三因子變量的散點圖,對各學院近10年來科研狀況做對比分析。以第一因子變量為橫坐標,第二因子變量為縱坐標,第三因子變量為豎坐標的三維散點圖如圖1所示。
從圖1中可以看出P學院、O學院、M學院等的第一因子很高。說明這些學院在國家級項目人均貢獻率、省部級項目人均貢獻率、A類論文人均貢獻率、B類論文人均貢獻率上成績突出,但在橫向項目人均貢獻率上稍顯不足,這些學院應該在保持尖端學術科研的前提下,多加強與企業(yè)的合作,創(chuàng)造更多產業(yè)應用成果。L學院、R學院、N學院等的第二因子很高,說明這些學院在論著人均貢獻率、C類論文人均貢獻率上成績突出,這與這些學院的科研性質是密不可分的,第二因子很高的學院可以在保持自己科研特色的前提下,多關注學術前沿的相關信息,爭取在尖端科研中有更大的突破。如B學院、I學院等的第三因子很高,說明這些學院在橫向項目人均貢獻率上成績突出,這些學院可以在緊密保持與企業(yè)的科研聯(lián)系的基礎上,加強自己在學科特色科研中的研究,多出一些基礎研究方面的尖端科研學術成果,增強學院在科研創(chuàng)新中的能力。
最后利用系統(tǒng)聚類分析法對各學院科研狀況進行聚類分析,即利用三因子變量對20個學院進行聚類,結果如表7所示,M學院、P學院、O學院和J學院為一類,B學院、I學院為一類,其它學院為一類。這個結果與散點圖分析的情況基本類似。
4 結束語
本文針對某高校各學院科研狀況進行綜合評價分析,通過對高校近十年科研指標數(shù)據進行因子分析,將八個指標變量分為三個科研因子,分別是高端科研因子、校企合作科研因子、基礎科研因子,并給出了因子得分模型,對各學院近十年的科研狀況給出了分析,最終的聚類分析結果也對各學院科研狀況做了驗證說明。論文的研究成果為科學地建立高校科研業(yè)績的管理體系及評價體系提供了理論依據。
從分析結果來看,因學院科研特色不同,導致各個學院在學術科研這個萬花筒中所扮演的角色也各不相同,但各學院之間還是應當加強科研合作,取他人之長補己之短,這樣才能為該高校向科研大校、科研強校的進軍道路上打下堅實的基礎。
參考文獻:
[1]薛薇.SPSS 統(tǒng)計分析方法及應用[M].二版.北京:電子工業(yè)出版社,2006:303-349.
[2]張文彤.SPSS11統(tǒng)計分析教程―高級篇[M].北京:北京希望電子出版社,2002:166-210.
[3]李衛(wèi)東.應用多元統(tǒng)計分析[M].北京:北京大學出版社,2008:226-240.
[4]閻慈琳.關于主成分分析做綜合評價的若干問題[J].數(shù)理統(tǒng)計與管理,1998(2):22-24.
[5]胡永宏,賀思輝.綜合評價方法[M].北京:經濟科學出版社, 2000.
[6]何曉群.現(xiàn)代統(tǒng)計分析方法與應用[M].北京:中國人民大學出版社,2003,8:15-18.