時間:2022-09-21 05:37:48
序論:在您撰寫醫(yī)學(xué)統(tǒng)計學(xué)論文時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。
1.1單因素方差分析(ANOVA)兩兩比較誤用獨(dú)立樣本t檢驗(yàn)單因素方差分析設(shè)計3組以上的均數(shù)比較,如果總體比較有差異,需進(jìn)行兩兩比較,一般用SNK法或LSD法。但部分研究者卻將資料進(jìn)行拆分,應(yīng)用獨(dú)立樣本t檢驗(yàn)進(jìn)行兩兩比較,導(dǎo)致第Ⅰ類統(tǒng)計學(xué)錯誤發(fā)生率(假陽性率)增加,從而掉進(jìn)了一個常見的“統(tǒng)計陷阱”,使所得結(jié)論可信度大大降低甚至得出錯誤結(jié)論。SNK法與LSD法雖然并非等價,實(shí)質(zhì)是一致的。SNK法一般用于經(jīng)方差分析結(jié)果具有統(tǒng)計學(xué)意義時才決定進(jìn)行的兩兩事后比較,而LSD法可用于方差分析不足以具有統(tǒng)計學(xué)意義時也能進(jìn)行兩兩比較[1]。比較兩種方法在SPSS的輸出結(jié)果形式,SNK是“分堆”比較,一目了然,對于組別數(shù)較多的研究更為好用,但沒有具體P值,而LSD是在進(jìn)行“兩兩”比較時,能給出具體的P值。
1.2兩兩比較時檢驗(yàn)水準(zhǔn)的重新調(diào)定χ2檢驗(yàn)或秩和檢驗(yàn)3組以上整體比較有差異時,需應(yīng)用分割法進(jìn)行兩兩比較,這時檢驗(yàn)水準(zhǔn)應(yīng)由原0.05調(diào)定為0.0167,否則會增加第Ⅰ類統(tǒng)計學(xué)錯誤的發(fā)生率。特別當(dāng)P值處于0.0167~0.05時,按照P<0.0167的標(biāo)準(zhǔn),差異無統(tǒng)計學(xué)意義,而按照P<0.05的標(biāo)準(zhǔn),卻有意義,與事實(shí)相悖,出現(xiàn)假陽性,很容易得出錯誤結(jié)論。這種分割法有時很保守,當(dāng)行列表資料分組多且為有序時可用Mantel-Haenszel卡方檢驗(yàn),也稱線性趨勢檢驗(yàn)(testforlineartrend)或定序檢驗(yàn)(Linear-by-Lineartest)[2]。統(tǒng)計路徑:用SPSS進(jìn)行計數(shù)資料的趨勢檢驗(yàn),在輸出結(jié)果中讀取線性關(guān)聯(lián)檢驗(yàn)統(tǒng)計量(Linear-by-LinearAssociation,LLA),如P<0.05可得出隨著病種級別的升高,檢測指標(biāo)逐漸升高的趨勢。
1.3臨床診斷試驗(yàn)中的統(tǒng)計學(xué)方法應(yīng)用在臨床診斷試驗(yàn)研究中,經(jīng)常選取單項計量指標(biāo)或者聯(lián)合計量指標(biāo)以診斷某種疾病,若僅用初級統(tǒng)計學(xué)方法如t檢驗(yàn)、單因素方差分析等往往不能有效挖掘信息,此時應(yīng)采用受試者工作特征曲線(ROC)對檢測結(jié)果進(jìn)行分析評價。ROC曲線分析基本原理是通過診斷界點(diǎn)的移動[3],獲得多對靈敏度和誤診率(1-特異度),以靈敏度為縱軸、誤診率為橫軸,連接各點(diǎn)繪制曲線,然后計算曲線下的面積,面積越大診斷價值越高。ROC曲線很直觀,能根據(jù)敏感性與特異性之和最大化原則自動產(chǎn)生最有效的診斷臨界點(diǎn)。具體路徑可以參考相關(guān)統(tǒng)計專著[3]。統(tǒng)計學(xué)處理一般描述為:采用SPSS(版次)統(tǒng)計軟件分析數(shù)據(jù),對單項及聯(lián)合檢測結(jié)果作圖繪成ROC曲線,計算曲線下面積(AUC)和標(biāo)準(zhǔn)誤,其中聯(lián)合檢測結(jié)果變量即預(yù)測概率由Logistic回歸產(chǎn)生(也可以用判別分析得出)。計量資料應(yīng)用-x±s表示,運(yùn)用獨(dú)立樣本t檢驗(yàn)及單因素方差分析,兩兩比較采用SNK及LSD法,計數(shù)資料采用χ2檢驗(yàn)。檢驗(yàn)水準(zhǔn)為0.05。具體內(nèi)容可據(jù)情而定。
1.4重復(fù)測量資料的方差分析誤用拆分文件的t檢驗(yàn)或方差分析如研究共設(shè)3組,每位患者在3個時間點(diǎn)均查某項血指標(biāo),部分作者在處理此類數(shù)據(jù)時,常誤將縱向(同一時間點(diǎn)3組的比較)與橫向(同組3個時間點(diǎn)的比較)數(shù)據(jù)均應(yīng)用拆分文件的t檢驗(yàn)或單因素方差分析來處理,結(jié)果導(dǎo)致統(tǒng)計學(xué)第Ⅰ類錯誤發(fā)生。此組數(shù)據(jù)實(shí)質(zhì)是重復(fù)測量資料,應(yīng)采用重復(fù)測量資料的方差分析。SPSS中的統(tǒng)計路徑:數(shù)據(jù)-分析-一般線性模型-重復(fù)度量。研究者可以參考相關(guān)書籍進(jìn)行處理[3]。
1.52×2析因設(shè)計及析因方差分析實(shí)驗(yàn)是2×2析因設(shè)計時,分組有兩個因素,A與B,故分組為A、B、O、A+B,這個設(shè)計在析因設(shè)計研究中很常用,但常會出現(xiàn)分組設(shè)計正確,卻沒有用析因設(shè)計方差分析。析因設(shè)計與單因素方差分析不同[4],它不但能分析治療效果中處理因素的單獨(dú)效應(yīng)和主效應(yīng),還能分析因素間的交互效應(yīng),并能提高檢驗(yàn)效能。非統(tǒng)計專業(yè)的研究者進(jìn)行析因分析可能稍有難度,可參考相關(guān)統(tǒng)計學(xué)書籍提供的統(tǒng)計步驟進(jìn)行此類分析[3]。
1.6Meta分析Meta分析是循證醫(yī)學(xué)系統(tǒng)評價常用的方法[5],應(yīng)用時需注意統(tǒng)計學(xué)處理中計數(shù)資料采用比值比(OR)作為效應(yīng)變量。具體路徑:先進(jìn)行異質(zhì)性檢驗(yàn),當(dāng)P>0.05時,認(rèn)為同質(zhì),選擇固定模型;P≤0.05時,不同質(zhì),此時可采用敏感性分析或分層分析等異質(zhì)性處理,使之達(dá)到同質(zhì)后再選擇固定模型;若采用異質(zhì)性處理仍未達(dá)到同質(zhì),則采用隨機(jī)模型,以上統(tǒng)計路徑均需交代清楚。Meta分析的結(jié)果是以“森林樹”體現(xiàn)的,審校中我們經(jīng)常遇到作者繪制的“森林樹”左上角“文獻(xiàn)、對比、結(jié)果名稱”等內(nèi)容顯示為“?”,這是由于部分版本的RevMan軟件不能輸入中文,此時可以考慮省去,或用Photo-shop軟件添加相應(yīng)中文。Meta分析作為一種高級統(tǒng)計方法,專業(yè)性要求較高,作者可參考循證醫(yī)學(xué)類權(quán)威雜志上的文章格式,如《中國循證醫(yī)學(xué)雜志》中“論著•二次研究”欄目的循證文章。
2科技論文中統(tǒng)計學(xué)處理的相關(guān)表述
2.1資料與方法中具體統(tǒng)計路徑的描述“統(tǒng)計學(xué)處理”的內(nèi)容常位于論文資料與方法的最后一段,一般來說包括統(tǒng)計軟件名稱及版次、統(tǒng)計描述、統(tǒng)計方法、檢驗(yàn)標(biāo)準(zhǔn)等內(nèi)容,亦可細(xì)致交待每個表格的具體統(tǒng)計方法。經(jīng)典例子如下,“統(tǒng)計學(xué)處理:采用SPSS(版次)統(tǒng)計軟件分析數(shù)據(jù)。計量資料用均數(shù)±標(biāo)準(zhǔn)差表示,采用單因素方差分析,兩兩比較采用SNK法及LSD法。檢驗(yàn)水準(zhǔn)為0.05”。上述內(nèi)容包括了大致的統(tǒng)計方法,即具體的統(tǒng)計路徑。此部分內(nèi)容,沒有絕對統(tǒng)一的規(guī)定[6]。常見的問題有:統(tǒng)計學(xué)方法描述不全、內(nèi)容過于簡單、存在粘貼抄寫痕跡等。如部分論文的統(tǒng)計學(xué)處理中提及“以α=0.05為檢驗(yàn)水準(zhǔn),P<0.05為差異有統(tǒng)計學(xué)意義”這句話,這在統(tǒng)計學(xué)上實(shí)質(zhì)是一個重復(fù)句,保留其一即可。
在各種醫(yī)學(xué)期刊中,半數(shù)以上是療效觀察方面的論著?,F(xiàn)擇其較普遍存在的統(tǒng)計學(xué)問題,結(jié)合實(shí)驗(yàn)設(shè)計基本原則加以討論。
(一)對照與均衡性測定
國內(nèi)醫(yī)學(xué)期刊有關(guān)臨床療效觀察的文章甚多,不少雜志刊登了一些事先未設(shè)計對照的文章,其結(jié)論難以令人信服。如《用柴葛解肌湯治療上呼吸感染》一文,報道治愈好轉(zhuǎn)率為97.7%,因無對照,無法斷定其效果如何,因此,治愈好轉(zhuǎn)率中含有假像。
對照的方法雖有多種,但對照的基本原則是與實(shí)驗(yàn)組齊同可比,最好作均衡性測定。
(二)安慰劑與盲法試驗(yàn)
安慰劑與盲法試驗(yàn)是醫(yī)研(主要是比較性研究)中常用的科研方法,結(jié)果準(zhǔn)確、誤差性小。安慰劑在形、量、色、味等要與實(shí)驗(yàn)藥物一樣,不能給受試者和執(zhí)行者任何暗示。這種試驗(yàn)就是雙盲法試驗(yàn)。但近年來,尚有人用改良的雙盲法,此法分兩期:第一期(公開期)試驗(yàn)有效者留,無效者棄。有效者進(jìn)入第二期(雙盲試驗(yàn)),以確定療效是否系安慰劑的作用。在預(yù)防效果觀察時可采用該法,臨床上應(yīng)用諸多困難,應(yīng)視具體情況而定。
(三)樣本含量與重復(fù)原則
沒有足夠樣本的研究結(jié)果,是經(jīng)不起重復(fù)試驗(yàn)的,有的論文憑少數(shù)病例觀實(shí)的結(jié)果下結(jié)論,是不慎重的。如《重癥肺炎并發(fā)DIC29例》一文,作者觀察腦型患者3例,其中死亡一例,就得出“一般腦型病死率高達(dá)57%,本組腦型病死率較低,看來及早用肝素阻斷DIC過程,對降低腦型病死率可能具有重要意義”的結(jié)論。因無對照,結(jié)論不可靠。
(四)隨機(jī)分組與實(shí)驗(yàn)設(shè)計類型
隨機(jī)化分組即每個實(shí)驗(yàn)對象有同等機(jī)會被抽樣(分配)到各組去,而不受任何系統(tǒng)因素的影響。常用的實(shí)驗(yàn)設(shè)計類型有完全隨機(jī)設(shè)計、自身對照設(shè)計、交義設(shè)計、配偶設(shè)計、隨機(jī)區(qū)組設(shè)計、拉丁方設(shè)計、正文(析因)設(shè)計、序貫設(shè)計、半數(shù)效量實(shí)驗(yàn)設(shè)計(動物試驗(yàn)),回顧性與前贍性調(diào)查研究設(shè)計等。科研設(shè)計時應(yīng)根據(jù)研究目的要求選擇不同類型的實(shí)驗(yàn)設(shè)計方法,進(jìn)行相應(yīng)的統(tǒng)計處理。
概率分布(probabilitydistribution)是醫(yī)學(xué)統(tǒng)計學(xué)中多種統(tǒng)計分析方法的理論基礎(chǔ)。授課內(nèi)容一般包括:二項分布、Possion分布、正態(tài)分布、t分布、F分布等。
借助概率分布常??梢詭椭覀兞私馍笜?biāo)的特征、醫(yī)學(xué)現(xiàn)象的發(fā)生規(guī)律等等。例如,臨床檢驗(yàn)中計量實(shí)驗(yàn)室指標(biāo)的參考值范圍就是依據(jù)正態(tài)分布和t分布的原理計算得到;許多醫(yī)學(xué)試驗(yàn)的“陽性”結(jié)果服從二項分布,因此它被廣泛用于化學(xué)毒性的生物鑒定、樣本中某疾病陽性率的區(qū)間估計等;而一定人群中諸如遺傳缺陷、癌癥等發(fā)病率很低的非傳染性疾病患病數(shù)或死亡數(shù)的分布,單位面積(或容積)內(nèi)細(xì)菌數(shù)的分布等都服從Poisson分布,我們就可以借助Poisson分布的原理定量地對上述現(xiàn)象進(jìn)行研究。
在生物信息學(xué)中概率分布也有一定應(yīng)用。例如,Poisson分布可以用于基因(蛋白質(zhì))序列的相似性分析。被研究者廣泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速將研究者提交的蛋白質(zhì)(或DNA)數(shù)據(jù)與公開數(shù)據(jù)庫進(jìn)行相似性序列比對。對于序列a和b,BLAST發(fā)現(xiàn)的高得分匹配區(qū)稱為HSPs。而HSP得分超過閾值t的概率P(H(a,b)>t)可以依據(jù)Poisson分布的性質(zhì)計算得到。
二、假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)(hypothesis)是醫(yī)學(xué)統(tǒng)計學(xué)中統(tǒng)計推斷部分的重要內(nèi)容。假設(shè)檢驗(yàn)根據(jù)反證法和小概率原理,首先依據(jù)資料性質(zhì)和所需解決的問題,建立檢驗(yàn)假設(shè);在假設(shè)該檢驗(yàn)假設(shè)成立的前提下,采用適當(dāng)?shù)臋z驗(yàn)方法,根據(jù)樣本算得相應(yīng)的檢驗(yàn)統(tǒng)計量;最后,依據(jù)概率分布的特點(diǎn)和算得的檢驗(yàn)統(tǒng)計量的大小來判斷是否支持所建立的檢驗(yàn)假設(shè),進(jìn)而推斷總體上該假設(shè)是否成立。其基本方法包括:u檢驗(yàn)、t檢驗(yàn)、方差分析(ANOVA)和非參數(shù)檢驗(yàn)方法。
假設(shè)檢驗(yàn)為醫(yī)學(xué)研究提供了一種很好的由樣本推斷總體的方法。例如,隨機(jī)抽取某市一定年齡段中100名兒童,將其平均身高(樣本均數(shù))與該年齡段兒童應(yīng)有的標(biāo)準(zhǔn)平均身高(總體均數(shù))做u檢驗(yàn),其檢驗(yàn)結(jié)果可以幫助我們推斷出該市該年齡段兒童身高是否與標(biāo)準(zhǔn)身高一致,為了解該市該年齡段兒童的生長發(fā)育水平提供參考。又如,醫(yī)學(xué)中常??梢圆捎胻檢驗(yàn)、秩和檢驗(yàn)比較兩種藥物的療效有無差別;用2檢驗(yàn)比較不同治療方法的有效率是否相同等等。
這些假設(shè)檢驗(yàn)的方法在生物實(shí)驗(yàn)資料的分析前期應(yīng)用較多,但由于研究目的和資料性質(zhì)不同,一般會對某些方法進(jìn)行適當(dāng)調(diào)整和結(jié)合。
例如,基于基因芯片實(shí)驗(yàn)數(shù)據(jù)尋找差異表達(dá)基因的問題?;蛐酒╣enechip)是近年來實(shí)驗(yàn)分子生物學(xué)的技術(shù)突破之一,它允許研究者在一次實(shí)驗(yàn)中獲得成千上萬條基因在設(shè)定實(shí)驗(yàn)條件下的表達(dá)數(shù)據(jù)。為了從這海量的數(shù)據(jù)中尋找有意義的信息,在對基因表達(dá)數(shù)據(jù)進(jìn)行分析的過程中,找到那些在若干實(shí)驗(yàn)組中表達(dá)水平有明顯差異的基因是比較基礎(chǔ)和前期的方法。這些基因常常被稱為“差異表達(dá)基因”,或者“顯著性基因”。如果將不同實(shí)驗(yàn)條件下某條基因表達(dá)水平的重復(fù)測量數(shù)據(jù)看作一個樣本,尋找差異表達(dá)基因的問題其實(shí)就可以采用假設(shè)檢驗(yàn)方法加以解決。
如果表達(dá)數(shù)據(jù)服從正態(tài)分布,可以采用t-檢驗(yàn)(或者方差分析)比較兩樣本(或多樣本)平均表達(dá)水平的差異。
但是,由于表達(dá)數(shù)據(jù)很難滿足正態(tài)性假定,目前常用的方法基于非參數(shù)檢驗(yàn)的思想,并對其進(jìn)行了改進(jìn)。該方法分為兩步:首先,選擇一個統(tǒng)計量對基因排秩,用秩代替表達(dá)值本身;其次,為排秩統(tǒng)計量選擇一個判別值,在其之上的值判定為差異顯著。常用的排秩統(tǒng)計量有:任一特定基因在重復(fù)序列中表達(dá)水平M值的均值;考慮到基因在不同序列上變異程度的統(tǒng)計量,其中,s是M的標(biāo)準(zhǔn)差;以及用經(jīng)驗(yàn)Bayes方法修正后的t-統(tǒng)計量:,修正值a由M的方差s2的均數(shù)和標(biāo)準(zhǔn)差估計得到。三、一些高級統(tǒng)計方法在基因研究中的應(yīng)用
(一)聚類分析
聚類分析(clusteringanalysis)是按照“物以類聚”的原則,根據(jù)聚類對象的某些性質(zhì)與特征,運(yùn)用統(tǒng)計分析的方法,將聚類對象比較相似或相近的歸并為同一類。使得各類內(nèi)的差異相對較小,類與類間的差異相對較大1。聚類分析作為一種探索性的統(tǒng)計分析方法,其基本內(nèi)容包括:相似性度量方法、系統(tǒng)聚類法(HierarchicalClustering)、K-means聚類法、SOM方法等。
聚類分析可以幫助我們解決醫(yī)學(xué)中諸如:人的體型分類,某種疾病從發(fā)生、發(fā)展到治愈不同階段的劃分,青少年生長發(fā)育分期的確定等問題。
近年來隨著基因表達(dá)譜數(shù)據(jù)的不斷積累,聚類分析已成為發(fā)掘基因信息的有效工具。在基因表達(dá)研究中,一項主要的任務(wù)是從基因表達(dá)數(shù)據(jù)中識別出基因的共同表達(dá)模式,由此將基因分成不同的種類,以便更為深入地了解其生物功能及關(guān)聯(lián)性。這種探索完全未知的數(shù)據(jù)特征的方法就是聚類分析,生物信息學(xué)中又稱為無監(jiān)督的分析(UnsupervisedAnalysis)。常用方法是利用基因表達(dá)數(shù)據(jù)對基因(樣本)進(jìn)行聚類,將具有相同表達(dá)模式的基因(樣本)聚為一類,根據(jù)聚類結(jié)果通過已知基因(樣本)的功能去認(rèn)識那些未知功能的基因。對于基因表達(dá)數(shù)據(jù)而言,系統(tǒng)聚類法易于使用、應(yīng)用廣泛,其結(jié)果——系統(tǒng)樹圖能提供一個可視化的數(shù)據(jù)結(jié)構(gòu),直觀具體,便于理解。而在幾種相似性的計算方法中,平均聯(lián)接法(AverageLinkageClustering)一般能給出較為合理的聚類結(jié)果2。
(二)判別分析
判別分析(discriminantanalysis)是根據(jù)觀測到的某些指標(biāo)的數(shù)據(jù)對所研究的對象建立判別函數(shù),并進(jìn)行分類的一種多元統(tǒng)計分析方法。它與聚類分析都是研究分類問題,所不同的是判別分析是在已知分類的前提下,判定觀察對象的歸屬3。其基本方法包括:Fisher線性判別(FLD)、最鄰近分類法(k-NearestNeighborClassifiers)、分類樹算法(ClassificationTreeAlgorithm),人工神經(jīng)網(wǎng)絡(luò)(ANNs)和支持向量機(jī)(SVMs)。
判別分析常用于臨床輔助鑒別診斷,計量診斷學(xué)就是以判別分析為主要基礎(chǔ)迅速發(fā)展起來的一門科學(xué)。如臨床醫(yī)生根據(jù)患者的主訴、體征及檢查結(jié)果作出診斷;根據(jù)各種癥狀的嚴(yán)重程度預(yù)測病人的預(yù)后或進(jìn)行某些治療方法的療效評估;以及流行病學(xué)中某些疾病的早期預(yù)報,環(huán)境污染程度的堅定及環(huán)保措施、勞保措施的效果評估等。
在生物信息學(xué)針對基因的研究工作中,由于借助了精確的生物實(shí)驗(yàn),研究者通常能得到基因(樣本)的準(zhǔn)確分類,如,基因的功能類、樣本歸結(jié)于疾?。ㄕ#顟B(tài)等等。當(dāng)利用了這些分類信息時,就可以采用判別分析的方法對基因進(jìn)行分類,生物信息學(xué)中又稱為有監(jiān)督的分析(SupervisedAnalysis)。例如,基因表達(dá)數(shù)據(jù)分析中,對于已經(jīng)過濾的基因,前三種方法的應(yīng)用較為簡單。而支持向量機(jī)(SVMs)和人工神經(jīng)網(wǎng)絡(luò)(ANNs)是兩種較新,但很有應(yīng)用前景的方法。
(三)相關(guān)分析
相關(guān)分析(correlationanalysis)是醫(yī)學(xué)統(tǒng)計學(xué)中研究兩變量間關(guān)系的重要方法。它借助相關(guān)系數(shù)來衡量兩變量之間的關(guān)系是否存在、關(guān)系的強(qiáng)弱,以及相互影響的方向。其基本內(nèi)容包括:線性相關(guān)系數(shù)、秩相關(guān)系數(shù)、相關(guān)系數(shù)的檢驗(yàn)、典型相關(guān)分析等。
我們常??梢越柚嚓P(guān)分析判斷研究者所感興趣的兩個醫(yī)學(xué)現(xiàn)象之間是否存在聯(lián)系。例如,采用秩相關(guān)分析我們發(fā)現(xiàn)某種食物中黃曲霉毒素相對含量與肝癌死亡率間存在正相關(guān)關(guān)系;采用線性相關(guān)方法發(fā)現(xiàn)中年女性體重與血壓之間具有非常密切的正相關(guān)關(guān)系等等。
生物信息學(xué)中可以利用相關(guān)分析建立基因調(diào)控網(wǎng)絡(luò)。如果將兩個不同的基因在不同實(shí)驗(yàn)條件下的表達(dá)看作是兩個變量,相關(guān)分析所研究的正是兩者之間的調(diào)控關(guān)系。如采用線性相關(guān)系數(shù)進(jìn)行兩基因關(guān)系的分析時,其大小反應(yīng)了基因調(diào)控關(guān)系的強(qiáng)弱,符號則反應(yīng)了兩基因是協(xié)同關(guān)系(相關(guān)系數(shù)為正),還是抑制關(guān)系(相關(guān)系數(shù)為負(fù))。
四、意義
生物信息學(xué)不僅是醫(yī)學(xué)統(tǒng)計學(xué)的研究前沿,更是醫(yī)學(xué)研究由宏觀向微觀拓展的重要領(lǐng)域,其研究內(nèi)容已逐漸為多數(shù)醫(yī)學(xué)院校的學(xué)員了解和熟悉。而如何對新技術(shù)產(chǎn)生的生物實(shí)驗(yàn)數(shù)據(jù)進(jìn)行準(zhǔn)確合理的分析,卻成為生物信息學(xué)研究的主要瓶頸之一。
在醫(yī)學(xué)統(tǒng)計學(xué)課堂教學(xué)中引入生物信息學(xué)實(shí)例,而不僅僅局限于常見的醫(yī)學(xué)、衛(wèi)生領(lǐng)域的例子,將難以理解的統(tǒng)計理論和方法與前沿的生物實(shí)例相結(jié)合,拓寬了學(xué)員的視野,提高了學(xué)員的學(xué)習(xí)興趣,更可以加深對所學(xué)知識的理解;與此同時,使學(xué)員掌握了生物實(shí)驗(yàn)數(shù)據(jù)的先進(jìn)分析方法,擴(kuò)大了學(xué)員的知識面,提高了他們今后開展醫(yī)學(xué)科研工作的能力。
醫(yī)學(xué)統(tǒng)計學(xué)的教學(xué)應(yīng)以提高研究生解決實(shí)際科研問題的能力為目標(biāo),使研究生形成正確的和嚴(yán)謹(jǐn)?shù)慕y(tǒng)計學(xué)思維方法和技能,幫助醫(yī)學(xué)研究生在今后的科研工作中正確運(yùn)用醫(yī)學(xué)統(tǒng)計學(xué)方法,順利完成研究生學(xué)業(yè)以及將來在工作中的科研任務(wù)。然而,筆者在教學(xué)實(shí)踐中發(fā)現(xiàn)有一些需要改進(jìn)的問題。
一、研究生醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)中遇到的主要問題
(一)研究生統(tǒng)計學(xué)基礎(chǔ)知識較為薄弱
雖然大部分學(xué)生在大學(xué)本科期間學(xué)習(xí)過統(tǒng)計學(xué),但多數(shù)人僅學(xué)習(xí)過較簡單的統(tǒng)計學(xué)基礎(chǔ)知識,進(jìn)入研究生階段醫(yī)學(xué)統(tǒng)計學(xué)學(xué)習(xí)后,學(xué)習(xí)比較吃力,并且由于總學(xué)時數(shù)的限制,教師在理論課的教學(xué)中對單個統(tǒng)計學(xué)方法的使用講解較多,而對一些研究生在完成學(xué)位論文期間或?qū)懋厴I(yè)后較為實(shí)用的統(tǒng)計學(xué)方法卻沒有時間講解,這就造成了研究生對學(xué)過的統(tǒng)計學(xué)方法一知半解,而將來可能用得上的統(tǒng)計學(xué)方法卻沒有學(xué)會。筆者在解答一些已經(jīng)畢業(yè)參加工作的研究生的問題時,發(fā)現(xiàn)有些問題十分基礎(chǔ),本應(yīng)該在研究生學(xué)習(xí)階段掌握而沒有掌握。
(二)課題設(shè)計統(tǒng)計學(xué)缺陷較常見
目前,國內(nèi)大部分高校研究生醫(yī)學(xué)統(tǒng)計學(xué)課程一般安排在研一上學(xué)期,而研究生應(yīng)用統(tǒng)計學(xué)知識進(jìn)行課題設(shè)計要到研究生二年級才啟動。許多研究生在課堂學(xué)習(xí)階段對統(tǒng)計學(xué)知識本來就沒有徹底學(xué)透,又要再經(jīng)過一年多才進(jìn)入課題設(shè)計有實(shí)驗(yàn)研究,對學(xué)習(xí)過的統(tǒng)計學(xué)知識已經(jīng)有一些遺忘,所以在進(jìn)行課題設(shè)計時不能正確運(yùn)用學(xué)過的相關(guān)知識,造成課題設(shè)計中有較多的統(tǒng)計學(xué)缺陷。而課題設(shè)計如果不正確,無法保證后續(xù)的研究結(jié)果的科學(xué)性和可信性。
(三)學(xué)位論文統(tǒng)計學(xué)錯誤普遍存在
國內(nèi)外期刊對論文中的統(tǒng)計學(xué)方法要求都很高,因此研究生的科研論文需要正確運(yùn)用統(tǒng)計學(xué)知識對研究數(shù)據(jù)進(jìn)行分析、整理。但與此形成鮮明對比的是,很多研究生不能把學(xué)習(xí)過的統(tǒng)計學(xué)知識正確運(yùn)用到研究論文中。尤其是學(xué)習(xí)臨床專業(yè)的醫(yī)學(xué)研究生,很多研究資料和數(shù)據(jù)來源于人群研究,涉及樣本量、對照組的選擇等基本的統(tǒng)計學(xué)常識,這些基礎(chǔ)性錯誤卻在研究生的論文中大量存在。這些問題與現(xiàn)在對高素質(zhì)人才的培養(yǎng)已經(jīng)不相適應(yīng),需要加以改進(jìn)。
二、對策與建議
(一)強(qiáng)化課堂教學(xué),鞏固醫(yī)學(xué)統(tǒng)計學(xué)知識基礎(chǔ)
鞏固基本統(tǒng)計方法和知識是醫(yī)學(xué)統(tǒng)計學(xué)的基礎(chǔ),通過課堂教學(xué),使學(xué)生掌握基本的統(tǒng)計方法原理、計算過程和結(jié)果解釋。在教學(xué)中既要注重基本原理和基本概念的講解,使研究生切實(shí)掌握基本的統(tǒng)計學(xué)知識,在論文寫作中不出現(xiàn)低級的統(tǒng)計學(xué)錯誤。在此基礎(chǔ)上,老師在課堂上應(yīng)該由簡到繁,深入淺出,逐步增加難度和深度,講解一些研究生在學(xué)習(xí)階段和將來工作中有用的、較為高級的統(tǒng)計學(xué)方法。目前,科學(xué)技術(shù)更新速度很快,同樣統(tǒng)計學(xué)的重要工具——統(tǒng)計軟件也更新很快,因此,老師要及時更新自己的知識,并向?qū)W生介紹最新、最先進(jìn)的統(tǒng)計方法和軟件。
(二)注重學(xué)用銜接,提升研究生課題設(shè)計的科學(xué)性
研究生的課題設(shè)計是科學(xué)研究成敗的關(guān)鍵之一,教師在教學(xué)過程中要向?qū)W生強(qiáng)調(diào)其重要性,讓學(xué)生帶著課題設(shè)計中的問題進(jìn)入課程學(xué)習(xí),讓學(xué)生結(jié)合自己的專業(yè),做好論文前期的準(zhǔn)備工作,完成科研選題,為畢業(yè)論文開題做好準(zhǔn)備。要指出課題設(shè)計中應(yīng)當(dāng)注意的統(tǒng)計學(xué)問題,如樣本量、對照組選擇等,使學(xué)生意識到統(tǒng)計學(xué)的基本知識是保證自己課題設(shè)計科學(xué)性的關(guān)鍵,在今后的課題設(shè)計中自覺以正確的統(tǒng)計學(xué)方法作為指導(dǎo),從而保證課題設(shè)計的科學(xué)性,為其成長為高層次的醫(yī)學(xué)科研人才打下良好的基礎(chǔ)。
(三)采用實(shí)例分析,減少研究論文中的統(tǒng)計學(xué)錯誤
在課堂上以一些已經(jīng)發(fā)表的高水平論文為例,詳細(xì)講解醫(yī)學(xué)統(tǒng)計學(xué)方法的具體應(yīng)用,使研究生在撰寫論文時,減少論文中的統(tǒng)計學(xué)錯誤,減少文章因?yàn)榻y(tǒng)計學(xué)問題而被拒稿;教師在課堂上也可以用一些已經(jīng)發(fā)表的、但是有明顯統(tǒng)計學(xué)錯誤的論文作為反面教材,給學(xué)生進(jìn)行分析、講解,使學(xué)生從正反兩個方面知道避免論文中的統(tǒng)計學(xué)錯誤的重要性。另外,要注意提醒學(xué)生,在數(shù)據(jù)處理和論文撰寫過程中,運(yùn)用統(tǒng)計學(xué)方法時要注意其使用條件,切不可誤用,對審稿人指出的統(tǒng)計學(xué)錯誤要認(rèn)真進(jìn)行修改或答復(fù)。
利用現(xiàn)代化學(xué)習(xí)工具學(xué)習(xí)當(dāng)今社會發(fā)展所需要的知識是時代的要求,因此應(yīng)轉(zhuǎn)變教育思想和更新教育觀念,改變以往的教學(xué)方式、學(xué)習(xí)方式和學(xué)習(xí)內(nèi)容,探索適應(yīng)現(xiàn)代社會、經(jīng)濟(jì)、科技及文化發(fā)展的教育觀念和人才培養(yǎng)模式,形成培養(yǎng)適合21世紀(jì)所需要人才的教學(xué)體系.醫(yī)藥院校的數(shù)學(xué)應(yīng)以應(yīng)用為主要目的,應(yīng)改變以掌握基本知識、基本理論及基本方法為目的的方式,把教學(xué)重點(diǎn)轉(zhuǎn)移到講解數(shù)理統(tǒng)計學(xué)概念、思考方法、形成及應(yīng)用背景等,引導(dǎo)學(xué)生思考數(shù)理統(tǒng)計學(xué)的思維特征,理解數(shù)理統(tǒng)計學(xué)思想,引導(dǎo)學(xué)生應(yīng)用數(shù)理統(tǒng)計學(xué)方法解決實(shí)際問題,以達(dá)到學(xué)以致用的目的.學(xué)好和用好醫(yī)藥數(shù)理統(tǒng)計學(xué)并不需要高深的數(shù)學(xué)知識,而是要促使學(xué)生在學(xué)習(xí)數(shù)理統(tǒng)計學(xué)的時候改變思維模式,使學(xué)生從醫(yī)藥學(xué)的形象思維模式向數(shù)理統(tǒng)計學(xué)的抽象思維和邏輯推斷模式轉(zhuǎn)變,并結(jié)合教材中例題的講解、學(xué)生自身實(shí)例資料的分析及作業(yè)的批閱使學(xué)生理解和掌握統(tǒng)計學(xué)中的基本概念、基本方法、統(tǒng)計符號及公式等.
2精簡和更新教學(xué)內(nèi)容
在教學(xué)內(nèi)容方面做到突出實(shí)用性,適當(dāng)?shù)販p少或減弱概率論部分的理論性和難度,以直觀、趣味和易于理解的方式把概率論作為數(shù)理統(tǒng)計的基礎(chǔ)知識加以介紹.在假設(shè)檢驗(yàn)部分注意闡述數(shù)理統(tǒng)計方法的思想、應(yīng)用的背景及應(yīng)用中所需的條件,重點(diǎn)講解假設(shè)檢驗(yàn)應(yīng)該如何選取原假設(shè)和備擇假設(shè),如何對得出的結(jié)論進(jìn)行合理的解釋;在參數(shù)估計部分著重地講解參數(shù)估計在實(shí)際應(yīng)用中的重要性、合理性及應(yīng)用中應(yīng)注意的問題,區(qū)間估計中置信區(qū)間的理解及單側(cè)置信限在應(yīng)用中的意義等;在方差分析部分講清楚引進(jìn)方差分析的意義、假設(shè)檢驗(yàn)的方法對多個總體進(jìn)行多次t檢驗(yàn)時的缺點(diǎn)、方差分析應(yīng)用的條件及合理解釋檢驗(yàn)結(jié)果等;在回歸分析部分注意闡述量與量之間的關(guān)系、回歸方程的理論意義及對回歸方程結(jié)果在應(yīng)用中的解釋等.目前SPSS軟件是國際醫(yī)學(xué)論文中應(yīng)用最廣泛的統(tǒng)計軟件[2],國內(nèi)的大部分醫(yī)學(xué)期刊也要求論文數(shù)據(jù)統(tǒng)計分析要應(yīng)用統(tǒng)計軟件處理,統(tǒng)計檢驗(yàn)結(jié)果要用P值來表示,更要求學(xué)生了解統(tǒng)計軟件的使用方法,做到正確使用統(tǒng)計軟件.
3互動式的教學(xué)方法培養(yǎng)應(yīng)用、創(chuàng)新型人才
傳統(tǒng)的教學(xué)方式是知識傳授型教學(xué),即教師在課堂上灌輸知識,在有限的時間內(nèi)按教學(xué)大綱要求把大量的教學(xué)內(nèi)容盡可能地講授完畢,不能有效地調(diào)動學(xué)生對學(xué)習(xí)的主動性,忽視學(xué)生應(yīng)用能力的發(fā)展,結(jié)果導(dǎo)致學(xué)生把主要精力投入到統(tǒng)計計算上,很難有時間去深入分析統(tǒng)計結(jié)果.互動式教學(xué)方法要求教師在教學(xué)中充分發(fā)揮教師的主導(dǎo)作用,同時讓學(xué)生處于教學(xué)的中心,在加強(qiáng)課堂討論的同時,由教員歸納總結(jié),充分調(diào)動學(xué)生的學(xué)習(xí)興趣,提高學(xué)生的主動性和創(chuàng)造性.統(tǒng)計學(xué)應(yīng)用能力的培養(yǎng)主要指可正確選擇和應(yīng)用統(tǒng)計分析方法解決醫(yī)藥學(xué)科學(xué)研究和醫(yī)藥工作中的實(shí)際問題[3].為了避免學(xué)生濫用及錯用統(tǒng)計方法,教師要重點(diǎn)講清各種方法的適用條件及特點(diǎn).在考試方法上亦采用開卷考試,使學(xué)生不再花大量時間去推敲和死記那些復(fù)雜的公式,不再難于分清和理解符號及公式.通過幾年來的改革實(shí)踐,發(fā)現(xiàn)上述教學(xué)內(nèi)容、方法及手段的改革增強(qiáng)了學(xué)生的學(xué)習(xí)興趣,使學(xué)生真正體會到數(shù)理統(tǒng)計學(xué)的內(nèi)容在醫(yī)藥及日常生活中的應(yīng)用價值,激發(fā)學(xué)生的創(chuàng)造性思維,取得了良好的效果.
[參考文獻(xiàn)]
[1]劉定遠(yuǎn).醫(yī)藥數(shù)理統(tǒng)計方法[M].第3版.北京:人民衛(wèi)生出版社,1999.20.
[2]王銳,陳長生,徐勇勇,等.統(tǒng)計軟件SPSS教學(xué)的經(jīng)驗(yàn)與體會[J].西北醫(yī)學(xué)教育,2004,12(5):425.
[關(guān)鍵詞]醫(yī)學(xué)期刊;隊列研究;統(tǒng)計學(xué)問題;對策
[中圖分類號] R181.2+3 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1674-4721(2016)08(b)-0152-03
隊列研究又稱前瞻性研究、隨訪研究及縱向研究,是將一個范圍明確的人群按是否暴露于某可疑因素及暴露程度分為不同的亞組,追蹤其各自的結(jié)局,比較亞組之間結(jié)局的差異,從而判定暴露因子與結(jié)局之間有無因果關(guān)聯(lián)以及關(guān)聯(lián)大小的一種觀察性研究方法[1]。這里暴露是指研究對象接觸過某種待研究的物質(zhì)(如重金屬等)、具備某種待研究的特征(如年齡、性別及遺傳因素等)或行為(如吸煙等)[2]。觀察的結(jié)局主要是與暴露因子可能有關(guān)的結(jié)局。隊列研究中先因后果的時間順序相對明確,受一些偏倚的影響小,是觀察性研究方法中驗(yàn)證病因能力最強(qiáng)的研究方法[3],其證據(jù)等級僅次于嚴(yán)格設(shè)計的隨機(jī)對照試驗(yàn)。盡管我國的前瞻性隊列研究起步較晚,但自20世紀(jì)八九十年代起也陸續(xù)開展了一些隊列研究[4]。如果這些研究未能正確使用該研究方法,不但不能有效驗(yàn)證病因假設(shè),還有可能得出錯誤的結(jié)論。本文收集并分析了近年國內(nèi)公開發(fā)表的隊列研究論文,發(fā)現(xiàn)其中存在的統(tǒng)計學(xué)問題并提出改進(jìn)意見和建議,旨在引起作者、編者和審稿專家的重視,提高期刊論文的質(zhì)量。
1隊列研究文獻(xiàn)的檢索
以“隊列研究”“前瞻性研究”“隨訪研究”“縱向研究”為關(guān)鍵詞,在中國知網(wǎng)(CNKI)和萬方數(shù)據(jù)庫中檢索2014~2015年公開發(fā)表的隊列研究文獻(xiàn)共1874篇,剔除重復(fù)文獻(xiàn)和非研究性文獻(xiàn)后,獲得研究性文獻(xiàn)929篇(表1)。
2 載文量及統(tǒng)計學(xué)方法應(yīng)用情況
根據(jù)李康等[5]主編的《醫(yī)學(xué)統(tǒng)計學(xué)》和Cochrane推薦的Newcastle-Ottawa-Scale(NOS)工具[6]對檢索到的文獻(xiàn)進(jìn)行統(tǒng)計學(xué)方法應(yīng)用情況評判,評判結(jié)果在文獻(xiàn)評價表中登記并復(fù)核,采用Excel管理和分析數(shù)據(jù)。結(jié)果發(fā)現(xiàn),絕大多數(shù)隊列研究采用χ2檢驗(yàn)和Logistic回歸方法進(jìn)行統(tǒng)計推斷,約占82.0%;而使用了生存分析及Cox比例風(fēng)險回歸模型的僅占13.0%(表2)。
3常見統(tǒng)計學(xué)問題
3.1研究對象描述不清楚或不確切
研究對象的選擇是隨訪研究的首要問題,因此文中關(guān)于研究對象的描述必須準(zhǔn)確清楚,根據(jù)研究屬于總體研究或是抽樣研究,對研究對象的描述應(yīng)加以區(qū)別[7]。目前我國隊列研究中關(guān)于研究對象的描述主要存在的問題為:描述中對總體研究或抽樣研究未加以明確說明;抽樣研究中的描寫模棱兩可,未說明具體抽樣方法。從統(tǒng)計學(xué)上講,總體研究的研究對象是根據(jù)研究目的所確定的同質(zhì)觀察單位的全體,而抽樣研究的研究對象是總體中隨機(jī)抽取的部分觀察單位。
例如,就“某高校教師肥胖率及其對糖尿病發(fā)病影響的研究”而言,首先要制定相應(yīng)的納入標(biāo)準(zhǔn)與排除標(biāo)準(zhǔn),研究的納入標(biāo)準(zhǔn)為“某高校在編、在職且未患糖尿病的教師”,排除標(biāo)準(zhǔn)為“妊娠期、哺乳期女教工”。如果研究為總體研究,其研究對象應(yīng)是該高校的所有在編、在職且未患糖尿病的非孕(哺乳)教師;如果研究為抽樣研究,則其研究對象是該高校所有在編、在職且未患糖尿病的非孕(哺乳)教師的一個隨機(jī)樣本,研究對象描述中還應(yīng)具體說明所使用的抽樣方法,如單純隨機(jī)抽樣、系統(tǒng)抽樣、整群抽樣或分層抽樣等,同時寫明隨機(jī)抽樣的具體實(shí)施方法。
3.2結(jié)局事件及其判斷標(biāo)準(zhǔn)描述不全面
隨訪研究的另一個重要因素是結(jié)局事件,其指隨訪觀察中將出現(xiàn)的預(yù)期結(jié)果事件,研究中既要記錄是否發(fā)生了結(jié)局事件,還應(yīng)記錄是否存在失訪及失訪原因(失去聯(lián)系、因其他疾病死亡、研究終止)。分析我國2014~2015年已發(fā)表的隊列研究文章發(fā)現(xiàn),大多數(shù)研究均未描述是否存在失訪,部分研究對結(jié)局事件的判斷標(biāo)準(zhǔn)描述不全面。按照隊列研究的設(shè)計要求,結(jié)局事件要有明確統(tǒng)一的判斷標(biāo)準(zhǔn)。例如,2型糖尿病結(jié)局的判斷標(biāo)準(zhǔn)[8-9]:確診糖尿病,即自我報告醫(yī)生診斷糖尿病和(或)正在使用胰島素和(或)口服降糖藥治療者;未確診糖尿病,即未診斷糖尿病但空腹血漿葡萄糖水平≥7.0 mmol/L者;對于隨訪期發(fā)生死亡者,如果其死亡原因中含有糖尿病也認(rèn)為是隨訪期發(fā)生2型糖尿病。
3.3統(tǒng)計分析不充分或錯誤
3.3.1基線特征描述不全面 隊列研究中暴露組與非暴露組基線特征是否存在差異以及差異的方向直接影響研究結(jié)果的解釋,因此基線特征的描述是隊列研究資料分析必不可少的內(nèi)容。而目前國內(nèi)的隊列研究文獻(xiàn)中存在較嚴(yán)重的不按暴露有無分組描述基線特征的現(xiàn)象。此外,如隨訪過程中存在失訪,則失訪者與隨訪者基線特征的比較也直接影響研究結(jié)果的解釋。在查閱的929篇研究性隊列研究文獻(xiàn)中無失訪情況描述,無失訪者與隨訪者基線特征比較者達(dá)90%以上。
因此,隊列研究的資料分析應(yīng)首先比較暴露組與非暴露組基線特征的一致性,以分析基線特征的差異對研究結(jié)果是否有影響以及影響方向,同時也可確定多因素分析中需要調(diào)整的混雜因素。如果研究中有失訪,還應(yīng)比較失訪者與隨訪者的基線特征是否一致,以判斷失訪對研究結(jié)果是否有影響以及影響方向。
3.3.2統(tǒng)計推斷方法選擇不當(dāng) 統(tǒng)計學(xué)方法的選擇一向是醫(yī)學(xué)科學(xué)研究中的難點(diǎn)問題。隊列研究中主要涉及的統(tǒng)計推斷方法包括χ2檢驗(yàn)、Logistic回歸以及Cox比例風(fēng)險回歸模型,此三種方法的誤用和混用在隊列研究文獻(xiàn)中較嚴(yán)重,包括誤用χ2檢驗(yàn)代替Logistic回歸、誤用Logistic回歸代替Cox回歸等。由表2可知,929篇研究性隊列研究文獻(xiàn)中應(yīng)用了Cox回歸的僅占13.0%,且2015年的比例與2014年基本相同(13.1% vs 13.0%),可見這一方法的正確應(yīng)用近兩年內(nèi)并未引起作者以及編輯足夠的重視。
隊列研究中統(tǒng)計學(xué)方法選擇的正確思路為[10]:若暴露組與非暴露組的基線特征一致,則可以直接應(yīng)用χ2檢驗(yàn)比較暴露組與非暴露組結(jié)局事件發(fā)生率的差異,以判斷暴露因素與結(jié)局事件是否有關(guān)聯(lián),同時計算相對危險度(relative risk,RR)及其95%置信區(qū)間,進(jìn)一步說明兩者的關(guān)聯(lián)強(qiáng)度。相反,若暴露組與非暴露組的基線特征存在差異,應(yīng)采用多因素的回歸分析對混雜因素進(jìn)行控制。如果數(shù)據(jù)資料中無時間變量,可采用Logistic回歸,并在模型中調(diào)整組間存在差異的基線特征變量;如果有時間變量,則應(yīng)采用Cox回歸,并在模型中調(diào)整組間存在差異的基線特征。
3.4其他問題
國內(nèi)公開發(fā)表的隊列研究文獻(xiàn)存在的其他問題:①應(yīng)用Logistic回歸或Cox回歸時,分類變量或等級變量無賦值說明,造成結(jié)果解釋的混亂。例如,只有在明確“男性=1,女性=0”或者相反的情況下,才能正確解釋暴露因素與研究結(jié)局之間的關(guān)系。②誤用χ2檢驗(yàn)公式:應(yīng)該使用校正公式時,卻應(yīng)用了非校正的通用公式或?qū)S霉?;不能?yīng)用χ2檢驗(yàn)時,卻計算了χ2值。例如,兩組率比較時,只有滿足總例數(shù)n≥40且理論頻數(shù)T≥5的條件下,才能采用非校正的四格表χ2檢驗(yàn)的通用公式或?qū)S霉剑蝗绻鹡≥40且1≤T
4隊列研究醫(yī)學(xué)論文作者及編輯應(yīng)注意的問題
分析結(jié)果表明,隊列研究醫(yī)學(xué)論文的統(tǒng)計學(xué)方法應(yīng)用基本正確,編輯人員也比較重視統(tǒng)計學(xué)方法的使用情況,但是仍有部分論文在研究設(shè)計和統(tǒng)計分析方法的應(yīng)用上存在一些問題,導(dǎo)致的研究結(jié)果缺乏科學(xué)性和可信性。為使作者、編輯和審稿者高度重視統(tǒng)計學(xué)的正確應(yīng)用,進(jìn)一步提高隊列研究醫(yī)學(xué)論文的質(zhì)量,筆者認(rèn)為還應(yīng)做好以下工作。
4.1提高對統(tǒng)計學(xué)知識的認(rèn)識,強(qiáng)化統(tǒng)計學(xué)意識
目前,國內(nèi)醫(yī)學(xué)科研工作者未認(rèn)識到醫(yī)學(xué)統(tǒng)計學(xué)的重要性,對醫(yī)學(xué)統(tǒng)計學(xué)的重視程度還不夠。因此,要加大“醫(yī)學(xué)統(tǒng)計學(xué)在醫(yī)學(xué)科研中重要性”的宣傳力度,提高科研工作者對醫(yī)學(xué)統(tǒng)計學(xué)的認(rèn)識;在醫(yī)學(xué)科研工作中普及醫(yī)學(xué)統(tǒng)計學(xué)知識,強(qiáng)化醫(yī)學(xué)統(tǒng)計學(xué)意識,促使其在科研設(shè)計、數(shù)據(jù)分析和論文撰寫中正確應(yīng)用醫(yī)學(xué)統(tǒng)計學(xué)方法[11]。
4.2加強(qiáng)流行病學(xué)與醫(yī)學(xué)統(tǒng)計學(xué)專家審稿工作
醫(yī)學(xué)研究,包括隊列研究,其統(tǒng)計分析都是以科學(xué)研究設(shè)計為基礎(chǔ)的。研究設(shè)計不科學(xué)、有缺陷,即使應(yīng)用了高級的統(tǒng)計學(xué)方法也于事無補(bǔ)。所以,審稿專家在具備豐富的專業(yè)知識的同時,還應(yīng)具備一定的醫(yī)學(xué)統(tǒng)計學(xué)和流行病學(xué)知識,能夠做到從研究設(shè)計到統(tǒng)計分析,系統(tǒng)地審核研究結(jié)果的科學(xué)性、可靠性,確保論文質(zhì)量[12]。此外,如果條件允許,所有稿件應(yīng)先通過流行病學(xué)與醫(yī)學(xué)統(tǒng)計學(xué)專家的審核,然后再由各專業(yè)學(xué)科專家審稿,以確保研究成果的真實(shí)可靠[13]。因此,醫(yī)學(xué)期刊編委會應(yīng)增設(shè)流行病學(xué)與醫(yī)學(xué)統(tǒng)計學(xué)專業(yè)的專家委員,嚴(yán)格審核論文的研究設(shè)計和統(tǒng)計分析,不合格的論文堅決不發(fā)表,這樣才能不斷提高稿件質(zhì)量和水平。
有計劃地定期聘請流行病學(xué)與醫(yī)學(xué)統(tǒng)計學(xué)專家對期刊編輯人員進(jìn)行流行病學(xué)與醫(yī)學(xué)統(tǒng)計學(xué)知識培訓(xùn)[14]。通過定期舉辦專業(yè)知識講座、選派編輯人員參加專題培訓(xùn)班、定期組織考核、根據(jù)考核結(jié)果給予適當(dāng)獎勵等措施,以提高編輯人員學(xué)習(xí)流行病學(xué)與醫(yī)學(xué)統(tǒng)計學(xué)知識的積極性,不斷提高其相關(guān)知識水平,最終達(dá)到提高論文質(zhì)量的目的。
[參考文獻(xiàn)]
[1]張嘯飛.前瞻性隊列研究及生存分析[A]//2014浙江省臨床流行病學(xué)與循證醫(yī)學(xué)學(xué)術(shù)年會論文匯編[C].浙江,2014: 15.
[2]李立明.流行病學(xué)[M].5版.北京:人民衛(wèi)生出版社,2003:58-59.
[3]李立明,呂筠.大型前瞻性人群隊列研究進(jìn)展[J].中華流行病學(xué)雜志,2015,36(11):1187-1189.
[4]王慧,陳培戰(zhàn),張作文,等.我國人群隊列研究的現(xiàn)狀、機(jī)遇與挑戰(zhàn)[J].中華預(yù)防醫(yī)學(xué)雜志,2014,48(11):1016-1021.
[5]李康,賀佳.醫(yī)學(xué)統(tǒng)計學(xué)[M].6版.北京:人民衛(wèi)生出版社,2013:84-150.
[6]何瓊,黃淵秀,康文婧,等.2001-2010年我國傷害預(yù)防病例對照研究及隊列研究文獻(xiàn)質(zhì)量評價[J].中華疾病控制雜志,2014,18(10):913-916.
[7]王芳,戴國華,婁昊.循證中醫(yī)藥隊列研究的隨訪設(shè)計[J].山東中醫(yī)雜志,2016,(1):14-17.
[8]樊森,陳紀(jì)春,黃建鳳,等.中國成人看電視時間與2型糖尿病發(fā)病關(guān)系的前瞻性隊列研究[J].中國循環(huán)雜志,2014, 29(5):372-376.
[9]李衛(wèi)東,傅坤發(fā),連燕舒,等.成人非酒精性脂肪肝與2型糖尿病發(fā)病關(guān)系的前瞻性隊列研究[J].中國全科醫(yī)學(xué),2015, 18(28):3426-3429.
[10]韓梅,陳薇,曹卉娟,等.比較效果研究常用方法之二:隊列研究設(shè)計[J].現(xiàn)代中醫(yī)臨床,2015,22(3):20-23.
[11]沈洪兵.重視大型隊列研究的人才梯隊建設(shè)和技術(shù)儲備[J].中華預(yù)防醫(yī)學(xué)雜志,2014,48(7):547-548.
[12]高永,張中文,石德文,等.基于Excel的統(tǒng)計分析系統(tǒng)在期刊編輯部審稿中的應(yīng)用[J].編輯學(xué)報,2013,25(5):478.
[13]黃晨,袁平戈,張大志.醫(yī)學(xué)期刊來稿中有關(guān)統(tǒng)計學(xué)錯誤分析[J].現(xiàn)代醫(yī)藥衛(wèi)生,2013,29(15):2268.
健康網(wǎng)訊: 南京鐵道醫(yī)學(xué)院衛(wèi)生系 周達(dá)生 二、統(tǒng)計指標(biāo)與統(tǒng)計處理方法要合理運(yùn)用
在各種醫(yī)學(xué)期刊論文中,對統(tǒng)計學(xué)處理與統(tǒng)計指標(biāo)的合理運(yùn)用問題,已比過去有所重視,但尚存在不少問題。
(一)均數(shù)與標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤的合理運(yùn)用問題
在醫(yī)學(xué)論文中運(yùn)用均數(shù)(表示各變量值平均水平與集中趨勢)、標(biāo)準(zhǔn)差(表示變量值個體問離散情況與程度)和標(biāo)準(zhǔn)誤(表示樣本群體間差異程度,衡量抽樣誤差大?。┑牡胤绞呛艹R姷?,而達(dá)到合理運(yùn)用尚存在一些問題。例如,在比較兩樣本統(tǒng)計量時只考慮平均水平(均值),而忽視了離散情況(標(biāo)準(zhǔn)差)和抽樣誤差(標(biāo)準(zhǔn)誤);在正常值研究時,如資料近似正態(tài)分布,應(yīng)當(dāng)用均值加減K倍標(biāo)準(zhǔn)差(X±KS)來確定95%的正常值范圍(K根據(jù)樣本大小查K值表而定),應(yīng)當(dāng)標(biāo)明標(biāo)準(zhǔn)誤,而錯用了標(biāo)準(zhǔn)差等。如《正常小兒三種不同劑量及正常成人50微克PHA皮試反應(yīng)強(qiáng)度研究》一文中寫道:“正常值范圍為均值±2×標(biāo)準(zhǔn)誤”。井寫道:“小兒50微克組:均值±2×標(biāo)準(zhǔn)誤=2.01~18.1毫米”。顯然是錯誤地把標(biāo)準(zhǔn)誤當(dāng)成標(biāo)準(zhǔn)差用作估計正常值了。
(二)正常值研究中的幾個問題
臨床正常值確定方法依資料頻數(shù)分布類型而定,主要有兩種:一是均值加減標(biāo)準(zhǔn)差法適用于近似正態(tài)分布資料,二是百分位數(shù)法,適用任意分布資料。此外,角度資料(如腦血流圖、心電圖等的角度數(shù)據(jù))運(yùn)用圓形分布法,Poisson分布資料用Poisson分布法,正偏態(tài)分布資料用對數(shù)正態(tài)分布法等來處理?,F(xiàn)今全國發(fā)表的一些醫(yī)學(xué)論文中,正常值方面的問題也較多。引一些實(shí)例加以研究。
如在《遷延性、慢性肝炎患者植物血凝素皮試應(yīng)用價值的探討》一文中寫道:“正常人甲組156人…平均值±標(biāo)準(zhǔn)誤為15.4±0.4mm(平均值上標(biāo)準(zhǔn)差為15.4±5.6mm)。”那么,正常值是角標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差咖個統(tǒng)釬量來計算的呢?是加減1倍還是2倍標(biāo)準(zhǔn)差(或標(biāo)準(zhǔn)誤)呢?作者均來說明。
又如《正常兒童尿游離α氨基酸氮的測定》一文,對1~13歲(分四個年齡組)125名正常兒進(jìn)行研究,在正常值研究設(shè)計及分析時存在三個問題:(1)樣本含量不足:如不同性別、不同年齡組的測定值僅據(jù)15人的結(jié)果而定正常值,顯然是不妥的。作者針對各組結(jié)果矛盾現(xiàn)象,在討論中兩八提到“可能因例數(shù)太少,不能切實(shí)反映客觀規(guī)律的緣故?!比舭床煌詣e、年齡組確定正常值,一般要求每組100~12O人方能悅明問題。(2)錯把標(biāo)準(zhǔn)誤當(dāng)作標(biāo)準(zhǔn)差用作估計正常值范圍:文中說:“1~13歲正常兒童的游離α氮基酸氮/總氮%的均值可信限為:1.30±3×0.036,即1.19~1.41”。這里將標(biāo)準(zhǔn)誤0.036當(dāng)作標(biāo)準(zhǔn)差用作估計正常值了。正確的應(yīng)是:“游離α氨基酸氮×l00/總氮%的95%正常值范圍為1.30±2×0.4=0.~2.3。這里0.4是標(biāo)準(zhǔn)差。正常值范圍在正態(tài)分布資料時,如考慮到樣本大小及把握度,最好表達(dá)為單側(cè):+KS或-KS;雙側(cè)±KS。式中K值表(見周達(dá)生:醫(yī)學(xué)問答,中華兒科雜志(4):245,1980)。(3)按性別、年齡組制訂正常值問題:當(dāng)研究對象有多個年齡組時,兩組均數(shù)間比較用t檢驗(yàn),多組均數(shù)間比較可用F-Q檢驗(yàn),若差異顯著,則需按不同性別、年齡組分別制訂正常值。
(三)聯(lián)系與因果
在臨床實(shí)驗(yàn)研究中,經(jīng)某種處理(如治療)后受試對象出現(xiàn)某種反應(yīng)(如治愈),并不能肯定是因果關(guān)系。有時比較兩變量之間關(guān)系時,雖明顯相關(guān),但也不能斷言其間有因果關(guān)系,只能說有一定統(tǒng)計聯(lián)系(蘇德?。郝?lián)系與因果。中華預(yù)防醫(yī)學(xué)雜志13:106,1979)。在醫(yī)學(xué)論文中甚至有不作相關(guān)回歸分析就胃然下類似結(jié)論的。要了解有無因果關(guān)系,有時可進(jìn)一步作回歸分析(當(dāng)然因果可表現(xiàn)為回歸關(guān)系,但呈回歸關(guān)系不一定是因果關(guān)系)。
(四)多組多級小值頻數(shù)處理問題
在臨床及動物實(shí)驗(yàn)研究中常遇到多組多級(R×C表)小值頻數(shù)的比較,論文中大多忽視此類數(shù)據(jù)的合理統(tǒng)計處理,主要問題有:(1)未加適當(dāng)統(tǒng)計處理,不考慮抽樣誤差而憑表面數(shù)字差別就輕易下結(jié)論。(2)處理方法不恰當(dāng)。對此類數(shù)據(jù)可采用超幾何概率計算法(見周達(dá)生:醫(yī)學(xué)科研中鄉(xiāng)組小值頻數(shù)統(tǒng)計處理方法探討。中華預(yù)防醫(yī)學(xué)雜志(4):211,1980)、薛仲三氏X3檢驗(yàn)公式(見薛仲三,醫(yī)學(xué)統(tǒng)計方法和原理。366頁,人民衛(wèi)生出版社,北京1978)和秩和檢驗(yàn)與等級指數(shù)法(黃鎮(zhèn)南:等級型資料的三種統(tǒng)計分析方法,湖南醫(yī)學(xué)院,長沙,1980)等。
(五)零反應(yīng)的統(tǒng)計處理
兩組計數(shù)比較,若一組有零反應(yīng),即出現(xiàn)0%或100%情況時,可用零反應(yīng)公式處理。
如《病毒性肝炎中醫(yī)辯證與機(jī)體免疫狀態(tài)的初步探討》一文,作者對19例遷延件肝炎中醫(yī)辨證與淋轉(zhuǎn)測定結(jié)果作了分析(原文表3)。由于作者對數(shù)據(jù)未作處理而下結(jié)論,不少信息失落,有些矛盾現(xiàn)象難以解釋。原表3中有三處出現(xiàn)有零反應(yīng),宜分割后列出三個四格表,用零反應(yīng)檢驗(yàn)法處理。本例為雙側(cè)檢驗(yàn),差異顯著性水平定力0.25和0.005。從三個四格表分析結(jié)果看,僅氣虛與陰虛淋轉(zhuǎn)測定值之間差異顯著(P<0.005),而正不虛與氣虛和陰虛問差異均不顯著(P>0.025)。從而提示在虛證中還要區(qū)別對待,只有氣虛者免疫功能才顯著地低下。這樣可使文中矛盾現(xiàn)象找到合理解釋。