多變數統計分析

跳轉到: 導航, 搜索

多變數統計分析(multivariate statistical analysis),統計資料中有多個變數(或稱因素、指標)同時存在時的統計分析,是統計學的重要分支,是單變數統計的發展。例如對630名炊事員高血壓病進行調查,檢查項目中除血壓外,尚有年齡、性別、體重、體胖等15個項目(變數)。如果用單變數統計分析法考察超重與血壓的關係,一般是把數據做成表1的形式。從表1可見,超重組與不超重組相比,高血壓患病率高出一倍以上。但如果把資料按體胖者與不體胖者劃分成兩組,再考察每組內的超重與高血壓患病率的關係,就未能發現超重與高血壓患病率有任何明顯的聯繫。也就是說,單變數統計分析忽視了另外因素(如此例中的體胖及年齡等)的影響。對於有多個變數客觀存在而又相互影響的資料,採用簡單的單變數統計分析是不合理的。多變數統計分析就能把變數間的內在聯繫和相互影響考慮在內。

統計學中的多變數統計分析起源於醫學和心理學。1930年代它在理論上發展很快,但由於計算複雜,實際應用很少。1970年代以來由於計算機的蓬勃發展和普及,多變數統計分析已滲入到幾乎所有的學科。到80年代後期,計算機軟體包已很普遍,使用也方便,因此多變數分析方法也更為普及。

多變數統計的理論基礎和工具是數學中的機率論和矩陣。但對於實際應用者而言,只要有合適的計算機和軟體包以及掌握一些初步的多變數統計知識就可以使用它來解決實際問題。多變數統計的內容很多,但從實際應用角度看,主要包括回歸分析、判別分析、因子分析、主成分分析、聚類分析、生存分析等六個大的分支。

關於「多變數統計分析」的留言: Feed-icon.png 訂閱討論RSS

目前暫無留言

添加留言
個人工具
名字空間
動作
導航
功能菜單
工具箱