醫學心理學/標準化測驗的基本特徵

跳轉到: 導航, 搜索

醫學心理學

心理測驗總則
- 標準化測驗的基本特徵
- 如何提高測驗效用

一個測驗是否標準化了，須在下面幾個方面受到考驗：

1．取樣（sampling）心理測驗是衡量某一心理品質的標尺，這個標尺產生於樣本。人們的心理活動千差萬別，所以取樣時，必須照顧取樣的代表性。根據樣本結果來使測驗標準化，這個樣本便是測驗的標準化樣本。在選擇測驗時除了了解所取樣本的代表性外，還要注意這一樣本與受試的情況是否相應。一般來說，要考慮樣本的年齡範圍、性別、地區、民族、教育程度、職業等基本特徵。如果是臨床量表，還應有疾病診斷、病程及治療等背景。受試者的情況在這些方面與樣本相應，所測結果與樣本才有可比性。在實際工作中，不是所有時候都有一個很適合的工具供使用，不得已也會使用不很相應的量表。這時，在解釋中須加以說明，並持謹慎態度，否則很易造成錯誤。

2．常模（norm）常模是一種可供比較的普通形式。通常有如下幾種：

（1）均數：是常模的一種普通形式。某一受試所測成績（粗分，或稱原始分）與標準化樣本的平均數相比較時，才能確定其成績的高低。

（2）標準分：均數所說明的問題還是有限的。只看均數，不注意分散情況，所得受試者的信息非常有限。如用標準分作常模，便可提供更多的信息。標準分能說明受試者的測驗成績在標準化樣本的成績分布圖上居何位置。標準分（Z）＝受試者成績（X）與樣本均數（x）之差（即X－x）除以樣本成績標準差（SD）。簡化成Z＝（X－x）／SD。這樣一來，不僅說明受試者的成績與樣本比較在其上或其下，而且還說明相差幾個標準差。

許多量表採用這種常模或由此衍化出來的常模。例如：在Wechsler氏量表中，離差智高＝100+15(X-x )/SD便是這一種。離差智商與標準分常模的不同之處在於：一是標準分均數為0。而離差智商均數為100。即Z=X在標準分時為0，在離差智商時為100；二是標準分的SD值隨樣本而定，而離差智商中是令標準差為15(Stanford Binet 為16)。

（3）T分：T分常模是標準分衍化出來的另一種常用常模。例如MMPI便採用此種常模。它與離差智商的不同之處，是所設的均數值及標準差不同。T分計算的公式：

T=50+10(X-x)/SD

（4）由標準分衍化而來的其他形式的常模；標準20和標準10即是屬於這一類，都是改變均數及標準差值而得。其計算公式如下；

標準 20=10+3(X-x)/SD

標準10=5+1.5(X-x)/SD

在韋氏量表中，有粗分、量表分以及離差智商諸量數。其中量表分的計算方法即屬此處的標準20計演算法。

（5）百分位（percentile rank,PR）：這是另一類常用常模，比標準分應用得早，且更通用。它的優點是不需要統計學的要領便可理解。習慣上將成績差的排列在下，好的在上，計算出樣本分數的各百分位範圍。將受試者的成績與常模相比較。如相當百分位50（P50），說明此受試者的成績相當標準化樣本的第50位。也即是說，樣本中有50％的人數，其成績在他之下（其中最好的至多和他一樣），另外50％人數的成績比他的好。如在P25，說明樣本中25％的成績在他之下（或至多和他一樣），另有75％人數的成績比他的好。以此類推。

（6）劃界分（cut off score）：在篩選測驗中常用此常模。如教育上用100分制時，以60分為及格分，此即劃界分。而入學考試時的劃界分因考生成績和錄取人數而異。在臨床神經心理測驗中，將正常人與腦病患者的測驗成績比較，設立劃界分，用這個分數劃分有無腦損害。如果某測驗對檢查某種腦損害很敏感，就說明設立的劃界分很有效。病人被劃入假陰性的人數就很少甚至沒有，正常人被劃為假陽性的也很少或沒有。如果不敏感，則假陽性或假陰性的機會均會增加。

（7）比率（或商數）：這一類常模也較常用。例如：在離差智商計算方法之前，便使用比率智商。其計算方法：IQ＝MA／CA×100，是將MA（心理年齡）與CA（實際年齡）相等的設作100，以使IQ成整數。H.R.B.中的損傷指數也是比率常模。損傷指數＝劃入有損的測驗數／受測的測驗數（圖12－1）。

不同測驗分與Z分和常態分佈的關係

圖12－1 不同測驗分與Z分和常態分佈的關係

以上是通用常模形式，此外還有各種性質的常模。如年齡常模（按年齡分組建立的）、性別、區域和各種疾病診斷的常模。從可比性看，常模越特異越有效。從適應性講，則以通常模使用方便。例如：以智力測驗為例，全國常模運用的範圍廣，而區域常模應用的地區則有限。但後者比前者更精確。有的常模雖系區域性，但因該區域有代表性，也可用於相似地區。

3．信度（reliability）心理測驗的信度是指同一受試者在不同時間用同一測驗（或用另一套相等的測驗）重複測驗，所得結果的一致性程度。信度用係數（coefficient）來表示。一般說，係數越大，說明一致性高，測得的分數可靠；反之則相反。信度的高低與測驗性質有關。通常，能力測驗的信度（要求0.80以上）高，人格測驗的信度（要求0.70以上）低。凡標準化的測驗手冊，都需要說明本測驗用各種方法所測得的信度。考驗信度通常有如下方法：

（1）重測信度：同一組受試在兩次不同時間作同一套測驗所得結果的相關性檢驗。

（2）正副本相關：有的測驗同時編製了平行的正副本，將同一組受試的兩套測驗結果進行相關性檢驗。

（3）分半相關：將一套測驗的各項目（要求按難度為序）按奇、偶數號分成兩半，對所測結果進行相關性檢驗。

其它尚有因素信度、測量標準誤等，此處從略。

4．效度（Validity）所謂效度即有效性，指此測驗測查到所要測查的沒有？測查到何種程度？如一個智力測驗，若測驗結果所表明的確實是受試的智力，而且量准了智力水平，那麼這一智力測驗的效度好；反之則不好。效度檢查，也同信度檢查一樣,有多種方法，並有各種名稱，如內容效度、預測效度、因素效度、內部效度等。美國心理協會在《心理測驗和診斷技術介紹》，簡稱《APA》（1954）及《教育和心理測驗的標準與手冊》（1966）中將它們分為三類。即校標（criterion）效度、內容（content）效度和結構（construct）效度三類，以後廣泛沿用。

（1）校標效度：即將測驗結果與某一標準行為進行相關檢查。如智力測驗與學習成績，診斷測驗與臨床診斷進行相關檢查等均屬之。

（2）內容效度：指測驗映所測量內容的程度。如算術成就測驗應反映受試者運算能力的程度。測驗與之相關的標準，是老師的評定，日常生活或工作中所表現的能力等。

（3）結構效度：反映編製此測驗所依據理論的程度。如編製一個智力測驗，必定依據有關智力的理論。該測驗所反映此智力的程度，可用結構效度來檢驗。

5.方法的標準化　施測方法、記分方法、標準結果的換演算法等都要按一定的規定進行，方符合標準測驗的條件。