結構效度

跳轉到: 導航, 搜索

結構效度是指一個測驗實際測到所要測量的理論結構和特質的程度，或者說它是指測驗分數能夠說明心理學理論的某種結構或特質的程度；是指實驗與理論之間的一致性，即實驗是否真正測量到假設（構造）的理論。

結構效度的概念最初是由美國心理學會(APA) 、美國教育研究協會(AERA) 和美國國家教育測量協會(NCME) (1954) 聯合委員會提出,發表於《心理測驗和診斷技術的技術建議》,本意是用於當測驗者所測屬性沒有確定的標準測量,而必須使用間接的測量來證實理論有效的時候。結構效度的出現,可以看成是自比奈發明智力測驗以來,測驗領域中最為顯著的變化。它標誌著測驗和歷史傳統與實用傳統徹底決裂,而且至今仍以顯著的方式改變著測驗事業。

結構效度是指一個測驗實際測到所要測量的理論結構和特質的程度，或者說它是指測驗分數能夠說明心理學理論的某種結構或特質的程度。它關係到我們依據測試成績所做的、對評價測試結果的解釋是否有意義並且恰當。羅德和諾維克認為「測試最重要的特性在於它的結構效度」。

結構效度的特點與應用範圍：

根據定義，可以得知結構效度具有如下一些特點：

（1）結構效度的大小首先取決於事先假定的心理特質理論(戴海崎, 張鋒和陳雪楓，2007)。要使得關於某一特質測驗的結構效度的研究結果可以進行比較，則對於該特質的假設和定義就應該相同。否則，不能進行比較。

（2）由於有可能出現理論假設不成立，或該試驗設計不能對該假設作出適當的檢驗等情況，因此當實際測量的資料無法證實我們的理論假設時，並不一定就表明該測驗結構效度不高。

（3）結構效度是通過測量什麼和不測量什麼的證據累加起來給以確定的，因而不可能有單一的數量指標來描述結構效度。

結構效度主要用於智力測驗、人格測驗等一些心理測驗方面。

確定結構效度的方法：

測驗編製者確定結構效度的方法

（1）考察測驗的內容效度，因為有些測驗對所測內容或行為範圍的定義或解釋類似於理論構想的解釋，所以內容效度高實質上也說明結構效度高。

（2）計算測驗的同質性信度的方法來檢測結構效度。若有證據表明測驗不同質，則可以斷定該測驗結構效度不高。

（3）利用相容效度法，考察新編製的測驗與某個已知的能有效測量相同特質的測驗之間的相關。若兩者相關較高，則說明新測驗有較高的效度。

（4）利用區分效度法，考察新編測驗與某個已知的能有效測量不同的特質的舊測驗間的相關。若兩者相關較高，表明測到了其他心理特質，則新測驗效度不高。

（5）對一組測驗進行因素分析，找出影響測驗的共同因素，每個測驗在共同因素上的負荷量（即測驗與各因素的相關）就是測驗的因素效度，測驗分數總變異中來自有關因素的比例就是該測驗結構效度的指標。

（6）綜合應用相容效度法和區分效度法，若用多種極不相同的方法測量同一種特質相關很高，或用極為相似的方法測量不同特質相關很低，則說明測量效度很高。若有多種特質都接受了多種方法的測量，就可以分別計算出任意兩種方法測量同一種特質的相關和測量不同特質的相關，以及任意兩種特質接受同一方法和不同方法的相關。

使用者確定結構效度的方法

（1）分析被試答題的過程。若有證據表明某一題的作答除了反映所要測的特質外，還反映其他因素的影響，則說明該題沒有較好地體現理論構想，該題的存在會降低結構效度。

（2）根據所要預測的效標的性質和種類來推斷結構效度，有兩種做法：其一，根據效標把人分為兩類，考察其得分的差異。若兩組人得分差異顯著，則說明該測驗有效，具有較高的結構效度。其二，根據測驗得分把人分成高分組和低分組，考察這兩組人在所測特質方面是否有差異。若兩組人在所測特質方面差異顯著，則說明該測驗有效，具有較高的結構效度。總結

結構效度的最大貢獻是可以用來提出和驗證假設，是發展心理學理論的重要研究工具。當然結構效度也有其明顯的局限性，特別是當測驗結果不能驗證原來的構想時，我們不能確定是構想有錯誤，是測驗本身缺乏內容效度，還是實驗設計有問題。這說明結構效度發展還未完全成熟。

出自A+醫學百科「結構效度」條目 http://cht.a-hospital.com/w/%E7%BB%93%E6%9E%84%E6%95%88%E5%BA%A6 轉載請保留此連結

關於「結構效度」的留言：	訂閱討論RSS
目前暫無留言
添加留言

結構效度

更多醫學百科條目

個人工具

名字空間

檢視

動作

搜索

導航

功能菜單

工具箱