文章詳目資料

測驗學刊 TSSCI

  • 加入收藏
  • 下載文章
篇名 垂直等化連結特性之研究:六種連結方法的比較
卷期 58:4
並列篇名 A Comparison of the Differences in Linked Score Properties for Vertical Scaling Obtained Using Six Linking Methods
作者 陳煥文
頁次 001-020
關鍵字 垂直等化相同分數分配特性連結方法連結關係等值特性Equity propertiesLinking methodsLinking relationshipsSame distribution propertyVertical scalingTSSCI
出刊日期 201112

中文摘要

本研究的目的為探討在垂直等化的情境下,以六種不同連結方法將低年級(四年級)測驗分數連結到高年級(六年級)測驗分數量尺時,不同連結方法在連結分數特性上表現之差異。本研究採用共同試題連結設計,而六種連結法包括次數估計法、Tucker 觀察分數法、Levine 觀察分數法、IRT 觀察分數法、IRT 真分數法和Levine 真分數法,歸類上前四者屬觀察分數連結法,後兩者屬真分數連結法;另外用以評比六種連結方法表現的連結分數特性包括連結關係、相同分數分配特性、第一序列等值特性和第二序列等值特性。本研究使用的測驗為四年級與六年級數學科電腦化測驗分別有25 題與27題,而其中共同試題有5 題;研究結果顯示就連結關係言,四年級與六年級分數呈現非線性連結關係,因此非線性連結法如IRT 真分數與觀察分數法和次數估計
法就能反應呈現此非線性連結關係;就相同分數分配特性而言,表現最好的為Tucker 觀察分數法和次數估計法,整體而言,觀察分數連結法在相同分數分配特性表現較真分數連結法佳,而所有的連結方法在六年級的大部分原始分數點皆低估了相對累積次數;就第一序列等值特性言,表現最好的兩種連結方法為IRT 真分數和觀察分數法,主要原因在於真分數的假設基礎、非線性連結關係的存在與IRT 心理計量模式的採用,而較低能力者( <-1.5)或較高能力者( >2.0)往往所得到的連結分數比其在六年級所預期得到的分數來的低,反之,在能力值較密集的中間範圍(-1.5< <2.0),受試者所得到的連結分數比其在六年級所預期得到的分數明顯來得高;整體而言,真分數連結法達到第一序列等值特性的程度較觀察分數連結法為高;就第二序列等值特性而言,表現最好的連結法為Levine 觀察分數法和Tucker 觀察分數法,在相當大的範圍內(能力值小於0.7),Levine 和Tucker 觀察分數法的條件測量標準誤明顯較其他方法接近六年級分數的條件測量標準誤,整體而言,觀察分數法在第二序列等值特性的表現較真分數
法為佳。

英文摘要

Six linking methods were used to link the grade 4 math test to grade 6 math test using common-item design. The six linking methods included in this study were four observed score methods (frequency estimation, Tucker observed linear, Levine observed linear, and IRT observed) and two true score methods (IRT true and Levine true linear). The criteria used for comparisons included similarities of the linking relationships, the equal distribution property, first order equity, and second order equity. The two tests for grade 4 and grade 6 are computerized math tests consisting of twenty-five and twenty-seven items, respectively. Among the items in the two tests, five of them are common items. The results indicated the existence of curvilinear linking relationship between the two tests. In general, first order equity tended to be more closely achieved by the true score methods than by the observed score methods. By contrast, the same distribution property and second order equity property were more closely achieved by the observed score methods than by the true score methods.

相關文獻