日本留学試験における得点等化について

2005年7月22日更新

日本留学試験は年に2回実施され、その得点は2年間に渡って利用される。そのため、各大学、短期大学および専修学校などで実施される1回の入学選考において、最大で4回分の試験の成績が混在して利用され得る。毎回の試験では異なる内容の問題が出題される上、実施地域間の時差への対策等の理由から、同一実施回においても複数種類の問題冊子が利用されるので、1回の入学選考において4種類以上の異なる試験の得点が比較されることになる。

得点等化

試験とは、「得点」というモノサシを使って能力レベルを測定するものである。しかし、能力レベルには長さや温度のように明確に定められた単位が無いので、このモノサシは試験の難易度等の違いによって全く別の目盛りが使われることになってしまう。左の図は、4つの試験甲・乙・丙・丁の得点と能力レベルの対応を表したものである。図から試験甲に比べて試験乙は高得点をとりにくく(問題が難しい)、試験丙は高得点をとりやすい(問題が易しい)ことがわかる。ここで、図中の受験者AとBの能力を比較する場合を考える。2人とも同じ試験を受けている限り、常にAはBよりも得点が高いので、Aの方が高い能力を持っていることを正しく評価することができる。しかし、人によって受験する回が異なると、例えばAが乙、Bが丙を受験するような事態が生じる。この場合、Aが35点に対してBは70点となり、たまたま易しい試験を受けたBの方が、より高い能力を持っているとみなされてしまう。

このような事態は、各回の試験が難易度等の性質に関して等質でないために生じるので、まず第一に、毎回の試験問題を可能な限り等質なものにする努力をしていく必要がある。しかし、毎回異なる問題で構成される試験の性質を、完全に等質にすることは困難である。その結果、図のように極端な事態は生じなくとも、実施回によって取得できる得点が変わるようなことがあれば、たまたま難しい回を受験した人が不利益を被ることになる。図の場合は4つの試験の得点の対応が明示されているので、受験者Aの方がレベルが高いことが明らかであるが、実際の試験ではそのような得点の対応づけがされていないことが多い。そこで、異なる試験の得点を対応づけ、試験の性質に依存しない得点に変換するために、何らかの方法で得点を調整する必要が出てくる。

得点等化とは、このような状況において、異なる試験を受験した人の得点から試験の性質による影響を排除して、受験者の能力に相応する何らかの共通な得点(尺度点)に変換して比較可能にする操作にほかならない。得点等化にはいくつかの方法が知られているが、項目反応理論と呼ばれる統計的理論に基づく方法が欧米諸国ではよく用いられており、TOEFLのような定評のある試験における等化方法としても用いられている。日本留学試験においても、基本的にはこの方法を用いて得点等化を行う。

項目反応理論では、個々の問題(項目)の統計的性質をもとにして得点等化を行う。あらかじめ、個々の問題の難易度などの統計的性質をあるひとつのモノサシを使って推定する。そして、どのような統計的性質の問題にどの程度正答できるかという情報をもとに、受験者の能力レベルがそのモノサシ上で測定されることになる。その結果、以前に受験したときに比べて受験者の学習が進んだ場合には、たまたま受験する試験の性質に関わらず、尺度点が上がることになる。日本留学試験ではそのような得点等化済みの尺度点が利用されるので、異なる回の得点であってもそのまま比較することができるのである。