個人差研究のための心理尺度の有効性―使用目的と内容―（福島県立医科大学助教：三枝高大） #心理統計を探検する

2024年1月17日 17:00

個人差研究において，心理尺度は個人間の差を把握することを目的としているにもかかわらず，その目的から離れた心理尺度の作成，利用，解釈が見受けられます。心理尺度の目的を確認したうえで，有効性・妥当性の検証，心理尺度の内容はどう扱われるべきなのかについて，三枝先生に解説いただきました。

1. はじめに

　現代のパーソナリティ心理学では，パーソナリティを始めとする心理学的構成概念に関する個人差を把握し，母集団の特徴を推測する個人差研究が行われています (e.g. 川本, 2023; 渡邊, 2018)。そうした研究で個人差を把握するために用いられる主な道具が心理尺度です。心理学的構成概念に関する個人差を把握するためには，多くの人々から心理尺度の諸項目への回答を得るという手続きが含まれます。Big Five Personality (e.g. 谷他, 2023) やHEXACO (e.g. Lee & Ashton, 2013 小塩監訳 2022), 対人円環モデル (e.g. Plutchik & Conte, 1997 橋本・小塩訳 2019) といった過去から現在までにかけて研究されてきた主要な諸パーソナリティ・モデルも，その研究の多くは，心理尺度を用いることで，その知見が蓄積されています。

　しかし，個人差を把握する手段として用いられる心理尺度は，本来の使用目的を超えた範囲で使用したり，得られた結果を解釈したりすることはできません。個人差を把握するための開発手続きを経て作成された心理尺度$${^{1}}$$を用いた調査結果が，個人差の把握という文脈を離れて，心理学的構成概念の意味を明らかにする結果として読み取られてしまうことや，特定の人物をアセスメントするために開発された道具として紹介されることがあるかもしれません。あるいは，個人差の把握の手段であることが忘れ去られたまま心理尺度の開発に着手した場合には，個人差把握のための内容を備えていない心理尺度が生み出されてしまうことでしょう。そこで本稿では，心理尺度の諸項目は，単に，心理学的構成概念の内容が表現されたものではなく，個人差の把握を含む，開発される心理尺度の使用目的に応じて作成されるものであることを確認していきます。

2. 使用目的に応じた心理尺度の有効性

　個人差研究で用いられる心理尺度は，個人差を把握するという目的を達成するために作成され，その使用に先立って，個人差を把握する手段としての有効性が示されます。心理尺度が個人差を把握する手段としての有効性を示す際にあげられるものの1つが妥当性です。妥当性は，現代では，テストの使用目的に応じたテスト得点の解釈とテスト使用の有効性が経験的証拠と理論によって支持されている程度を意味します (e.g. AERA, APA, & NCME, 2014)。妥当性は当初，単に「測りたいものが測れている$${^{2}}$$」こととされていましたが (e.g. Buckingham, 1921)，現在ではこのように，テストの使用目的に応じたその利用の適切性に重点を置いた意味づけがなされています。個人差研究のための心理尺度の使用についても，測定対象となる集団の個人差を把握するという使用目的と無関係に有効性の検証手続きを決定することはできません。また，その開発過程においても個人差把握という使用目的に応じた項目作成が行われる必要があります。

　心理尺度の妥当性を示す手続きとして，基準関連の証拠や収束的証拠や弁別的証拠といった，当該心理尺度と別の指標の関連性によって経験的に示される証拠 (Messick, 1989 池田訳 1992) は，心理尺度開発の研究論文中で目にすることの多い手続きです。この時に確認される別の指標は，心理尺度の扱う心理学的構成概念の内容から，その使用目的にかかわらず，一律に決定されるものではありません。当該心理尺度がどのような集団を対象に用いられるものであり，どのような目的で心理尺度を用いるものなのかに応じて決定されるものです（e.g. Messick, 1975）。

　心理尺度の開発にあたっては，任意の心理学的構成概念に関する内容が含まれた多数の項目が作成されます。こうした項目の内容に関する適切性を検討することも，妥当性を示す証拠の1つとしてみなされています (Messick, 1989 池田訳 1992)。内容の適切性に関する証拠は，心理尺度開発の妥当性検証の手続きとして研究論文中で目にすることは比較的少ないものかもしれません。心理尺度の諸項目の開発や，心理尺度の諸項目の内容の適切さの検討手続きについても，心理尺度の使用目的に応じて決定されるものであり (e.g. Lennon, 1956)，取り扱う心理学的構成概念の包含する広範な意味内容を単に含んでいるか，といった観点からのみで検討されるというわけではありません。

3. 心理尺度の内容

　心理尺度の内容の適切さを考えるときに検討される「内容」という語は，単に，各項目に記述された文章だけのことを指すというよりも，回答者に回答を求めたときに想定される諸項目への反応を含むものと考えられます (e.g. Guion, 1977; Messick, 1989 池田訳 1992)。こうした意味では，内容の適切さというものは，取り扱いたい心理学的構成概念を心理尺度の諸項目がいかに適切に表現できているかによって検討されるのではなく，使用目的に応じて，意図した反応が得られる内容であるかが重要視されます。

　たとえば，「優しさ」の心理尺度であれば，「優しさ」の意味を的確に表した内容をもった諸項目であるかというよりも，「優しさ」の多寡が回答に反映されうる内容をもった諸項目であるとみなせるかという観点が重要になります。くわえて，個人差の把握という使用目的が開発される心理尺度にあるのであれば，作成される諸項目によって人々から得られる諸反応は，研究目的に適う範囲で，個人差を持ったものとなることが想定される内容である必要はあります$${^{3}}$$。同じく，「優しさ」の心理尺度を例とするならば，使用目的に適う範囲の「優しさ」の個人差を把握するための項目反応を得られる内容であるかも検討されなくてはなりません。いかに「優しさ」の意味が的確に表現された項目であっても，「優しさ」の多寡以外の理由で項目反応が決定されうる内容や研究意図に応じた項目反応の個人差を得ることが困難であると想定される内容は項目候補から除外されえます。

　関連して，心理尺度の作成にあたって実施される因子分析の潜在変数が心理尺度の諸項目に共通する内容を表していると考える研究者もいるようです (e.g. Borsboom, 2005 仲嶺監訳 2022)。こうした考えに基づいて，心理学的構成概念のもつ多様な内容の意味を分類する手段として因子分析が用いられる場合もあるかもしれません。こうした利用においては，心理学的構成概念の多様な意味内容の共通性と因子分析によって把握される諸項目への回答の個人差に基づく潜在変数に対応関係を見出していることになります。確かに，1つの心理学的構成概念であっても，多様な意味内容を含みうるものであり，心理尺度に含まれる諸項目もそれらの意味内容に応じて複数の領域に分類することができるでしょう。しかし，そうした意味上の分類にもとづいた諸項目に共通する内容と回答者の集合の特徴を示した潜在変数とは異なるものであり，それらを同一のものとみなせるというわけではありません (e.g. Borsboom, 2005 仲嶺監訳 2022)。

4. まとめ

　上記で述べましたように，心理尺度はその使用目的に応じて項目が作成され，その有効性の検証方法もまたその使用目的に依存します。心理尺度は新たな心理学的構成概念の開発と同一視されることもありますが，個人差研究で用いられる心理尺度が扱っているのは，やはり，心理学的構成概念の個人差としての側面であることを，心理尺度を用いた研究を実施したり，読み解いたりする際には留意する必要があるでしょう。

脚注

個人差の把握を目的としない心理尺度は，異なる目的を達成するための，異なる手続きによって作成されることでしょう。
このことをいわゆる妥当性検証の手続きで示すことができると考えることは，難しい仮定でもあります (e.g. Borsboom, 2005 仲嶺監訳 2022)
本稿では，想定としていますが，構成概念妥当性に含まれるような実質的証拠を得るために，調査を実施した上で項目反応を確認する手続きを妥当性の検証手続きに含めることもあります。

引用文献

American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (2014). Standards for educational and psychological testing. Washington, DC: American Educational Research Association.
Borsboom, D. (2005). Measuring the mind: Conceptual issues in contemporary psychometrics. Cambridge University Press. (ボースブーム, D. 仲嶺真（監訳）下司忠大・三枝高大・須藤竜之介・武藤拓之（訳）(2022). 心を測る―現代の心理測定における諸問題― 金子書房)
Buckingham, B. R. (1921). Intelligence and its measurement: A symposium--XIV. Journal of Educational Psychology, 12(5), 271–275.
Guion, R. M. (1977). Content validity—The source of my discontent. Applied Psychological Measurement, 1, 1-10.
Lee, K. & Ashton, M. C. (2013). The H Factor of Personality: Why Some People Are Manipulative, Self-Entitled, Materialistic, and Exploitive—And Why It Matters for Everyone. Wilfrid Laurier University Press. (K.リー，M.C.アシュトン. 小塩真司（監訳）三枝高大・橋本泰央・下司忠大・吉野伸哉（訳） (2022). パーソナリティのHファクター―自己中心的で，欺瞞的で，貪欲な人たち― 北大路書房)
Lennon, R. T. (1956). Assumptions underlying the use of content validity. Educational and Psychological Measurement, 16, 294–304.
Messick, S. (1975). The standard problem: Meaning and values in measurement and evaluation. American psychologist, 30, 955.
Messick, S. (1989). Validity. In R. L. Linn (ed.), Educational Measurement (pp.13–103). Washington, DC: American Council on Education and National Council on Measurement in Education. (メシック, S. 池田央（訳） (1992). 妥当性 R. L. リン（編）池田央・藤田恵璽・柳井晴夫・繁桝算男（訳）教育測定学〈上巻〉pp.19-145. 学習評価研究所)
川本哲也 (2023). 個人差研究に関する動向・課題と今後の展望―パーソナリティの統合的理解に向けて― 教育心理学年報, 62, 63-90.
Plutchik, R., & Conte, H. R. (1997). Circumplex Models of Personality and Emotions. American Psychological Association. (ロバート・プルチック, ホープ・R・コント. 橋本泰央・小塩真司（訳） (2019). 円環モデルからみたパーソナリティと感情の心理学福村出版)
谷伊織・阿部晋吾・小塩真司（編著） (2023). Big Fiveパーソナリティ・ハンドブック―5つの因子から「性格」を読み解く― 福村出版
渡邊芳之 (2018). パーソナリティ研究の現状と動向教育心理学年報，57, 79-97.

執筆者プロフィール

三枝高大（みえだ・たかひろ）
福島県立医科大学保健科学部助教。
専門はパーソナリティ心理学，差異心理学。

著訳書

デニーボースブーム　仲嶺真（監訳）下司忠大・三枝高大・須藤竜之介・武藤拓之（訳） (2022). 『心を測る―現代の心理測定における諸問題―』金子書房

K. リー・M. C. アシュトン　小塩真司（監訳）三枝高大・橋本泰央・下司忠大・吉野伸哉（訳） (2022). 『パーソナリティのHファクター―自己中心的で，欺瞞的で，貪欲な人たち―』北大路書房