研究デザインにおける4つのタイプの妥当性(+3さらに考慮すべき)
公開: 2021-01-03調査から導き出した結論(調査、フォーカスグループ、実験計画、またはその他の調査方法の分析から)は、それらが有効である場合にのみ役立ちます。
これらの結果はどの程度「真実」ですか? それらはあなたが実際に勉強しようとしていることをどれだけうまく表現していますか? 妥当性は、研究が測定しようとしたものを測定するかどうかを判断し、結果の真実性を概算するために使用されます。
残念ながら、研究者は、有効と見なされるものに関して、独自の定義を作成することがあります。
- 定量的研究では、妥当性と信頼性のテストが行われます。
- しかし、一部の定性的研究者は、彼らが彼らの仕事におけるいくつかの適格性チェックまたは措置の必要性を認めているとしても、彼らの研究には妥当性が適用されないことを示唆するところまで行ってきました。
これは間違っています。 定性的研究で判断するのが難しい場合でも、妥当性は常に重要です。
妥当性を無視することは、あなたの仕事の信頼性を問題にし、他の人にその結果への信頼を疑うことです。 研究で定性的尺度を使用する場合でも、結果の信頼性を維持するために、信頼性と妥当性の尺度を使用してそれらを検討する必要があります。
研究における妥当性とは何ですか?
妥当性は、結果が現実を表す範囲について研究者が話す方法です。 定量的または定性的な調査方法は、実際の現象を調査する方法です。妥当性とは、測定する現象の量と、結果によって取得される「ノイズ」または無関係な情報の量を指します。
妥当性と信頼性は、「良い」研究報告と「悪い」研究報告の違いを生みます。 質の高い研究は、研究結果の信頼性だけでなく、テストと妥当性の向上への取り組みに依存しています。
その重みに値する研究は、測定されているものが測定されることを意図しているものであるかどうかに関係し、観察が行われる状況によって観察がどのように影響を受けるかを考慮します。
私たちの結論がどのように行われるかの基礎は、与えられた研究のより広い実質的な問題に取り組む上で重要な役割を果たします。
このため、正当な調査方法の一部として策定されたさまざまな妥当性タイプを検討します。
研究における妥当性の7つの主要なタイプは次のとおりです。
- 顔の妥当性
- コンテンツの有効性
- 妥当性を構築する
- 内部妥当性
- 外部妥当性
- 統計的結論の妥当性
- 基準関連の妥当性
1.顔の妥当性
顔の妥当性は、結果がどのように見えるかに基づいて、結果がどの程度有効であるかを示します。 これは、統計的方法を使用して定量化されていないため、最も科学的でない妥当性の方法です。
顔の妥当性は、用語の技術的な意味での妥当性ではありません。 それは、私たちが主張するものを測定しているように見えるかどうかに関係しています。
ここでは、メジャーが表面にどの程度有効であるかを確認し、それに基づいて主観的な判断を下します。
例えば、
- 回答者にとって有効と思われる調査を行い、管理者にとって有効と思われる質問が選択されたとします。
- 管理者は、ランダムな人々のグループ、訓練されていないオブザーバーに、質問が彼らにとって有効であると思われるかどうかを尋ねます
研究では、顔の判断だけに頼るだけでは決して十分ではありません。許容できる結論を引き出すには、より定量化可能な妥当性の方法が必要です。 考慮すべき測定機器はたくさんあるので、顔の妥当性は、あるアプローチを別のアプローチと区別する必要がある場合に役立ちます。
顔の妥当性は、それ自体のメリットで決して信頼されるべきではありません。
2.コンテンツの有効性
コンテンツの妥当性とは、調査で使用された測定値が、基礎となる構成要素(測定しようとしているもの)のすべてのコンテンツをカバーしているかどうかです。
これも主観的な尺度ですが、顔の妥当性とは異なり、尺度のコンテンツがコンテンツの全領域をカバーしているかどうかを確認します。 研究者が内向性を測定したい場合、彼らは最初にその特性に関連するコンテンツのドメインを構成するものを決定する必要があります。
コンテンツの妥当性は、他の方法では測定が困難な構成を測定するための人々の認識に依然依存しているため、主観的な測定形式と見なされます。
コンテンツの妥当性がそれ自体を区別する(そして有用になる)のは、その分野の専門家または対象集団に属する個人を使用することです。 この研究は、厳密な統計的検定を使用することで、より客観的にすることができます。
たとえば、調査で使用された項目がコンテンツドメインをどのように表しているか、それらがどの程度明確であるか、および因子分析によって評価された理論的因子構造をどの程度維持しているかを研究者に通知するコンテンツ妥当性調査を行うことができます。
3.妥当性を構築します
コンストラクトは、研究目的で考案されたイメージやアイデアを作成するために意味のある方法で関連付けられた動作のコレクションを表します。 コンストラクトの妥当性は、(コンストラクトの外側のものと比較して)あなたの研究がコンストラクトを測定する程度です。

うつ病は、睡眠不足、食欲不振、集中力低下などの行動に現れる性格特性を表す構成要素です。
コンストラクトの存在は、関連するインジケーターのコレクションを観察することで明らかになります。 任意の1つの記号は、複数の構成に関連付けることができます。 集中力が低下している人は、ADDを持っているかもしれませんが、うつ病は持っていません。
構成概念の妥当性は、研究における操作化(概念を観察に結び付ける)から、それらの操作化が基づいている構成概念に対して推論を行うことができる程度です。 構成の妥当性を確立するには、最初に、データが理論的構造をサポートしているという証拠を提供する必要があります。
また、構成の操作化を制御していることを示す必要があります。つまり、理論が現実とある程度対応していることを示す必要があります。
- 収束的妥当性–操作が他の操作と類似している程度。理論的には類似している必要があります。
- 識別的妥当性-スケールがそれ自体を適切に区別するか、理論的理由または以前の研究に基づいて異なるべきまたは異なるべきではないグループを区別しない場合。
- Nomological Network –研究で関心のある構成概念、それらの観察可能な兆候、およびこれらの間の相互関係の表現。 CronbachとMeehlによると、構成概念の妥当性を持たせるためには、メジャーのノモロジカルネットワークを開発する必要があります。
- Multitrait-Multimethod Matrix –CampbellとFiskeによる構成の妥当性を調べる際の6つの主要な考慮事項。 これには、収束的妥当性と識別的妥当性の評価が含まれます。 その他は、特性メソッドユニット、マルチメソッド/特性、真に異なる方法論、および特性特性です。
4.内部妥当性
内部妥当性とは、観察された効果を生み出すために独立変数を正確に述べることができる程度を指します。
従属変数の効果が独立変数のみによるものである場合、内部妥当性が達成されます。 これは、結果を操作できる程度です。
言い換えれば、内部妥当性とは、研究が研究環境で「機能する」ことをどのように判断できるかということです。 特定の調査内で、変更した変数は調査している変数に影響しますか?
[ブログ購読]
5.外部の妥当性
外部妥当性とは、研究の結果をサンプルを超えて一般化できる範囲を指します。 つまり、調査結果を他の人や設定に適用できるということです。
これは、結果を一般化できる程度と考えてください。 研究結果は世界の他の地域にどの程度当てはまりますか?
実験室の設定(または他の研究の設定)は、変数が少ない制御された環境です。 外部妥当性とは、他のすべての変数が存在する場合でも、結果がどれだけうまく保持されるかを指します。
6.統計的結論の妥当性
統計的結論の妥当性は、因果変数と結果変数の間に関係または共変動が存在するかどうかの決定です。
このタイプの有効性には以下が必要です。
- 適切なサンプリング手順の確保
- 適切な統計的検定
- 信頼性の高い測定手順
これは、結論が信頼できる、または信頼できる程度です。
7.基準関連の妥当性
基準に関連する妥当性(機器の妥当性とも呼ばれます)は、測定方法の品質の尺度です。 メジャーの精度は、すでに有効であることがわかっているメジャーと比較することで実証されます。
言い換えれば、あなたの測定値が、以前の調査のために有効であることがわかっている他の測定値と高い相関関係がある場合。
これが機能するためには、基準が適切に測定されていることを知っている必要があります。 また、適切な基準が常に存在するとは限らないことに注意してください。
あなたがしていることは、基準に照らして運用のパフォーマンスをチェックすることです。
判断の基準として使用する基準は、使用するさまざまなアプローチを説明しています。
- 予測的妥当性–理論的に予測できるものを予測する運用化の能力。 メジャーが期待される結果を予測する程度。
- 同時妥当性–理論的に可能なはずのグループを区別する運用化の能力。 これは、テストが以前に検証された測定値とよく相関する場所です。
調査データの妥当性を見るとき、データが私たちが表すべきだと思うものを表しているかどうかを尋ねています。
有効なデータを提供するために、回答者の考え方と態度に依存しています。
言い換えれば、私たちはすべての質問に正直かつ誠実に答えることを彼らに頼っています。 私たちはまた、彼らが私たちが尋ねる質問に答えることができるかどうかにも依存しています。 回答者が理解または理解できないという質問がなされた場合、データは私たちが何をしていると思うかを教えてくれません。