研究设计中的 4 种有效性类型（+3 更多需要考虑）

已发表: 2021-01-03

您从研究中得出的结论（无论是来自分析调查、焦点小组、实验设计还是其他研究方法）只有在有效的情况下才有用。

这些结果有多“真实”？它们在多大程度上代表了你真正想要研究的东西？效度用于确定研究是否衡量了它打算衡量的内容并近似于结果的真实性。

不幸的是，当涉及到被认为是有效的东西时，研究人员有时会创建自己的定义。

在定量研究中，对有效性和可靠性的测试是给定的。
然而，一些定性研究人员甚至认为有效性不适用于他们的研究，即使他们承认在他们的工作中需要一些合格的检查或措施。

这是错误的。有效性始终很重要——即使在定性研究中更难确定。

忽视有效性就是质疑你工作的可信度，并质疑其他人对其结果的信心。即使在研究中使用了定性测量，也需要使用可靠性和有效性测量来观察它们，以保持结果的可信度。

什么是研究的有效性？

有效性是研究人员如何谈论结果代表现实的程度。定量或定性的研究方法是研究真实现象的方法——有效性是指他们测量的现象中有多少与结果捕获了多少“噪音”或无关信息。

有效性和可靠性决定了“好”和“坏”的研究报告。高质量的研究取决于对测试和提高研究结果的有效性和可靠性的承诺。

任何值得重视的研究都关注被测量的东西是否是要被测量的东西，并考虑观察结果受到环境影响的方式。

我们如何得出结论的基础在解决任何给定研究的更广泛的实质性问题方面发挥着重要作用。

出于这个原因，我们将研究已被制定为合法研究方法的一部分的各种有效性类型。

以下是研究中有效性的 7 种关键类型：

表面效度
内容有效性
建构效度
内部效度
外部有效性
统计结论效度
标准相关效度

1. 面子效度

面部有效性是根据结果的外观，您的结果看起来有多有效。这是最不科学的有效性方法，因为它没有使用统计方法进行量化。

表面效度不是技术意义上的效度。它与我们是否衡量我们声称的内容有关。

在这里，我们看看一个衡量标准在表面上的有效性，并据此做出主观判断。

例如，

想象一下，您进行了一项对受访者来说似乎有效的调查，并且选择了这些问题，因为它们对管理员来说似乎是有效的。
管理员询问一组随机的人，未经训练的观察者，如果这些问题对他们来说是有效的

在研究中，仅仅依靠面部判断是远远不够的——为了得出可接受的结论，需要更量化的有效性方法。有许多测量工具需要考虑，因此在您需要区分一种方法与另一种方法的情况下，表面效度很有用。

永远不应该相信表面有效性本身的优点。

2. 内容有效性

内容效度是指研究中使用的衡量标准是否涵盖了基础结构（您要衡量的事物）中的所有内容。

这也是一种主观测量，但与表面效度不同，我们询问测量的内容是否涵盖内容的整个领域。如果研究人员想要测量内向性，他们必须首先决定什么构成了该特征的相关内容域。

内容效度被认为是一种主观的测量形式，因为它仍然依赖于人们对测量结构的感知，否则这些结构很难测量。

内容有效性的区别（并变得有用）是通过使用该领域的专家或属于目标人群的个人。通过使用严格的统计测试，可以使这项研究更加客观。

例如，您可以进行内容有效性研究，告知研究人员调查中使用的项目如何代表他们的内容领域、它们的清晰程度以及它们在多大程度上维持了因子分析评估的理论因子结构。

3. 构建效度

构造表示以有意义的方式关联的行为集合，以创建为研究目的而发明的图像或想法。构念效度是您的研究衡量构念的程度（与构念之外的事物相比）。

抑郁症是一种代表人格特征的结构，表现为睡眠过多、食欲不振、注意力不集中等行为。

通过观察相关指标的集合，可以看出构造的存在。任何一个标志都可能与多个结构相关联。难以集中注意力的人可能患有ADD，但不是抑郁症。

构念效度是从研究中的操作化（将概念与观察联系起来）推论到这些操作化所基于的构念的程度。要建立结构效度，您必须首先提供证据证明您的数据支持理论结构。

你还必须表明你控制了结构的操作化，换句话说，表明你的理论与现实有一定的对应关系。

收敛有效性——一个操作与理论上应该相似的其他操作的相似程度。
判别效度——如果量表充分区分自身或不区分基于理论原因或先前研究应该不同或不应该不同的群体。
Nomological Network——研究中感兴趣的结构的表示，它们的可观察表现，以及它们之间的相互关系。根据 Cronbach 和 Meehl 的说法，必须为测量开发一个法理网络，以使其具有结构效度
Multitrait-Multimethod Matrix –根据 Campbell 和 Fiske 在检查构造有效性时的六个主要考虑因素。这包括对收敛效度和区分效度的评估。其他是特征方法单元、多方法/特征、真正不同的方法和特征特征。

4. 内部效度

内部效度是指能够准确地表述自变量以产生观察到的效果的程度。

如果因变量的影响仅归因于自变量，则实现内部有效性。这是可以操纵结果的程度。

换句话说，内部效度是您如何判断您的研究在研究环境中“有效”。在给定的研究中，您更改的变量是否会影响您正在研究的变量？

[博客订阅]

5. 外部效度

外部效度是指研究结果可以在样本之外推广的程度。也就是说，您可以将您的发现应用于其他人和环境。

将此视为结果可以概括的程度。研究结果对世界其他地区的适用程度如何？

实验室环境（或其他研究环境）是变量较少的受控环境。外部效度是指结果保持得有多好，即使存在所有其他变量。

6. 统计结论效度

统计结论有效性是确定因果变量之间是否存在关系或协变。

这种有效性要求：

确保适当的抽样程序
适当的统计检验
可靠的测量程序

这是一个结论可信或可信的程度。

7. 标准相关效度

标准相关效度（也称为工具效度）是衡量测量方法质量的指标。通过将测量与已知有效的测量进行比较来证明测量的准确性。

换句话说——如果你的测量与其他已知有效的测量具有高度相关性，因为之前的研究。

为此，您必须知道该标准已被很好地衡量。请注意，并不总是存在适当的标准。

您正在做的是根据标准检查您的操作化性能。

您用作判断标准的标准说明您将使用的不同方法：

预测有效性——操作化预测其理论上能够预测的内容的能力。衡量指标预测预期结果的程度。
并发有效性——操作化在理论上应该能够区分组的能力。这就是测试与先前已验证的度量很好相关的地方。

当我们查看调查数据的有效性时，我们是在询问数据是否代表了我们认为它应该代表的内容。

我们依靠受访者的心态和态度来提供有效的数据。

换句话说，我们依靠他们诚实和认真地回答所有问题。我们还取决于他们是否能够回答我们提出的问题。当被问及受访者无法理解或理解的问题时，数据并不能告诉我们我们认为它会做什么。