Capitulo 9
Capitulo 9
Capitulo 9
La escala de Stapel, llamada así en honor de su creador, Jan Stapel, es una escala de clasifi
cación unipolar con 10 categorías numeradas del 5 a 5, sin un punto neutral (cero).11 Esta escala
por lo general se presenta de manera vertical. Se pide a los encuestados que indiquen qué tan
precisa o imprecisa es la descripción que hace cada término del objeto, seleccionando una
respuesta numérica apropiada para la categoría. Cuanto mayor sea el número, más precisa es la
descripción que hace el término del objeto, como se muestra en el proyecto de la tienda
departamental. En ese ejemplo, la evaluación indicó que Sears carecía de alta calidad y que su
servicio era algo defi ciente.
Instrucciones Por favor, evalúe la precisión con que
cada palabra o frase describe a cada una de las tiendas
departamentales. Seleccione un número positivo para
las frases que considere que describen con precisión a
la tienda. Cuanto más precisa crea que es la frase para
describir a la tienda, más grande debe ser el número
positivo que elija. Debe elegir un número negativo para
las frases que considere que no la describen con
precisión. Cuanto menos precisa crea que es la
descripción que hace la frase de la tienda, más grande
debe ser el número negativo que elija. Puede elegir
cualquier número, de 5 para las frases que piense que
son muy precisas a 5 para las frases que piense que son
muy inexactas
Figura 9.1 Escalas balanceadas y no balanceadas escala balanceada Escala con un número igual de
categorías favorables y desfavorables.
escalas de clasificación forzada Escala de clasificación que obliga a los encuestados a expresar una
opinión porque no ofrece la opción de “sin opinión” o “no sabe”.
Escalas balanceadas frente a no
balanceadas
En una escala balanceada, el número de categorías favorables y desfavorables es igual; en una
escala no balanceada es diferente.14 En la fi gura 9.1 se presentan ejemplos de una escala
balanceada y una no balanceada. En general, la escala debe ser balanceada para obtener datos
objetivos. Sin embargo, cuando es probable que exista un sesgo (positivo o negativo) en la
distribución de las respuestas, podría ser más conveniente usar una escala no balanceada con
más categorías en dirección al sesgo. Si se usa una escala no balanceada, en el análisis de los
datos debe tenerse en consideración la naturaleza y el grado de desequilibrio.
Número par o non de categorías
Con un número non de categorías el punto central de la escala por lo general se designa como
neutral o imparcial. La presencia, posición o etiquetamiento de una categoría neutral puede
tener una infl uencia signifi cativa en la respuesta. La escala de Likert es una escala de clasifi
cación balanceada con un número non de categorías y un punto neutral.15 La decisión de usar
un número par o non de categorías depende de si algunos de los encuestados pueden ser
neutrales respecto a la respuesta medida. Si hay la posibilidad de que al menos algunos
encuestados den una respuesta neutral o indiferente, debe usarse un número non de categorías.
Por otro lado, si el investigador desea forzar la respuesta o cree que no existe una respuesta
neutral o indiferente, debe usarse una escala de clasifi cación con un número par de categorías.
Un tema relacionado es si la escala debe ser forzada o no.
Escalas forzadas frente a las no forzadas
En las escalas de clasifi cación forzada, los encuestados son obligados a expresar una opinión
porque no se les da la opción de “sin opinión”. En tal caso, los encuestados que no tienen
opinión pueden marcar la posición central de la escala. Si una proporción sufi ciente de los
encuestados no tienen opinión sobre el tema, marcar la posición central podría distorsionar las
medidas de tendencia central y la varianza. En situaciones donde se espera que los encuestados
no tengan opinión, en vez de estar simplemente renuentes a revelarla, una escala no forzada
que incluya una categoría de “sin opinión” mejora la precisión de los datos
Naturaleza y grado de las descripciones
verbales
La naturaleza y el grado de la descripción verbal asociada con las categorías de la escala varían
considerablemente y tienen efecto en las respuestas. Las categorías de la escala pueden tener
descripciones verbales, numéricas y hasta pictóricas. Además, el investigador debe decidir si
etiqueta todas, algunas o sólo las categorías extremas de la escala. De manera sorprendente,
ofrecer descripciones verbales para cada categoría no siempre incrementa la precisión o confi
abilidad de los datos. Sin embargo, etiquetar todas o muchas de las categorías permite reducir la
ambigüedad de la escala. Las descripciones de las categorías deben localizarse tan cerca como
sea posible de las categorías de respuesta. La fuerza de los adjetivos usados para anclar la escala
infl uye en la distribución de las respuestas. Con anclas fuertes (1 completamente en
desacuerdo, 7 completamente de acuerdo), es menos probable que los encuestados usen las
categorías extremas de la escala. Esto da por resultado distribuciones de respuesta menos
variables y más pronunciadas. En contraste, las anclas
Forma física o configuración
Se dispone de diversas opciones con respecto a la forma o confi guración de la escala. Las
escalas se pueden presentar de manera horizontal o vertical. Las categorías pueden expresarse
en cajas, líneas discretas o unidades sobre un continuo, y pueden o no tener números asignados.
Si se usan valores numéricos, pueden ser positivos, negativos o ambos. En la fi gura 9.2 se
presentan varias confi guraciones posibles. La escala del termómetro y la de la cara sonriente
son dos confi guraciones únicas de las escalas de clasifi cación que se utilizan en la investigación
de mercados. En la escala del termómetro, cuanto más alta sea la temperatura, más favorable es
la evaluación. De igual forma, las caras felices indican evaluaciones más favorables. Estas escalas
son especialmente útiles con los niños.18 En la fi gura 9.3 se presentan ejemplos de estas
escalas. La tabla 9.2 resume las seis decisiones que deben tomarse al diseñar escalas de clasifi
cación. La tabla 9.3 presenta algunas escalas de uso común. Aunque las escalas mostradas
tienen cinco categorías, el número varía según el criterio del investigador
Actividades del proyecto
1. Desarrollar escalas de Likert, de
diferencial semántico y de Stapel
para medir la satisfacción del
cliente hacia Sears.
2. ilustrar las seis decisiones de la
escala de clasificación por ítem de
la tabla 9.2 en el contexto de la
medición de la satisfacción del
cliente hacia Sears.
ESCALAS DE REACTIVOS MÚLTIPLES
El desarrollo de las escalas de clasifi cación de reactivos múltiples requiere de considerable
experiencia técnica.19 La fi gura 9.4 es un paradigma para la elaboración de esas escalas. Suele
llamarse constructo a la característica que será medida. El desarrollo de la escala comienza con
una teoría subyacente del constructo que se quiere medir. La teoría es necesaria no sólo para la
elaboración de la escala, sino también para interpretar las puntuaciones resultantes. El siguiente
paso es generar un conjunto de reactivos para la escala. Por lo regular, esto se basa en la teoría,
el análisis de los datos secundarios y en la investigación cualitativa. A partir de este conjunto se
genera un conjunto reducido de reactivos potenciales de acuerdo con el criterio del investigador
y de otros expertos, quienes adoptan algunos criterios cualitativos para ayudarse en su juicio. El
grupo reducido de reactivos todavía es demasiado grande para constituir una escala, por lo que
se hace otra reducción de manera cuantitativa. Mediante un pretest aplicado a una muestra
grande de encuestados se obtienen los datos sobre el conjunto reducido de reactivos
potenciales. Los datos son analizados usando técnicas como correlaciones, análisis factorial,
análisis de conglomerados, análisis discriminante y otras prueba
estadísticas que se explicarán más
adelante en este libro. Como resultado de
estos análisis estadísticos, se eliminan
algunos otros reactivos, lo que da como
resultado una escala depurada. Para
evaluar la confi abilidad y validez de esta
escala depurada se recaban más datos de
una muestra diferente (véase el siguiente
apartado). Con base en estas
evaluaciones se selecciona un conjunto fi
nal de reactivos. Como se observa en la fi
gura 9.4, el proceso de desarrollo de la
escala es iterativo con varios ciclos de
retroalimentación.
Medición de la complejidad técnica con
una escala técnicamente refinada