Antes de analizar cualquier conjunto de datos, lo primero es entender qué tipo de datos tienes. El tipo de dato determina qué operaciones puedes hacer, qué estadísticas tiene sentido calcular y qué visualizaciones son apropiadas.
La clasificación principal: cuantitativos vs cualitativos
Datos cuantitativos (numéricos)
Representan cantidades que se pueden medir. Tienen sentido las operaciones matemáticas como sumar, promediar o calcular la desviación estándar.
Ejemplos: salario, temperatura, edad, precio, número de visitas.
Se dividen en:
-
Discretos: solo toman valores enteros. No existe "2.5 hijos". Ejemplos: número de empleados, cantidad de ventas, número de clases aprobadas.
-
Continuos: pueden tomar cualquier valor dentro de un rango, incluidos decimales. Ejemplos: peso (73.4 kg), temperatura (36.7°C), distancia.
Datos cualitativos (categóricos)
Representan categorías o características que no se miden numéricamente. No tiene sentido calcular el promedio de "colores de ojos".
Ejemplos: género, país, tipo de producto, estado civil, color.
Se dividen en:
-
Nominales: sin orden natural. País, color, tipo de producto. No hay una categoría "mayor" que otra.
-
Ordinales: tienen un orden implícito. Nivel educacional (básica < media < universitaria), satisfacción (malo < regular < bueno < excelente).
Ejemplo: tabla de empleados
| columna | valor ejemplo | tipo |
|---|---|---|
| nombre | "Ana García" | cualitativo nominal |
| cargo | "Desarrolladora" | cualitativo nominal |
| nivel | "Senior" | cualitativo ordinal |
| salario | 3000 | cuantitativo continuo |
| años_experiencia | 5 | cuantitativo discreto |
| region | "Norte" | cualitativo nominal |
¿Por qué importa distinguirlos?
Para estadísticas: el promedio tiene sentido en datos cuantitativos, no en cualitativos. Para cualitativos usas frecuencias y modas.
Para visualizaciones: los datos cuantitativos se muestran en histogramas o boxplots. Los cualitativos en gráficos de barra o torta.
Para modelos: los algoritmos de machine learning tratan de forma diferente los números y las categorías. Necesitas conocer el tipo antes de entrenar cualquier modelo.
Un caso especial: datos numéricos que son cualitativos
A veces los datos parecen numéricos pero son categóricos. Por ejemplo, el código postal 3820000 es un número, pero sumarlo o promediar no tiene ningún sentido — es una categoría con representación numérica.
Pregúntate siempre: ¿tiene sentido hacer operaciones matemáticas con este dato?
Errores frecuentes
Tratar ordinales como numéricos: convertir "malo=1, regular=2, bueno=3" y calcular promedios puede ser engañoso porque no sabemos si la distancia entre "malo" y "regular" es la misma que entre "regular" y "bueno".
Ignorar el tipo al limpiar datos: un dato como "treinta y cinco" en una columna numérica rompe el análisis. Reconocer el tipo esperado te ayuda a detectar estos problemas.
Aprende haciendo, no solo leyendo
Leer es el primer paso. El verdadero aprendizaje ocurre cuando practicas con ejercicios reales de SQL y recibes corrección inmediata de IA.
Comenzar gratis →