Estadística

Calculadora de Valores Atípicos

Identifica valores atípicos en tu conjunto de datos usando múltiples métodos de detección: IQR (cercos de Tukey), Z-Score y Z-Score Modificado. Compara métodos, visualiza resultados con diagramas de caja y analiza cada punto de datos.

Calculadora de Valores Atípicos - Detecta Valores Atípicos Estadísticos

Identifica valores atípicos en cualquier conjunto de datos usando múltiples métodos estadísticos. Compara IQR (cercos de Tukey), Z-Score y detección por Z-Score Modificado. Ve resultados con visualización de diagrama de caja y análisis detallado de puntos de datos.

¿Qué son los Valores Atípicos en Estadística?

Los valores atípicos son puntos de datos que difieren significativamente de otras observaciones. Pueden indicar errores de medición, errores de entrada de datos o valores genuinamente inusuales. Detectar valores atípicos es crucial para la calidad de datos, análisis estadístico y aprendizaje automático. Los métodos comunes de detección incluyen el método IQR (usando cercos de Tukey), método Z-Score (midiendo desviaciones estándar desde la media) y Z-Score Modificado (usando mediana y MAD para robustez).

Fórmula del Método IQR

Valor atípico si x < Q₁ - 1.5×IQR o x > Q₃ + 1.5×IQR

Cómo Detectar Valores Atípicos

1

2

3

4

5

Aplicaciones de Detección de Valores Atípicos

Limpieza de Datos

Identifica y maneja puntos de datos erróneos antes del análisis o modelado.

Control de Calidad

Detecta defectos de fabricación o anomalías de proceso usando límites de control estadístico.

Detección de Fraude

Identifica transacciones o patrones inusuales que pueden indicar actividad fraudulenta.

Investigación Científica

Encuentra observaciones inusuales que pueden llevar a nuevos descubrimientos o indicar errores experimentales.

Preguntas Frecuentes

El método IQR (Rango Intercuartílico), también conocido como cercos de Tukey, identifica valores atípicos como valores por debajo de Q1 - 1.5×IQR o por encima de Q3 + 1.5×IQR (valores atípicos leves). Los valores atípicos extremos caen fuera de Q1 - 3×IQR y Q3 + 3×IQR. Este método es robusto y funciona bien con datos sesgados.