Identifica valores atípicos en tu conjunto de datos usando múltiples métodos de detección: IQR (cercos de Tukey), Z-Score y Z-Score Modificado. Compara métodos, visualiza resultados con diagramas de caja y analiza cada punto de datos.
También podrías encontrar útiles estas calculadoras
Calcula IQR, desviación cuartílica y detecta valores atípicos
Calcula Q1, Q2, Q3, IQR y resumen de cinco números
Calcula puntaje z, percentil y probabilidad
Calcula desviación estándar y varianza
Identifica valores atípicos en cualquier conjunto de datos usando múltiples métodos estadísticos. Compara IQR (cercos de Tukey), Z-Score y detección por Z-Score Modificado. Ve resultados con visualización de diagrama de caja y análisis detallado de puntos de datos.
Los valores atípicos son puntos de datos que difieren significativamente de otras observaciones. Pueden indicar errores de medición, errores de entrada de datos o valores genuinamente inusuales. Detectar valores atípicos es crucial para la calidad de datos, análisis estadístico y aprendizaje automático. Los métodos comunes de detección incluyen el método IQR (usando cercos de Tukey), método Z-Score (midiendo desviaciones estándar desde la media) y Z-Score Modificado (usando mediana y MAD para robustez).
Fórmula del Método IQR
Valor atípico si x < Q₁ - 1.5×IQR o x > Q₃ + 1.5×IQRIdentifica y maneja puntos de datos erróneos antes del análisis o modelado.
Detecta defectos de fabricación o anomalías de proceso usando límites de control estadístico.
Identifica transacciones o patrones inusuales que pueden indicar actividad fraudulenta.
Encuentra observaciones inusuales que pueden llevar a nuevos descubrimientos o indicar errores experimentales.
El método IQR (Rango Intercuartílico), también conocido como cercos de Tukey, identifica valores atípicos como valores por debajo de Q1 - 1.5×IQR o por encima de Q3 + 1.5×IQR (valores atípicos leves). Los valores atípicos extremos caen fuera de Q1 - 3×IQR y Q3 + 3×IQR. Este método es robusto y funciona bien con datos sesgados.
Z-Score mide cuántas desviaciones estándar está un valor de la media. Valores con |Z| > 2 o |Z| > 3 (dependiendo del umbral) se consideran valores atípicos. La fórmula es Z = (x - μ) / σ. Este método asume datos normalmente distribuidos.
Usa Z-Score Modificado cuando tus datos no están normalmente distribuidos o contienen muchos valores atípicos. Usa la mediana y MAD (Desviación Absoluta Mediana) en lugar de media y desviación estándar, haciéndolo más robusto. Valores con |M| > 3.5 típicamente se consideran valores atípicos.
El método IQR es mejor para uso general y datos sesgados. Z-Score funciona bien para datos normalmente distribuidos. Z-Score Modificado es más robusto cuando sospechas muchos valores atípicos o distribuciones no normales. Comparar los tres métodos da la imagen más completa.