- ¿Cómo se maneja los datos faltantes en la clasificación??
- ¿Cuántos datos faltantes son aceptables en el aprendizaje automático??
- Cómo manejar los datos categóricos faltantes en el aprendizaje automático?
- ¿Knn funciona con valores faltantes??
¿Cómo se maneja los datos faltantes en la clasificación??
Una forma de manejar los valores faltantes es la eliminación de las filas o columnas que tienen valores nulos. Si alguna columna tiene más de la mitad de los valores como nulos, entonces puede soltar toda la columna. De la misma manera, las filas también se pueden eliminar si tienen una o más valores de columnas como nulas.
¿Cuántos datos faltantes son aceptables en el aprendizaje automático??
¿Cuántos datos faltan?? El porcentaje general de datos que faltan es importante. En general, si faltan menos del 5% de los valores, entonces es aceptable ignorarlos (Ref).
Cómo manejar los datos categóricos faltantes en el aprendizaje automático?
Reemplazar los datos faltantes con los valores más frecuentes
Cuando los valores faltantes son de columnas categóricas como cadena o numérica, los valores faltantes se pueden reemplazar con la categoría más frecuente. Si el número de valores faltantes es muy grande, se puede reemplazar con una nueva categoría.
¿Knn funciona con valores faltantes??
KNN es un algoritmo que es útil para igualar un punto con sus vecinos K más cercanos en un espacio multidimensional. Se puede utilizar para datos continuos, discretos, ordinales y categóricos, lo que hace que sea particularmente útil para tratar todo tipo de datos faltantes.