- ¿Cuál es el problema con el sobremuestreo??
- ¿Por qué deberíamos usar sobremuestreo??
- ¿Es una buena idea sobriszar??
- Está sobremollando bien en el aprendizaje automático?
¿Cuál es el problema con el sobremuestreo??
El sobremuestreo aleatorio puede aumentar la probabilidad de ocurrir un sobreajuste, ya que hace copias exactas de los ejemplos de clase minoritaria. De esta manera, un clasificador simbólico, por ejemplo, podría construir reglas que aparentemente son precisas, pero en realidad cubren un ejemplo replicado.
¿Por qué deberíamos usar sobremuestreo??
El sobremuestreo es la práctica de seleccionar a los encuestados para que algunos grupos constituyan una mayor parte de la muestra de la encuesta que en la población. Los grupos pequeños de sobremuestreo pueden ser difíciles y costosos, pero permite que las encuestas arrojen luz sobre grupos que de otro modo serían demasiado pequeños para informar sobre.
¿Es una buena idea sobriszar??
El sobremuestreo es una forma bien conocida de mejorar potencialmente los modelos entrenados en datos desequilibrados. Pero es importante recordar que el sobremuestreo incorrectamente puede llevar a pensar que un modelo se generalizará mejor de lo que realmente lo hace.
Está sobremollando bien en el aprendizaje automático?
Sobremuestreo aleatorio
Para los algoritmos de aprendizaje automático afectados por la distribución sesgada, como las redes neuronales artificiales y las SVM, esta es una técnica altamente efectiva.