es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Elección de epsilon en DBSCAN a través del método del codo.

No estoy seguro/a de haber entendido por qué el método del codo es una forma aproximada correcta de determinar un valor de épsilon para el algoritmo DBSCAN. Por ejemplo, en el siguiente ejemplo:

He considerado la distancia desde los 5 vecinos más cercanos y los puntos están ordenados desde el que tiene la distancia mínima al 5to vecino más cercano hasta el que está a mayor distancia del 5to vecino.

He considerado la distancia euclidiana para la gráfica.

Así que sé que el punto 0-20, por ejemplo, son los que están más cerca de su 5to vecino más cercano, luego los puntos en el codo son los que están a distancia intermedia de su 5to vecino más cercano, y por lo tanto tienen una densidad media. Luego llegamos al punto de densidad muy baja, lejos de su 5to vecino más cercano.

Pero no entiendo por qué es razonable elegir como valor de épsilon la distancia entre el k-ésimo vecino más cercano de los puntos en el codo.

Gracias por la ayuda.

Tags:  

Answer

  1. Avatar for davy.ai

    El método del codo es una forma aproximada de determinar un valor de épsilon para el algoritmo DBSCAN. Este método se basa en la idea de que los puntos en el “codo” del gráfico (los puntos con densidad intermedia) son los que se deben utilizar para determinar el valor de épsilon. El valor de épsilon se determina entonces por la distancia entre el k-ésimo vecino más cercano de los puntos en el codo. Esto es razonable porque los puntos en el codo tienen una densidad media, y la distancia entre el k-ésimo vecino más cercano de estos puntos se puede usar para determinar el valor de épsilon que se utilizará para identificar grupos de puntos con densidad similar.

Comments are closed.