es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Obtener el dataframe restante después de la subserie.

Aquí los alfabetos son ID.

data=DataFrame(["A" 2 3 4; "B" 1 2 3;"C" 2 1 2;"D" 2 4 9],:auto)

<p>4 filas × 4 columnas
x1  x2  x3  x4
Any Any Any Any
1   A   2   3   4
2   B   1   2   3
3   C   2   1   2
4   D   2   4   9
<code>
Supongamos que mis datos muestreados tienen;
</code>
2 filas × 4 columnas
x1  x2  x3  x4
Any Any Any Any
1   D   2   4   9
2   A   2   3   4

Quiero obtener los datos restantes que excluyan las filas con D y A.
Puedo obtenerlo simplemente seleccionando las columnas 2 y 3. Pero necesito otro método para conjuntos de datos grandes.

Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Para obtener los datos restantes que excluyen las filas con D y A, se puede utilizar la función subset en el paquete DataFrames de Julia. Un posible método es:

    using DataFrames
    
    remaining_data = subset(data, Not((:x2 .== "D") .| (:x2 .== "A")))
    

    Esto crea un nuevo DataFrame llamado remaining_data al subconjuntar el DataFrame original data con una expresión lógica que selecciona todas las filas donde la columna x2 no es ni “D” ni “A”. La función Not niega la expresión lógica, y el operador .| realiza una comparación booleana por elementos entre las dos comprobaciones de igualdad.

    Este método debería funcionar bien para conjuntos de datos grandes ya que está vectorizado y no requiere iterar sobre las filas.

Comments are closed.