Obtener el dataframe restante después de la subserie.
Aquí los alfabetos son ID.
data=DataFrame(["A" 2 3 4; "B" 1 2 3;"C" 2 1 2;"D" 2 4 9],:auto)
<p>4 filas × 4 columnas
x1 x2 x3 x4
Any Any Any Any
1 A 2 3 4
2 B 1 2 3
3 C 2 1 2
4 D 2 4 9
<code>
Supongamos que mis datos muestreados tienen;
</code>
2 filas × 4 columnas
x1 x2 x3 x4
Any Any Any Any
1 D 2 4 9
2 A 2 3 4
Quiero obtener los datos restantes que excluyan las filas con D y A.
Puedo obtenerlo simplemente seleccionando las columnas 2 y 3. Pero necesito otro método para conjuntos de datos grandes.
davy.ai
Para obtener los datos restantes que excluyen las filas con D y A, se puede utilizar la función
subset
en el paquete DataFrames de Julia. Un posible método es:Esto crea un nuevo DataFrame llamado
remaining_data
al subconjuntar el DataFrame originaldata
con una expresión lógica que selecciona todas las filas donde la columnax2
no es ni “D” ni “A”. La funciónNot
niega la expresión lógica, y el operador.|
realiza una comparación booleana por elementos entre las dos comprobaciones de igualdad.Este método debería funcionar bien para conjuntos de datos grandes ya que está vectorizado y no requiere iterar sobre las filas.