Tag: LARGE-DATA
Tengo un dataframe con solo dos columnas, una es de texto y la otra contiene valores de la biblioteca numpy, que pueden tener más de 170000 elementos. El problema es cómo guardar estos grandes arrays de numpy como archivos, para poder cargarlos de nuevo más tarde. Al intentar guardarlos como . . . Read more
Tengo un conjunto de datos con 30000 nodos y muchas aristas. No puedo obtener el resultado con centralidad de intermediación y cercanía en Python. Obtengo una VM con una configuración alta e intento hacerlo, pero no obtengo resultado. ¿Hay alguna forma de ejecutarlo y obtener el resultado para la centralidad?
Me gustaría tener una forma de indexar una rejilla de malla de Numpy de d dimensiones: sin almacenar la rejilla de malla densa completa en memoria que admita todos los tipos de indexación admitidos por la rejilla de malla densa completa Como ejemplo: x = np.random.randn(Nx) y = np.random.randn(Ny) z . . . Read more
Tengo un conjunto de datos donde cada observación tiene dos tipos de IDs, es decir, hay una dependencia de pares entre ellos. Sin embargo, a veces falta uno de los IDs en la fila. Los datos se ven así: Donde “‘''” es una cadena vacía y no “np.NaN”. Las filas . . . Read more