Tag: APACHE-SPARK-DATASET
Tengo un gran conjunto de datos de fuentes de Google en formato de archivo ttf. ¿Cómo puedo convertir todos sus glifos en imágenes individuales? Encontré este guión de DrawBot en este enlace, pero solo permite convertir un único archivo ttf.
Quiero crear un flujo de datos para entrenar modelos TensorFlow. Los datos se almacenan en archivos HDF5 muy grandes (250+ GB). He escrito un flujo de datos que funciona para archivos de entrada más pequeños, pero al final es terminado por el kernel después de consumir demasiada RAM+swap (he verificado . . . Read more
Construí una aplicación shiny que trabaja con datos que necesitan actualizaciones frecuentes. La aplicación no cambia, solo los datos. Al principio, solía actualizar mis datos localmente y republicar mi aplicación cada vez que los datos se actualizaban, lo que rápidamente encontré bastante molesto. Luego empecé a almacenar mis conjuntos de . . . Read more
Intenté utilizar el API de conjunto de datos cargado con mis propios datos para entrenar el modelo de hunggingface. Este es mi código: train_data = datasets.load_dataset(‘csv’, data_files=”/gdrive/MyDrive/project/train.csv”) test_data = datasets.load_dataset(‘csv’, data_files=”/gdrive/MyDrive/project/test.csv”) train_data DatasetDict({ train: Dataset({ features: [‘Post’, ‘Label’], num_rows: 174 }) }) Pero en el entrenador, obtengo este mensaje de . . . Read more
Estoy creando un tipo de red neuronal ANN que pueda clasificar si quien habla soy yo o no, pero el problema es que no puedo entrenarla debido a la forma de mis datos. Los datos X son: (262144,) Los datos y son: (261768,) ¿Cómo puedo hacer que los archivos de . . . Read more