Tag: DATA-CLEANING
Tengo un marco de datos con 11 características, una será mi ytrain y las demás serán las Xtrain; Mi problema es que la forma de Xtrain es (2173, 10) o la forma de ytrain es (2137,) ¿Cómo puedo ajustar los dos con la misma forma para entrenar mi modelo? PD: . . . Read more
Estoy realizando un preprocesamiento para un conjunto de datos en una columna específica llamada ‘Título’. Ya he eliminado los números y la puntuación. Pero también quiero eliminar las medidas. Las medidas no están en una columna separada, están en la columna del título. # Cargar conjunto de datos df = . . . Read more
Aquí tienes un ejemplo de los datos en los que estoy trabajando (la primera línea son los nombres de las columnas): DENOMINAZIONE;ATC;PRINCIPIO ATTIVO;TITOLARE;AIC ABASAGLAR;A10AE04;INSULINA GLARGINA;ELI LILLY NEDERLAND B.V.;043658 ABASRIA;A10AE04;INSULIN GLARGINA;ELI LILLY REGIONAL OPERATIONS GMBH.;043658 ABECMA;L01;IDECABTAGENE VICLEUCEL;CELGENE EUROPE BV;049604 ABEVMY;L01XC07;BEVACIZUMAB;MYLAN IRE HEALTHCARE LTD;049452 ABILIFY MAINTENA;N05AX12;ARIPIPRAZOLE;OTSUKA PHARMACEUTICAL EUROPE LTD;043143 ABILIFY MAINTENA;N05AX12;ARIPIPRAZOLE;OTSUKA PHARMACEUTICAL . . . Read more
Necesito ayuda para limpiar los datos que aparecen durante un corto período de tiempo utilizando Pandas. “Cuando los datos aparecen durante una duración corta < 5 minutos, quiero eliminar esos datos del marco de datos, de lo contrario, mantenerlos en el marco de datos”. En la figura 1, tanto en . . . Read more
Tengo un par de secuencias que quiero descomponer en series de números adyacentes. Las secuencias están anidadas dentro de una lista de individuos de tal manera que el tamaño de la ventana que contiene los números adyacentes varía de un individuo a otro. Aquí tienes algunos datos de ejemplo: # . . . Read more