Tag: DATA-SCIENCE
Estoy intentando asignar un nuevo valor a un Dataframe de pandas llamado df con este codigo: df.loc[ (~df[‘col1’].str.contains(“|”.join(df[‘col2’]))) & (df[‘col2’] == ‘both’) & (df[‘col3’] != ”), ‘col2’] = df[‘col1’].astype(str) + ” || ” + df[‘col2’].astype(str) Pero cuando lo ejecuto, obtengo el error: cannot set using a list-like indexer with a . . . Read more
Imaginemos que tenemos una columna (X) que contiene el id del cliente y varias otras columnas x1, x2, x3, x4, x5, x6 que solo tienen estos 4 valores distintos (‘Alto’, ‘Bajo’, ‘Medio’, ‘Nan’) repetidamente. Por favor haz clic en el enlace adjunto. Actualización reciente: 16/12/2021: He realizado una codificación one-hot . . . Read more
Estoy realizando un proyecto de análisis de datos en el que estoy trabajando con números realmente grandes. Inicialmente lo hice todo en Python puro, pero ahora estoy intentando hacerlo con numpy y pandas. Sin embargo, parece que he encontrado un obstáculo, ya que no es posible manejar enteros más grandes . . . Read more
Extrayendo la definición de diferentes palabras en cada oración texto = data[‘OmschrijvingSkillwithoutstopwords’].tolist() textos etiquetados = pos_tagsents(map(word_tokenize, texto)) data[‘pos’] = pos_tagsents(data[‘OmschrijvingSkillwithoutstopwords’].apply(word_tokenize).tolist()) data[‘Nombres’] = data[‘pos’].apply(lambda row: [i[0] for i in row if i[1] == ‘NN’]) data[‘Verbos’] = data[‘pos’].apply(lambda row: [i[0] for i in row if i[1] == ‘VB’]) data[‘Adj’] = data[‘pos’].apply(lambda row: . . . Read more
Tengo este código y no puedo eliminar una fila específica del DataFrame. ¿Cómo puedo mejorar este código? Quiero eliminar los valores de esa columna que no sean numéricos. Esta forma no funciona porque hay algunas columnas faltantes que fueron eliminadas anteriormente, por lo que obtengo el siguiente error: KeyError: ‘[1093] . . . Read more