es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: DATA-SCIENCE

Recibo el mensaje no se puede establecer utilizando un índice similar a una lista con una longitud diferente a la del valor.

Estoy intentando asignar un nuevo valor a un Dataframe de pandas llamado df con este codigo: df.loc[ (~df[‘col1’].str.contains(“|”.join(df[‘col2’]))) & (df[‘col2’] == ‘both’) & (df[‘col3’] != ”), ‘col2’] = df[‘col1’].astype(str) + ” || ” + df[‘col2’].astype(str) Pero cuando lo ejecuto, obtengo el error: cannot set using a list-like indexer with a . . . Read more

¿Cómo realizar el agrupamiento cuando tengo múltiples columnas categóricas y menos columnas numéricas en pandas?

Imaginemos que tenemos una columna (X) que contiene el id del cliente y varias otras columnas x1, x2, x3, x4, x5, x6 que solo tienen estos 4 valores distintos (‘Alto’, ‘Bajo’, ‘Medio’, ‘Nan’) repetidamente. Por favor haz clic en el enlace adjunto. Actualización reciente: 16/12/2021: He realizado una codificación one-hot . . . Read more

Cómo manejar enteros grandes en NumPy?

Estoy realizando un proyecto de análisis de datos en el que estoy trabajando con números realmente grandes. Inicialmente lo hice todo en Python puro, pero ahora estoy intentando hacerlo con numpy y pandas. Sin embargo, parece que he encontrado un obstáculo, ya que no es posible manejar enteros más grandes . . . Read more

Error con las etiquetas de recuento (nltk) en la columna del marco de datos.

Extrayendo la definición de diferentes palabras en cada oración texto = data[‘OmschrijvingSkillwithoutstopwords’].tolist() textos etiquetados = pos_tagsents(map(word_tokenize, texto)) data[‘pos’] = pos_tagsents(data[‘OmschrijvingSkillwithoutstopwords’].apply(word_tokenize).tolist()) data[‘Nombres’] = data[‘pos’].apply(lambda row: [i[0] for i in row if i[1] == ‘NN’]) data[‘Verbos’] = data[‘pos’].apply(lambda row: [i[0] for i in row if i[1] == ‘VB’]) data[‘Adj’] = data[‘pos’].apply(lambda row: . . . Read more