Tag: SPACY
Estoy tratando de determinar cómo están interrelacionados semánticamente los elementos en una lista dada. Por ejemplo, para la siguiente lista de sustantivos, me gustaría obtener la puntuación promedio de similitud entre cada par posible (sin tener que hacerlo manualmente par por par, como se describe también a continuación). wordlist=[‘molds’, ‘brick’, . . . Read more
Tengo un formato json generado por la herramienta de anotación docanno. Quiero convertir dicho json a otro formato. Por favor, revisa a continuación el formato requerido. Formato json de Docanno: {“id”: 2, “data”: “Mi nombre es Nithin Reddy y trabajo como científico de datos.”, “label”: [[3, 8, “Misc”], [11, 23, . . . Read more
Intenté instalar Chatterbot, pero llega un momento en el que entra en un bucle para instalar Spacy. Aparece escrito: \ Usando spacy-2.1.8.tar.gz en caché (30.7 MB) \ Instalando dependencias de construcción … \ Después de esperar un tiempo, devuelve 145 líneas de errores. \ Ya tengo Spacy V3.2.1 instalado, no . . . Read more
Intento procesar datos provenientes de BigQuery. Creé un pipeline con Apache Beam de la siguiente manera: nlp = fr_core_news_lg.load() class CleanText(beam.DoFn): def process(self, row): row[‘descriptioncleaned’] = ‘ ‘.join(unidecode.unidecode(str(row[‘description’])).lower().translate(str.maketrans(string.punctuation, ‘ ‘*len(string.punctuation))).split()) yield row class LemmaText(beam.DoFn): def process(self, row): doc = nlp(row[‘descriptioncleaned’], disable=[“tagger”, “parser”, “attribute_ruler”, “ner”, “textcat”]) row[‘descriptionlemmatized’] = ‘ ‘.join(list(set([token.lemma_ for . . . Read more
Estoy entrenando mi reconocedor de entidades nombradas, pero tengo la impresión de que se bloquea en la época 0. Ya he realizado varios entrenamientos y nunca había tenido este problema. ¿Alguien tiene algún consejo? Adjunto una captura de pantalla de mi terminal. ¡Muchas gracias!