Hice esta pregunta para entender mejor algunas de las sutilezas entre el entrenamiento de modelos Spacy con DocBin serializados en disco, en comparación con la carga de instancias Example a través de una función de carga de datos personalizada. El objetivo era entrenar un modelo de NER de Spacy con . . . Read more
Hola, descargué un corpus utilizando NLTK. phrase = nltk.corpus.conll2002.iob_sents(‘esp.testb’)[0] Eso devuelve: [(‘La’, ‘DA’, ‘B-LOC’), (‘Coruña’, ‘NC’, ‘I-LOC’), (‘,’, ‘Fc’, ‘O’), (’23’, ‘Z’, ‘O’), (‘may’, ‘NC’, ‘O’), (‘(‘, ‘Fpa’, ‘O’), (‘EFECOM’, ‘NP’, ‘B-ORG’), La pregunta es cómo puedo obtener la oración completa. Estoy utilizando el siguiente código: ‘ ‘.join([w[0] for w . . . Read more
Actualmente estoy tratando de extraer frases sustantivas de oraciones. Las oraciones se almacenaron en una columna en un archivo de Excel. Aquí está el código usando Python: import pandas as pd import spacy df = pd.read_excel(“xxx.xlsx”) nlp = spacy.load(“en_core_web_md”) for row in range(len(df)): doc = nlp(df.loc[row, “Title”]) for np in . . . Read more
Estoy utilizando spacy versión==2.2.4 para el reconocimiento de entidades nombradas y deseo utilizar la misma versión para probar el pipeline personalizado de extracción de relaciones en spacy. Pero desafortunadamente, me encuentro con el siguiente problema al ejecutar el modelo de extracción de relaciones personalizado con la versión de spacy mencionada . . . Read more
¿Por qué estoy obteniendo este error? ¿Alguien puede decirme, por favor, o explicarme cómo usarlo con un ejemplo simple? TypeError Traceback (most recent call last) /tmp/ipykernel<em>33/3577035061.py in <module> 6 # Objeto de la clase Matcher 7 matcher = Matcher(nlp.vocab) —-> 8 matcher.add(“matching</em>1”, None, pattern) 9 10 matches = matcher(doc) /opt/conda/lib/python3.7/site-packages/spacy/matcher/matcher.pyx . . . Read more