Tag: SPACY-3
Necesito ayuda con regex en spacy en japonés. Tengo este texto: 道が凍っているから気を付けなさい。 Necesito encontrar cada palabra hasta el carácter “を” en japonés, por lo que básicamente necesito obtener “道が凍っているから気を”. Intenté este código: import spacy from spacy.matcher import Matcher nlp = spacy.load(“ja_core_news_sm”) matcher = Matcher(nlp.vocab) pattern = [{“TEXT”: {“REGEX”: “^.*?[を]”}}] matcher.add(“mypattern”, . . . Read more
Estoy tratando de encontrar un patrón específico: cualquier verbo con un sustantivo que termine en s, t o l. Por ejemplo: Como un gato, Como una comida, Hago especias. ¿Cómo puedo hacer esto? Sé que estaba haciendo esto: nlp = spacy.load(“en_core_web_sm”) matcher = Matcher(nlp.vocable) pattern = [{“POS”: “VERB”}, {“POS”: “NOUN”}] . . . Read more
Error de importación: no se puede importar el nombre ‘SentenceSegmenter’ desde ‘spacy.pipeline’ Spacy versión: 3.2.1 Sé que esta clase es para una versión anterior de Spacy, ¿pero tendría algo similar para esta versión de Spacy?
Necesito detectar si una entidad dada está rodeada de comillas, ya sean comillas simples o dobles. ¿Cómo debería hacer esto? Mi primera idea fue agregar una extensión personalizada al span: def is_quoted(span): prev_token = span.doc[span.start – 1] next_token = span.doc[span.end + 1] return prev_token in [“\””, “\'”] and next_token in . . . Read more
Estoy tratando de obtener los patrones del reglamentador de entidades para usar una combinación de lemma y ent_type para generar una etiqueta para la frase “aterrizó (o aterrizar) en Baltimore (ubicación)”. Parece estar funcionando con el Matcher, pero no con el reglamentador de entidades que creé. Configuré las anulaciones de . . . Read more