HUGGINGFACE-TOKENIZERS - es.davy.ai

¿Cómo funciona el relleno de espacios (padding) en el tokenizer de huggingface?

30 May, 2023 Programación 0

Intenté seguir el ejemplo de tokenización siguiente: tokenizer = BertTokenizer.from_pretrained(MODEL_TYPE, do_lower_case=True) sent = “Me desagrada esto. No aquello.”, _tokenized = tokenizer(sent, padding=True, max_length=20, truncation=True) print(_tknzr.decode(_tokenized[‘input_ids’][0])) print(len(_tokenized[‘input_ids’][0])) La salida fue: [CLS] Me desagrada esto. No aquello. [SEP] 9 Observe el parámetro max_length=20 de tokenizer. ¿Cómo puedo hacer que el tokenizador de . . . Read more

Convertir la sintaxis de consulta SphinxSearch en cadena de búsqueda booleana en Ruby.

22 May, 2023 Programación 0

He estado pensando en cuál es la manera más fácil de convertir la siguiente consulta de Sphinx Search en lo que se usa comúnmente en búsquedas web típicas o portales, por ejemplo, una cadena de búsqueda booleana, y viceversa. (A | B) “C D” (E | “F G” | “H . . . Read more

es.davy.ai

¿Tienes una pregunta?

Tag: HUGGINGFACE-TOKENIZERS

¿Cómo funciona el relleno de espacios (padding) en el tokenizer de huggingface?

Convertir la sintaxis de consulta SphinxSearch en cadena de búsqueda booleana en Ruby.