es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: CJK

Soporte de caracteres japoneses y coreanos en Pyhthon.

Obtengo errores de caracteres en python al realizar web scraping. from requests_html import HTML</p> <p>with open(‘list.html’, ‘r’, encoding=’cp932′, errors=’ignore’) as html<em>file: source = html</em>file.read() html = HTML(html=source)</p> <p>video<em>link = html.find(‘a’, first=True).text print(video</em>link) <code> **La línea que abre en html es esta** </code> <dt><a href=”https://www.youtube.com/watch?v=OAJn4XRhr10″> (15) アイナ・ジ・エンド (BiSH) / きえないで [OFFiCiAL . . . Read more

Estoy tratando de agregar un término personalizado en el servicio de moderación de texto de Azure para el idioma zho_chs. Sin embargo, devuelve “zho_chs” como un código inválido.

Dado que eres un traductor español que traduce documentos de TI, traduciré el texto al español: Dado que introduje “OriginalText” como entrada para detectar términos ofensivos y detectó el idioma como zho_chs. A continuación se muestra el texto de respuesta de la API. { “OriginalText”: “some profanity in zho_chs\r\n”, “NormalizedText”: . . . Read more

Soporte de caracteres japoneses y coreanos

Estoy obteniendo � como salida en Python. Este es el código que estoy usando: from bs4 import BeautifulSoup import requests with open(‘list.html’, ‘r’, encoding=’cp932′, errors=’ignore’) as archivo_html: contenido = archivo_html.read() sopa = BeautifulSoup(contenido, ‘lxml’) etiquetas = sopa.find_all(‘dt’) for etiqueta in etiquetas: titulo = etiqueta.text print(etiqueta.text) Intenté utf-16 pero luego obtengo . . . Read more

¿Dónde puedo encontrar listas de los caracteres más comunes para los idiomas chino simplificado, japonés y coreano?

Estoy desarrollando un sencillo juego de rompecabezas para dispositivos móviles y actualmente estoy trabajando en el aspecto de localización del mismo. Quiero localizarlo en chino simplificado, japonés y coreano. Planeo utilizar la colección de fuentes noto-cjk, pero el problema es que el tamaño de las fuentes es muy grande debido . . . Read more