es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Cómo descubrir/identificar un código a partir de un carácter especial.

Quizás una pregunta realmente tonta,

¿Cómo puedo conocer el código de un carácter especial? Estoy intentando formatear una cadena como se muestra en la imagen de abajo.

Aquí va el enlace a la imagen

Sin embargo, cuando copio los caracteres especiales, todo lo que obtengo son espacios en blanco. He intentado diferentes codificaciones (utf8, latin1, iso) para reemplazar este carácter, pero ninguno funcionó.

Todo lo que sé es:

El string se inserta en el servidor SQL desde un código de GeNeXuS.
El string se recupera del servidor SQL y se escribe en un archivo CSV usando Spark.
Un amigo me dijo que este carácter especial PODRÍA SER shift + enter en GeNexuS.

Mi pregunta principal es:

¿Cómo puedo descubrir qué tipo de carácter es este? Sabiendo qué tipo de carácter es, puedo utilizar una función de reemplazo o expresiones regulares para eliminarlo de mi conjunto de datos de Spark.

Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Como experto en TI especializado en expresiones regulares, codificación de caracteres, escapado de caracteres especiales y caracteres no ascii, hay varias formas de identificar el código de un carácter especial. Aquí hay algunos pasos que puedes seguir:

    1. Verifica la codificación del archivo fuente o documento donde se encuentra el carácter. Es posible que el carácter esté codificado de una manera específica que no sea compatible con la codificación que estás utilizando.
    2. Busca el punto de código Unicode para el carácter. Puedes utilizar recursos en línea como la Tabla de Caracteres Unicode o utilizar la utilidad de mapa de caracteres en tu sistema operativo.

    3. Verifica el código ASCII para el carácter. Si el carácter es un carácter ASCII, puedes buscar el código ASCII en una tabla.

    4. Utiliza un lenguaje de programación o una herramienta que admita la visualización de caracteres no imprimibles. Por ejemplo, si estás utilizando Python, puedes utilizar la función ord() para obtener el punto de código Unicode de un carácter.

    Una vez que hayas identificado el código del carácter especial, puedes utilizar una función de reemplazo o regex para eliminarlo de tu DF de spark según sea necesario.

Comments are closed.