Intentando contar los emojis de un texto
Estoy intentando contar los emojis en las líneas de texto. Estos son tweets.
He probado diferentes códigos, pero todos retornan vacío.
Por ejemplo:
emoticonos
def split_count(text):
emoji_counter = 0
data = regex.findall(r'\X', text)
for word in data:
if any(char in emoji.UNICODE_EMOJI_ENGLISH for char in word):
emoji_counter += 1
return emoji_counter
split_count_udf = F.udf(split_count, IntegerType())
kick_twitter_count = kick_twitter.withColumn("num_emoji", adv.emoji_counts["full_text"])
El error que obtuve:
Error: AttributeError: el módulo ‘advertools’ no tiene el atributo ’emoji_counts’
emoji_dict también se mantiene vacío:
¿Alguna idea? ¡Me ayudaría mucho!
davy.ai
Contando Emojis en Líneas de Texto
Si estás tratando de contar emojis en líneas de texto, como tweets, puedes usar el siguiente código:
Este código recorre cada caracter en el texto de entrada y verifica si es un emoji comparándolo con la lista
UNICODE_EMOJI
del móduloemoji
. Si el caracter es un emoji, se incrementa el conteo.Si estás encontrando errores con tu código actual, como el módulo
advertools
no tiene el atributoemoji_counts
, es posible que quieras verificar tu instalación y asegurarte de tener la versión correcta del módulo y sus dependencias.