Tag: MAPREDUCE
Soy nuevo en Python y quiero usar el paquete de MrJob para contar la frecuencia relativa de pares de palabras. Escribí el código de abajo pero no produce la salida correcta. ¿Puedes por favor ayudarme con mis errores? ((𝜆|𝜇) = 𝜆𝜓𝜖𝜗𝜕(𝜆, 𝜇)/𝜆𝜓𝜖𝜗𝜕(𝜇)=𝜆𝜓𝜖𝜗𝜕(𝜆, 𝜇)/∑A’ 𝜆𝜓𝜖𝜗𝜕(𝜆’ , 𝜇)` import re from collections . . . Read more
Tengo una lista de listas que contienen cadenas y quiero contar en cuántas de esas listas aparece cada elemento: list_of_lists = [[“dog”, “cow”], [“dragon”, “ox”, “cow”], [“fox”, “cow”, “dog”]] Entonces, “cow” aparece en 3 listas, “dog” aparece en 2, etc. Para un conjunto de datos tan pequeño, normalmente haría lo . . . Read more
Hola, ¿alguien puede ayudarme a hacer map reduce con Kmeans usando Spark? Actualmente puedo hacer Kmeans con Spark, pero no sé cómo hacer el mapeo y la reducción. Gracias.
Estoy diseñando un MapReduce en Apache Hadoop. Se me ha proporcionado datos que incluyen: el identificador único de los clientes, su código postal, la fecha de compra y el producto que han adquirido. Un ejemplo de los datos se ve así: CustId 10001, PostCode 111111, DoP 19/11/2000, ProdP 1 Quiero . . . Read more
Tengo una cadena con el siguiente formato: “ABCD XYZ JSON1: { ‘key1′:’val’, ‘key2’:{ ‘key2key1′:’key2val1’, ‘key2key2′:’key2val2’} }, MNO PQRS JSON2{…}” Necesito extraer cada JSON de una cadena así. No conozco el texto antes de comenzar JSON. ¿Cómo puedo extraerlos?