Tag: APACHE-SPARK-DATASET
Estoy convirtiendo un dataframe en un dataset usando case class que tiene una secuencia de otra case class. case class IdMonitor(id: String, ipLocation: Seq[IpLocation]) case class IpLocation( ip: String, ipVersion: Byte, ipType: String, city: String, state: String, country: String) Ahora tengo otro dataset de strings que solo tiene IPs. Mi . . . Read more
Estoy tratando de implementar el agrupamiento K-means en TensorFlow. Ya consulté este enlace https://www.tensorflow.org/api_docs/python/tf/compat/v1/estimator/experimental/KMeans -Esto utiliza números aleatorios en una matriz bidimensional. ¿Cómo puedo utilizar un conjunto de datos y convertirlo en objetos tensoriales y entrenar los datos utilizando kmeans?
Tengo datos como este: Las letras en la columna de valor son notas que describen el valor. Necesito crear una columna adicional que contenga solo las letras de la columna de valor y el número y “:” conservarán su posición. Sé que necesito usar expresiones regulares, por ejemplo. //w y . . . Read more
Aquí está el código: df = df.drop( [‘PassengerId’, ‘Name’, ‘SibSp’, ‘Parch’, ‘Ticket’, ‘Embarked’], axis = ‘columns’, inplace = True ) df.head() Está mostrando un error de tipo NoneType tanto en drop como en head. Creo que el código está bien, pero no pude definir el problema.
Conjunto de datos dset = new DataSet(); dset.ReadXml(FILENAME); El error que recibí al leer xml en el conjunto de datos: No se puede agregar una columna SimpleContent a una tabla que contiene columnas de elementos o relaciones anidadas. Descubrí qué está causando el problema. Mi elemento xml que está causando . . . Read more