Tag: ICEBERG

Iceberg: Cómo recorrer rápidamente una tabla muy grande

06 Aug, 2023 Programación 0

Soy nuevo en Iceberg y tengo una pregunta sobre cómo consultar una tabla grande. Tenemos una tabla Hive con un total de 3,6 millones de registros y 120 campos por registro, y queremos transferir todos los registros de esta tabla a otras bases de datos, como pg, kafka, etc. Actualmente . . . Read more

Escribiendo especificaciones de múltiples particiones en una tabla Apache Iceberg.

31 Jul, 2023 Programación 0

Me gustaría escribir una tabla Iceberg con una especificación de partición diferente a la configuración predeterminada de la tabla, para que cuando ejecute la compactación de datos, los datos se compacten según la especificación predeterminada (según sea posible con la configuración write-format). Por ejemplo: df.writeStream .format(“iceberg”) .outputMode(“append”) .options(Map(“path” ->tableIdentifier, “checkpointLocation” . . . Read more

Cómo elegir las claves de partición para las tablas de Apache Iceberg.

11 Jul, 2023 Programación 0

Tengo varios almacenes de Hive. Los datos residen en archivos Parquet en Amazon S3. Algunas de las tablas contienen TB de datos. Actualmente, en Hive, la mayoría de las tablas se particionan por una combinación de mes y año, ambos guardados principalmente como strings. Otros campos son bigint, int, float, . . . Read more

es.davy.ai

¿Tienes una pregunta?

Tag: ICEBERG

Iceberg: Cómo recorrer rápidamente una tabla muy grande

Escribiendo especificaciones de múltiples particiones en una tabla Apache Iceberg.

Cómo elegir las claves de partición para las tablas de Apache Iceberg.