Apache Parquet
Apache Parquet es un formato de archivo columnar gratuito y de código abierto que puede utilizarse para almacenar datos tabulares. Es similar a otros formatos de archivo en columna disponibles para Hadoop, como Apache ORC y Apache RCFile. Parquet utiliza el algoritmo de trituración y ensamblaje de registros descrito en el artículo de Dremel para … Leer más