Golden record

Un registro dorado es un término utilizado para describir un registro completo y preciso de una entidad, normalmente utilizado en el contexto de la gestión de datos. El término se deriva de la idea de un «patrón oro», que es un punto de referencia perfecto o idealizado con el que se pueden medir otras cosas. … Leer más

Apache Parquet

Apache Parquet es un formato de archivo columnar gratuito y de código abierto que puede utilizarse para almacenar datos tabulares. Es similar a otros formatos de archivo en columna disponibles para Hadoop, como Apache ORC y Apache RCFile. Parquet utiliza el algoritmo de trituración y ensamblaje de registros descrito en el artículo de Dremel para … Leer más

Caché distribuida

Una caché distribuida es un tipo de caché que se reparte entre varios servidores. Se utiliza para acelerar el acceso a los datos a los que los usuarios acceden con frecuencia. Los datos se almacenan en la caché de forma que sean accesibles para todos los servidores del sistema. Esto permite que los datos sean … Leer más

Máquina de vectores de apoyo (SVM)

Una máquina de vectores de apoyo (SVM) es un algoritmo de aprendizaje supervisado que puede utilizarse tanto para tareas de clasificación como de regresión. El algoritmo se basa en la búsqueda de un hiperplano que separa mejor un conjunto de datos en dos clases. Los SVM son especialmente adecuados para la clasificación de conjuntos de … Leer más

Datos históricos

Los datos históricos se refieren a los datos que se han recogido a lo largo del tiempo. Estos datos pueden utilizarse para seguir las tendencias, controlar los cambios y predecir eventos futuros. Los datos históricos pueden almacenarse en diversos formatos, como bases de datos, hojas de cálculo y archivos de texto. ¿Dónde puedo obtener datos … Leer más

Sistema de registro (SOR)

Un sistema de registro (SOR) es una aplicación de software que es la fuente principal de datos para un proceso empresarial específico. Los datos de un SOR suelen mantenerse en una base de datos y se utilizan para apoyar las actividades principales de una organización. Los SOR suelen ser aplicaciones de misión crítica que se … Leer más

Censo de los Estados Unidos

El Censo de los Estados Unidos es el proceso de recuento de la población de los Estados Unidos. Se realiza cada diez años, y los resultados se utilizan para determinar el número de escaños en el Congreso que tiene cada estado, así como para distribuir los fondos federales. El censo más reciente se realizó en … Leer más

Ley de Protección de la Privacidad del Conductor (DPPA)

La Ley de Protección de la Privacidad del Conductor (DPPA) es una ley federal que se promulgó en 1994 para proteger la privacidad de la información personal contenida en los archivos de los departamentos estatales de vehículos de motor. La DPPA regula la divulgación de la información personal de los registros estatales de vehículos de … Leer más