Deduplicación de destino

La deduplicación de destino es el proceso de eliminación de copias duplicadas de datos de un conjunto de datos de destino. Esto puede hacerse por diversas razones, como reducir los requisitos de almacenamiento, mejorar la calidad de los datos o reducir el tiempo de procesamiento. Existen varios algoritmos que pueden utilizarse para la deduplicación de … Leer más

Histograma

Un histograma es una representación gráfica de la distribución de datos numéricos. Es una estimación de la distribución de probabilidad de una variable continua (variable cuantitativa) y fue introducido por primera vez por Karl Pearson. Es una buena herramienta para visualizar la distribución de los datos, ya que es fácil de interpretar y comprender. El … Leer más

Integración de datos

La integración de datos es la combinación de datos procedentes de múltiples fuentes en una visión única y coherente. Los datos pueden proceder de fuentes dispares, como bases de datos relacionales, archivos planos y servicios web. La integración de datos es un componente clave de las soluciones de data warehousing y business intelligence (BI). El … Leer más

Bluesnarfing

El término «bluesnarfing» se refiere al acceso no autorizado a los datos de un dispositivo con Bluetooth. Esto puede hacerse aprovechando las vulnerabilidades del protocolo Bluetooth o utilizando herramientas de hacking especializadas. Una vez que se ha accedido a los datos, éstos pueden utilizarse para suplantar al propietario del dispositivo o para cometer un fraude. … Leer más

Almacenamiento compartido

Cuando varios ordenadores necesitan acceder a los mismos datos o archivos, se dice que esos datos se almacenan en un sistema de «almacenamiento compartido». Puede tratarse de un servidor central al que se conectan todos los ordenadores o de una red de área de almacenamiento (SAN), que es una red dedicada de dispositivos de almacenamiento. … Leer más

Almacenamiento masivo

El almacenamiento masivo se refiere al almacenamiento colectivo de datos en un sistema. Suele referirse a los sistemas de almacenamiento a gran escala, como el almacenamiento conectado a la red (NAS) o las redes de área de almacenamiento (SAN). Los sistemas de almacenamiento masivo suelen utilizarse para almacenar grandes cantidades de datos a los que … Leer más

Kilobyte (KB)

Un kilobyte es una unidad de información digital que equivale a 1.024 bytes. Un byte es una unidad de información digital que equivale a ocho bits. ¿Cómo se llama también un byte de datos? Un byte de datos también se llama «palabra». Una palabra es una unidad de datos que suele utilizarse para representar un … Leer más

Lenguaje de definición de datos (DDL)

Un lenguaje de definición de datos (DDL) es un estándar para especificar cómo se definen los datos en una base de datos. Se utiliza para crear, modificar y eliminar objetos de la base de datos como tablas, índices y restricciones. Las sentencias DDL se utilizan normalmente para crear o modificar la estructura de una base … Leer más

Datos semiestructurados

Los datos semiestructurados son información que no tiene un modelo de datos predefinido o que no está organizada de forma predefinida. Los datos semiestructurados suelen ser datos no estructurados que han sido organizados o estructurados hasta cierto punto. Este tipo de datos suele encontrarse en archivos que contienen etiquetas u otros marcadores para identificar ciertos … Leer más

Función Hash

Una función hash es cualquier función que puede utilizarse para asignar datos de tamaño arbitrario a datos de tamaño fijo. Los valores devueltos por una función hash se denominan valores hash, códigos hash, compendios o simplemente hashes. Las funciones hash se utilizan habitualmente en informática para almacenar y recuperar datos de forma eficiente. El uso … Leer más