Big Data
La frase "big data" se usa a menudo en empresa configuraciones para describir grandes cantidades de datos . No se refiere a una cantidad específica de datos, sino que describe un conjunto de datos que no puede almacenarse ni procesarse utilizando los datos tradicionales. base de datos software.
Ejemplos de big data incluyen el Google índice de búsqueda, la base de datos de Facebook perfiles de usuario y la lista de productos de Amazon.com. Estas colecciones de datos (o "conjuntos de datos") son tan grandes que los datos no pueden almacenarse en una base de datos típica, o incluso en una sola computadora. En cambio, los datos deben almacenarse y procesarse utilizando un sistema altamente escalable sistema de administración de base de datos. Big data a menudo se distribuye a través de múltiples dispositivos de almacenamiento, a veces en varios lugares diferentes.
Muchos sistemas de gestión de bases de datos tradicionales tienen límites para la cantidad de datos que pueden almacenar. Por ejemplo, una base de datos Access 2010 solo puede contener dos gigabytes de datos, lo que hace inviable almacenar varios Petabytes or exabytes de datos. Incluso si un DBMS puede almacenar grandes cantidades de datos, puede funcionar de manera ineficiente si demasiados tablas or archivos se crean, lo que puede conducir a un rendimiento lento. Las soluciones de Big Data resuelven estos problemas al proporcionar sistemas de almacenamiento altamente receptivos y escalables.
Hay varios tipos diferentes de big data programa. soluciones, incluidas plataformas de almacenamiento de datos y programas de análisis de datos. Algunos de los productos de software de big data más comunes incluyen Apache Hadoop, Big Data Platform de IBM, Oracle NoSQL Base de datos, Microsoft HDInsight y EMC Pivotal One.