28 jul 2012

Impacto del Big Data en el almacenamiento

Conforme los datos siguen creciendo exponencialmente, los administradores del centro de datos enfrentan retos enormes tratando de manejar eficientemente sus datos y el espacio de almacenamiento.

Según un estudio de IDC y EMC, la información digital aumentará de 40,000 PB a 2.3 millones entre 2010 y 2020 tan sólo en India. Como resultado, las empresas de todos los tamaños (pequeñas, medianas y grandes) enfrentarán un reto cada vez mayor para almacenar, proteger y manejar la información digital en rápido crecimiento, y cumplir con los requisitos de resguardo de la información.

Esta explosión de datos, conocida como Big Data, ha creado la necesidad y el apetito de innovación en el terreno del almacenamiento. Y entonces se tienen tecnologías como almacenamiento en múltiples niveles, datos fluidos y virtualización del almacenamiento.

La otra necesidad de un manejo eficiente de datos surge de la misma naturaleza de los datos, que tienden a perder su importancia con el tiempo. Las organizaciones desean archivar lo antiguo y mantener al alcance los datos más recientes o importantes. Se cree que el acceso a los datos sigue la regla 80/20 (el 20% más reciente de los datos capta el 80% del acceso).

“Una de las preocupaciones más serias para el administrador del centro de datos es cómo manejar el tamaño cada vez mayor de los datos en gabinetes dentro de las oficinas, además del tema de los requisitos de energía y el enfriamiento. El componente del almacenamiento, que tiene el mayor número de partes mecánicas, requiere máxima energía y capacidad de enfriamiento”, señaló Rajesh Awasthi, director de Nube y Telecomunicaciones de NetApp India, quien define la eficiencia del almacenamiento como la capacidad de almacenar la máxima cantidad de datos en el menor espacio posible y al más bajo costo posible.

“Es muy difícil predecir cuánto tiempo se conservará algún archivo de datos en el disco. Todos los datos inician su vida en almacenamiento primario. Trátese de un registro en una base de datos, un archivo del usuario, algún archivo de código fuente de software o un adjunto en un mensaje de e-mail, estos datos consumen espacio físico en una unidad de disco en alguna parte de su entorno de almacenamiento primario. La creación de datos en el espacio de almacenamiento primario inicia una cadena de sucesos que conllevan a ineficiencias en el almacenamiento”, aseguró Awasthi.
La oferta de proveedores

Tradicionalmente ha existido una brecha entre el manejo del almacenamiento y el manejo de los datos. El manejo de los datos que incluye el manejo de archivos, sistemas de archivos y datos estructurados, ha sido con frecuencia una disciplina aparte del manejo de la infraestructura de almacenamiento implícita.

Los administradores de datos se han preocupado históricamente por la redundancia, el desempeño, la persistencia y la disponibilidad de sus datos, mientras que los administradores de almacenamiento se han enfocado en proveer la infraestructura física que cumpla los requisitos de los datos.

En general, el almacenamiento se configura primero y luego se lleva a cabo el manejo de los datos dentro de las restricciones del almacenamiento configurado. Si cambian los requisitos de almacenamiento de los datos, los datos deben ser transferidos a un espacio de almacenamiento diferente o bien el espacio de almacenamiento implícito debe ser reconfigurado. Cualquiera de estos procesos es perturbador y requiere que múltiples administradores específicos del dominio trabajen juntos de cerca.

El gigante de las bases de datos Oracle intenta cerrar estas brechas con soluciones como Oracle Enterprise Manager. De acuerdo con un reporte oficial de la firma del Oráculo, “al ofrecer una consola única para el manejo de múltiples arquitecturas de servidor y una cadena interminable de sistemas operativos, las capacidades de Oracle Enterprise Manager incluyen descubrimiento de activos, provisión de firmware y sistemas operativos; manejo automatizado de parches, manejo de parches y configuración; manejo de la virtualización y reportes de cumplimiento completos. El sistema abierto y extensible que se puede integrar con herramientas existentes para el manejo de centro de datos, Oracle Enterprise Manager, se encarga del manejo de toda la infraestructura (desde firmware, sistemas operativos y máquinas virtuales hasta servidores, almacenamiento y estructuras de red)”.

Según el reporte, Oracle Enterprise Manager permite al personal del centro de datos observar y emprender acción contra el mal uso de la energía, además de permitir ver el consumo de energía en términos de dinero real.

El desempeño del dispositivo giratorio de almacenamiento basado en disco (que no mostró una mejora significativa) fue otro reto ignorado por muchos años. Esa situación ha cambiado de forma dramática gracias a los dispositivos de almacenamiento de tipo Flash. Por ejemplo, 4 milisegundos pueden considerar un tiempo de respuesta representativo para lecturas breves de discos giratorios. Los dispositivos tipo Flash pueden realizar la misma lectura en 0.4 milisegundos, lo que representa un orden de magnitud de mejora en el tiempo de respuesta.

La nueva característica Database Smart Flash Cache, de Oracle, aprovecha este avance en E/S que ofrecen los dispositivos de almacenamiento de tipo Flash. “La caché Flash es una tecnología disponible en los servidores y es como llevar el almacenamiento al interior de los servidores”, señaló Mitesh Agarwal, director IT de Oracle India.

Fuente: Information Week

Suscríbete a nuestro Boletín

0 Comments:

Publicar un comentario

Gracias por dejar un comentario en Segu-Info.

Gracias por comentar!