Política de Cookies
Utilizamos cookies propias y de terceros para mejorar tu accesibilidad, personalizar y analizar tu navegación. Al continuar navegando consideramos que aceptas su instalación. Puedes cambiar la configuración u obtener más información en nuestra
(+ info)

Aceptar

PQC

El factor humano en un Data Center (II)

POSTED BY Garcerán Rojas 21 de March de 2018

Habida cuenta que en un entorno de data center se producen siempre situaciones que no han podido ser previstas. ¿Qué hacer ante lo no habitual? ¿Cómo ha de reaccionar el grupo de personas?

La contribución de las personas y su aportación al objetivo común, es la clave para desenvolverse adecuadamente en entornos de misión crítica entre los que se encuentran estos data centers de nuestros pecados. Así finalizaba el primero de estos artículos dedicados a los aspectos humanos en el data center, y lo hacíamos desde el punto de vista individual, en lo que respecta a las capacidades y a la forma en que se acometen los trabajos, es decir, todo lo relacionado con el conocimiento y la actitud de las personas que tienen en sus manos la operación y el mantenimiento del conjunto del sistema.

El factor humano, es decir, la contribución de diferentes aportaciones de las personas al objetivo común, se definió entonces como un elemento fundamental en cualquier organización y, de forma muy especial, en aquellos entornos de alta necesidad de disponibilidad, conocidos como entornos de misión crítica o MCFs (Mission Critical Facilities).

Un entorno de misión crítica, resulta siempre de alta complejidad, por lo que, independientemente de que el conocimiento y la actitud sean necesidades básicas, los aspectos organizativos tienen un peso extraordinario en el éxito del proyecto del que se trate.

Se ha repetido ya en numerosas ocasiones que un 70% de los problemas graves que afectan a un data center son ocasionados por errores humanos y, de ellos, dos terceras partes, es decir, casi la mitad del total, son motivados por defectos organizacionales. Se produce el error, pero muchas veces porque la propia organización lo permite, cuando no directamente lo genera.

En su momento, hicimos una comparación con una orquesta, donde resulta esencial cubrir las especialidades y establecer una estructura fiable. En este símil, la parte organizativa tiene que ver con la dirección, que ha de marcar el rumbo, elegir el tempo y corregir las desviaciones que se produzcan.

En el mundo de los data centers se produce, además, una curiosa paradoja consistente en el hecho de que cuanto más automatizado es el sistema y más elevada su tecnología, más se necesita garantizar el factor humano que se encuentra en la base de su funcionamiento. Podría parecer que la plena automatización nos ofrece un escenario donde las personas no intervienen, pero no es así. Su intervención se convierte en indispensable.

En la organización existen distintos grupos que deben funcionar de una forma cohesionada y sin fisuras:

Por un lado la Propiedad, es decir, el usuario final que es, en definitiva, quien establece las condiciones del negocio o servicio, el dimensionamiento del mismo y las fases de crecimiento habituales en toda inversión en un centro de datos. Su influencia es notoria y su responsabilidad sobre los posibles fallos de organización bastante clara, sobre todo en el comienzo de cada proceso.

Por otro, la empresa que tiene a su cargo las tareas de operación y mantenimiento, funciones que resulta muy habitual encontrarlas contratadas a terceros.

Sea la operación asignada a personal propio o a terceros, el mantenimiento de los equipos más significativos de la infraestructura electromecánica siempre se contrata al proveedor de los mismos, y aquí se encuentra el tercero de los grupos.

El último bloque es el de los consultores de distinta especie que nos encontramos en la órbita de nuestro cliente y que, de una u otra forma, le damos soporte a lo largo de la vida útil de la instalación.

Pues bien, el éxito del proceso se encuentra en la acción coordinada de todas las partes, algo que cada vez se está exigiendo más como imprescindible. Y la historia no nos ofrece, precisamente, buenas muestras de ello ya que, por ejemplo, son conocidas las eternas disputas entre los departamentos de IT (informática) y la de infraestructuras E&M, pertenecientes o no a la misma organización. Incluso hay conceptos que se manejaban entre ellos de forma exactamente opuesta.

En línea con lo anterior, desde hace unos cuantos años se observa una tendencia en el sector consistente en asignar una responsabilidad única sobre el data center, para evitar dualidades que, en términos de rozamiento interno, malgasten unas energías muy necesarias para el éxito general. La tónica general ha sido, y lo sigue siendo aún, otorgar esa función al CIO.

Disponer, entre otras cosas, de una estructura organizativa sólida, de una relación completa de procedimientos, de una definición clara de los alcances de cada parte, de las cadenas de reporte perfectamente engrasadas, de las responsabilidades respecto a las tomas de decisión, es decir, quién puede tomarlas y en qué condiciones, facilita sobremanera la consecución de los objetivos marcados, que no deben ser otros que el de situar el data center a la altura operativa que se le supone, tras la inversión realizada en su diseño y construcción

Hemos asistido a sucesos increíbles que jalonan nuestro discurrir de estos años en el terreno de los CPDs, y las preguntas sobre los mismos resultan inmediatas y múltiples. A continuación las plantearemos, dejando los detalles sobre su resolución para una posterior colaboración en estas páginas.

  • ¿Cuál puede ser la razón por la que para realizar un procedimiento de emergencia con activación cruzada entre ramas independientes, el procedimiento escrito sea de tal complejidad que sería imposible reproducirlo en los tiempos propios de una urgencia?
  •  ¿Cómo puede ser posible que un vigilante de seguridad apague todos los SAIs de un data center, ni más ni menos que la “alimentación ininterrumpida”, y que este tipo de actuación se haya repetido en escenarios distintos con personas y organizaciones diferentes?
  •  ¿Cómo tenía acceso al lugar y cuáles eran sus instrucciones y formación al respecto?
  •  ¿Cómo puede ser posible que, perteneciendo a una empresa internacional especialista en esto, cada vez que se abría una ventana de actuación en su cliente, y llegaba para dirigirla la persona en cuestión, todo el mundo se echaba a temblar pues las posibilidades de ejecutar maniobras en falso crecían de forma notoria?
  •  ¿Cómo puede entenderse que alguien del equipo de mantenimiento apague el grupo electrógeno porque al realizar una visita nocturna y faltar la iluminación del local, se creyó que se estaba quemando al observar el rojo intenso del escape?
  •  ¿Son fallos individuales o de la propia organización?

A esta última compete entregar al equipo de trabajo las tres cosas que necesita para desarrollar el mismo correctamente y que son la formación, la información y los medios. Sólo a partir de esa premisa se podrán establecer las responsabilidades de cada parte y encontrar los terrenos donde el solape de unas con otras debe ser perfectamente estudiado y determinado.

También resulta clave el tipo de estructura que se plantee, siendo el entorno de los data centers uno especialmente adecuado para incorporar soluciones preferentemente horizontales y colaborativas, con la mínima dosis de una verticalidad, por otro lado siempre necesaria en una cierta proporción.

En el comienzo de todo este asunto, se encuentra indudablemente la definición sobre el tamaño del equipo humano y su perfil profesional, es decir, la estructura general de los recursos. Y no sólo en lo que respecta a los valores particulares de cada bloque y de cada miembro del mismo, sino, de forma muy importante, las indicaciones sobre la actuación ante ausencias de piezas claves en el mecanismo.

  • ¿Cómo se tiene calentando en la banda a quien puede entrar al terreno de juego en cualquier momento?, ¿Cómo se forma a miembros del equipo de un data center para otro enclave distinto al que trasladarse urgentemente en caso de necesidad? ¿Son necesarias las rotaciones?
  •  ¿Cómo se realiza la coordinación con los responsables de la seguridad general del centro, para evitar sucesos como los descritos, cuando éstos no pertenecen a la parte de operación y mantenimiento?
  •  ¿Cómo acompasar las tareas de preventivo con el paso de los años y la aproximación al fin de la vida útil de las diferentes partes?
  •  ¿Cómo se establecen los criterios para la respuesta ante la generación de alarmas en el sistema? ¿Cómo separar el grano de la paja? ¿Cómo asegurar que se reacciona cuando es realmente necesario y que, por el contrario, no se actúa de forma innecesaria ante eventos menores?
  •  ¿Cómo determinar escenarios de actuación donde la simplificación en los procesos sea un hecho demostrable y cómo acometer los necesarios ensayos de forma no invasiva para la instalación?

Habida cuenta que en un entorno de data center se producen siempre situaciones que no han podido ser previstas. ¿Qué hacer ante lo no habitual? ¿Cómo ha de reaccionar el grupo de personas?

La orquesta ha ido completándose y hemos de dar por supuesto que cada quien toca su instrumento de forma precisa, eso sí, habiéndose seleccionado las disciplinas adecuadas a la partitura que hay que interpretar. A lo largo de la vida del centro existen muchas probabilidades. Desde que sea necesario un allegro vivace hasta que haya que seleccionar un tempo largo.

Desde el punto de vista de la organización, además de garantizar que se va a poder responder a todas las necesidades que van a ir manifestándose con el tiempo, hay que dedicar una atención especial a la motivación del grupo. La implicación de todos y cada uno de los responsables de cada área en las mejoras que se consiguen y demuestran, son vitaminas insufladas de forma aparentemente espontánea al conjunto de los intervinientes, pero que se convierten en una plataforma de crecimiento para los componentes individuales del grupo y, sobre todo, para el conjunto en sí mismo.

En definitiva, ya prácticamente nadie discute que la componente humana ocupa, con pleno merecimiento, la base del funcionamiento del sistema, por lo que debe dársele la importancia que tiene, y hacerlo mediante la dotación de los recursos necesarios y, por delante de ello, con la disposición de unas reglas de juego bien entendibles por todos y que faciliten, apoyen y empujen al grupo hacia la permanente consecución de los objetivos marcados por el negocio o el servicio correspondiente. El planteamiento debería ser siempre en términos de mejora continua, lo que garantizará que la instalación discurrirá su vida útil en unas condiciones óptimas que permitan asegurar que la inversión realizada en su diseño y construcción se ve complementada con un nivel de operación a su altura.

No hacerlo así provocaría que la orquesta desafine y si esto ocurre cuando los músicos son de segundo nivel podría incluso entenderse, pero disponiendo de auténticos virtuosos en cada sección, es decir, topologías redundadas, sistemas sofisticados de control, dotación correcta de recursos humanos individuales, etc., que la organización permita o, peor aún, provoque una pobre interpretación, sería imperdonable.

Bach y Beethoven saldrían justificadamente de sus lugares de reposo y, unidos a Von Karajan y Georg Solti que les estarían ya esperando, constituirían un implacable jurado ante el que no tendríamos argumentos convincentes para nuestra defensa.

 

¿Pudiste disfrutar de la lectura de la primera parte de este artículo? Si no es así, aquí tienes el enlace a la publicación por si quieres analizar en conjunto: "Factor Humano parte I"

Garcerán Rojas