Política de Cookies
Utilizamos cookies propias y de terceros para mejorar tu accesibilidad, personalizar y analizar tu navegación. Al continuar navegando consideramos que aceptas su instalación. Puedes cambiar la configuración u obtener más información en nuestra
(+ info)

Aceptar

PQC

Los SAIs en los Data Centers

POSTED BY Garcerán Rojas 07 de April de 2022

Los SAIs pertenecen, podríamos decir que desde siempre, al mobiliario de este tipo de instalaciones. Y la primera consideración a efectuar es ¿son realmente necesarios?

Para quienes estamos acostumbrados desde hace muchos años a trabajar en data centers dotados de redundancia distribuida con topologías 2xN en SAIs, resulta ciertamente sorprendente escuchar que más de la mitad de las caídas “eléctricas” en un data center son por causa de los UPSs y así lo vienen siendo desde que tenemos constancia de las estadísticas publicadas a nivel internacional.

Las estadísticas, en esas topologías indican que los SAIs no tienen una elevada incidencia en las caídas de los data center y, sin embargo, a nivel global, parece suponer lo contrario, lo que parece indicar que las muestras sobre las que se trabaja están compuestas por centros de configuración mucho más simple, donde el SAI representa un camino crítico y único.

Pero, en cualquiera de los casos, estamos ante uno de los elementos más característicos de los data center y de cualquier otro entorno de misión crítica. Los SAIs pertenecen, podríamos decir que desde siempre, al mobiliario de este tipo de instalaciones. Y la primera consideración a efectuar es ¿son realmente necesarios?

Y la respuesta, aunque exista una cierta tendencia a la conexión directa a red de cargas IT, es bastante evidente: SÍ.

Las condiciones de suministro eléctrico en cualquier instalación de data center, incluso en los países con una mayor disponibilidad, presentan situaciones no tolerables por unos equipos IT que, a pesar de la evolución que han tenido en las tecnologías aplicadas a las fuentes de alimentación desde la irrupción de los SMPS, no pueden soportar una ausencia de tensión superior a los 20 ms.

Por tanto, los SAIs constituyen un denominador común casi irreemplazable.

Es cierto que, en los tiempos que corren, se están viendo algunas aplicaciones en las que no se cuenta con ellos y que, en otras ocasiones, se está recurriendo a no colocarlos en una de las ramas, pero ello no impide que se pueda afirmar rotundamente que se trata de los elementos más conocidos del reparto (muchas veces hemos oído a gente del lado TI hablar de la parte eléctrica como “eso de los SAIs y ya está”).

En la evolución de los data center en general, y de la alimentación eléctrica a los equipos IT en particular, existe un indudable punto de inflexión que se sitúa allá por 1993 cuando se publicaros los resultados de un estudio sobre más de 1700 casos de caída en el servicio y que reconocían al SAI como responsable de una proporción menor del 10%, mientras que casi un 80% se encontraba relacionado con problemas en los circuitos de distribución.

A partir de ese hecho, y mediante una decisión consensuada entre los principales fabricantes de los equipos IT, comenzó a dotarse a estos de doble fuente de alimentación, con el indudable propósito de atacar ese 80% de casos.

Sin embargo, y salvo honrosas excepciones, el sector no respondió exactamente al planteamiento real sino que tomó un doble camino que supuso una curiosa paradoja.

Por un lado, el de aquellos que entendieron perfectamente lo ocurrido y concentraron sus esfuerzos en dotar a la nueva tecnología de alimentación dual de todos los recursos mediante el uso de circuitos independientes para cada una de las ramas y, por otro, el de una mayoría que tiró por la vía de concentrar las redundancias exclusivamente en los SAIs pero en configuraciones de redundancia paralela.

Esta topología todavía sigue viva en muchas aplicaciones y sería una apuesta segura afirmar que, de las muestras utilizadas por quienes relacionan las estadísticas sobre caídas, una muy elevada proporción presenta esta disposición.

A la hora de hablar de los SAIs, son muchos los conceptos asociados al rol que representa en nuestras instalaciones y que, muchas veces, han quedado indebidamente reducidos a una simple cuestión de potencia y autonomía, siendo la realidad bien distinta. Para poder realizar una correcta aplicación de estos elementos hay que tener en cuenta múltiples aspectos. Entre ellos, las topologías, el dimensionamiento, las desclasificaciones, el factor de potencia, la sincronización, la tecnología, los bypass, el comportamiento en cortocircuito, el esquema de neutro, los ciclos de vida, los ensayos, las baterías, las distorsiones, los ensayos, los estados de carga, etc.

Pues bien, comencemos a desgranar esta serie de conceptos.

En cada nuevo proyecto, y ya que en modo alguno de discute la utilización de los SAIs, aparece indefectiblemente la primera y consabida discusión sobre qué tecnología adoptar y qué modelo en concreto.

De forma recurrente en Europa y de modo incipiente en Latam, la primera decisión es la de si ir a modelos estáticos con baterías como almacén de energía o a rotativos dotados de volantes de inercia para idéntico objetivo. Los pros y contras son bien explicados por los encargados de vender unos u otros pero la decisión no es nada fácil, al menos para los que no disponen de un historial en su organización en el uso de ambas alternativas durante años, única forma de saber a ciencia cierta hacia dónde ir.

  • Los modelos rotativos, tanto los puros, como los híbridos, como los asociados al grupo electrógeno de respaldo provienen de tecnologías utilizadas desde hace muchos años en distintos sectores y que volvieron a cobrar fuerza al ocupar un espacio entre aquellos que no acababan de tener un buen “feeling” con los modelos estáticos. La progresiva incorporación al sector de los data center ha sido evidente, la mejora y modernización de la tecnología y de los sistemas derivados un hecho incuestionable y la realidad actual presenta, por ello, una proporción a tener en cuenta, sobre todo en aquellas aplicaciones de mayor potencia para las que, hasta hace bien poco, estaba más justificada la inversión.
  • En el caso de los estáticos, utilizados de forma genérica en los data centers desde que estos pueden considerarse como tales, las modalidades van desde la off-line hasta la on-line de doble conversión, pasando por las de naturaleza interactiva o las de conversión tipo delta, siendo los argumentos para la utilización de cada uno de ellas variados y, todos ellos, ciertos. Por ejemplo, el enorme ahorro de aparellaje cuando se eligen modelos fuera de línea en alta tensión (hay quien afirma que un modelo off-line no es apropiado para un data center pero sobre ello habría mucho que discutir), el compromiso entre precio y prestaciones de determinados modelos interactivos o la aportación de un excelente acondicionamiento de línea en los modelos de doble conversión.

En todos los casos, de lo que se trata es de ponderar adecuadamente las prestaciones que ofrece la tecnología a seleccionar, más allá de una potencia, y de una autonomía, determinadas. Es decir, independencia de la carga IT respecto de la alimentación, niveles de distorsión, eficiencia, comportamiento en sobrecarga y, por supuesto, precio.

Una vez elegidos familia y modelo, otro de los campos en los que es notoria la evolución histórica en la utilización de SAIs, es el de su configuración cuando existe más de una unidad. A partir de la primigenia utilización de módulos simples, la necesidad de aumentar la disponibilidad fue llevando al sector hacia disposiciones redundantes donde, su expresión más utilizada desde los 80 hasta mediados los 90, fue la redundancia paralela adoptándose soluciones casi siempre en N+1.

Con algunas excursiones hacia combinaciones del tipo redundante aislado que duraron poco tiempo, donde unos SAIs se alimentaban desde otros, en su forma más frecuente mediante la utilización de unidades generales del edificio como respaldo de las específicas del data center, se vivió una transición hacia disposiciones redundantes distribuidas más adecuadas para el sistema de alimentación dual a equipos.

El cambio fue lento pero continuo y, de hecho, en nuestra larga historia en el mundo de los DC una de las épocas donde más experiencia acumulamos en la realización de trabajos del tipo “cortecero”, fue el de realizar transformaciones desde entornos paralelo redundante 1+1 a topologías redundantes distribuidas 2x1 sin más que abrir la unión entre las máquinas y constituir, si no se hallaba ya preparada, una rama nueva de distribución en sala (cuadros, protecciones y cableado). Este tipo de actividad sigue siendo una constante en los proceso de reingeniería de data centers, parece que tendrá que continuar siéndolo durante bastante tiempo.

De hecho, la disponibilidad de un conjunto de SAIs en paralelo decrece con el número de unidades y con los años.

Por ello, hay que atender, por un lado, a los ciclos de vida y, por otro, a la limitación en el número de unidades, máxime en unos tiempos como los presentes donde se está intentando acomodar las inversiones al propio crecimiento progresivo de la carga IT de manera que los escalones de crecimiento en los SAIs pueden plantearse pequeños y, con ello, se multiplica el número de unidades en paralelo con la consiguiente pérdida de fiabilidad del conjunto.

Sin embargo, hoy en día, no entendemos un data center, por muy simple que sea la idea inicial sobre su nivel de exigencia, para el que no se prevea una independencia de fuentes ininterrumpidas. Lo que sí está variando es la disposición de unidades en paralelo por cada rama, motivado ello por dos aspectos bien distintos.

Por un lado, la ya citada aproximación modular y su eficiente adecuación a la progresión en la que la carga TI va a ir incorporándose al centro y, por otro, el nivel de seguridad que desee adoptarse y su reflejo en el número de unidades adicionales a colocar por cada rama. La topología 2x(N+1) ha sido muy usada en entornos de máximo nivel de exigencia, llegándose incluso a contados escenarios 2x(N+2), pero la tendencia actual es a limitar esta disposición a planeamientos 2xN que disponen de una disponibilidad asociada muy elevada. Es más, incluso esos planteamientos 2xN están siendo afinados de forma que se entregue esa tipología a nivel de sala IT pero dentro de un escenario donde existen SAIs reserva que constituyen la redundancia común para distintas salas, en el supuesto de que nunca va a requerirse su utilización en más de una o, como mucho de un número reducido de salas.

El dimensionamiento en potencia de un SAI también ha sido un campo en el que se han producido ciertas variaciones a medida que estas máquinas han ido evolucionando. La selección del modelo siempre se ha hecho en kVA, es decir, en función de su potencia aparente, pero la realidad nos ha presentado un escenario donde las cargas IT se han calculado y valorado en kW es decir, en potencia activa. Durante muchos años en los que los factores de utilización de los SAIs se encontraban en 0,8 (relación entre la potencia activa entregable y la aparente de un SAI) y las cargas eran ligeramente inductivas, el único problema estribaba en realizar los cálculos en kW y confirmar que los kW que necesitaba la carga los podía entregar el UPS.

A partir de 2004 comenzaron a modificarse las fuentes de alimentación de los equipos IT pasando a ser éstas ligeramente capacitivas, lo cual obligó a los fabricantes de UPS a realizar ciertas modificaciones en sus equipos encaminadas a poder manejar el nuevo tipo de cargas IT (los fabricantes de SAIs siempre han reaccionado muy rápido ante estos cambios en las reglas del juego). El dimensionamiento al uso seguía siendo perfectamente válido pero era necesario confirmar que el modelo de UPS era apropiado para la nueva situación y, en caso contrario, realizar una desclasificación sobre el mismo, extensible también a todos los modelos en uso (la sustitución de quipos IT en los data center fue progresiva pero los UPS seguían siendo los mismos).

Esta nueva situación coincidió con las primeras mejoras en el factor de utilización que, pronto pasó a ser de 0,9 de forma más o menos generalizada, habiéndose llegado ya a un factor de 1 en muchos fabricantes, es decir, que la máquina te da el mismo número de kVA que de kW, lo que nos plantea un nuevo problema, ciertamente opuesto al histórico. Ahora no basta con verificar que los kW que da el SAI son suficientes para atender los de la carga IT, sino que hay que verificar también la potencia aparente. Cierto es que los márgenes de error son pequeños pero dada la finura de los dimensionamientos en los crecimientos escalonados, se pueden cometer errores importantes.

La disposición de elementos redundantes, tanto en su versión paralela como distribuida, ha dado lugar a otro de los grandes problemas asociados a la operación de estos elementos y la realidad del día a día del negocio que soportan.

Como quiera que la incorporación de cargas IT sigue un ritmo que, a veces, es más rápido que la capacidad de la infraestructura para adaptarse a la nueva realidad (business is business), se han dado y se dan bastantes casos donde la redundancia desaparece y, como quiera que la potencia total es suficiente, se va salvando el día a día de la continuidad, pero sin colchón de seguridad alguno. En el momento en el que falla alguno de los componentes individuales, falla el conjunto del sistema.

Por ello, la continua vigilancia sobre los estados de carga es uno de los factores prioritarios en la operación de un data center y en la sostenibilidad del mismo. Es más, en muchas ocasiones se están incluso marcando límites del 90% para el máximo nivel de utilización de los elementos individuales en el peor escenario.

Por otra parte, es bastante corriente encontrarse con limitaciones al crecimiento que se encuentran al margen de la propia consideración de las unidades en paralelo y de la ampliación en número de las mismas. Circuitos comunes de menor capacidad, reducidos calibres de interruptores, etc., son escenarios habituales asociados a disposiciones muy redundadas en módulos de SAI pero con restricciones evidentes en esas otras partes comunes del sistema que hacen que a la inversión no pueda sacársele el provecho que se pretendía y, lo que es peor, que demos por supuesto que la instalación dispone de un margen de crecimiento que no es real y que puede llevarnos a situaciones de colapso y de evidente riesgo para la continuidad del servicio en todo el centro.

Como complemento de su función asociada a la ininterrumpibilidad, y muchas veces ignorada, o directamente ensombrecida por el enorme peso específico de esta, se halla la tarea de acondicionamiento en la tensión que se entrega a los equipos alimentados desde el UPS. Es decir, el vínculo de los SAIs con el mundo de la Power Quality. Ahí nos encontramos con la necesidad de entregar a los equipos críticos una forma de onda donde la tensión y la frecuencia se encuentren mejoradas respecto de las existentes en la red general.

El nivel de acondicionamiento está íntimamente relacionado con el tipo de SAI utilizado, siendo de mayor garantía los modelos denominados VFI (IEC 602040-3), es decir, donde tanto la frecuencia como la tensión de salida son independientes de las correspondientes a la entrada, algo que no pueden ofrecer los modelos fuera de línea y, sólo parcialmente, los interactivos

El concepto del acondicionamiento ha sido, históricamente, anulado por el de la Continuidad de Servicio, pero tiene una importancia máxima en este tipo de entornos, donde la sensibilidad de los equipos es directamente proporcional a la evolución en el grado de integración.

Al comienzo de nuestra actividad en el terreno de la Power Quality, los únicos que entraban algo en ese terreno eran los fabricantes de SAIs, y lo hacían desde una perspectiva focalizada en un producto que, eso sí, bien seleccionado, contribuía en gran medida a la mejora en las condiciones de suministro a equipos sensibles. Pero, de forma simultánea, ciertas medidas tomadas por ese colectivo, fundamentalmente en lo que respecta a la relación entre el conductor neutro y el de protección, fueron directamente en contra de la línea anteriormente expresada, dando lugar a situaciones que incorporaban serios problemas de seguridad.

Una buena solución para este inconveniente, que ha sido muy corriente en nuestro sector, ha sido el uso de transformadores de aislamiento, esa gran ayuda de la que disponemos los diseñadores y usuarios de data centers para resolver muchos de los problemas relacionados con tierras, armónicos, sobretensiones transitorias y demás fenómenos relacionados con la PQ. En los países donde, debido a las tensiones normalizadas de suministro, deben realizar una reducción de voltaje para llegar a los equipos, tienen, sin muchas veces darse cuenta de ello, la ayuda impuesta por la necesidad y, por ello, suelen presentar menos anomalías en las condiciones de funcionamiento de esa parte de la instalación.

También en el campo de la PQ, otra amenaza permanente son las sobretensiones transitorias para las que se presentan los escenarios de riesgo asociados al uso de determinados modelos de SAI o condiciones de funcionamiento de los mismos.

  • Así, los modelos off-line deben ir acompañados de un completo sistema de protección dado que la carga IT se encuentra directamente conectada a la fuente.
  • Los interactivos, a pesar de trabajar en ocasiones sobre la tensión incidente, tampoco suponen una separación completa, por lo que deben incorporar también una protección complementaria.
  • Por último, en el caso de los modelos on-line, o de doble conversión, la separación es completa en modo diferencial pero no siempre lo es también en modo común, y las sobretensiones transitorias penetran frecuentemente en ese modo, por lo que la protección de la que hablamos también debe incorporarse.

En este orden de cosas, se está produciendo, además, una situación muy delicada relacionada con la eficiencia energética.

Desde allá por 2009, y en gran medida como consecuencia de la publicación por parte de Google de sus resultados de PUE, comenzó un tiempo de locura colectiva en el sector por ver quien presentaba números más bajos y ello afectó de forma evidente a los SAIs. A pesar de que el mayor contribuyente de la parte electromecánica al valor PUE era siempre la parte de clima, en el mundo del SAI comenzaron a analizarse los rendimientos como factor de compra determinante (cada centésima de mejora era una opción de venta añadida). Los interactivos cobraron una cierta ventaja sobre los de doble conversión, desde donde surgió rápidamente la propuesta de trabajar en modo ECO, algo parecido a utilizar el bypass como camino prioritario y el inversor como secundario.

El funcionamiento en modo ECO, por el que, dicho de forma muy simplificada, uno compra un UPS de doble conversión, a precio de doble conversión y lo utiliza como un off-line, aparte de las evidentes consideraciones económicas, tiene efectivamente un claro resultado en eficiencia, pero somete a la carga a los riesgos inherentes a la conexión directa entre carga IT y red de suministro exterior. Los tiempos de reacción del sistema, normalmente en un entorno máximo de 2 ms, resultan del orden de 1000 veces más lentos que la velocidad de penetración de las sobretensiones, con lo que queda todo dicho.

Otro componente del conjunto de suministro eléctrico a los equipos IT, que lleva ocupando una posición importante en muchos de los esquemas básicos, son los sistemas de transferencia estática o STS cuya relación con los SAIs ha sido muy estrecha y a los que ha influenciado notablemente. Como quiera que la transferencia ideal en un STS se realiza cuando las dos formas de onda incidentes se encuentran sincronizadas (mismo ángulo de fase), se tomó por costumbre proceder a una sincronización de los SAIs de ramas independientes por medio de un elemento conocido como LBS (Load Bus Sync).

Durante los años 90 y principios de siglo, supusieron una constante en casi todos los diseños de primer nivel, pero el tiempo ha puesto las cosas en su sitio y, hoy en día, la lista de lugares donde esa sincronización ha generado más problemas que los que podría haber resuelto, es amplia, por lo que ya no es muy corriente verlos en los diseño y sí verlos desconectados allá donde están colocados. Lo que sí se confirma con esta apreciación es que cada elemento que se incorpora al conjunto constituye un punto más de fallo y que las ventajas deben ser muy poderosas para compensar ese hecho.

También hay que mencionar de forma muy específica un elemento más del SAI que ha constituido un factor de discusión a lo largo de esta reciente historia de su aplicación a los data centers. Se trata de los bypasses, o circuitos de rodeo como se les conoce muy acertadamente en algún que otro país de Latam, que según cuál ha sido la época han sido de una forma o de otra.

A la hora de acoplar SAIs en paralelo, estos circuitos de rodeo han podido ser individuales por cada módulo o centralizados.

No se trata en estas páginas de entrar a un detalle que nos ocuparía mucho espacio, pero según la época la tendencia ha sido una u otra. Asimismo, y como mayor garantía de continuidad, era muy corriente también (ahora ya no tanto) cruzar los bypasses entre ramas.

Un UPS es un elemento que cuando se produce un cortocircuito en las vías de distribución, se comporta como cualquier otro elemento del suministro de energía, es decir, aportando al corto la energía de la que dispone. Habida cuenta que la capacidad de los UPSs para aportar esta energía no ha sido muy alta (con la excepción de los modelos rotativos), se da en este tipo de configuraciones una situación de conocido riesgo y que no es otra que la que aparece cuando se produce un corto en los circuitos que dependen de esa máquina. Si la corriente de corto generada no es muy grande, puede ello suponer que el interruptor de protección que deba abrir el defecto no pueda hacerlo o, al menos, no en los tiempos deseables, con lo que la caída de tensión asociada al corto puede afectar al resto de circuitos que dependen de la misma fuente y provocar, al margen de los riesgos asociados a un corto sin despejar, una caída completa del servicio.

Por ello, ante un corto, lo más habitual ha sido y es que el SAI conmute a bypass y, de esta forma, genere una corriente de falta que garantice la intervención inmediata de la protección. Sin embargo, existen modelos que sí disponen de una cierta capacidad para entregar una corriente de corto desde el mismo inversor y es, en estos casos, cuando el estudio específico sobre el ajuste de las protecciones cobra una especial relevancia. Lo cierto es que conocemos muy poca gente en el sector que descienda hasta ese nivel de detalle pero resulta imprescindible si se quiere garantizar la correcta respuesta del sistema ante situaciones de defecto.

Por último, y aunque seguro que existen múltiples conceptos más que citar en este mundillo de los SAI, citemos al componente más básico de todo el sistema y sobre el que se asienta el concepto de interrumpibilidad.

Las baterías.

Probablemente un artículo sobre baterías podría ocupar un espacio similar a todo el utilizado anteriormente en este, por lo que nos ceñiremos a citar algunos aspectos generales. El primero es constatar cómo, a lo largo de los años, las baterías han constituido un elemento, por un lado de fallo y, por otro, de controversia.

Los fallos asociados generalmente a una falta de mantenimiento, a un incorrecto emplazamiento (los cuartos reservados para estos elementos no siempre están dotados de las condiciones necesarias ni sobre ellos se realiza un control estricto de accesos) o a una topología simple en el número de ramas (cuando existe una sola rama, basta con que falle un solo componente de la misma para que falle toda ella). La controversia ha sido permanente, sobre todo hace unos años, y normalmente relacionada con las ofertas de fabricante donde, en ocasiones, se jugaba con las características de las baterías para ofrecer precios competitivos.

Los UPSs, en definitiva, han constituido, y lo siguen haciendo, uno de los puntos clave en la infraestructura que da soporte a un data center. No el único y, quizá ni siquiera, el más importante como más de uno pudiera suponer, pero indudablemente son una pieza inseparable del mecanismo. Que quienes analizan a año a año las causas de caídas le otorguen un alto porcentaje de la responsabilidad no hace sino refrendar esa apreciación.

De la capacidad de los profesionales del sector para resolver todos los aspectos relacionados con su funcionamiento e interrelación con el resto de componentes del sistema, dependerá que esas cifras vayan menguando. Desde luego, por nuestra parte, esfuerzo no faltará.

Garcerán Rojas