Política de Cookies
Utilizamos cookies propias y de terceros para mejorar tu accesibilidad, personalizar y analizar tu navegación. Al continuar navegando consideramos que aceptas su instalación. Puedes cambiar la configuración u obtener más información en nuestra
(+ info)

Aceptar

PQC

A vueltas con el “cooling”

POSTED BY Garcerán Rojas 29 de julio de 2022

Con la reciente caída de Google, motivada por asuntos de clima, esta materia se ha vuelto a poner en el candelero.

No es que su relación con el asunto de las caídas tenga un vínculo extremadamente estrecho, como le sucede a la parte eléctrica, pero tampoco vamos a negar que no exista un histórico apreciable.

Aprovechando la jugada, me gustaría hacer algunas observaciones relacionadas, con el comportamiento del conjunto del sistema cuando se dan situaciones de pérdida en la alimentación y con las variaciones que se han producido en torno a los criterios del “continuous cooling”.

Ante un evento de estas características se presentan dos escenarios. Primero el de la pérdida y, posteriormente, y si las cosas van como deber de ir, el de la recuperación.

La pérdida, salvo en topologías dotadas de “continuous cooling”, no tiene mucho misterio. Se cae la alimentación y se para el servicio, y el tiempo de vuelta de éste queda determinado por el de entrada del sistema de respaldo, en cuanto a la alimentación se refiere (normalmente a cargo de los grupos electrógenos), más el tiempo de rearme y adquisición del régimen de trabajo por parte de la máquina o máquinas en cuestión.

Este proceso, que no entrañaba problemas importantes hace unos años, se ha ido complicando en la medida que se ha ido produciendo una elevación de las densidades de potencia ya que las inercias térmicas en las salas IT son cada vez más cortas y el riesgo de desviación de las condiciones del aire de entrada a los servidores respecto de los niveles considerados como recomendables, es cada vez mayor en periodos muy cortos de tiempo.

ASHRAE TC 9.9 en su Guía 2021 sigue manteniendo el límite superior de temperatura recomendada en 270C (temperatura extensible a 320C como permitida) y el límite de variación de temperatura en 200C/h (50C/min) en entornos donde no existan almacenamiento de cintas, en cuyo caso los límites se estrechan apreciablemente.

Hay que precisar aquí que no se trata de evitar que el gradiente de temperatura instantáneo sea más o menos escarpado, sino de no rebasar la franja establecida como límite en el plazo de tiempo marcado.

Con estos datos en la mano, la evolución de los primeros instantes tras la caída, son difícilmente manejables. La temperatura evolucionará como le venga en gana y de nuestra parte, esperar que no se excedan los límites de desconexión de los equipos, no sin antes prestar mucha atención a los incrementos en la demanda eléctrica que supone el funcionamiento de la parte IT con temperaturas elevadas. No vaya a resultar que estemos en una situación de plena carga en UPSs y con el sobreconsumo añadido entremos en una situación “incómoda”.

La única manera de evitar la anterior afirmación de “difícilmente manejable” es proceder a un continuous cooling que, a día de hoy, Uptime Institute exige para entornos Tier IV y, de forma más general, recomienda para centros donde se supere la potencia de 4 kW por rack. Sólo en este escenario podremos influir en la variación al alza de temperatura, a lo que conviene puntualizar el hecho de que los criterios para la certificación han cambiado desde hace unos pocos años. El requerimiento original de igualar, para la parte de clima continuo, los tiempos de los UPS-IT, pasó a mejor vida, siendo la exigencia actual el hecho de no rebasar los límites marcados en la guía ASHRAE.

Vayamos ahora a analizar la fase de recuperación de las condiciones originales tras un periodo de pérdida. Todo comienza en plan optimista, con el suspiro de alivio inherente al hecho de haber recuperado la alimentación y disponer de toda la potencia frigorífica en nuestras manos. Y ahí es donde puede encontrarse la trampa. En sistemas ampliamente redundados, la potencia instalada puede ser muy elevada y la tentación de poner el sistema “a todo gas”, con el propósito de recuperar las temperaturas de referencia lo antes posible, una situación ciertamente recurrente que debe ser evitada.

Si los márgenes de variación al alza son manejables solamente en topologías de clima continuo, los de variación a la baja pueden activarse en cualquier instalación.

Quienes dominan de verdad esta realidad sabrán disculparme dos cosas. La primera, que siendo como soy un “eléctrico de toda la vida”, ose meterme en este jardín y, la segunda, que incurra en la descripción de algunas obviedades, pero como bien decía mi apreciado Pitt Turner: ”lo que para algunos puede ser una obviedad, para muchos otros resulta una revelación"

Garcerán Rojas