Diseño de sistemas eficientes de refrigeración líquida para centros de datos

Sep 02, 2024

Dejar un mensaje

 

I Componentes del sistema de enfriamiento del centro de datos

 

La mayor parte de la energía eléctrica que consumen los equipos informáticos se convierte en calor residual. Para garantizar que los equipos informáticos funcionen dentro de un rango de temperatura adecuado, los centros de datos están equipados con sistemas de refrigeración y disipación de calor, incluidos enfriadores, torres de refrigeración y unidades de aire acondicionado de precisión, que eliminan el calor residual del centro de datos. El proceso de transferencia de calor se ilustra en la Figura 1. Los puntos clave de consumo de energía incluyen enfriadores, torres de refrigeración, bombas y unidades de aire acondicionado de precisión.

 

 Heat Transfer in Data Centers

▲ Figura 1: Transferencia de calor en centros de datos

 

En la actualidad, los principales medios de transferencia de calor en los centros de datos son el aire o el agua. El agua, con una capacidad calorífica específica a presión constante de 1,004 kJ/(KgK) y una capacidad calorífica específica de 4200 kJ/(KgK), tiene una capacidad de transferencia de calor aproximadamente 1,000 veces mayor que el aire. Por lo tanto, el uso de agua como medio de refrigeración es un método eficaz de ahorro de energía en el diseño de sistemas de refrigeración. Para mejorar la eficiencia energética de los sistemas de refrigeración, se utilizan medidas como radiadores de alta eficiencia y suministro de aire preciso para capturar y transferir calor.

 

En el aire acondicionado de precisión, la refrigeración ha evolucionado desde la refrigeración a nivel de sala hasta las salas de datos modulares y la refrigeración a nivel de rack, acercándose a la fuente de calor y reduciendo el consumo de energía en el transporte de refrigerante. La generación de fuentes de refrigeración ha progresado desde la refrigeración por aire hasta la refrigeración por agua y la refrigeración natural, mejorando la eficiencia de la transferencia de calor externa.

 

Cooling with rear door heat exchangers

 

Los sistemas de refrigeración tradicionales cuentan con sistemas de control independientes y estrategias operativas para aire acondicionado de precisión, enfriadores y torres de refrigeración, optimizando la eficiencia a nivel local. Sin embargo, la eficiencia general de refrigeración aún requiere mejoras.

 

Se pueden lograr mejoras sistemáticas mediante la gestión de extremo a extremo y el control preciso de la recolección de calor, la preparación de la fuente de enfriamiento y la transferencia de calor externa, reduciendo así el consumo de energía del sistema de enfriamiento.

 

 

II Diseño de sistemas de refrigeración líquida de extremo a extremo

 

1. Diseño de refrigeración líquida a nivel de placa

Con el crecimiento exponencial de la demanda de potencia informática, la integración y el consumo de energía de las CPU y GPU han aumentado significativamente, y el consumo de energía de un solo chip alcanza los 300 W. Los disipadores de calor de chips tradicionales y las soluciones de refrigeración por aire han encontrado cuellos de botella en la refrigeración. Dado que el chip es la fuente de calor, el principal desafío para el sistema de refrigeración del centro de datos es eliminar eficazmente el calor del interior del chip.

 

Desde la perspectiva de la disipación de calor, el calor generado por el chip debe transferirse primero al disipador térmico de la placa. Las soluciones de disipación de calor más eficientes facilitarán una mejor recolección de calor.

 

En el caso de chips individuales con un consumo de energía inferior a 200 W y equipos informáticos con un consumo de energía inferior a 20 kW por rack, se puede seguir utilizando el aire como medio de transferencia de calor. Los disipadores térmicos de tubo de calor y los disipadores térmicos de cámara de vapor (VC), combinados con materiales TIM de alta conductividad térmica (como láminas de grafito/grafeno), reducen eficazmente la resistencia térmica entre el chip y la base del disipador térmico, lo que mejora la eficiencia del disipador térmico.

 

En el caso de chips individuales con un consumo de energía superior a 200 W y equipos de TI con un consumo de energía superior a 20 kW por rack, el aire ya no es suficiente como medio de transferencia de calor y se debe utilizar refrigerante líquido para enfriar. La tecnología de placa fría refrigerada por líquido es actualmente una solución madura para la refrigeración de chips a nivel de placa. Una placa fría refrigerada por líquido consta de conectores de entrada y salida, una cubierta superior y una placa base, que se conectan mediante soldadura al vacío para formar una cámara de intercambio de calor de líquido sellada. La cámara incluye cámaras de distribución y canales de flujo de varios anchos, que controlan el flujo de fluido y aumentan la turbulencia, mejorando las capacidades de refrigeración local y eliminando los puntos calientes causados ​​por chips de alta potencia. La estructura interna se muestra en la Figura 2.

 

Cross-Section of a Liquid-Cooled Cold Plate

▲ Figura 2: Sección transversal de una placa fría refrigerada por líquido

 

Los distintos tipos de placas dentro del mismo rack tienen distintos niveles de potencia y puntos calientes, pero la presión de suministro en el conector de entrada de la línea de suministro de líquido es generalmente la misma, lo que requiere que la cámara de distribución de la placa fría controle la regulación. En el caso de las placas con un menor consumo de energía del chip, la regulación reduce el flujo de refrigerante. En la práctica, las placas frías refrigeradas por líquido cubren la CPU, la memoria y otros componentes de alta potencia, pero los componentes como resistencias y condensadores, que no están cubiertos, generan calor residual que requiere refrigeración por ventilador. Esto da como resultado una combinación de refrigeración por líquido y aire dentro del sistema, lo que deja espacio para mejorar la eficiencia de refrigeración.

 

Al utilizar materiales TIM para cubrir todos los componentes durante el diseño de la placa fría, se puede lograr técnicamente un enfriamiento 100% líquido, pero esto aumenta el costo y la complejidad de la placa fría. Al buscar un enfriamiento eficiente, también se debe considerar la inversión inicial. Si los tipos de placas de nodos son uniformes, se puede considerar una placa completamente cubierta, con costos iniciales compensados ​​por el escalamiento de la producción, logrando un equilibrio entre ahorro de energía e inversión.

 

cold plate

 

El agua desionizada se utiliza normalmente como refrigerante en la refrigeración líquida debido a su alta capacidad calorífica específica, que permite una rápida absorción del calor y, al mismo tiempo, no es corrosiva, por lo que no afecta a la fiabilidad de las tuberías. La refrigeración líquida por placa fría es indirecta, ya que el chip no entra en contacto directo con el refrigerante líquido, lo que da como resultado una alta fiabilidad y una tecnología madura.

 

Sin embargo, existe una resistencia térmica entre el chip y el refrigerante líquido, lo que lleva a algunos fabricantes a promover soluciones de refrigeración por inmersión. En la refrigeración por inmersión, el equipo informático se sumerge en un líquido circulante y el chip entra en contacto directo con el refrigerante, lo que reduce la resistencia térmica y aprovecha el cambio de fase para eliminar más calor, lo que lo convierte en un nuevo punto de interés en la refrigeración líquida. Los líquidos fluorados se utilizan habitualmente como refrigerantes en la refrigeración por inmersión, pero su alto coste es una barrera para su uso comercial a gran escala.

 

2. Refrigeración líquida a nivel de rack

En los centros de datos, los equipos informáticos se organizan en bastidores, que albergan equipos de información del centro de datos, como servidores, dispositivos de almacenamiento y conmutadores de red. Mientras que la refrigeración a nivel de placa elimina el calor de los dispositivos informáticos individuales, la refrigeración a nivel de bastidor recoge y transfiere el calor al exterior. Los componentes clave de la refrigeración líquida a nivel de bastidor incluyen colectores de entrada y salida, unidades de monitorización, sensores de temperatura, válvulas solenoides y válvulas de retención, como se muestra en la Figura 3.

 

Rack-Level Liquid Cooling Configuration

▲ Figura 3: Configuración de refrigeración líquida a nivel de rack

 

El colector se conecta externamente a la unidad de distribución de enfriamiento líquido a nivel de la sala y internamente a través de conectores rápidos a los conectores de entrada y salida de la placa fría enfriada por líquido, lo que facilita la transferencia de calor del sistema al exterior del rack.

Las funciones principales de la válvula solenoide y la válvula de retención son controlar el flujo de líquido y limitar el alcance de la falla a una sola válvula en caso de una fuga.

 

La función principal del sensor de temperatura es monitorear continuamente las temperaturas de entrada y salida del agua. Al utilizar la diferencia de temperatura entre el agua de entrada y la de salida, controla la apertura de la válvula solenoide, controlando así el flujo de agua y asegurando que el calor y el flujo coincidan.

El sistema de refrigeración líquida utiliza agua desionizada como fluido de trabajo, lo que teóricamente no provocará cortocircuitos.

 

Sin embargo, las placas de circuitos o los componentes electrónicos suelen tener partículas de polvo y, cuando el agua desionizada entra en contacto con la placa de circuitos, puede provocar un cortocircuito. Este es uno de los principales obstáculos y preocupaciones en la implementación de la refrigeración líquida. Para abordar el problema de las fugas en la placa fría, se emplean medidas como el control de calidad, la supervisión de microfugas y la prevención de grandes fugas repentinas.

 

El control de calidad se divide en etapas de aplicación de producción e instalación. En la etapa de producción, se garantiza la confiabilidad del proceso, el 100% de las placas frías se someten a pruebas de presión y se utilizan ultrasonidos para el muestreo aleatorio y la detección de defectos. Los accesorios de conexión rápida deben validarse para una inserción efectiva y confiabilidad a largo plazo. En la etapa de aplicación de instalación, la tubería secundaria debe limpiarse antes de la instalación para evitar que las impurezas provoquen bloqueos en los accesorios de conexión rápida, atascos de resorte o fallas del anillo de goma, evitando así fugas durante el funcionamiento. Las medidas anteriores tienen como objetivo prevenir fugas tanto como sea posible.

 

Rack-Level

 

Si una placa fría desarrolla una microfuga, debe ser detectable y activar una alarma para avisar al personal de mantenimiento para que la repare rápidamente. Existen dos métodos de detección: uno es mediante un sensor de inmersión en agua, que se instala en la bandeja de goteo. La función principal de la bandeja de goteo es facilitar la detección de fugas y evitar que el líquido se escape fuera del rack, reduciendo la propagación de fallas.

 

Si bien la detección del sensor de inmersión en agua es madura y confiable, requiere que el líquido filtrado se acumule en la bandeja de goteo después de fluir a lo largo de la placa de hardware y los accesorios del bastidor, momento en el cual la cantidad total de líquido filtrado puede ser considerable y puede que ya haya dañado la placa y los componentes durante el flujo.

 

El otro método es el monitoreo en tiempo real. Se mezcla una sustancia trazadora con un punto de ebullición bajo en el fluido de trabajo y, en caso de una fuga, un sensor de gas integrado en la placa la detecta. Las fugas repentinas a gran escala son poco frecuentes, pero tienen un gran impacto. Para evitar este tipo de incidentes, se instalan válvulas de retención en la entrada y la salida del colector en el bastidor. Estas válvulas de retención se cierran automáticamente cuando se detecta una diferencia de presión significativa.

 

3. Diseño de refrigeración líquida a nivel de sala

La refrigeración a nivel de sala está diseñada para transferir el calor extraído de los racks al exterior. La solución de refrigeración líquida a nivel de sala incluye una sala de datos modular refrigerada por líquido, enfriadores, bombas de agua, torres de refrigeración, tuberías y más, como se muestra en la Figura 4.

 

Room-Level Liquid Cooling Configuration

▲ Figura 4: Configuración de refrigeración líquida a nivel de sala

 

Normalmente, una sala de datos modular refrigerada por líquido contiene dos unidades de distribución de refrigeración líquida (CDU) de respaldo, 10-20 racks de TI, 1-2 acondicionadores de aire a nivel de fila y equipos de suministro de energía, como se muestra en la Figura 4.

 

La unidad de distribución de refrigeración líquida (CDU) es responsable de distribuir el fluido de trabajo entre los racks de TI refrigerados por líquido, proporcionando distribución de flujo del lado secundario, control de presión, aislamiento físico y funciones anticondensación. Durante el funcionamiento real, la CDU suministra un determinado caudal y temperatura de agua de refrigeración a los racks de TI refrigerados por líquido, que ingresa a las placas frías refrigeradas por líquido a través del colector, elimina el calor generado por los procesadores y los componentes clave y devuelve el agua de refrigeración calentada a la unidad de intercambio de calor intermedia de la CDU. Luego, el calor se libera en la tubería de agua de retorno exterior y esta parte del calor se descarga al entorno exterior a través de enfriadores o enfriadores secos, completando el proceso de gestión del calor para los servidores refrigerados por líquido.

 

La CDU regula la temperatura y el flujo del refrigerante que ingresa a las placas frías refrigeradas por líquido, lo que proporciona refrigeración a los bastidores de TI y distribuye la energía de refrigeración. La unidad de intercambio de calor interna también cumple una función en el aislamiento del circuito de suministro de líquido entre la sala de datos modular y el entorno exterior. Debido a su función crítica, la CDU generalmente emplea una configuración de redundancia 1+1. La CDU controla el flujo del refrigerante líquido detectando las temperaturas del agua de entrada y salida y la presión de suministro y ajustando la velocidad de la bomba de agua de suministro.

 

Room-Level Liquid Cooling

 

Actualmente, la mayoría de los sistemas de control de CDU no se vinculan con los sensores de temperatura dentro de los racks, lo que da como resultado un control relativamente burdo. Para abordar este problema, algunas aplicaciones han reemplazado las CDU centralizadas por CDU distribuidas, que están integradas en los racks. De esta manera, los ajustes de flujo de CDU se basan completamente en el estado operativo y las fluctuaciones de consumo de energía del rack. Las CDU centralizadas son adecuadas para escenarios con una gran cantidad de racks refrigerados por líquido que se pueden consolidar en una sala de datos modular, mientras que las CDU distribuidas son más adecuadas para situaciones con solo 2-3 racks refrigerados por líquido, lo que facilita la implementación.

 

 

III Conclusión

 

Bajo la guía de los objetivos de doble carbono, los centros de datos tienen una doble misión: por un lado, a través de operaciones intensivas y a gran escala, proporcionan suficiente potencia informática para la economía digital. La aplicación generalizada de bastidores de alta densidad y chips de alta potencia, impulsada por la eficiencia de la potencia informática de los centros de datos, ha provocado que la refrigeración por aire tradicional se encuentre con cuellos de botella. Por otro lado, al utilizar intercambiadores de calor de alta eficiencia, refrigeración líquida y refrigeración natural mediante enfriadores secos, los centros de datos pueden reducir su propio consumo de energía.

 

Después de adoptar la refrigeración líquida, la eficiencia de refrigeración mejora significativamente, con un consumo de energía de los sistemas de refrigeración reducido del 37% a aproximadamente el 10%, lo que resulta en un importante ahorro de energía y reducción de carbono. Si el 50% de los nuevos centros de datos construidos en todo el país adoptan la refrigeración líquida, se pueden ahorrar 45 mil millones de kWh de electricidad al año y 3 millones de toneladas de CO2.Las emisiones se pueden reducir.

 

 

Envíeconsulta