Design af effektive flydende kølesystemer til datacentre

Sep 02, 2024

Læg en besked

 

I Komponenter i datacenterets kølesystem

 

Størstedelen af ​​den elektriske energi, der forbruges af IT-udstyr, omdannes til spildvarme. For at sikre, at it-udstyret fungerer inden for et passende temperaturområde, er datacentre udstyret med køle- og varmeafledningssystemer, herunder kølere, køletårne ​​og præcisionsklimaanlæg, som fjerner spildvarme fra datacentret. Varmeoverførselsprocessen er illustreret i figur 1. Vigtige energiforbrugspunkter omfatter kølere, køletårne, pumper og præcisionsklimaanlæg.

 

 Heat Transfer in Data Centers

▲ Figur 1: Varmeoverførsel i datacentre

 

I øjeblikket er de primære varmeoverførselsmedier i datacentre luft eller vand. Vand med en konstant tryk specifik varmekapacitet på 1,004 kJ/(KgK) og en specifik varmekapacitet på 4200 kJ/(KgK), har en varmeoverførselskapacitet cirka 1,000 gange større end luft. Derfor er brug af vand som kølemedium en effektiv energibesparende metode i design af kølesystemer. For at forbedre energieffektiviteten af ​​kølesystemer bruges foranstaltninger som højeffektive radiatorer og præcis lufttilførsel til at opfange og overføre varme.

 

Inden for præcisionsklimaanlæg har køling udviklet sig fra rumniveau til modulære datarum og køling på rackniveau, flyttet tættere på varmekilden og reduceret energiforbruget i kølevæsketransport. Genereringen af ​​kølekilder har udviklet sig fra luftkøling til vandkøling og naturlig køling, hvilket forbedrer den eksterne varmeoverførselseffektivitet.

 

Cooling with rear door heat exchangers

 

Traditionelle kølesystemer har uafhængige kontrolsystemer og driftsstrategier for præcisionsklimaanlæg, kølere og køletårne, der optimerer effektiviteten lokalt. Den samlede køleeffektivitet kræver dog stadig forbedring.

 

Systematiske forbedringer kan opnås ved end-to-end-styring og præcis styring af varmeopsamling, kølekildeforberedelse og ekstern varmeoverførsel, og derved reducere kølesystemets strømforbrug.

 

 

II End-to-End flydende kølesystem design

 

1. Design med flydende køling på bordniveau

Med den eksponentielle vækst i efterspørgslen efter computerkraft er integrationen og strømforbruget af CPU'er og GPU'er steget markant, med enkelt-chip strømforbrug nået op på 300W. Traditionelle chip-køleplader og luftkølingsløsninger er stødt på flaskehalse i køling. Da chippen er varmekilden, er den primære udfordring for datacenterets kølesystem effektivt at fjerne varme fra chippen.

 

Fra et varmeafledningsperspektiv skal den varme, der genereres af chippen, først overføres til kølepladen på printniveau. Mere effektive heatsink-løsninger vil lette en bedre varmeopsamling.

 

For enkeltchips med strømforbrug under 200W og IT-udstyr med strømforbrug under 20kW pr. rack, kan luft fortsat bruges som varmeoverførselsmedie. Heat pipe heatsinks og vapor chamber (VC) heatsinks, kombineret med høj termisk ledningsevne TIM materialer (såsom grafitplader/grafen), reducerer effektivt den termiske modstand mellem chippen og heatsink base, hvilket forbedrer heatsinkens effektivitet.

 

For enkeltchips med strømforbrug over 200W og IT-udstyr med strømforbrug over 20kW pr. stativ er luft ikke længere tilstrækkeligt som varmeoverførselsmedie, og flydende kølevæske skal bruges til køling. Væskekølet koldpladeteknologi er i øjeblikket en moden løsning til spånkøling på pladeniveau. En væskekølet kold plade består af indløbs- og udløbsforbindelser, et øvre dæksel og en bundplade, som er forbundet ved vakuumlodning for at danne et forseglet væskevarmevekslerkammer. Kammeret omfatter distributionskamre og forskellige breddestrømningskanaler, som styrer væskeflowet og øger turbulensen, hvilket forbedrer lokale kølemuligheder og eliminerer hot spots forårsaget af højeffektschips. Den indre struktur er vist i figur 2.

 

Cross-Section of a Liquid-Cooled Cold Plate

▲ Figur 2: Tværsnit af en væskekølet kold plade

 

Forskellige typer plader i samme rack har varierende effektniveauer og hot spots, men forsyningstrykket ved indløbsstikket til væskeforsyningsledningen er generelt det samme, hvilket kræver, at koldpladens fordelingskammer kan kontrollere droslingen. For plader med lavere chip-strømforbrug reducerer drosling kølevæskestrømmen. I praksis dækker væskekølede kolde plader CPU'en, hukommelsen og andre højeffektkomponenter, men komponenter som modstande og kondensatorer, som ikke er dækket, genererer restvarme, der kræver blæserkøling. Dette resulterer i en kombination af væske- og luftkøling i systemet, hvilket giver plads til forbedring af køleeffektiviteten.

 

Ved at bruge TIM-materialer til at dække alle komponenter under koldpladedesign, kan der teknisk opnås 100 % væskekøling, men det øger omkostningerne og kompleksiteten af ​​koldpladen. Mens man stræber efter effektiv køling, skal den oprindelige omkostningsinvestering også overvejes. Hvis nodekorttyperne er ensartede, kan en fuldt dækket tavle overvejes, hvor startomkostningerne udlignes ved at skalere produktionen, så der opnås en balance mellem energibesparelser og investeringer.

 

cold plate

 

Deioniseret vand bruges typisk som kølemiddel i væskekøling på grund af dets høje specifikke varmekapacitet, hvilket muliggør hurtig varmeabsorption, samtidig med at det er ikke-ætsende, og dermed ikke påvirker rørledningens pålidelighed. Væskekøling af kold plade er indirekte, idet chippen ikke kommer i direkte kontakt med det flydende kølevæske, hvilket resulterer i høj pålidelighed og moden teknologi.

 

Imidlertid eksisterer der termisk modstand mellem chippen og det flydende kølevæske, hvilket får nogle producenter til at fremme nedsænkningskøleløsninger. I nedsænkningskøling er it-udstyr nedsænket i cirkulerende væske, hvor chippen kommer i direkte kontakt med kølevæsken, hvilket reducerer den termiske modstand, mens faseændringen udnyttes til at fjerne mere varme, hvilket gør det til et nyt hotspot inden for væskekøling. Fluorholdige væsker bruges almindeligvis som kølemidler til nedsænkningskøling, men deres høje omkostninger er en barriere for kommerciel brug i stor skala.

 

2. Væskekøling på stativniveau

I datacentre er it-udstyr arrangeret af racks, som rummer datacenterinformationsudstyr såsom servere, lagerenheder og netværksswitches. Mens køling på bordniveau fjerner varme fra individuelle it-enheder, opsamler og overfører køling på rackniveau varmen udendørs. Nøglekomponenter i væskekøling på stativniveau omfatter indløbs- og udløbsmanifolder, overvågningsenheder, temperatursensorer, magnetventiler og kontraventiler, som vist i figur 3.

 

Rack-Level Liquid Cooling Configuration

▲ Figur 3: Konfiguration af væskekøling på stativniveau

 

Manifolden forbindes eksternt til væskekølingsfordelingsenheden på værelsesniveau og internt via lynkoblinger til den væskekølede koldplades ind- og udløbsstik, hvilket letter overførslen af ​​systemvarme til ydersiden af ​​stativet.

Magnetventilens og kontraventilens hovedfunktioner er at kontrollere væskestrømmen og begrænse omfanget af svigt til et enkelt stativ i tilfælde af lækage.

 

Temperaturfølerens primære rolle er løbende at overvåge indløbs- og udløbsvandets temperaturer. Ved at udnytte temperaturforskellen mellem indløbs- og udløbsvandet styrer den åbningen af ​​magnetventilen og styrer derved vandgennemstrømningen og sikrer, at varme og flow er afstemt.

Væskekølesystemet bruger deioniseret vand som arbejdsvæske, hvilket teoretisk set ikke vil forårsage kortslutninger.

 

Printplader eller elektroniske komponenter har dog ofte støvpartikler, og når deioniseret vand kommer i kontakt med printpladen, kan det forårsage kortslutning. Dette er en af ​​de største forhindringer og bekymringer i implementeringen af ​​væskekøling. For at løse problemet med koldpladelækage anvendes foranstaltninger som kvalitetskontrol, mikrolækageovervågning og forebyggelse af pludselige store lækager.

 

Kvalitetskontrol er opdelt i produktions- og installationsapplikationsfaser. I produktionsstadiet er procespålideligheden sikret, 100% af kolde plader gennemgår tryktestning, og ultralyd bruges til stikprøveudtagning og defektdetektering. Quick-connect fittings skal valideres for effektiv indsættelse og langsigtet pålidelighed. I installationsapplikationsstadiet skal det sekundære rør skylles rene før installationen for at forhindre, at urenheder forårsager blokeringer i hurtigkoblingsbeslag, fjederstop eller fejl i gummiringe, og derved forhindre lækager under drift. Ovenstående foranstaltninger har til formål at forhindre lækager så meget som muligt.

 

Rack-Level

 

Hvis en kold plade udvikler en mikrolækage, skal den kunne detekteres og udløse en alarm for at få vedligeholdelsespersonalet til at reparere den omgående. Der er to detekteringsmetoder: Den ene er ved hjælp af en vandnedsænkningssensor, som er installeret på drypbakken. Drypbakkens hovedfunktion er at lette lækagedetektion og forhindre væske i at lække uden for stativet, hvilket reducerer spredningen af ​​fejl.

 

Mens detektering af vandnedsænkningssensor er moden og pålidelig, kræver det, at den lækkende væske samler sig i drypbakken efter at have strømmet langs hardwarepladen og rackfittings, på hvilket tidspunkt den samlede mængde lækket væske kan være betydelig og allerede kan have beskadiget brættet og komponenter under flowet.

 

Den anden metode er overvågning i realtid. Et sporstof med lavt kogepunkt blandes i arbejdsvæsken, og i tilfælde af en lækage registrerer en gassensor indbygget i pladen det. Storstilede pludselige lækager er sjældne, men meget virkningsfulde. For at forhindre sådanne hændelser er kontraventiler installeret ved indgangen og udgangen af ​​manifolden på stativet. Disse kontraventiler lukker automatisk, når der registreres en betydelig trykforskel.

 

3. Væskekølingsdesign på værelsesniveau

Køling på værelsesniveau er designet til at overføre den varme, der udvindes fra stativerne, til det fri. Væskekøleløsningen på værelsesniveau inkluderer et væskekølet modulært datarum, kølere, vandpumper, køletårne, rør og mere, som vist i figur 4.

 

Room-Level Liquid Cooling Configuration

▲ Figur 4: Konfiguration af væskekøling på værelsesniveau

 

Typisk indeholder et væskekølet modulært datarum to backup-væskekølingsdistributionsenheder (CDU'er), 10-20 IT-stativer, 1-2 klimaanlæg på rækkeniveau og strømforsyningsudstyr, som vist i figur 4.

 

Væskekølingsdistributionsenheden (CDU) er ansvarlig for at fordele arbejdsvæsken blandt IT-væskekølede stativer, hvilket giver flowfordeling på sekundærsiden, trykkontrol, fysisk isolation og anti-kondenseringsfunktioner. Under den faktiske drift leverer CDU'en en vis flow og temperatur af kølevand til IT-væskekølede stativer, som kommer ind i de væskekølede kolde plader via manifolden, fjerner varmen genereret af processorer og nøglekomponenter og returnerer den opvarmede køling. vand til den mellemliggende varmevekslerenhed i CDU. Varmen frigives derefter til den udendørs returvandsledning, og denne del af varmen udledes til det udendørs miljø via kølere eller tørkølere, hvilket afslutter varmestyringsprocessen for de væskekølede servere.

 

CDU'en regulerer temperaturen og flowet af kølevæsken, der kommer ind i de væskekølede kolde plader, og sørger derved for køling til IT-reolerne og fordeler kølekraft. Den interne varmevekslerenhed spiller også en rolle ved at isolere væskeforsyningskredsløbet mellem det modulære datarum og det udendørs miljø. På grund af sin kritiske rolle anvender CDU normalt en 1+1 redundanskonfiguration. CDU'en styrer flowet af den flydende kølevæske ved at detektere indløbs- og udgangsvandstemperaturerne og forsyningstrykket og justere hastigheden af ​​forsyningsvandspumpen.

 

Room-Level Liquid Cooling

 

I øjeblikket er de fleste CDU-kontrolsystemer ikke forbundet med temperatursensorerne i stativerne, hvilket resulterer i en relativt grov kontrol. For at løse dette problem har nogle applikationer erstattet centraliserede CDU'er med distribuerede CDU'er, som er integreret i stativerne. På denne måde er CDU-flowjusteringer udelukkende baseret på rackets driftsstatus og strømforbrugsudsving. Centraliserede CDU'er er velegnede til scenarier med et stort antal væskekølede racks, der kan konsolideres til et modulært datarum, mens distribuerede CDU'er er bedre egnede til situationer med kun 2-3 væskekølede racks, hvilket gør implementeringen nemmere.

 

 

III Konklusion

 

Under vejledning af dual-carbon-mål bærer datacentre en dobbelt mission: På den ene side giver de gennem intensive og skalerede operationer tilstrækkelig computerkraft til den digitale økonomi. Den udbredte anvendelse af højdensitetsreoler og højeffektchips, drevet af effektiviteten af ​​datacenterets computerkraft, har fået traditionel luftkøling til at støde på flaskehalse. På den anden side kan datacentre reducere deres eget energiforbrug ved at bruge højeffektive varmevekslere, væskekøling og naturlig køling fra tørkølere.

 

Efter indførelse af flydende køling er køleeffektiviteten væsentligt forbedret, med energiforbruget i kølesystemer reduceret fra 37 % til omkring 10 %, hvilket resulterer i betydelige energibesparelser og kulstofreduktion. Hvis 50 % af nybyggede datacentre på landsplan anvender væskekøling, kan der årligt spares 45 milliarder kWh elektricitet og 3 millioner tons COemissioner kan reduceres.

 

 

Send forespørgsel