Arnes z najzmogljivejšim superačunalnikom v Sloveniji
Skupna zmogljivost nove Arnesove gruče bo predvidoma presegala 520 TFLOPS.
Arnesovi strokovnjaki so nedavno razširili Arnesovo superračunalniško gručo. Ko bodo novi strežniki začeli delovati, bo Arnesov sistem, ki je uporabnikom na voljo že od leta 2009, postal najzmogljivejši superračunalnik v Sloveniji.
Prenovljena Arnesova gruča bo dobila kar 4.256 novih procesorskih jeder, ki imajo teoretično zmogljivost skoraj 170 TFLOPS, in 48 novih grafičnih procesorjev NVidia V100s z zmogljivostjo več kot 350 TFLOPS. Skupno torej 520 TFLOPS ali več kot 0,5 PFLOPS.
Poleg računskih zmogljivosti se bodo povečale tudi diskovne. Štiri velike diskovne strežnike, ki so s pomočjo razpršenega omrežnega podatkovnega sistema CEPH zagotavljali diskovni prostor superračunalniški gruči, bo nadomestilo kar deset novih. Vsak bo prispeval 150 TB prostora na trdih diskih in 16 TB na hitrih diskih SSD, omogočali pa bodo vzporedno pisanje in branje na več diskov in več strežnikov, kar bo še povečalo varnost podatkov in pospešilo delovanje. Prenovljeni sistem bo tako zagotavljal hiter vzporeden dostop do več kot 1 PB uporabnega prostora na trdih diskih in več kot 100 TB prostora na hitrih diskih SSD.
Tehnične specifikacije novih računskih strežnikov Arnesove gruče
- 62 strežnikov s procesorjem AMD Epyc 7702P 64 C/128 T, 256 GB RAM;
- 24 strežnikov s procesorjem AMD Epyc 7272 12 C/24 T, 128 GB RAM in 2x NVidia V100s;
- 10 strežnikov za diskovni sistem CEPH s 150 TB HDD in 16 TB SSD;
- skupaj 4256 jeder, 17,9 TB RAM, 3 PB bruto HDD, 320 TB SSD;
- zunanja povezava: 100 Gbit/s.
Globalno tekmovanje v gradnji superračunalnikov
V zadnjih letih je globalno tekmovanje v gradnji vse večjih superračunalniških sistemov za znanost in raziskave vedno bolj napeto, v njem pa vse bolj odločno sodeluje tudi Evropska unija.
Superračunalniki so pomembni, ker omogočajo reševanje problemov, ki so za navadne računalnike pogosto prezahtevni. Ko govorimo o zmogljivosti računalnikov za potrebe znanosti, merimo zmogljivost računalnikov v številu računskih operacij, ki jih lahko računalnik izvede na sekundo, kar navadno merimo z enoto FLOPS, številom operacij med vrednostmi s plavajočo vejico na sekundo (Floating point Operations Per Second). Primer takšne operacije je seštevanje dveh racionalnih števil.
Računske operacije se na različnih računalnikih izvajajo različno hitro. Vzemimo za primer algoritme globokega učenja, ki so danes najpogostejši pristop na področju umetne inteligence. Pri tem največkrat uporabljamo knjižnico TensorFlow, izračuni pa tečejo na specializiranih sodobnih grafičnih karticah, ki so za takšne računske operacije precej hitrejše od centralnih procesnih enot. Da bi raziskovalci lahko kar najhitreje izvajali takšne operacije, gruča po novem vključuje tudi vrsto pomožnih grafičnih procesorjev. Drugi znanstveni problemi imajo seveda drugačne zahteve: velikost pomnilnika v posameznem vozlišču, pasovno širino do pomnilnika ali čim manjši zamik pri komunikaciji med računskimi vozlišči: za vsako vrsto problema je lahko kritična druga značilnost ustroja superračunalnika. Zato noben superračunalnik ni enako ustrezen za vse uporabnike in vse vrste problemov. Na Arnesu skušamo pomagati čim večjemu številu uporabnikov, kar se kaže tudi v arhitekturi računalnika.
Kdo bo uporabljal Arnesov superračunalnik?
Arnesov superračunalnik podpira uporabo za izobraževanje, med raziskovalci pa največ na področjih umetne inteligence in tehnologije znanja, teoretske fizike in fizike delcev, v genomiki, računski kemiji in pri obdelavah velepodatkov. V prenovljeni obliki bo primeren tudi za analizo posnetkov kriomikroskopije in druge intenzivne obdelave podatkov. Zelo velike naloge in močno paralelni algoritmi, kakršni so običajni v fiziki trdnih snovi ter dinamiki tekočin, so primernejši za sisteme, kakršna sta HPC Maister in HPC Vega.
Dostop do superračunalnikov je za raziskovalce pogosto ključnega pomena: rezultate dobijo hitreje, preizkusijo lahko več pristopov, predvsem pa lahko obdelajo bistveno več podatkov in se lotijo mnogo zahtevnejših problemov.
Montaža strežnikov najzmogljivejšega superačunalnika v Sloveniji
Povezovanje in sodelovanje za uspehe slovenskih raziskovalcev
Poleg Arnesove gruče so v Sloveniji številni drugi superračunalniki in več skupin naprednih uporabnikov. Od leta 2009 ustanove in uporabniki tesno sodelujejo: organizirali so se kot konzorcij SLING – Slovensko nacionalno superračunalniško omrežje, ki ga vodimo na Arnesu.
SLING raziskovalcem omogoča preprost, standardiziran dostop do infrastrukture za porazdeljeno računanje in obdelavo podatkov, tako da lahko uporabljajo procesorske enote, omrežne povezave in diskovne kapacitete številnih računalniških gruč v različnih računskih centrih v Sloveniji in celotnem omrežju Evropske iniciative za računski grid EGI. Večina največjih slovenskih gruč je vključenih v SLING, tako da je mogoče naloge hkrati pošiljati na več gruč.
SLING sodeluje še z mnogimi tujimi in mednarodnimi iniciativami, kot so italijanska Società Big Data in avstrijski Vienna Scientific Cluster (s katerim spomladi v Mariboru soorganiziramo bilateralno avstrijsko-slovensko konferenco o superračunalništvu ASHPC21), Partnerstvo za napredno računalništvo v Evropi PRACE ter evropsko superračunalniško pobudo EuroHPC, kjer smo tudi član konzorcija Leonardo, ki v Italiji gradi enega največjih sistemov EuroHPC. SLING seveda podpira tudi največjo slovensko iniciativo na področju superračunalništva, projekt HPC RIVR.
Kaj lahko še pričakujemo?
Doslej je bila najzmogljivejša slovenska gruča na Univerzi v Mariboru: prototipni superračunalnik Maister je nastal v okviru projekta HPC RIVR, ki ga financirata Evropska unija iz Evropskega sklada za regionalni razvoj ter Ministrstvo za izobraževanje, znanost in šport, uporabnikom pa s teoretično maksimalno zmogljivostjo 244 teraflopov služi že od novembra 2019.
Toda že letos marca bo v prostorih Inštituta informacijskih znanosti IZUM v Mariboru začel delovati še zmogljivejši superračunalnik Vega, ki bo imel teoretično zmogljivost več kot 10 PFLOPS, njegova dejanska zmogljivost pa bo 6,8 PFLOPS, torej bo kar 13-krat zmogljivejši od Arnesove prenovljene superračunalniške gruče. Sistem Vega je prav tako del HPC RIVR, vendar je na razpisu EuroHPC pridobil dodatno financiranje, tako da bo ob zagonu prvi evropski superračunalnik v okviru pobude EuroHPC. Sodelovanje Arnesa in SLING v konzorciju Leonardo bo slovenskim uporabnikom približalo še enega od največjih evropskih superračunalniških sistemov, ki domuje v Italiji. Vse to bo odlična popotnica, s katero bodo slovenski raziskovalci še toliko laže sodelovali pri uporabi novih, vse večjih evropskih kapacitet.
Slovenski kompetenčni center za superračunalništvo
Na Arnesu smo z desetimi partnerji v konzorciju SLING vzpostavili tudi slovenski kompetenčni center za superračunalništvo, ki ga v okviru projekta evropskih nacionalnih kompetenčnih centrov EUROCC financira pobuda EuroHPC. Kompetenčni center spodbuja izobraževanje, usposabljanje in povezovanje na področju superračunalništva, za potrebe raziskav v znanosti in industriji, na akademskem področju ter pri zagotavljanju javnih storitev, predvsem prek dviga nivoja znanja uporabnikov in splošnega zavedanja, kakšne so prednosti uporabe tovrstne tehnologije. Tako pričakujemo številne nove uporabnike, ki jim bo prenovljena Arnesova gruča prišla še kako prav.
Arnesova večletna pobuda za razvoj sodelovanja na področju superračunalništva bo s prenovljenim Arnesovim superračunalnikom, novimi projekti, poglobljenim sodelovanjem z znanstveno-raziskovalno skupnostjo ter uspešnim skupnim nastopom v projektu Vega tako dosegla izredno mednarodno potrditev in odprla slovenskim raziskovalcem številne nove poti.
Za dodatne informacije o slovenskem superračunalniškem omrežju smo vam na voljo na info@sling.si.