Szuperszámítógépek a modern világban. Feliratkozás a hírekre

Az elmúlt években a számítógépes tervező és gyártó cégek fáradhatatlanul dolgoznak. Ennek eredményeként a technológia mennyisége a világon exponenciálisan növekszik.

A legerősebb számítógépek

Nemrég nem tudott a világ a DirectX10-ről, és a FarCry vagy az NFS Underground 2 grafikája a számítógépes képességek csúcsának tűnt. Valamikor a technika csodájának tűnt egy 600 megabájtnyi információ tárolására alkalmas lemez, de ma már szabadon kaphatóak a terabájtos memóriakártyák.

A szuperszámítógépek terén nagyjából ugyanez történik. 1993-ban a Tennessee Egyetem professzora, Jack Dongarra azzal az ötlettel állt elő, hogy készítsen egy rangsort a világ legerősebb számítógépeiről. Azóta ezt a TOP500-as listát évente kétszer frissítik: júniusban és novemberben.

Telik az idő, és a 90-es évek elejének szuperszámítógép-besorolásának vezetői már a hétköznapi PC-felhasználók mércéje szerint is istentelenül elavultak. Tehát 1993-ban az első a CM-5/1024 volt, amelyet a Thinking Machines állított össze: 1024 processzor 32 MHz órajellel, 59,7 gigaflop számítási sebesség – valamivel gyorsabb, mint egy hagyományos 8 magos PC az asztal alatt. Melyik ma a legjobb számítógép?


Sunway TaihuLight

Alig öt évvel ezelőtt a teljesítmény terén a pálmát folyamatosan az USA-ban gyártott szuperszámítógépek tartották. 2013-ban kínai tudósok ragadták meg a vezetést, és láthatóan nem adják fel.

Jelenleg a világ legerősebb számítógépe a Sunway TaihuLight (a Taihu-tó isteni fényereje), egy grandiózus gép, amelynek számítási sebessége 93 petaflop (maximális sebesség - 125,43 petaflop). Ez 2,5-szer erősebb, mint az előző rekorder - a Tianhe-2 szuperszámítógép, amelyet 2016 júniusáig a legerősebbnek tartottak.


A Sunway Taihulight 10,5 millió beépített maggal rendelkezik (40 960 processzor, mindegyik 256 számítástechnikai és 4 vezérlőmaggal).

Így néz ki 2016 legerősebb számítógépe

Minden berendezést Kínában fejlesztettek és gyártottak, míg a korábbi legerősebb számítógép processzorait az amerikai Intel cég gyártotta. A Sunway TaihuLight költségét 270 millió dollárra becsülik. A szuperszámítógép a Wuxi megyei Nemzeti Szuperszámítógép Központban található.

Az előző évek rekorderei

2016 júniusáig (és a TOP500-as listát minden júniusban és novemberben frissítik) a legerősebb és leggyorsabb számítógép a Tianhe-2 szupergép volt (kínai fordításban „Tejút”), amelyet Kínában fejlesztettek ki a Védelmi Tudományos és Technológiai Egyetemen 2016. Changsha az Inspur cég segítségével.


A Tianhe-2 teljesítménye 2507 billió műveletet tesz lehetővé másodpercenként (33,86 petaflops másodpercenként), a csúcsteljesítmény 54,9 petaflop. A kínai fejlesztés 2013-as indulása óta vezeti ezt a rangsort – ez egy hihetetlenül lenyűgöző adat!

Tianhe-2 szuperszámítógép

A Tianhe-2 jellemzői a következők: 16 ezer csomópont, 32 ezer 12 magos Intel Xeon E5-2692 processzor és 48 ezer 57 magos Intel Xeon Phi 31S1P gyorsító, ami összesen 3 120 000 magot jelent; 256 ezer egyenként 4 GB-os DDR3 RAM és 176 000 GDDR5 8 GB-os memória - összesen 2 432 000 GB RAM. A merevlemez kapacitása több mint 13 millió GB. Azonban nem fog tudni játszani rajta - kizárólag számítástechnikai célokra szolgál, és a Milky Way 2-ben nincs videokártya telepítve. Különösen a metrófektetés és a városfejlesztés számításaiban segít.

Jaguár

Sokáig az USA-ból származó Jaguar szuperszámítógép állt a rangsor élén. Miben különbözik a többitől és mik a technikai előnyei?


A Jaguar nevű szuperszámítógép nagyszámú független cellából áll, két részre osztva - XT4 és XT5. Az utolsó rész pontosan 18688 számítási cellát tartalmaz. Mindegyik cellában két hatmagos AMD Opteron 2356 processzor található, 2,3 GHz-es frekvenciával, 16 GB DDR2 RAM, valamint egy SeaStar 2+ router. Ebből a részből akár egy cella is elegendő lenne a legerősebb játékhoz való számítógép létrehozásához. A rész mindössze 149 504 számítási magot, hatalmas mennyiségű RAM-ot - több mint 300 TB-ot, valamint 1,38 Petaflops teljesítményt és több mint 6 Petabájt lemezterületet tartalmaz.

Számítógépes szörnyeteg építése

Az XT4 partíció 7832 cellát tartalmaz. Jellemzőik szerényebbek, mint az előző XT5 szekcióé: minden cellában egy hatmagos, 2,1 GHz-es processzor, 8 GB RAM és egy SeaStar 2 router található.A szekció összesen 31 328 számítási magot és több mint 62 TB memória, valamint 263 TFLOPS csúcsteljesítmény és több mint 600 TB lemezterület. A Jaguar szuperszámítógép saját operációs rendszerén, a Cray Linux Environment-en fut.

Egy másik számítógép lélegzik a Jaguar hátuljában, az IBM – Roadrunner – ötletgazdája. A legerősebb számítástechnikai szörny másodpercenként akár 1000 000 000 000 műveletet is képes kiszámolni. Kifejezetten a Los Alamos-i Energiaügyi Minisztérium Nemzeti Nukleáris Biztonsági Igazgatósága számára fejlesztették ki. Ezzel a szuperszámítógéppel tervezték az Egyesült Államokban található összes nukleáris létesítmény működésének monitorozását.


A Road Runner feldolgozási csúcssebessége körülbelül 1,5 petaflop. Összesen 3456 eredeti háromlapátos szerver kapacitásáról beszélünk, amelyek mindegyike körülbelül 400 milliárd művelet végrehajtására képes másodpercenként (azaz 400 gigaflop). A Roadrunner belsejében körülbelül 20 ezer nagy teljesítményű kétmagos processzor található - 12 960 Cell Broadband Engine és 6948 AMD Opteron, maga az IBM ötlete. Egy ilyen szuperszámítógép rendszermemóriája 80 terabájt.

Tehát mennyi helyet foglal el ez a technológiai csoda? A gép 560 négyzetméteres területen található. És az osztály összes berendezése az eredeti architektúrájú szerverekbe van csomagolva. Az összes berendezés súlya körülbelül 23 tonna. Szállításához tehát legalább 21 nagy traktorra lesz szüksége az Országos Nukleáris Biztonsági Hivatal munkatársainak.

Néhány szó arról, hogy mi is az a petaflops. Egy petaflop körülbelül 100 ezer modern laptop teljes teljesítményével egyenlő. Ha megpróbálod elképzelni, egy majdnem két és fél kilométer hosszú utat is kikövezhetnek. Egy másik elérhető összehasonlítás: 46 éven belül a bolygó teljes lakossága olyan számításokat fog végezni, amelyeket a Roadrunner egy nap alatt képes elvégezni. El tudja képzelni, milyen kevésre lesz szüksége a Sunway TaihuLigh-nak, értékelésünk vezetőjének?

Titán

2012-ben az Egyesült Államok Energiaügyi Minisztériumának Oak Ridge Nemzeti Laboratóriuma elindította a Titan szuperszámítógépet, amely 20 petaflops névleges teljesítményű – vagyis egy másodperc alatt kvadrillió lebegőpontos műveletet tud végrehajtani.


A Titant Cray fejlesztette ki. Az elmúlt években a Titán mellett még két szuperszámítógépet fejlesztettek ki amerikai szakemberek. Az egyik - a Mira - ipari és tudományos kutatási igényekre szolgál, a másik - Sequoia - segítségével pedig atomfegyver-kísérleteket szimulálnak. Mindezen fejlesztések mögött az IBM Corporation áll.

A legerősebb számítógép Oroszországban

Sajnos az orosz fejlesztés, a „Lomonosov-2”, amelyet Oroszország legerősebb számítógépének tartanak, csak a 41. helyen áll a TOP500-ban (2016 júniusában). Székhelye a Moszkvai Állami Egyetem Tudományos Számítástechnikai Központja. A hazai szuperszámítógép teljesítménye 1849 petaflop, a csúcsteljesítmény körülbelül 2,5 petaflop. Magok száma: 42 688.



Iratkozzon fel csatornánkra a Yandex.Zen

Szuperszámítógép Titan

Az emberek még mindig nem repülnek a Marsra, a rák még nem gyógyult meg, és az olajfüggőségtől sem szabadultunk meg. Pedig vannak olyan területek, ahol az emberiség hihetetlen előrehaladást ért el az elmúlt évtizedekben. A számítógépek számítási teljesítménye csak egy ezek közül.

A Lawrence Berkeley National Laboratory és a University of Tennessee szakértői évente kétszer teszik közzé a Top 500-at, amely a világ legerősebb szuperszámítógépeinek listáját tartalmazza.

Kicsit előre tekintve azt javasoljuk, hogy kóstolja meg előre ezeket a számokat: az első tíz képviselőinek produktivitását több tíz kvadrillió flopban mérik. Összehasonlításképpen: az ENIAC, a történelem első számítógépe 500 flop ereje volt; Ma egy átlagos személyi számítógép több száz gigaflop (milliárd flop), az iPhone 6 körülbelül 172 gigaflop, a PS4 pedig 1,84 teraflop (billió flop).

A 2014. novemberi legfrissebb Top 500-zal felvértezve a Naked Science úgy döntött, hogy kitalálja, mi a világ 10 legerősebb szuperszámítógépe, és milyen problémák megoldása igényel ilyen hatalmas számítási teljesítményt.

  • Helyszín: USA
  • Teljesítmény: 3,57 petaflops
  • Elméleti maximális teljesítmény: 6,13 petaflop
  • Teljesítmény: 1,4 MW

Mint szinte minden modern szuperszámítógép, beleértve a jelen cikkben bemutatottakat, a CS-Storm is számos processzorból áll, amelyeket egyetlen számítógépes hálózatba egyesítenek a masszívan párhuzamos architektúra elve alapján. A valóságban ez a rendszer számos elektronikával ellátott rackből ("szekrényből") áll (többmagos processzorokból álló csomópontok), amelyek egész folyosókat alkotnak.

A Cray CS-Storm szuperszámítógép-fürtök egész sorozata, de egyikük mégis kiemelkedik a többi közül. Pontosabban a titokzatos CS-Stormról van szó, amelyet az Egyesült Államok kormánya használ ismeretlen célokra és ismeretlen helyen.

Azt tudni lehet, hogy az amerikai Cray cégtől az amerikai Cray cégtől vásároltak az energiafogyasztás szempontjából rendkívül hatékony (2386 megaflop/1 Watt) CS-Stormot, összesen közel 79 ezer magszámmal.

A gyártó honlapján viszont azt írják, hogy a CS-Storm klaszterei alkalmasak nagy teljesítményű számítástechnikára a kiberbiztonság, a térinformatikai intelligencia, a mintafelismerés, a szeizmikus adatfeldolgozás, a renderelés és a gépi tanulás területén. Valahol ebben a sorozatban valószínűleg leült a kormányzati CS-Storm használata.

CRAY CS-STORM

9. Vulcan – Blue Gene/Q

  • Helyszín: USA
  • Teljesítmény: 4,29 petaflops
  • Elméleti maximális teljesítmény: 5,03 petaflop
  • Teljesítmény: 1,9 MW

A „Vulcan”-t az amerikai IBM cég fejlesztette ki, a Blue Gene családhoz tartozik, és a Lawrence Livermore National Laboratory-ban található. Az Egyesült Államok Energiaügyi Minisztériumának tulajdonában lévő szuperszámítógép 24 rackből áll. A klaszter 2013-ban kezdte meg működését.

A már említett CS-Stormmal ellentétben a Vulcan alkalmazási köre jól ismert - különféle tudományos kutatások, többek között az energia területén, például természeti jelenségek modellezése és nagy mennyiségű adat elemzése.

Különféle tudományos csoportok és cégek férhetnek hozzá a szuperszámítógéphez, ha kérelmet nyújtanak be a High Performance Computing Innovation Centerhez (HPC Innovációs Központ), amely ugyanabban a Livermore National Laboratoryban található.

Szuperszámítógép Vulcan

8. Juqueen – Blue Gene/Q

  • Helyszín: Németország
  • Teljesítmény: 5 petaflop
  • Elméleti maximális teljesítmény: 5,87 petaflop
  • Teljesítmény: 2,3 MW

2012-es indulása óta a Juqueen a második legerősebb szuperszámítógép Európában és az első Németországban. A Vulcanhoz hasonlóan ezt a szuperszámítógép-klasztert is az IBM fejlesztette ki a Blue Gene projekt részeként, és ugyanahhoz a Q generációhoz tartozik.

A szuperszámítógép Európa egyik legnagyobb kutatóközpontjában, Jülichben található. Ennek megfelelően használják - nagy teljesítményű számítástechnikai célokra különféle tudományos kutatásokban.

Juqueen szuperszámítógép

7. Stampede – PowerEdge C8220

  • Helyszín: USA
  • Teljesítmény: 5,16 petaflops
  • Elméleti maximális teljesítmény: 8,52 petaflop
  • Teljesítmény: 4,5 MW

A texasi Stampede az egyetlen klaszter a Top 500 első tíz helyezettje között, amelyet az amerikai Dell cég fejlesztett ki. A szuperszámítógép 160 rackből áll.

Ez a szuperszámítógép a világon a legerősebb a kizárólag kutatási célokra használt szuperszámítógép. A Stampede létesítményei nyitottak a tudományos csoportok számára. A klasztert számos tudományterületen használják – az emberi agy pontos tomográfiájától és a földrengések előrejelzésétől a zenei minták és a nyelvi struktúrák azonosításáig.

Szuperszámítógépes roham

6. Piz Daint – Cray XC30

  • Helyszín: Svájc
  • Teljesítmény: 6,27 petaflops
  • Elméleti maximális teljesítmény: 7,78 petaflop
  • Teljesítmény: 2,3 MW

A Swiss National Supercomputing Center (CSCS) Európa legerősebb szuperszámítógépével büszkélkedhet. Az alpesi hegyről elnevezett Piz Daint Cray fejlesztette ki, és az XC30 családhoz tartozik, amelyen belül a legtermékenyebb.

A Piz Daint különféle kutatási célokra használatos, például számítógépes szimulációkhoz a nagy energiájú fizika területén.

Piz Daint szuperszámítógép

5. Mira – Blue Gene/Q

  • Helyszín: USA
  • Teljesítmény: 8,56 petaflops
  • Elméleti maximális teljesítmény: 10,06 petaflop
  • Teljesítmény: 3,9 MW

A Mira szuperszámítógépet az IBM a Blue Gene projekt részeként fejlesztette ki 2012-ben. Az Argonne National Laboratory nagy teljesítményű számítástechnikai részlege, amely a klaszternek ad otthont, állami támogatással jött létre. A szuperszámítógép-technológia iránti érdeklődés Washingtonból a 2000-es évek végén és a 2010-es évek elején feltehetően a Kínával való rivalizálásnak tulajdonítható ezen a területen.

A 48 állványon található Mirát tudományos célokra használják. A szuperszámítógépet például éghajlati és szeizmikus modellezésre használják, ami lehetővé teszi a pontosabb adatok megszerzését a földrengések és az éghajlatváltozás előrejelzésére vonatkozóan.

Mira szuperszámítógép

4. K Számítógép

  • Helyszín: Japán
  • Teljesítmény: 10,51 petaflops
  • Elméleti maximális teljesítmény: 11,28 petaflop
  • Teljesítmény: 12,6 MW

A Fujitsu által kifejlesztett és a kobei Fizikai-kémiai Kutatóintézetben található K Computer az egyetlen japán szuperszámítógép, amely a Top 500 első tíz helyezettje között szerepel.

Egy időben (2011 júniusában) ez a klaszter az első helyet foglalta el a rangsorban, és egy évre a világ legtermékenyebb számítógépévé vált. 2011 novemberében pedig a K Computer lett az első a történelemben, amely 10 petaflop feletti teljesítményt ért el.

A szuperszámítógépet számos kutatási feladatban használják. Például a természeti katasztrófák előrejelzésére (amely Japán számára fontos a térség fokozott szeizmikus aktivitása és az ország nagy sérülékenysége miatt cunami esetén) és számítógépes modellezés az orvostudomány területén.

Szuperszámítógép K

3. Sequoia – Blue Gene/Q

  • Helyszín: USA
  • Teljesítmény: 17,17 petaflops
  • Elméleti maximális teljesítmény: 20,13 petaflop
  • Teljesítmény: 7,8 MW

A Blue Gene/Q család négy szuperszámítógépe közül a legerősebb, amelyek a besorolás első tízében vannak, az Egyesült Államokban, a Livermore National Laboratoryban található. Az IBM a Sequoiát a National Nuclear Security Administration (NNSA) számára fejlesztette ki, amelynek egy nagyon speciális célra volt szüksége egy nagy teljesítményű számítógépre: a nukleáris robbanások szimulálására.

Érdemes megemlíteni, hogy a valódi nukleáris kísérleteket 1963 óta tiltják, és a számítógépes szimuláció az egyik legelfogadhatóbb lehetőség a kutatás folytatására ezen a területen.

A szuperszámítógép erejét azonban más, sokkal nemesebb problémák megoldására használták fel. A klaszternek például sikerült teljesítményrekordokat felállítania a kozmológiai modellezésben, valamint az emberi szív elektrofiziológiai modelljének megalkotásában.

Sequoia szuperszámítógép

2. Titan – Cray XK7

  • Helyszín: USA
  • Teljesítmény: 17,59 petaflops
  • Elméleti maximális teljesítmény: 27,11 petaflop
  • Teljesítmény: 8,2 MW

A Nyugaton valaha készült legproduktívabb szuperszámítógép, valamint a Cray márka legerősebb számítógép-klasztere az Egyesült Államokban, az Oak Ridge National Laboratoryban található. Annak ellenére, hogy az Egyesült Államok Energiaügyi Minisztériuma rendelkezésére álló szuperszámítógép hivatalosan is elérhető bármilyen tudományos kutatáshoz, 2012 októberében, a Titan piacra dobásakor az alkalmazások száma minden határt meghaladt.

Emiatt az Oak Ridge Laboratóriumban külön bizottságot hívtak össze, amely 50 pályázat közül csak 6-ot választott ki a „legfejlettebb” projektek közül. Ezek között szerepel például a neutronok viselkedésének modellezése egy atomreaktor szívében, valamint a globális klímaváltozások előrejelzése a következő 1-5 évre.

Számítási teljesítménye és lenyűgöző méretei (404 négyzetméter) ellenére a Titan nem bírta sokáig a talapzaton. Mindössze hat hónappal a 2012. novemberi diadal után a nagyteljesítményű számítástechnika terén az amerikai büszkeséget váratlanul kiszorította a keleti bennszülött, és példátlan módon felülmúlta a ranglista korábbi vezetőit.

Szuperszámítógép Titan

1. Tianhe-2 / Tejút-2

  • Helyszín: Kína
  • Teljesítmény: 33,86 petaflops
  • Elméleti maximális teljesítmény: 54,9 petaflop
  • Teljesítmény: 17,6 MW

Első indítása óta a Tianhe-2, vagyis a Tejút-2 körülbelül két éve a Top-500 vezetője. Ez a szörny csaknem kétszer olyan erős, mint a 2. számú a rangsorban – a TITAN szuperszámítógép.

A Népi Felszabadító Hadsereg Védelmi Tudományos és Technológiai Egyeteme és az Inspur által kifejlesztett Tianhe-2 16 ezer csomópontból áll, összesen 3,12 millió maggal. Ennek a kolosszális, 720 négyzetmétert elfoglaló szerkezetnek a RAM-ja 1,4 petabájt, a tárolóeszközé pedig 12,4 petabájt.

A Milky Way 2-t a kínai kormány kezdeményezésére tervezték, így nem meglepő, hogy példátlan ereje a jelek szerint az állam igényeit szolgálja. Hivatalosan is közölték, hogy a szuperszámítógép különféle szimulációkat végez, hatalmas mennyiségű adatot elemez, valamint Kína nemzetbiztonságát biztosítja.

Figyelembe véve a kínai katonai projektekben rejlő titkosságot, csak találgatni lehet, hogy a Milky Way-2 milyen hasznot húz időről időre a kínai hadsereg kezében.

Tianhe-2 szuperszámítógép

Kezdőlap → A hazai számítástechnika története → Szuperszámítógépek

Szuperszámítógépek

Andrej Borzenko

A szuperszámítógépek a leggyorsabb számítógépek. Fő különbségük a nagyszámítógépektől a következő: egy ilyen számítógép összes erőforrása általában egy vagy legalább több feladat lehető leggyorsabb megoldására irányul, míg a nagyszámítógépek általában meglehetősen nagy számú feladatot hajtanak végre, amelyek mindegyikével versenyeznek. Egyéb. A számítógépipar rohamos fejlődése meghatározza az alapfogalom relativitását – amit tíz évvel ezelőtt még szuperszámítógépnek lehetett nevezni, az ma már nem tartozik ebbe a definícióba. A szuperszámítógépnek van egy humoros definíciója is: ez egy olyan eszköz, amely a számítási problémát input-output problémává redukálja. Van azonban benne némi igazság: gyakran az egyetlen szűk keresztmetszet a nagy sebességű rendszerekben az I/O eszközök. A világ ötszáz legerősebb rendszerét tartalmazó hivatalos listából – a Top500-ból (http://www.top500.org) – megtudhatja, hogy jelenleg mely szuperszámítógépek teljesítik a legnagyobb teljesítményt, amelyet évente kétszer tesznek közzé.

Minden számítógépen az összes fő paraméter szorosan összefügg. Nehéz elképzelni egy univerzális számítógépet, amely nagy teljesítményű és kevés RAM-mal rendelkezik, vagy hatalmas RAM-mal és kis lemezterülettel. Emiatt a szuperszámítógépekre jelenleg nem csak a maximális teljesítmény, hanem a maximális RAM és lemezmemória is jellemző. Az ilyen műszaki jellemzők biztosítása meglehetősen drága - a szuperszámítógépek költsége rendkívül magas. Mely feladatok olyan fontosak, hogy több tíz- vagy százmillió dollárba kerülő rendszereket igényelnek? Általában ezek olyan alapvető tudományos vagy mérnöki számítástechnikai problémák, amelyek széles körben alkalmazhatók, és amelyek hatékony megoldása csak nagy teljesítményű számítási erőforrások rendelkezésre állásával lehetséges. Íme néhány olyan terület, ahol ilyen típusú problémák merülnek fel:

  • előrejelzések az időjárásról, az éghajlatról és a légkör globális változásairól;
  • anyagtudomány;
  • félvezető eszközök építése;
  • szupravezetés;
  • szerkezeti biológia;
  • gyógyszerfejlesztés;
  • emberi genetika;
  • kvantumkromodinamika;
  • csillagászat;
  • autóipar;
  • szállítási feladatok;
  • hidro- és gázdinamika;
  • szabályozott termonukleáris fúzió;
  • tüzelőanyag-égető rendszerek hatékonysága;
  • olaj- és gázkutatás;
  • számítási problémák az óceántudományokban;
  • beszédfelismerés és -szintézis;
  • képfelismerés.

A szuperszámítógépek nagyon gyorsan számolnak, nemcsak a legmodernebb elembázis használatának, hanem a rendszerarchitektúra új megoldásainak is köszönhetően. A fő helyet itt a párhuzamos adatfeldolgozás elve foglalja el, amely több művelet egyidejű (párhuzamos) végrehajtásának gondolatát testesíti meg. A párhuzamos feldolgozásnak két típusa van: a folyamat és a tényleges párhuzamosság. A csővezetékes feldolgozás lényege, hogy kiemeli az általános művelet végrehajtásának egyes szakaszait, és minden szakasz, miután befejezte a munkáját, átadja az eredményt a következőnek, miközben egyidejűleg elfogadja a bemeneti adatok új részét. Nyilvánvaló feldolgozási sebességnövekedés érhető el a korábban elosztott műveletek kombinálásával.

Ha egy adott eszköz időegységenként egy műveletet hajt végre, akkor ezer egységben ezer műveletet hajt végre. Ha öt egyforma, egyidejűleg működő független eszköz van, akkor egy öt eszközből álló rendszer nem ezer, hanem kétszáz időegység alatt képes ugyanazt az ezer műveletet elvégezni. Hasonlóképpen, egy N eszközből álló rendszer ugyanazt a munkát 1000/N időegység alatt végzi el.

Természetesen ma már kevesen lepődnek meg a számítógép-architektúra párhuzamosságán. Minden modern mikroprocesszor alkalmaz valamilyen párhuzamos feldolgozást, még ugyanazon a chipen belül is. Ugyanakkor ezek az ötletek maguk is nagyon régen megjelentek. Kezdetben koruk legfejlettebb, tehát egyetlen számítógépein valósították meg őket. Itt külön jóváírás jár az IBM-nek és a Control Data Corporationnek (CDC). Olyan újításokról beszélünk, mint a bitpárhuzamos memória, a bitpárhuzamos aritmetika, a független bemeneti/kimeneti processzorok, a parancsfolyamat, a pipeline független funkcionális egységek stb.

Általában a „szuperszámítógép” szót a Cray számítógépekhez kötik, bár manapság ez korántsem így van. Az első szuperszámítógép fejlesztője és főtervezője Seymour Cray volt, a számítógépipar egyik leglegendásabb alakja. 1972-ben elhagyta a CDC-t, és megalapította saját cégét, a Cray Research-t. Az első szuperszámítógépet, a CRAY-1-et négy évvel később (1976-ban) fejlesztették ki, és 12 csővezetékes funkcionális egységgel rendelkezett vektor-pipeline architektúrával. A Cray-1 csúcsteljesítménye 160 MT/s (12,5 ns órajel), a 64 bites RAM (amely 8 MB-ra bővíthető) ciklusideje pedig 50 ns volt. A fő újítás természetesen a vektoros parancsok bevezetése volt, amelyek független adatok teljes tömbjével dolgoznak, és lehetővé teszik a pipeline funkcionális eszközök hatékony használatát.

A 60-80-as években a szuperszámítógépek gyártásával foglalkozó világ vezetőinek figyelme a nagy volumenű lebegőpontos problémák megoldására alkalmas számítástechnikai rendszerek gyártására irányult. Ilyen feladatokból nem volt hiány - szinte mindegyik nukleáris kutatáshoz és repülőgép-modellezéshez kapcsolódott, és a katonaság érdekében végezték őket. A lehető legrövidebb időn belüli maximális teljesítmény elérésének vágya azt jelentette, hogy egy rendszer minőségi értékelésének kritériuma nem az ára, hanem a teljesítménye volt. Például a Cray-1 szuperszámítógép a konfigurációtól függően 4-11 millió dollárba került.

A 80-90-es évek fordulóján. A hidegháború véget ért, és a katonai megrendeléseket kereskedelmi parancsok váltották fel. Addigra az ipar nagy előrelépést tett a soros processzorok gyártásában. Megközelítőleg ugyanolyan számítási teljesítményük volt, mint az egyedieké, de lényegesen olcsóbbak voltak. A szabványos komponensek és a változó számú processzor alkalmazása lehetővé tette a skálázhatósági probléma megoldását. Most a számítási terhelés növekedésével új processzorok és I/O eszközök hozzáadásával lehetett növelni a szuperszámítógép és perifériáinak teljesítményét. Így 1990-ben megjelent az Intel iPSC/860 szuperszámítógép 128 processzorral, amely 2,6 Gflops teljesítményt mutatott a LINPACK teszten.

Tavaly novemberben jelent meg a világ 500 legerősebb számítógépe listájának 18. kiadása - a Top500. A listavezető továbbra is az IBM Corporation (http://www.ibm.com), amely a telepített rendszerek 32%-át és a teljes termelékenység 37%-át birtokolja. Érdekes hír volt a Hewlett-Packard megjelenése a második helyen a rendszerek számát tekintve (30%). Sőt, mivel ezek a rendszerek viszonylag kicsik, teljes teljesítményük a teljes lista mindössze 15%-a. A Compaq-kal való egyesülést követően várhatóan az új cég uralja majd a listát. A listán a számítógépek számát tekintve a következő az SGI, a Cray és a Sun Microsystems.

A világ legerősebb szuperszámítógépe továbbra is az ASCI White rendszer volt (erre később még visszatérünk), amelyet a Livermore Laboratoryban (USA) telepítettek, és 7,2 Tflops teljesítményt mutatott a LINPACK teszten (a csúcsteljesítmény 58%-a). A második helyen a pittsburghi szuperszámítógépes központba telepített Compaq AlphaServer SC rendszer végzett 4 Tflops teljesítménnyel. A listát a Cray T3E rendszer zárja 94 Gflops LINPACK teljesítményével.

Érdemes megjegyezni, hogy a listán már 16 olyan rendszer szerepelt, amelyek teljesítménye meghaladja az 1 teraflopot, ezek felét az IBM telepítette. A kis SMP blokkokból álló klaszterek száma folyamatosan növekszik – jelenleg 43 ilyen rendszer található a listán. A lista nagy része azonban továbbra is a masszívan párhuzamos rendszerekre vonatkozik (50%), ezt követik a nagy SMP-rendszerekből álló klaszterek (29%).

Az architektúrák típusai

A párhuzamos számítógépek osztályozásának fő paramétere a megosztott vagy elosztott memória megléte. Valami a kettő között vannak olyan architektúrák, ahol a memória fizikailag elosztott, de logikailag megosztott. Hardver szempontból két fő séma javasolta magát a párhuzamos rendszerek megvalósításához. Az első több különálló rendszer, helyi memóriával és processzorokkal, amelyek valamilyen környezetben üzenetek küldésével kommunikálnak egymással. A második olyan rendszerek, amelyek megosztott memórián keresztül működnek együtt. Anélkül, hogy egyelőre belemennénk a technikai részletekbe, ejtsünk néhány szót a modern szuperszámítógépek architektúrájának típusairól.

Az elosztott memóriával rendelkező, masszívan párhuzamos rendszerek (Massively Parallel Processing, MPP) ötlete meglehetősen egyszerű. Erre a célra közönséges mikroprocesszorokat vesznek, amelyek mindegyike saját helyi memóriával van felszerelve, és valamilyen kapcsolóközegen keresztül csatlakozik. Az ilyen architektúrának számos előnye van. Ha nagy teljesítményre van szüksége, akkor több processzort is felvehet, ha pedig korlátozottak a pénzügyek, vagy előre ismert a szükséges számítási teljesítmény, akkor könnyen kiválasztható az optimális konfiguráció. Az MPP-nek azonban vannak hátrányai is. A tény az, hogy a processzorok közötti interakció sokkal lassabb, mint a feldolgozók által végzett adatfeldolgozás.

Az osztott memóriával rendelkező párhuzamos számítógépeken az összes RAM meg van osztva több azonos processzor között. Ez eltávolítja az előző osztály problémáit, de újakat ad hozzá. Az a tény, hogy az osztott memóriához hozzáféréssel rendelkező processzorok számát pusztán technikai okok miatt nem lehet nagyra növelni.

A vektor-pipeline számítógépek fő jellemzői természetesen a pipeline funkcionális egységek és a vektoros utasítások halmaza. A hagyományos megközelítéssel ellentétben a vektoros parancsok független adatok teljes tömbjein működnek, ami lehetővé teszi a rendelkezésre álló folyamatok hatékony betöltését.

Az utolsó irány szigorúan véve nem független, hanem az előző három kombinációja. Egy számítási csomópont több processzorból (hagyományos vagy vektor-pipeline) és azok közös memóriájából jön létre. Ha a kapott számítási teljesítmény nem elegendő, akkor több csomópontot nagy sebességű csatornákkal kombinálnak. Mint tudják, egy ilyen architektúrát klaszternek neveznek.

MPP rendszerek

A masszívan párhuzamos skálázható rendszereket a nagy mennyiségű számítási és adatfeldolgozást igénylő alkalmazási problémák megoldására tervezték. Nézzük meg őket közelebbről. Általában homogén számítási csomópontokból állnak, beleértve:

  • egy vagy több központi feldolgozó egység;
  • helyi memória (más csomópontok memóriájához való közvetlen hozzáférés nem lehetséges);
  • kommunikációs processzor vagy hálózati adapter;
  • néha merevlemezek és/vagy egyéb bemeneti/kimeneti eszközök.

Ezen kívül speciális I/O csomópontok és vezérlő csomópontok is hozzáadhatók a rendszerhez. Mindegyik valamilyen kommunikációs médiumon keresztül (nagy sebességű hálózat, switch stb.) csatlakozik. Ami az operációs rendszert illeti, két lehetőség van. Az első esetben egy teljes értékű operációs rendszer csak a vezérlőgépen fut, míg az egyes csomópontok az operációs rendszer erősen lecsökkentett verzióját futtatják, csak a benne található párhuzamos alkalmazás ágának működését biztosítva. Egy másik esetben minden csomópont teljes értékű UNIX-szerű operációs rendszert futtat.

Az elosztott memóriarendszerekben a processzorok száma elméletileg korlátlan. Az ilyen architektúrák használatával skálázható rendszereket lehet építeni, amelyek teljesítménye a processzorok számával lineárisan növekszik. Egyébként magát a „masszívan párhuzamos rendszerek” kifejezést általában az ilyen, nagyszámú (tíz és száz) csomóponttal rendelkező, méretezhető számítógépekre szokták utalni. A számítási rendszer skálázhatósága szükséges a számítások arányos gyorsításához, de sajnos ez nem elég. A megfelelő nyereség eléréséhez egy probléma megoldásában szükség van egy skálázható algoritmusra is, amely képes a szuperszámítógép összes processzorát hasznos számításokkal terhelni.

Emlékezzünk vissza, hogy többprocesszoros rendszereken két programvégrehajtási modell létezik: SIMD (egy utasításfolyam - több adatfolyam) és MIMD (több utasításfolyam - több adatfolyam). Az első feltételezi, hogy minden processzor ugyanazt a parancsot hajtja végre, de mindegyik a saját adatain. A másodikban minden processzor a saját parancsfolyamát dolgozza fel.

Az elosztott memóriarendszerekben az információ processzorról processzorra való átviteléhez egy olyan mechanizmusra van szükség, amely az üzeneteket a számítási csomópontokat összekötő hálózaton keresztül továbbítja. A kommunikációs berendezések és programok magas szintű működésének részleteitől való elvonatkoztatás érdekében általában üzenettovábbítási könyvtárakat használnak.

Intel szuperszámítógépek

Az Intel Corporation (http://www.intel.com) jól ismert a szuperszámítógépek világában. Az elosztott memóriájú Paragon többprocesszoros számítógépei ugyanolyan klasszikussá váltak, mint a Cray Research vektor-pipeline számítógépei.

Az Intel Paragon öt i860 XP processzort használ 50 MHz órajellel egy csomópontban. Néha különböző típusú processzorokat helyeznek el egy csomópontban: skaláris, vektoros és kommunikációs. Ez utóbbi arra szolgál, hogy mentesítse a főprocesszort az üzenetátvitelhez kapcsolódó műveletek végrehajtásától.

Az új párhuzamos architektúra legjelentősebb jellemzője a kommunikációs berendezés típusa. A szuperszámítógép működésének két legfontosabb mutatója függ tőle: a processzorok közötti adatátvitel sebessége és egy üzenet továbbításának költsége.

Az összeköttetést úgy tervezték, hogy nagy üzenetküldési sebességet biztosítson minimális késleltetéssel. Több mint ezer heterogén csomópont összekapcsolását biztosítja egy kétdimenziós téglalap alakú rács topológia mentén. A legtöbb alkalmazásfejlesztésnél azonban bármely csomópont úgy tekinthető, hogy közvetlenül kapcsolódik az összes többi csomóponthoz. Az összeköttetés méretezhető: áteresztőképessége a csomópontok számával nő. A tervezés során a fejlesztők arra törekedtek, hogy minimalizálják a felhasználói folyamatokat végrehajtó processzorok részvételét az üzenettovábbításban. Erre a célra speciális üzenetfeldolgozó processzorokat vezettek be, amelyek a csomóponti táblán helyezkednek el, és az üzenetküldési protokoll feldolgozásáért felelnek. Ennek eredményeként a csomópontok fő processzorait nem vonják el a probléma megoldásától. Konkrétan nincs költséges feladatról feladatra váltás, az alkalmazott problémák megoldása az üzenetváltással párhuzamosan történik.

Az üzenetek tényleges továbbítását a hálózati csomópontok útválasztójának összetevőire épülő útválasztó rendszer (Mesh Router Components, MRC) végzi. Egy adott csomópont memóriájához való MRC hozzáféréshez a csomópont egy speciális interfész hálózati vezérlővel is rendelkezik, amely egy egyedi VLSI, amely egyidejű átvitelt biztosít a csomópont memóriájába és a memóriából, valamint figyeli az üzenetátvitel során fellépő hibákat.

Az Intel Paragon moduláris felépítése nem csupán a méretezhetőséget támogatja. Lehetővé teszi számunkra, hogy számoljunk azzal a ténnyel, hogy ez az architektúra szolgál majd alapjául más mikroprocesszorokon alapuló vagy új üzenetküldési technológiát alkalmazó új számítógépeknek. A méretezhetőség a szuperszámítógép különböző blokkjainak különböző szinteken történő kiegyensúlyozásán is alapul; különben a csomópontok számának növekedésével valahol szűk keresztmetszet jelenhet meg a rendszerben. Így a csomópontok sebessége és memóriakapacitása egyensúlyban van az összekapcsolás sávszélességével és késleltetésével, a csomópontokon belüli processzorok teljesítménye pedig a cache memória és a RAM sávszélességével stb.

Egészen a közelmúltig az egyik leggyorsabb számítógép az Intel ASCI Red volt – az Accelerated Strategic Computing Initiative ASCI (Accelerated Strategic Computing Initiative) ötletgazdája. A három legnagyobb amerikai nemzeti laboratórium (Livermore, Los Alamos és Sandia) vesz részt ebben a programban. Az 1997-ben az Egyesült Államok Energiaügyi Minisztériuma számára készült ASCI Red 9152 Pentium Pro processzort egyesít, 600 GB teljes RAM-mal és másodpercenként 1800 milliárd művelettel rendelkezik.

IBM szuperszámítógépek

Amikor az IBM Corporation (http://www.ibm.com) skálázható párhuzamos architektúrájú SP (Scalable POWER parallel) univerzális rendszerei megjelentek a számítógépes piacon, gyorsan népszerűvé váltak. Manapság az ilyen rendszerek számos alkalmazási területen működnek, mint például a számítási kémia, balesetelemzés, elektronikus áramkör-tervezés, szeizmikus elemzés, tározómodellezés, döntéstámogatás, adatelemzés és online tranzakciófeldolgozás. Az SP rendszerek sikerét elsősorban sokoldalúságuk, valamint az üzenettovábbítással osztott memória modellen alapuló architektúra rugalmassága határozza meg.

Általánosságban elmondható, hogy az SP szuperszámítógép egy skálázható, masszívan párhuzamos, általános célú számítástechnikai rendszer, amely egy sor RS/6000 bázisállomásból áll, amelyeket egy nagy teljesítményű kapcsoló köt össze. Valóban, ki ne ismerné például a Deep Blue szuperszámítógépet, amely sakkban győzte le Garri Kaszparovot? De az egyik módosítása 32 csomópontból áll (IBM RS/6000 SP), amelyek 256 P2SC (Power Two Super Chip) processzoron alapulnak.

Az RS/6000 család az IBM számítógépeinek második generációja, amely a vállalat által az 1970-es évek végén kifejlesztett korlátozott utasításkészlet-architektúrán (RISC) alapul. Ezzel a koncepcióval egy nagyon egyszerű parancskészletet használnak a számítógépes rendszerben végzett összes munka elvégzésére. Mivel a parancsok egyszerűek, nagyon nagy sebességgel hajthatók végre, és a végrehajtható program hatékonyabb megvalósítását is biztosítják. Az RS/6000 család a POWER architektúrán (Performance Optimized by Advanced RISC architektúra) és annak származékain – PowerPC, P2SC, POWER3 stb. – alapul. Mivel a POWER architektúra egyesíti a RISC architektúra koncepcióit néhány hagyományosabb koncepcióval, az eredmény egy olyan rendszer, optimális általános teljesítmény.

Az RS/6000 SP rendszer több processzor erejét biztosítja a legbonyolultabb számítási problémák megoldásához. Az SP kapcsolórendszer az IBM legújabb innovációja a nagy sávszélességű, késleltetés nélküli processzorok közötti kommunikációban a hatékony párhuzamos számítástechnika érdekében. A legmegfelelőbb rendszerkonfiguráció kiválasztását többféle processzorcsomópont, változó keret (rack) méret és számos további I/O képesség biztosítja. Az SP-t vezető szoftvergyártók támogatják olyan területeken, mint a párhuzamos adatbázisok és a valós idejű tranzakciófeldolgozás, valamint a fő műszaki szoftverszállítók olyan területeken, mint a szeizmikus feldolgozás és a mérnöki tervezés.

Az IBM RS/6000 SP párhuzamos feldolgozással bővíti az alkalmazások képességeit. A rendszer megszünteti a teljesítménykorlátozásokat, és segít elkerülni a méretezéssel és az oszthatatlan, külön végrehajtott töredékek jelenlétével kapcsolatos problémákat. A világszerte több mint ezer ügyféllel rendelkező SP-k komplex és nagy volumenű műszaki és kereskedelmi alkalmazásokhoz kínálnak megoldásokat.

Az SP fő egység egy processzor csomópont, amely RS/6000 munkaállomás architektúrával rendelkezik. Az SP csomópontok többféle típusa létezik: vékony, széles, magas, számos műszaki paraméterben különböznek egymástól. Például a POWER3-II alapú High csomópontok legfeljebb 16 processzort és 64 GB memóriát tartalmaznak, de a vékony csomópontok legfeljebb 4 processzort és 16 GB memóriát tesznek lehetővé.

A rendszer 512 csomópontig skálázható, és lehetőség van különböző típusú csomópontok kombinálására. A csomópontok rackbe vannak telepítve (mindegyikben legfeljebb 16 csomópont). Az SP szinte lineárisan méretezi a lemezeket a processzorokkal és a memóriával együtt, így valódi hozzáférést tesz lehetővé terabájtnyi memóriához. Ez a teljesítménynövekedés megkönnyíti a rendszer felépítését és bővítését.

A csomópontokat egy nagy teljesítményű kapcsoló (IBM high-performance switch) köti össze, amely többlépcsős felépítésű és csomagkapcsolással működik.

Minden SP-csomópont teljes AIX operációs rendszert futtat, amely lehetővé teszi több ezer már meglévő AIX alkalmazás kihasználását. Ezenkívül a rendszercsomópontok csoportokba vonhatók. Például több csomópont működhet Lotus Notes kiszolgálóként, míg az összes többi párhuzamos adatbázist dolgoz fel.

A nagy rendszerek kezelése mindig kihívást jelentő feladat. Az SP egyetlen grafikus konzolt használ erre a célra, amely megjeleníti a hardver és a szoftver állapotát, a futó feladatokat és a felhasználói információkat. A rendszergazda egy ilyen konzol (vezérlő munkaállomás) és az SP-hez csatolt PSSP (Parallel Systems Support Programs) szoftvertermék segítségével oldja meg a felügyeleti feladatokat, beleértve a jelszavas védelem és a felhasználói engedélyek kezelését, az elvégzett feladatok elszámolását, a nyomtatás kezelését, a rendszerfigyelést. , a rendszer elindítása és kikapcsolása.

A legjobb

Mint már említettük, a Top500 (táblázat) szerint korunk legerősebb szuperszámítógépe az ASCI White, amely két kosárlabdapálya méretű területet foglal el, és a Livermore National Laboratory-ban van telepítve. 512 SMP csomópontot tartalmaz 64 bites POWER3-II processzorokon (összesen 8192 processzoron), és új Colony kommunikációs technológiát használ körülbelül 500 MB/s átviteli sebességgel, ami majdnem négyszer gyorsabb, mint a nagy teljesítményű SP. kapcsoló.

Top 10 Top500 (18. kiadás)

Pozíció Gyártó Számítógép Hol van telepítve Egy ország Év Processzorok száma
1 IBM ASCI fehér Egyesült Államok 2000 8192
2 Compaq AlphaServer SC Pittsburgh Szuperszámítógép Központ Egyesült Államok 2001 3024
3 IBM SP Power3 NERSC Energiakutató Intézet Egyesült Államok 2001 3328
4 Intel ASCI vörös Sandia Nemzeti Laboratórium Egyesült Államok 1999 9632
5 IBM ASCI Blue Pacific Livermore Nemzeti Laboratórium Egyesült Államok 1999 5808
6 Compaq AlphaServer SC Egyesült Államok 2001 1536
7 Hitachi SR8000/MPP Tokiói Egyetem Japán 2001 1152
8 SGI ASCI Blue Mountain Los Alamos Nemzeti Laboratórium Egyesült Államok 1998 6144
9 IBM SP Power3 NAVOCEANO Oceanográfiai Központ Egyesült Államok 2000 1336
10 IBM SP Power3 Német meteorológiai szolgálat Németország 2001 1280

Az új szuperszámítógép architektúrája a bevált masszívan párhuzamos RS/6000 architektúrán alapul, és 12,3 teraflops (billió művelet másodpercenként) teljesítményt nyújt. A rendszer összesen 8 TB RAM-ot tartalmaz 16 processzoros SMP csomópontok között, és 160 TB lemezmemóriát. Ahhoz, hogy a rendszert a New York állambeli IBM laboratóriumokból a kaliforniai Livermore-ba szállítsák, 28 pótkocsira volt szükség.

Minden rendszercsomópont az AIX operációs rendszert futtatja. A szuperszámítógépet az Egyesült Államok Energiaügyi Minisztériumának tudósai használják összetett 3D-s modellek futtatására a nukleáris fegyverek biztonságának megőrzése érdekében. Valójában az ASCI White az ASCI ötlépcsős programjának harmadik lépése, amely egy új szuperszámítógép létrehozását tervezi 2004-ben. Általánosságban elmondható, hogy az ASCI White három különálló rendszerből áll, amelyek közül a White a legnagyobb (512 csomópont, 8192 processzor). és van még Ice (28 csomópont, 448 processzor) és Frost (68 csomópont, 1088 processzor).

Az ASCI White elődje a Blue Pacific szuperszámítógép volt (az ASCI Blue másik neve), amely 1464 négyprocesszoros csomópontot tartalmazott, amelyek PowerPC 604e/332 MHz kristályokon alapultak. A csomópontok összesen közel öt mérföldes kábelekkel kapcsolódnak egyetlen rendszerbe, a számítógépterem területe pedig 8 ezer négyzetláb. Az ASCI Blue rendszer összesen 5856 processzorból áll, és 3,88 teraflops csúcsteljesítményt biztosít. A teljes RAM mennyisége 2,6 TB.

Egy szuperszámítógép kilométernyi kábelből áll.

Az Egyesült Államok Nemzeti Légkörkutató Központja (NCAR) az IBM-et választotta a világ legerősebb, klímaváltozás előrejelzésére tervezett szuperszámítógépének szállítójaként. A Blue Sky néven ismert rendszer egy nagyságrenddel növeli az NCAR klímamodellezési képességeit, ha idén teljesen működőképes lesz. A Blue Sky magja az IBM SP szuperszámítógép és az IBM eServer p690 rendszerek lesznek, amelyek használatával közel 7 Tflop csúcsteljesítmény érhető el 31,5 TB-os IBM SSA lemezalrendszerrel.

A Blue Storm nevű szuperszámítógépet az Európai Középtávú Időjárás-előrejelzések Központja (ECMWF) megrendelésére hozzák létre. A Blue Storm kétszer erősebb lesz, mint az ASCI White. Létrehozásához 100 IBM eServer p690 szerverre van szükség, más néven Regatta. Minden hűtőgép méretű rendszeregység több mint ezer processzort tartalmaz. 2004-ben a Blue Storm új generációs p960-as szerverekkel lesz felszerelve, amivel kétszer erősebb lesz. A szuperszámítógép az AIX operációs rendszert fogja futtatni. Kezdetben a Blue Storm meghajtók összkapacitása 1,5 petabájt lesz, a számítási teljesítmény pedig körülbelül 23 teraflop. A rendszer 130 tonnás lesz, és 1700-szor erősebb lesz, mint a Deep Blue sakk szuperszámítógép.

Az IBM kutatói a Livermore National Laboratory-val dolgoznak a Blue Gene/L és Blue Gene/C számítógépeken. Ezek a számítógépek az 5 éves Blue Gene projekt részét képezik, amely még 1999-ben kezdődött a fehérjék tanulmányozására, és amelybe 100 millió dollárt fektettek be.Az új Blue Gene/L (200 teraflops) szuperszámítógép létrehozása 2004-ben fejeződik be - a hat hónappal - egy évvel korábban, mint a nagyobb teljesítményű Blue Gene/C számítógépen végzett munka várható befejezése (1000 teraflop). A Blue Gene/L tervezési teljesítménye így meghaladja majd a világ 500 legerősebb számítógépének együttes teljesítményét. Ugyanakkor az új szuperszámítógép csak fél teniszpályának megfelelő területet foglal el. Az IBM mérnökei az energiafogyasztás csökkentésén is dolgoztak – 15-szörösére sikerült csökkenteniük.

Megjegyzések

LINPACK tesztek.
A LINPACK benchmarkok egy lineáris egyenletrendszer megoldásán alapulnak egy valós számmezőn sűrű együtthatómátrixszal Gauss-elimináció segítségével. A valós számokat általában teljes pontossággal ábrázolják. A valós számokkal végzett műveletek nagy száma miatt a LINPACK eredményeket tekintik a hardver- és szoftverkonfigurációk teljesítményének mércéjének azokon a területeken, ahol intenzíven alkalmazzák az összetett matematikai számításokat.

Föld szimulátor.
A New Scientist magazin szerint a szuperszámítógépek Top500-as listájának új, 19. változatában a NEC Corporation Earth Simulator projektjének szuperszámítógép-rendszere kerül az első helyre. Telepítése a Japán Földtudományi Intézetben (Yokohama Institute for Earth Sciences) található Kanagawában, Yokohama prefektúrában. A fejlesztők azt állítják, hogy a csúcsteljesítmény elérheti a 40 Tflop-ot.

Az Earth Simulator szuperszámítógép a klímaváltozás szimulálására szolgál a műholdakról kapott adatok alapján. A NEC képviselői szerint a nagy számítógép-teljesítményt speciálisan kialakított vektorprocesszorok használatával érik el. A rendszer 5120 ilyen processzoron alapul, 640 SX-6 csomópontban (egyenként 8 processzor). A szuperszámítógépen SUPER-UX operációs rendszer fut. A fejlesztőeszközök között megtalálhatók a C/C++, Fortran 90 és HPF nyelvekhez készült fordítók, valamint automatikus vektorizációs eszközök, az MPI-2 interfész megvalósítása és az ASL/ES matematikai könyvtár. A teljes gép három teniszpálya (50 x 65 m) területét foglalja el, és több kilométer kábelt használ.

A korábban első helyen álló K Computer szuperszámítógép a harmadik helyre szorult. A teljesítménye 11,28 Pflops (lásd 1. ábra). Emlékezzünk vissza, hogy a FLOPS (Floating-point Operations Per Second, FLOPS) a számítógép teljesítményének mértékegysége, amely megmutatja, hogy egy adott számítástechnikai rendszer másodpercenként hány lebegőpontos műveletet képes végrehajtani.

A K Computer a Rikagaku Kenkiyo Fizikai és Kémiai Kutatóintézet (RIKEN) és a Fujitsu közös fejlesztése. A japán Oktatási, Kulturális, Sport-, Tudományos és Technológiai Minisztérium (MEXT) által vezetett High-Performance Computing Infrastructure kezdeményezés részeként hozták létre. A szuperszámítógépet a japán Kobe városában, az Institute of Advanced Computing Sciences területén telepítették.

A szuperszámítógép elosztott memória architektúrán alapul. A rendszer több mint 80 000 számítási csomópontból áll, és 864 rackben található, amelyek mindegyike 96 számítási csomópontot és 6 I/O csomópontot tartalmaz. Az egy-egy processzort és 16 GB RAM-ot tartalmazó csomópontok a „hatdimenziós hurok / tórusz” topológiának megfelelően vannak összekapcsolva. A rendszer összesen 88 128 nyolcmagos SPARC64 VIIIfx processzort (705 024 magot) használ, amelyeket a Fujitsu gyárt 45 nm-es technológiával.

Ez az általános célú szuperszámítógép magas szintű teljesítményt és támogatást nyújt az alkalmazások széles skálájához. A rendszert az éghajlatváltozás, a katasztrófamegelőzés és az orvostudomány területén végzett kutatásokra használják.

Az egyedülálló vízhűtő rendszer csökkenti a berendezés meghibásodásának valószínűségét és csökkenti az általános energiafogyasztást. Az energiamegtakarítás a rendkívül hatékony berendezések, a hő- és villamosenergia-termelő rendszer, valamint a napelemek sora révén érhető el. Ezenkívül a hűtőből származó szennyvíz újrafelhasználásának mechanizmusa csökkenti a környezetre gyakorolt ​​negatív hatást.

Az épület, amelyben a K Computer található, földrengésálló, és a japán léptékben (0-7) 6-os vagy annál nagyobb földrengéseknek is ellenáll. A berendezési állványok és kábelek hatékonyabb elhelyezése érdekében az 50 × 60 m méretű harmadik emelet teherhordó oszlopoktól teljesen mentes. A modern építési technológiák lehetővé tették, hogy elfogadható terhelési szintet (1 t/m2-ig) biztosítsanak a 1,5 tonnát is elérő állványok beépítéséhez.

SEQUOIA SZUPERSZÁMÍTÓGÉP

A Lawrence Livermore Nemzeti Laboratóriumban telepített Sequoia szuperszámítógép. Lawrence teljesítménye 16,32 Pflop, és a második helyen áll a rangsorban (lásd a 2. ábrát).

Ezt az IBM által a Blue Gene/Q-n alapuló petaflop szuperszámítógépet az Egyesült Államok Nemzeti Nukleáris Biztonsági Hivatala (NNSA) számára hozták létre az Advanced Simulation and Computing program részeként.

A rendszer 96 rackből és 98 304 számítási csomópontból áll (rackenként 1024 csomópont). Mindegyik csomópont 16 magos PowerPC A2 processzort és 16 GB DDR3 RAM-ot tartalmaz. Összesen 1 572 864 processzormagot és 1,6 PB memóriát használnak. A csomópontok az „ötdimenziós tórusz” topológiájának megfelelően kapcsolódnak egymáshoz. A rendszer által elfoglalt terület 280 m2. A teljes energiafogyasztás 7,9 MW.

A Sequoia szuperszámítógép volt az első a világon, amely több mint 10 Pflop számítási teljesítményt igénylő tudományos számításokat végzett. Így a HACC kozmológiai szimulációs rendszer körülbelül 14 Pflopsot igényelt a 3,6 billió részecske üzemmódban, az emberi szív elektrofiziológiáját szimuláló Cardiod projektkód futtatásakor pedig a teljesítmény elérte a 12 Pflopsot.

TITÁN SZUPERSZÁMÍTÓGÉP

Az amerikai Oak Ridge National Laboratory-ban (ORNL) telepített Titan szuperszámítógépet a világ leggyorsabb szuperszámítógépeként ismerték el. A Linpack benchmark tesztjein a teljesítménye 17,59 Pflops volt.

A Titan hibrid CPU-GPU architektúrát valósít meg (lásd a 3. ábrát). A rendszer 18 688 csomópontból áll, amelyek mindegyike 16 magos AMD Opteron processzorral és Nvidia Tesla K20X grafikus gyorsítóval van felszerelve. Összesen 560 640 processzort használnak. A Titan az ORNL korábban üzemeltetett Jaguar szuperszámítógépének frissítése, és ugyanazokat a szerverszekrényeket foglalja el (404 m2 összterület).

A meglévő áram- és hűtőrendszerek használatának lehetősége körülbelül 20 millió dollárt takarított meg az építkezés során. A szuperszámítógép fogyasztása 8,2 MW, ami 1,2 MW-tal több, mint a Jaguaré, míg a lebegőpontos műveletekben a teljesítménye közel 10-szerese.

A Titán elsősorban anyagtudományi és atomenergetikai, valamint belső égésű motorok hatékonyságának javításával kapcsolatos kutatások elvégzésére szolgál majd. Ezenkívül az éghajlatváltozás modellezésére és a negatív hatások kezelésére irányuló lehetséges stratégiák elemzésére is használják.

A "LEGZÖLD" SZUPERSZÁMÍTÓGÉP

A legnagyobb teljesítményű rendszer azonosítását célzó Top500 besoroláson kívül van egy Green500 minősítés is, amely a „legzöldebb” szuperszámítógépeket ismeri el. Itt az energiahatékonysági mutatót (Mflops/W) vesszük alapul. Jelenleg (a besorolás legújabb kiadása 2012 novembere) a Green500 vezetője a Beacon szuperszámítógép (253. hely a Top500-ban). Energiahatékonysági mutatója 2499 Mflops/W.

A Beacont Intel Xeon Phi 5110P társprocesszorok és Intel Xeon E5-2670 processzorok hajtják, így a csúcsteljesítmény elérheti a 112 200 Gflops-ot 44,9 kW összfogyasztás mellett. A Xeon Phi 5110P társprocesszorok nagy teljesítményt nyújtanak alacsony energiafogyasztás mellett. Mindegyik társprocesszor 1 teraflops teljesítménnyel rendelkezik (dupla pontosság), és akár 8 GB GDDR5 memóriát támogat 320 Gbps sávszélességgel.

A Xeon Phi 5110P passzív hűtőrendszere 225 W TDP-re van besorolva, ami ideális nagy sűrűségű szerverekhez.

EURORA SZUPERSZÁMÍTÓGÉP

2013 februárjában azonban olyan hírek jelentek meg, amelyek szerint a bolognai (Olaszország) székhelyű Eurora szuperszámítógép energiahatékonyságban (3150 Mflops/watt szemben a 2499 Mflops/W-tal) megelőzte a Beacont.

Az Eurorát az Eurotech építette, és 64 csomópontból áll, amelyek mindegyike két Intel Xeon E5-2687W processzort, két Nvidia Tesla K20 GPU-gyorsítót és egyéb hardvert tartalmaz. Egy ilyen csomópont méretei nem haladják meg a laptop méreteit, de teljesítményük 30-szor nagyobb, energiafogyasztásuk pedig 15-ször alacsonyabb.

Az Eurora magas energiahatékonyságát számos technológia alkalmazásával érik el. A vízhűtés adja a legnagyobb hozzájárulást. Így minden szuperszámítógép-csomópont egyfajta szendvics: alul központi berendezés, középen vízhőcserélő, felül pedig egy másik elektronikai egység (lásd 4. ábra).

Ilyen magas eredményeket a jó hővezető képességű anyagok használatának, valamint a kiterjedt hűtőcsatorna-hálózatnak köszönhetünk. Új számítástechnikai modul telepítésekor annak csatornáit kombinálják a hűtőrendszer csatornáival, ami lehetővé teszi a szuperszámítógép konfigurációjának az egyedi igények függvényében történő megváltoztatását. A gyártók szerint a szivárgás veszélye megszűnt.

Az Eurora szuperszámítógép elemeit 48 voltos egyenáramú források táplálják, amelyek bevezetésével csökkent az energiaátalakítások száma. Végül a számítástechnikai berendezésekből eltávolított meleg víz más célokra is felhasználható.

KÖVETKEZTETÉS

A szuperszámítógép-ipar aktívan fejlődik, és egyre több új rekordot állít fel a teljesítmény és az energiahatékonyság terén. Megjegyzendő, hogy ebben az iparágban, mint sehol másutt, napjainkban széles körben alkalmazzák a folyadékhűtést és a 3D-s modellezési technológiákat, mivel a szakemberek előtt áll egy olyan szupererős számítástechnikai rendszer összeállítása, amely képes lenne működőképes. korlátozott térfogat minimális energiaveszteséggel.

Jurij Khomutsky- Az I-Teco projektvezető mérnöke. Kapcsolatba léphet vele: [e-mail védett]. A cikk a „www.AboutDC.ru - Solutions for Data Centers” adatközpontokról szóló internetes portál anyagait használja fel.

Olvasási idő: 2 perc.

Az emberiség mindeddig nem jutott el a Mars szemétdombjaihoz, nem találta fel a fiatalság elixírjét, az autók még nem szárnyalhatnak a föld felett, de több olyan terület is van, ahol még sikerült. A nagy teljesítményű szuperszámítógépek létrehozása pont ilyen terület. A számítógép teljesítményének értékeléséhez meg kell határoznia, hogy melyik kulcsparaméter felelős ezért a jellemzőért. Ez a paraméter a flops - egy érték, amely megmutatja, hogy egy számítógép hány műveletet tud végrehajtani egy másodperc alatt. Big Rating magazinunk ezen érték alapján rangsorolta 2017-ben a világ legerősebb számítógépeit.

Szuperszámítógép teljesítménye - 8,1 Pflop/sec

Ez a számítógép olyan adatokat tárol, amelyek felelősek az Egyesült Államok katonai struktúrájának biztonságáért, és szükség esetén a nukleáris támadásra való felkészültségért is. Két évvel ezelőtt ez a gép volt az egyik legerősebb és legdrágább a világon, mára azonban a Trinity-t újabb készülékek váltották fel. A rendszer, amelyen ez a szuperszámítógép fut, a Cray XC40, aminek köszönhetően a készülék másodpercenként ennyi műveletet tud „végezni”.

Mira

Szuperszámítógép teljesítménye – 8,6 Pflop/sec

A Cray újabb szuperszámítógépet adott ki, a Mirát. Az Egyesült Államok Energiaügyi Minisztériuma elrendelte ennek a gépnek a gyártását, hogy összehangolja munkáját. A Mira tevékenységi területe az ipar és a kutatási potenciál fejlesztése. Ez a szuperszámítógép másodpercenként 8,6 petaflopot képes kiszámítani.

Szuperszámítógép teljesítménye – 10,5 Pflop/sec

Ennek az eszköznek a neve azonnal leírja a teljesítményt, a japán „kei” (K) szó tíz kvadrilliót jelent. Ez a szám szinte pontosan leírja a termelési kapacitását - 10,5 petaflops. Ennek a szuperszámítógépnek a csúcspontja a hűtőrendszere. Vízhűtést alkalmaznak, ami csökkenti az energiatartalékok fogyasztását és csökkenti az összeszerelési sebességet.

Szuperszámítógép teljesítménye – 13,6 Pflop/sec

A Felkelő Nap országából származó Fujitsu cég nem hagyta abba a munkát, miután kiadták a K Computer szuperszámítógépet, azonnal új projektbe kezdtek. Ez a projekt az Oakforest-Pacs szuperszámítógép volt, amely a gépek új generációja (Knights landing generáció) közé tartozik. Fejlesztése a Tokiói Egyetem és a Tsukuba Egyetem megbízásából készült. Az eredeti terv szerint a készülék memóriája 900 TB-os, az Oakforest-Pacs teljesítménye pedig 25 kvadrillió művelet lenne másodpercenként. De a finanszírozás hiánya miatt sok szempontot nem véglegesítettek, így a szuperszámítógép teljesítménye 13,6 petaflop volt másodpercenként.

Cori

Szuperszámítógép teljesítménye – 14 Pflop/sec

A Cori tavaly a hatodik helyen állt a világ legerősebb szuperszámítógépeinek listáján, de a technológiai fejlődés őrült gyorsaságával egy pozíciót veszített. Ez a szuperszámítógép az Egyesült Államokban, a Lawrence Berkeley Nemzeti Laboratóriumban található. A svájci tudósok Cori segítségével 45 qubit-es kvantumszámítógépet tudtak kifejleszteni. Ennek a szuperszámítógépnek a termelési kapacitása 14 petaflop másodpercenként.

Szuperszámítógép teljesítménye – 17,2 Pflop/sec

A világ minden tájáról érkező tudósok régóta egyetértettek abban, hogy a Sequoia a bolygó leggyorsabb szuperszámítógépe. És ez nem csak azért van így, mert olyan számtani számításokat tud végezni, amelyekhez 6,7 milliárd embernek 320 évre lenne szüksége, egy másodperc alatt. A gép mérete valóban lenyűgöző - több mint 390 négyzetmétert foglal el, és 96 állványt tartalmaz. Tizenhatezer billió művelet vagy más szóval 17,2 petaflop ennek a szuperszámítógépnek a termelési kapacitása.

Titán

Szuperszámítógép teljesítménye – 17,6 Pflop/sec

Amellett, hogy a bolygó egyik leggyorsabb szuperszámítógépe, nagyon energiatakarékos is. Az energiahatékonysági mutató 2142,77 megaflop a fogyasztáshoz szükséges energia wattján. Ennek az alacsony fogyasztásnak az oka az Nvidia gyorsító, amely a számítástechnikához szükséges teljesítmény akár 90%-át biztosítja. Ráadásul az Nvidia gyorsítója jelentősen lecsökkentette ennek a szuperszámítógépnek a területét, most már csak 404 négyzetméterre van szüksége.

Szuperszámítógép teljesítménye – 19,6 Pflop/sec

Az eszköz első piacra dobására 2013-ban került sor Svájcban, Lugano városában. Most ennek a szuperszámítógépnek a földrajzi elhelyezkedése a Svájci Nemzeti Szuperszámítógép Központ. A Piz Daint a fenti gépek legjobb tulajdonságainak kombinációja, nagyon magas energiahatékonysággal és nagyon gyors számítási képességgel rendelkezik. Csak egy jellemző hagy sok kívánnivalót maga után - ennek a szuperszámítógépnek a méretei; 28 hatalmas állványt foglal el. A Piz Daint másodpercenként 19,6 petaflop számítási teljesítményre képes.

Szuperszámítógép teljesítménye – 33,9 Pflop/sec

Ennek az eszköznek a romantikus neve Tianhe, ami kínaiul „Tejút”-ot jelent. A Tianhe-2 volt a leggyorsabb számítógép az 500 leggyorsabb és legerősebb szuperszámítógép listáján. 2507 aritmetikai műveletet tud kiszámítani, ami petaflopsban 33,9 Pflops/sec. A számítógép használatának szakterülete az építőipar, az utak építésével és lefektetésével kapcsolatos műveleteket számítja ki. 2013-as első bemutatása óta ez a számítógép nem veszített a listákon elfoglalt helyéről, ami azt bizonyítja, hogy a világ egyik legjobb gépe.

Szuperszámítógép teljesítmény – 93 Pflop/sec

A Sunway TaihuLight a világ leggyorsabb szuperszámítógépe, hatalmas számítási sebessége mellett hatalmas méreteiről is híres - több mint 1000 négyzetméteres területet foglal el. A 2016-os, Németországban lezajlott nemzetközi konferencián ezt a szuperszámítógépet a világ leggyorsabbjának ismerték el, és e tekintetben továbbra sincs komoly versenytársa. Sebessége háromszor nagyobb, mint a Tianhe-2, a legközelebbi szuperszámítógép e tekintetben!

A technológiai fejlődés nem áll meg, kozmikus sebességgel fejlődik, az emberi élet számos területére hatással van, és számos pozitív és negatív oldala van. Különböző típusú technológiák váltak elérhetővé az emberek számára: számítógépek, robotok és műszerek. De minden berendezés fő célja az ember életének leegyszerűsítése; a technológia nem válhat értelmetlen szórakoztatássá, amely csak az idejét vesztegeti.



Ossza meg