Sentieon DNASeq -suorituskyvyn vertailu NVIDIA Clara Parabricksiin
Kirjoittajat: Henry A Gabb, Intel Corporation; Don Freed ja Zhipan Li, Sentieon Inc.
Seuraavan sukupolven sekvensointitekniikat (NGS) ovat vähentäneet merkittävästi kokonaisten genomien ja eksomien sekvensointiin tarvittavia kustannuksia ja aikaa. NGS ja tehokas sekundaarianalyysi ovat tuoneet tarkkuuslääketieteen kliiniseen ympäristöön ja jopa hoitopisteeseen. Sentieon optimoi genomin analytiikkaohjelmistonsa 3. sukupolven Intel® Xeon® Scalable -prosessoreille ja 4. sukupolven Intel Xeon Scalable -prosessorille (aiemmin koodinimeltään Sapphire Rapids). Se on suunniteltu skaalautumaan moniytimisjärjestelmiin luokkansa parhaan suorituskyvyn saavuttamiseksi riippumatta siitä, onko kliininen vaatimus nopea läpimeno (esim. ensiapuosastolla yhden potilaan genomin haittavaikutusten ennustamiseksi) tai korkea suorituskyky (esim. onkologiassa laboratorio analysoimaan useita näytteitä samasta kasvaimesta tai eri potilaista).
Sentieon-ohjelmisto on vektoroitu nykyaikaisille prosessoreille, erityisesti Intel Xeon -prosessoreille, jotta saavutetaan korkea suorituskyky ilman omaa ohjelmointikieliä tai erikoislaitteistoa, mikä eliminoi toimittajan lukkiutumisen ja vähentää ohjelmistokehitys-, käyttöönotto- ja ylläpitokustannuksia. Halusimme verrata Sentieonin suorituskykyä ja tarkkuutta vaihtoehtoihin, kuten NVIDIA Clara Parabricksiin, nähdäksemme, ovatko erikoislaitteet kustannustehokkaita tai jopa tarpeellisia.
Viimeaikaiset suorituskykytiedot ovat saatavilla vertailua varten: NVIDIA Clara Parabricks Germline Pipeline -vertailu AWS:ssä. Tässä artikkelissa raportoidaan seuraavien HG001-testien suorituskyky- ja hintatiedot:
Keskitymme PrecisionFDA Truth Challengen HG001 WGS 30x -testiin. Tätä testiä varten tarjotaan Parabricks vs. Genome Analysis Toolkit (GATK) -suorituskykyvertailu (kuva 1). GATK on standardi, jonka mukaan muunnelmien kutsun tarkkuus arvioidaan, mutta se on kirjoitettu Java-kielellä, joten se ei ole suorituskyvyn kultainen standardi. Illinoisin yliopisto ja Mayo Clinic ovat jo todenneet, että Sentieon ylittää huomattavasti GATK:n ilman tarkkuuden menetystä: Sentieon DNASeq Variant Calling Workflow osoittaa vahvaa laskennallista suorituskykyä ja tarkkuutta. Siksi emme vaivaudu GATK-vertailuon. Tavoitteenamme on verrata Sentieon-ohjelmistoa (kirjoitettu C++-kielellä ja optimoitu nykyaikaisille vektorisuorittimille) Parabricksiin (kirjoitettu CUDA-kielellä ja optimoitu NVIDIA-grafiikkasuorittimille).
Käytimme kuvan 1 vertailuarvojen kuvausta ja suorituskykytietoja saadaksemme mahdollisimman lähelle Sentieonin ja Parabricksin omenoista omenoihin -suorituskykyvertailua. Kartoimme haplotyyppikutsuttajan, jälkikäsittelyn ja fq2bam-vaiheet kuvasta 1 muunnelman kutsuputken tyypillisiin vaiheisiin (taulukko 1). Karttauksemme perustuu seuraavaan Parabricksin vertailuarvojen kuvaukseen:
"Fq2bam vaihe sisältää bwa-memin ja osia koordinaattien lajittelusta, jälkikäsittely sisältää koordinaattien lajittelun osia, seuraavien kaksoiskappaleiden merkitsemisen tekijä: bqsr. haplotypecaller syötebamiin sovellettu applybqsr-vaihe, joka syötetään sitten muunnelmakutsuvaiheeseen."
Sentieonin vs. Parabricksin kilpailukykyinen suorituskyky useilla eri laskenta-alustoilla on esitetty kuvassa 2 ja taulukossa 2. Alustat ja hinnoittelutiedot näkyvät taulukossa 3. 3. sukupolven Intel Xeon Scalable -prosessorit tarjoavat kilpailukykyiset suorituskyky, ja 4. sukupolven Intel Xeon Scalable -prosessori (aiemmin koodinimeltään Sapphire Rapids) tarjoaa parhaan yleisen suorituskyvyn. Esitys on kuitenkin vain osa tarinaa. Myös genomikohtainen hinta ja virrankulutus on otettava huomioon.
Intel Xeon -prosessorin genomihinta on huomattavasti alhaisempi (1,54 dollaria) verrattuna A100:een (4,59 dollaria) (taulukko 3). Jos 4. sukupolven Intel Xeon Scalable -prosessorilla on samanlainen AWS EC2 -hinnoittelu, genomikohtainen hinta putoaa alle dollariin (2,1635 dollaria/h * 26,8 minuuttia = 0,97 dollaria). On myös syytä huomata, että näissä vertailuissa käytetyt 4. sukupolven Intel Xeon Scalable -prosessorit ovat julkaisua edeltäviä laitteistoja, joten lopputuotteen suorituskyky saattaa parantua.
Virrankulutuksen osalta kaksi Intel Xeon Platinum 8352M -suoritinta c6i.metal -esiintymässä vaativat 370 W, kun taas kahdeksan NVIDIA A100 Tensor Core -suoritinta p4d.24xlarge -esiintymässä vaativat 3 200 W. Parabricksin paras suorituskyky vaatii 8,6-kertaisen tehon ja 3,0-kertaisen hinnan, mutta tarjoaa vain 1,5-kertaisen suorituskyvyn nykyisen sukupolven Intel Xeon 8352M -suorittimeen verrattuna.
Sentieon suoritti suorituskykymittaukset maaliskuussa 2022. Intel® Xeon® 8368 -prosessoripohjainen järjestelmä on kaksikantainen 2,4 GHz Intel Xeon Platinum 8368 -prosessori (152 ydintä, HyperThreading käytössä), 256 Gt DDR4–320-muistia ja 1 Tt Intel 660p ja 2 Tt Intel DC P4510 SSD. Neljännen sukupolven Intel Xeon Scalable -prosessoripohjainen järjestelmä on Intelin esituotantoalusta, jossa on kaksi 4. sukupolven Intel Xeon Scalable -suoritinta (aiemmin koodinimeltään Sapphire Rapids, >40 ydintä, HyperThreading käytössä), Intelin esituotannon BIOS, 256 Gt DDR-muisti (16(1DPC)/16 Gt/4800 MT/s) ja 1 Tt Intel D3-S4610 SSD. Ubuntu Linux 20.04 asennettiin molempiin järjestelmiin. Suorituskyky vaihtelee käytön, kokoonpanon ja muiden tekijöiden mukaan, joten tulokset voivat vaihdella.
Yllä mainittu Parabricks-blogi raportoi muunnelman kutsutarkkuuden (F1-pisteet), joka on verrattavissa GATK:hen. Sentieon on kuitenkin johdonmukainen voittaja Yhdysvaltain elintarvike- ja lääkeviraston hallinnoimassa PrecisionFDA Truth Challengessa (kuva 3). HG001-benchmark tulee tästä haasteesta. Uudemmassa PrecisionFDA Truth Challenge V2:ssa Sentieon kilpaili 19 muuta joukkuetta vastaan ja voitti neljä 12 kategoriasta. Parabricks ei ollut osallistujien joukossa.
Sentieon ei käytä patentoituja ohjelmointikieliä, kuten CUDA, välttäen näin toimittajan lukkiutumisen. Ohjelmisto on kirjoitettu standardilla C++. Se on myös optimoitu hyödyntämään nykyaikaisten prosessorien vektorikäsittelykykyä. Sentieon käyttää algoritmisia parannuksia kalliiden, virtaa kuluttavien laitteistojen sijaan suorituskyvyn saavuttamiseksi. Se tukee ja optimoi kaikkia lyhyen ja pitkän lukuluokan sekvensointialustoja, ja se on johdonmukainen voittaja FDA:n avoimissa haasteissa. Tämä osoittaa, että Intel Xeon Scalable -prosessorien Sentieon on johtava alusta genomin sekundaarianalyysissä.