Сравняване на производителността на Sentieon DNASeq с NVIDIA Clara Parabricks
Автори: Henry A Gabb, Intel Corporation; Дон Фрийд и Жипан Ли, Sentieon Inc.
Технологиите за секвениране от следващо поколение (NGS) значително намалиха разходите и времето, необходими за секвениране на цели геноми и екзоми. NGS и ефективният вторичен анализ доведоха прецизната медицина до клиничните условия и дори до точката на лечение. Sentieon оптимизира своя софтуер за анализ на генома за процесори Intel® Xeon® Scalable от 3-то поколение и процесор Intel Xeon Scalable от 4-то поколение (по-рано с кодово име Sapphire Rapids). Той е проектиран да се мащабира върху многоядрени системи, за да постигне най-доброто в класа си представяне, независимо дали клиничното изискване е бърз обрат (напр. в спешното отделение за прогнозиране на нежелани лекарствени реакции от геном на един пациент) или висока производителност (напр. в онкологията лаборатория за анализиране на множество проби от един и същ тумор или от различни пациенти).
Софтуерът Sentieon е векторизиран за модерни процесори, по-специално процесори Intel Xeon, за постигане на висока производителност без собствени езици за програмиране или специализиран хардуер, което елиминира привързването към доставчика и намалява разходите за разработка, внедряване и поддръжка на софтуер. Искахме да сравним производителността и точността на Sentieon с алтернативи, като NVIDIA Clara Parabricks, за да видим дали специализираният хардуер е рентабилен или дори необходим.
Последните данни за производителността са налични за сравнение: Сравнителен анализ на NVIDIA Clara Parabricks Germline Pipeline на AWS. Тази статия докладва данни за ефективността и разходите за следните тестове HG001:
Ще се съсредоточим върху теста HG001 WGS 30x от PrecisionFDA Truth Challenge. За този тест е предоставено сравнение на производителността на Parabricks срещу Инструментариум за анализ на генома (GATK) (Фигура 1). GATK е стандартът, по който се оценява точността на извикване на варианти, но е написан на Java, така че не е златният стандарт за производителност. Университетът на Илинойс и клиниката Mayo вече установиха, че Sentieon значително превъзхожда GATK без загуба на точност: Sentieon DNASeq Variant Calling Workflow демонстрира силна изчислителна производителност и точност. Затова няма да се занимаваме с GATK сравнение. Нашата цел е да сравним софтуера Sentieon (написан на C++ и оптимизиран за съвременни векторни процесори) с Parabricks (написан на CUDA и оптимизиран за NVIDIA GPU).
Използвахме описанието на бенчмарка и данните за производителността от Фигура 1, за да се доближим възможно най-близо до сравнението на производителността между ябълки на Sentieon и Parabricks. Съпоставихме стъпките на извикващия хаплотип, последващата обработка и fq2bam от Фигура 1 към типичните етапи на тръбопровода за извикване на варианти (Таблица 1). Нашето картографиране се основава на следното описание от показателите на Parabricks:
„Стъпката fq2bam включва bwa-mem и части от сортиране на координати, последваща обработка включва части от сортиране на координати, последвано маркиране на дубликати от bqsr. haplotypecaller стъпката applybqsr, приложена към входния bam, който след това се подава към стъпката за извикване на вариант.“
Успоредното конкурентно представяне на Sentieon срещу Parabricks на различни изчислителни платформи е показано на Фигура 2 и Таблица 2. Платформите и подробностите за ценообразуването са показани в Таблица 3. Процесорите Intel Xeon Scalable от 3-то поколение осигуряват конкурентоспособност производителност, като процесорът Intel Xeon Scalable от 4-то поколение (по-рано с кодово име Sapphire Rapids) дава най-добра цялостна производителност. Изпълнението обаче е само част от историята. Цената на геном и консумацията на енергия също трябва да се вземат предвид.
Цената на геном е значително по-ниска за процесора Intel Xeon ($1,54) в сравнение с A100 ($4,59) (Таблица 3). Ако процесорът Intel Xeon Scalable от 4-то поколение има подобна цена на AWS EC2, цената на геном пада до по-малко от долар ($2,1635/ч * 26,8 минути = $0,97). Също така си струва да се отбележи, че процесорите Intel Xeon Scalable от 4-то поколение, използвани в тези бенчмаркове, са предварителен хардуер, така че производителността на крайния продукт може да се подобри.
По отношение на консумацията на енергия, двата процесора Intel Xeon Platinum 8352M в инстанцията c6i.metal изискват 370 W, докато осемте процесора NVIDIA A100 Tensor Core в инстанцията p4d.24xlarge изискват 3200 W. Най-добрата производителност на Parabricks изисква 8,6 пъти повече мощност и 3,0 пъти по-висока цена, но осигурява само 1,5 пъти по-висока производителност от текущото поколение процесор Intel Xeon 8352M.
Измерванията на производителността бяха извършени от Sentieon през март 2022 г. Системата, базирана на процесор Intel® Xeon® 8368, е процесор Intel Xeon Platinum 8368 с два гнезда на 2,4 GHz (152 ядра, активиран HyperThreading), 256 GB DDR4–3200 памет, и 1 TB Intel 660p и 2 TB Intel DC P4510 SSD. Системата, базирана на 4-то поколение Intel Xeon Scalable процесор, е предпроизводствена платформа на Intel с два процесора Intel Xeon Scalable от 4-то поколение (по-рано с кодово име Sapphire Rapids, >40 ядра, активиран HyperThreading), Intel предпроизводствен BIOS, 256 GB DDR памет (16(1DPC)/16 GB/4800 MT/s) и 1 TB Intel D3-S4610 SSD. Ubuntu Linux 20.04 беше инсталиран и на двете системи. Производителността варира в зависимост от употребата, конфигурацията и други фактори, така че резултатите може да варират.
Блогът Parabricks, цитиран по-горе, съобщава за вариантна точност на извикване (резултати F1), сравнима с GATK. Sentieon обаче е последователен победител в предизвикателството за истината на PrecisionFDA, администрирано от Администрацията по храните и лекарствата на САЩ (Фигура 3). Бенчмаркът HG001 идва от това предизвикателство. В по-скорошното PrecisionFDA Truth Challenge V2, Sentieon се състезава срещу 19 други отбора и спечели четири от 12-те категории. Parabricks не беше сред записите.
Sentieon не използва собствени езици за програмиране като CUDA, като по този начин избягва блокирането на доставчика. Софтуерът е написан на стандартен C++. Освен това е оптимизиран да се възползва от възможностите за векторна обработка на съвременните процесори. Sentieon използва алгоритмични подобрения, а не скъп, енергоемък хардуер, за да постигне производителност. Той поддържа и оптимизира за всички платформи за секвениране на кратко и дълго четене и е постоянен победител в откритите предизвикателства на FDA. Това демонстрира, че Sentieon на процесорите Intel Xeon Scalable е лидерската платформа за вторичен анализ на генома.