Jeden z nejvíce nepochopených základních technických bodů za poslední desetiletí souvisí se spotřebou energie a s tím, jak různé procesory reagují odlišně na zátěž. Základním předpokladem je, že když je k dispozici dodatečný energetický rozpočet, jednotlivá jádra mohou zvýšit svou frekvenci a napětí, aby se maximalizoval výkon v krátkých časových intervalech, a když je potřeba více jader, mohou se snížit. Zmatek pochází z toho, jak to funguje, spolu s tím, jak TDP souvisí se spotřebou energie. Po několika zajímavých osobních diskusích na Computexu, Intel Fellow Guy Therien, hlavní architekt segmentu Client Performance Segmentation společnosti Intel, souhlasil s tím, že popíše, jak Intel definoval a upravil své vysvětlení TDP a Turbo, a také promluví s novým Intel Performance Maximizerem. nástroj pro přetaktování. Zabýváme se také přístupem Intelu k trhu nadšenců.
Abych to uvedl na pravou míru: Mám na Computexu mnoho konverzací, které jsou mimo záznam, mimo oblast prezentace příslušné společnosti. Mohou to být neformální chaty s mými přímými PR kontakty, o nadcházejících podrobnostech nebo zpětné vazbě na tiskové aktivity, nebo to mohou být hlubší zákulisní rozhovory s inženýry. To je normální způsob – většina z toho, co nakonec uděláme na veletrhu, se nikdy nedostane k publikaci, ale pomáhá nám při poskytování budoucího obsahu tím, že rozumíme plánování, procesu a konceptu, i když nemůžeme podávat přímé zprávy. Události. Vždy bylo mým cílem jít za černou skříňku toho, jak tyto společnosti fungují, abych porozuměl vnitřnímu jednání a fungování, i když jen proto, abych porozuměl tomu, jak jsou přijímána rozhodnutí a jakým směrem se lze dále ubírat.
Několik z těchto chatů se letos na Computexu uskutečnilo s Intelem, většinou kolem jeho demonstrací o jeho nových 10nm procesorech Ice Lake '10th Gen Core', stejně jako Core i9-9900KS a novém nástroji Intel pro automatické přetaktování Performance Maximizer. Teď v listopadu, když jsem zveřejnil hluboký ponor do toho, proč mohou být hodnoty TDP a turbo Intelu pro většinu uživatelů poněkud zavádějící, oslovil mě tehdy kolega Intel Therien, aby mi pomohl objasnit několik věcí. Měli jsme několik neshod ohledně interpretace hodnot a tato diskuse se znovu objevila na základě oznámení společnosti Intel Computex. Guy a já jsme měli několik hlubokých zajímavých diskusí, z nichž některé byly čistě z filozofického hlediska uživatelské zkušenosti.
Na základě těchto diskusí mě Intel pozval, abych si s Guyem promluvil o řadě těchto bodů, které by mi pomohly s objasněním. Pro pořádek si rád povídám s Guyem – jako každý správný inženýr je přímočarý a věcný a rád vede žhavé debaty o jednotlivých tématech. To neznamená, že jsem na něj šel lehce.
| |
Dr. Ian Cutress hlavní redaktor, AnandTech | Guy Therien společník společnosti Intel |
table>Guy Therien je jedním z těch dlouholetých „životních“ inženýrů Intelu, kteří, jak se zdá, zůstávají desítky let. Ve společnosti je od února 1993, postupně prošel různými rolemi v oblasti inženýrství platforem, až se v lednu 2018 stal firemním kolegou. Je držitelem 25 amerických patentů, téměř výhradně v oblasti stavů výkonu procesorů, správy napájení, tepelného managementu, migrace vláken a přidělení rozpočtu na napájení. Guy byl s Intelem, když přizpůsobil své použití TDP na procesorech, a jedním z jeho posledních projektů bylo zjištění, jak by TDP a turbo měly být implementovány a interpretovány výrobci OEM a partnery základních desek. Protože se nyní nacházíme v situaci, kdy příležitostní uživatelé vidí, že spotřeba energie narušuje toto číslo TDP na krabici, a to i v dlouhém časovém měřítku, je nyní více než jen OEM, kdo potřebuje pochopit, jak Intel definuje své specifikace. Guy v současné době zastává pozici Corporate Fellow a hlavního architekta pro segmentaci výkonnosti ve skupině Client Computing Group společnosti Intel a přispívá k technologickému vedení společnosti Intel.
Komunita
Ian Cutress: Když jsme mluvili na Computexu, jedním z témat, kterých jsme se dotkli, bylo o vztahu Intelu s komunitou nadšenců a o tom, jak se vyvíjel za posledních 10 až 15 let. Prošli jsme starými dobrými časy vysokého výkonu a přetaktování až do současnosti, kdy máme několik generací podobných produktů. Nyní jsme zpět v plné válce na x86 mezi Intelem a AMD. Jak z vašeho pohledu, jakožto hlavního architekta v Intelu, dnes Intel přistupuje ke komunitě v souvislosti se svými produkty?
Guy Therien: Takže víte, že se historicky stala zajímavá věc – měli jsme spoustu produktů napříč celou naší řadou SKU a různí lidé je používali k různým účelům. Ale pak jsme zjistili, že existuje určitá podskupina těch lidí, kterým dnes říkáme overclockeři a nadšenci, kteří chtěli z produktů dostat víc. Jak víte, součástí toho, že jsme velkou korporací, je to, že když vyrábíme miliony a miliony produktů, existují určité požadavky, které musíme prosadit, abychom zajistili, že naši lidé, kteří nejsou nadšenci (tj. většina zákaznické základny Intelu), dostanou to, co očekávají od našich produktů z hlediska výkonu a spolehlivosti, životnosti a podobných věcí.
V důsledku těchto požadavků na kvalitu našich produktů zavádíme určité kontroly a limity na výkon dílů, i když je ve skutečnosti možné dočasně dosáhnout vyššího výkonu. Dnešní nadšenci jsou ochotni riskovat a možná neberou v úvahu výkon opotřebení, který je cílený na běžnou populaci, a tak začali, víte, přetaktovat a upravit chod procesoru mimo standardní ovládací sadu Intel, pomocí ovládací prvky, které jsou mimo provoz samotného procesoru, věci jako BCLK a zvýšení rychlosti paměti a rychlosti hodin. Dlouhou dobu jsme si mysleli "hej, to bude špatné" a opotřebováváme CPU a víte, že existují určité vnitřní obavy ohledně lidí, kteří to dělají. Řekl bych, že za starých časů byla všeobecná úleva, že lidé, kteří to dělali, nějak neopotřebovávali CPU. Ale postupem času došlo k zajímavému přechodu, kdy jsme si uvědomili, že existuje velká část lidí, kteří to opravdu chtějí dělat. Všechny věci se v průběhu času sčítají a vytvářejí tyto produkty.
Takže tato myšlenka se ve skutečnosti zrodila ze snahy zabránit lidem, aby měnili své externí hodiny a řídili tyto ovládací prvky uvnitř procesoru, aby byly v mnoha ohledech jednotnější. Nyní samozřejmě, jak víte, máme vnitřní ovládací prvky a schopnost přetaktování, takže pokud jste ochotni přijmout rizika úpravy výchozího nastavení nad rámec standardních poměrů dodávaných s procesory K SKU, můžete odemknout násobič a nastavit poměry programově a skutečně naprogramovat poměry tak, aby zvýšily jejich výkon. Samozřejmě, že to má někdy nevýhodu, což znamená, že to nebude trvat tak dlouho.
Pokud se tedy možná zamyslíte nad dnešní komunitou nadšenců, jak se náš pohled vyvíjel: od pohledu, že jsme se na ně dívali jako možná výzva pro kvalitu našich produktů, se stal skutečným přínosem. Víte, že vyrábíme spoustu produktů a opravdu chceme, aby jejich maximální schopnost prosvítala, a pak otevřením a přijetím těchto ovládacích prvků veřejným způsobem jsme byli schopni poskytnout další výkon lidem, kteří to opravdu potřebují. to nebo to chtít.
Ian Cutress: Takže jsme v posledních letech nechali Intel udělat spoustu propagačních materiálů s ohledem na nadšence. Jaký je podle vás současný stav vztahů s nadšenci uvnitř Intelu? Jak se dnes Intel dívá na nadšence? Jak silná je snaha protlačit výkonný hardware do rukou těchto nadšenců?
Guy Therien: No jistě, dav nadšenců je významným středem zájmu, po kterém jdeme – slyšeli jste o našem úsilí pro tvůrce PC a celá naše řada K SKU je zaměřena na oba ty lidi, kteří jsou nadšenci, kteří jsou spotřebiteli, ale také tím, co byste mohli nazvat profesionálními nadšenci, kteří ve svém podnikání skutečně potřebují dosáhnout každého výkonu. Takže dnes jsme plně pozadu za nadšenci s produkty pro přetaktování a neustále do našich produktů zasouváme další knoflíky pro přetaktování. To je stejně jako maximalizace výkonu, který jste viděli u 9900K a 9900KS, čemu říkáme „tenké“ věci, ve skutečnosti v některých případech víte, že se prostřednictvím aukčního procesu prodávají specializované díly nebo díly s nižším objemem. lidé, aby získali více výkonu z procesorů s nejvyšším počtem jader. Je to tedy velmi silné a přímé uznání zaměření, které se klade a snaží se vyrábět produkty, které uspokojí potřeby nadšenců tím, že jim porozumíme a vymyslíme produkty s tenkým košem, které je podpoří.
Ian Cutress: Řekli byste tedy, že Intel přistupuje k nadšencům a overclockerům jako k různým skupinám?
Guy Therien: Existují lidé, kterým říkáme overclockeři, kteří jsou lidmi, kteří budou spouštět a pracovat mimo specifikaci. Přijímáme nestandardní [provoz], pokud s tím přijmete související rizika. Naopak nadšenci jsou lidé, kteří potřebují výkon, a my se snažíme pro nadšence maximalizovat výkon „ve specifikaci“. Určitě existuje silný crossover a existují nadšenci ochotní přijmout rizika přetaktování, takže mezi nimi rozhodně existuje směs. Zaměřujeme se však také na operace „in-spec“ a také na schopnost jít mimo specifikace. Osobně se snažím maximalizovat výkon „ve specifikaci“, jako je i9-9900KS, jako W-3175X, ale můžete jít mimo specifikace a získat ještě více.
Intel Performance Maximizer
Ian Cutress: Jedna z věcí, o kterých jsme na Computexu diskutovali, se týkala nového nástroje Intel Performance Maximizer a schopnosti vyjít ze specifikací výkon. Tento nový nástroj restartuje počítač do vlastního režimu UEFI, otestuje procesor a zajistí přetaktování. Intel jej chce zpřístupnit lidem, kteří nemusí být nutně v pořádku s tím, jak tyto nástroje pro přetaktování fungují. Vím, že jste v souvislosti s tímto nástrojem udělali spoustu práce – můžete mi promluvit o tom, jak interně přemýšlela o tom, jak se Intel posunul od přístupu „zůstat ve specifikaci“ k navrhování předchozího nástroje Intel XTU až k současnému Nástroj Intel Performance Maximizer (IPM) a skupiny lidí, na které je zaměřen?
Guy Therien: Abych to trochu přiblížil. Moje historie je v softwaru a pak jsem se přeorientoval na správu napájení a nakonec na interakce mezi procesorem a operačním systémem, abych řídil funkce procesoru, takže jsem byl jedním z lidí odpovědných za Speed Step a mým projektem byl také hardwarový P-states. Postupem času jsem při pohledu na vylepšení turba začal zkoumat, co bychom mohli udělat navíc. Tehdy jsem začal zkoumat, jak ne všechna jádra v balení jsou vytvořena stejně, a začal jsem zkoumat, jak některá jádra mají stejné napětí, ale při tomto napětí poskytují vyšší frekvenci. To nakonec vedlo k Turbo Boost Max, ale cestou jsem se musel naučit hodně o výrobě a spolehlivosti. To nakonec jednoho dne vedlo k diskusím se společnostmi, které přetaktují obchodní systémy – kupují si od nás procesory a sami je testují a absorbují záruku a své systémy prodávají zákazníkům finančních služeb a podporují je.
Takže přes všechno to úsilí jsme také narazili na zajímavý problém, který se odehrával na straně serveru. Když prodáváme naše díly, s ohledem na naše interní nástroje provádíme modelování, abychom určili, jak dlouho se očekává, že vydrží. Existuje matematický výraz opotřebení, který je naší specifikací. Tato specifikace je založena na předpokládaném opotřebení CPU a na tom, jak dlouho si myslíme, že typické díly nebo nejhorší případ (nebo nejpoužívanější) díly stráví v turbu. Naše interní datové listy specifikují procento dílů, které mají vydržet určitou dobu při jaké pracovní zátěži. Naši uživatelé to tedy chápou, koupí si naše díly (hovoříme o opravdu špičkových serverech) a řeknou, že chápou, že existuje limit, jak dlouho vydrží, když se používají za podmínek Intel specifikoval – ale že jej za těchto podmínek nebude používat. Ptají se nás, že když to dají do turba a nechají v turbu, 24 hodin denně, 7 dní v týdnu, jak dlouho to vydrží? Dívají se na nás, chápou, co prodáváme a za jakou cenu, ale ptají se nás, jak dlouho naše produkty vydrží v jejich specifických podmínkách. Když se to poprvé začalo dít, řekli jsme, že nevíme, ale zkusíme to zjistit.
Proběhlo tedy úsilí pokusit se změřit opotřebení těchto systémů. Jen pro upřesnění, všechny systémy se pomalu opotřebovávají a zpomalují / v průběhu času potřebují vyšší napětí pro stejnou frekvenci. To, co děláme, stejně jako všichni v tomto odvětví, je přidat určité napětí, rezervu opotřebení, abychom zajistili, že díl bude nadále fungovat podle specifikací po určitou dobu životnosti dílu. Můžete tedy měřit, jaké napětí potřebují díly, když se časem opotřebují, a doufejme, že zjistíte, kdy se díly opotřebují (pokud se vůbec opotřebují, protože některé se neopotřebují vůbec). Chtěli vědět, jestli to můžeme posoudit offline a dát jim ukazatel, kdy se součástka opotřebuje. Ukázalo se, že o to bylo vynaloženo dlouhé úsilí. Vzhledem k tomu, že dostupnost serveru musí být až 99,999 % času, projekt byl nakonec neúspěšný. Měli jsme falešně pozitivní a falešně negativní a nedokázali jsme jim přesně říct, kdy se která konkrétní část opotřebí, a když jsme jim řekli, že se neopotřebí, nakonec se to stalo. Tak to je velmi obtížný úkol, že? Dozvěděl jsem se tedy o tomto úsilí a jedním z odhalení, které tým měl, bylo, aby zlepšili svou přesnost, nemohli přijímat opatření, když byl operační systém spuštěn, kvůli variabilitě způsobené OS kvůli přerušením a dalšímu pozadí. procesy, takže se naučili provádět měření v prostředí offline mimo OS.
Došli jsme tedy k tomuto závěru a podívali jsme se na spoustu dalších nástrojů, které tvrdily, že mají funkce automatického přetaktování a funkce automatického ladění. Mnoho z těchto nástrojů nebylo příliš úspěšných, hlavně kvůli variabilitě běhového prostředí uvnitř OS a také proto, že často naklánějí věci na maximum, což časem kvůli opotřebení znamená, že nastavení nejsou použitelná / nepoužitelná už nefunguje. Tyto nástroje se nikdy nevrátí a znovu nevyhodnotí situaci, aby zjistily, zda by neměly trochu ustoupit, nebo přidat trochu více napětí nebo tak něco, aby udržely systém v provozu. Takže bez skutečných dat, která říkala, že mnoho lidí, kteří si kupují nejlepší CPU, nepřetaktuje, jsme měli podezření, že je to skutečně pravda. Předpokládali jsme, že velká část těchto zákazníků, kteří si kupují naše produkty nejvyšší třídy, chce maximální výkon, ale nepřehánějí, i když mají možnost s K SKU. Myšlenka tedy byla, když jsme se podívali na to, co můžeme dělat ručně pomocí komplikovaných nástrojů, jako je XTU nebo BIOS, kde musíte upravit mnoho parametrů, aby se přetaktovalo, zjistili jsme, že vnitřní kapacita většiny procesorů byla v průměru výrazně nad specifikací. Není to tak, že by to byla jedna nebo dvě přihrádky nad specifikací, často to byly čtyři nebo pět přihrádek. Takže jsme si řekli, že bychom měli lidem, kteří si koupí to nejlepší, poskytnout způsob, jak získat trochu vyšší výkon z dílu, který si koupili.
Nyní, protože existuje určitá variabilita v částech a mezi miliony částí, které vytváříme, jsou některé, které jsou mnohem mnohem lepší než jiné, pokud jde o jejich maximální schopnosti. Ale určitě většina z nich, lví podíl, dokáže dosáhnout alespoň několika binů (1 bin = 100 MHz) nad specifikací bez velkého rizika pro každodenní provoz.
Výsledkem toho všeho bylo, že jsme se zamysleli nad tím, proč lidé, kteří si kupují špičkové procesory, procesory K, nepřetaktují. Protože to může být trochu děsivé, že? Se všemi těmito nastaveními, jako je zvýšení proudových limitů, zvýšení napětí, změna výkonu a jak všechna tato nastavení interagují, a co přetaktování paměti a tak dále. Zvolili jsme tedy pro uživatele jednodušší přístup a zaměřili jsme se pouze na poměrové přetaktování, což koncovému uživateli poskytuje způsob, který je pro koncového uživatele snadný na pár kliknutí s naším novým nástrojem Intel Performance Maximizer (IPM). Pokud uživatel přijme podmínky [používání], stane se to velmi snadným zážitkem. Takže pro mnoho lidí, kteří si koupili ty nejlepší díly, je nyní docela snadné získat trochu vyšší výkon, až o 10-15%, což bude záviset na kvalitě procesoru, ale to je cesta k tomu.
Tento nástroj IPM je v konečném důsledku zaměřen na každého, kdo si kupuje procesor K a je spokojený s tím, že přijímá malé množství rizika při provádění mimo specifikaci výměnou za vyšší výkon z produktu, který si již zakoupil.
Ian Cutress: Jaký je postoj Intelu k přetaktování na laptopech ve srovnání se stolními počítači a pracovními stanicemi? Nebo jsou tyto druhy zařízení interně vnímány jako nezávislé pro typy uživatelů, kteří by mohli mít zájem o maximalizaci výkonu svého hardwaru v různých segmentech trhu.
Guy Therien: Bez ohledu na zařízení, pokud kupujete špičkovou SKU, která je odemčená, chceme těmto lidem dát vědět, že mohou získat o něco vyšší výkon v jednoduchém a jednoduchým způsobem s nástrojem IPM ve stolních procesorech, pokud přijímají riziko.
Ian Cutress: Zmínil jste další nástroje pro přetaktování, které již existují, a že Intel je jedinečný v tom, že máte možnost optimalizovat přetaktování mimo operační systém. Vidíme nástroje od společností jako Asus, MSI, ASRock a dalších hlavních partnerů Intelu, kteří vytvářeli nástroje po většinu posledních 10 let. Co může IPM přinést ke stolu, co tito kluci nemohou?
Kluk Therien: Takže první je jednoduchost a snadné použití. Jsme přesvědčeni, že mnoho nástrojů, které jsou k dispozici, je pro většinu uživatelů ohromující a že existuje jen malá část uživatelů, kteří jsou ochotni se pokusit porozumět a naučit se všechny nuance nástrojů.
Druhou je úroveň spolehlivosti, která přichází s tím, že netlačíte až na okraj a máte určité rezervy. IPM vybere o 100 MHz nižší, než je špičková procházející frekvence. Je to nástroj, který uživatelům umožňuje nepřetržitě pracovat bez obav tím, že tlačí přetaktování příliš vysoko. S IPM věříme, že je určitě stabilnější než ostatní nástroje – přinášíme úroveň spolehlivosti, kterou jiné nástroje nemají, přidáváním marží a netlačíme to až na limity jednotlivých procesorů.
Další funkcí IPM je, že když se použijí další nástroje, nastavují řadu parametrů, jako je frekvence a napětí, a pak to projdou zátěžovým testem, aby se zjistilo, zda to funguje. Pokud se zasekne, ustoupí a zkusí to znovu, pak ustoupí a zkusí to znovu, a kdo ví, jaké individuální možnosti má uživatel na úrovni zátěžového testu. Myslím tím jistě, že v aplikacích třetích stran vždy docházelo k nějakému automatickému ladění, ale vždy se to týká zátěžového testu – někteří uživatelé říkají, že Prime95 je dobrý zátěžový test, ale z naší strany plotu musíme pokrýt široký rozsah napětí pro všechny věci, které by se mohly pokazit při zvýšení rychlosti nad spec. IPM má tedy speciální sadu testů, které spouští a které jsme interně navrhli, abychom zajistili to, co považujeme za dobrou sadu pokrytí pro všechny rohové případy v celém systému, které mohou být ovlivněny vysokou frekvencí, jako jsou kritické a nekritické výpočetní cesty. Díky našemu intenzivnímu testování a dodatečné rezervě, kterou poskytujeme, tedy víte, že systém by měl mít velmi vysoký výkon s dobrou mírou stability. Protože známe procesor jako my, nikdo jiný se nemůže rovnat tomu, jak testujeme.
TDP a Turbo: Co znamenají a jak bychom měli testovat
Ian Cutress: IPM je zaměřeno na lidi, kteří chtějí přetaktovat nebo ze svého procesoru dostat maximum. Ale většina nadšenců chce používat standardní procesor a stále mít nejlepší výkon – v tomto ohledu se spoléhají na specifikace, jako je hodnocení TDP společnosti Intel a frekvence turba. Můžete vysvětlit vztah Intelu k tomu, jak definuje TDP a Turbo, a důvody, proč za těmito definicemi stojí?
Guy Therien: Před několika lety jsem byl zodpovědný za vyladění jazyka, abychom se ujistili, že v celé korporaci máme popisné termíny pro to, co je TDP a co je Turbo. To bylo založeno na tom, že se řada lidí sešla a hovořila o tom, jak jsme testovali naše díly a co jsme vlastně prosazovali z hlediska TDP.
TDP je průměrná ztráta energie při maximální provozní teplotě spoje, uvedené v technickém listu Intel pro daný procesor, pro který je procesor ověřován během výroby a při provádění souvisejícího vysoce složitého pracovního zatížení specifikovaného Intelem na dané frekvenci. To znamená, že když uvedeme základní frekvenci, myslíme na prostředí nejhoršího případu a vysoce komplexní pracovní zátěž ve skutečném světě, kterou by uživatel vložil na platformu – když součást běží při určité teplotě, slibujeme, že každá součást dosáhnete této základní frekvence v rámci výkonu TDP. Takže to je ono – umožňuje našim zákazníkům, našim zákazníkům ODM a výrobcům vědět, jakou tepelnou kapacitu a schopnost dodávky energie implementovat do svých systémů, aby získali základní frekvenci, kterou můžeme historicky nazývat naše „označená“ frekvence.
Pro tuto referenční zátěž – musíme se také vypořádat se složitostí této pracovní zátěže. Pokud vezmete dvě pracovní zátěže, jako je jednoduchá 100% 'žádná práce, ale držte vše napájené' spinovou smyčkou, která způsobuje turbo, a 100% komplexní zátěž, rozdíl ve spotřebě energie mezi těmito dvěma může být mnoho 10 s wattů. Pokud definujeme power virus jako něco, co způsobí, že každý tranzistor a každá brána přepínají na každých hodinách, pak to považujeme za absolutně nejhorší případ power virus – naše pracovní zátěž TDP taková není. TDP definujeme s pracovní zátěží, která je procentem toho nejhoršího scénáře (vysoké procento, ale ne 100 %), protože v podmínkách reálného světa se jen zřídka přiblížíte k absolutně nejhoršímu případu power viru (dokonce i při vykreslování videa). Toto procento se může změnit na základě generace procesoru, na základě schopností každého procesoru, s jakou pravděpodobností budou různé části procesoru pravděpodobně používány, jak se vyvíjejí pracovní zátěže. Můžeme upravit naši pracovní zátěž tak, aby odpovídala kdekoli, od základní rotace až po power virus a všechny mezi nimi, nebo dokonce dvě sady zátěží současně. Musíme provést veškerou tuto analýzu, abychom se pokusili zjistit, co si myslíme, že v kterékoli generaci je typický nejhorší případ pracovní zátěže, zejména se všemi softwarovými aplikacemi. Například herní streamer může mít 87 % naší očekávané zátěže nebo něco podobného, takže může využít nižší spotřebu energie na základní frekvenci nebo dostat frekvenci nad základní do turbo rozsahu – možná i maximální turbo frekvence pro dlouhé časové období.
Je zde také přirozená variabilita výroby dílů. Některý křemík má větší štěstí než jiný křemík. Pamatujte, že když specifikujeme TDP, platí to pro všechny díly, které kdy koupíte. Takže pokud jste OEM a kupujete milion CPU, udáváme, že každá součást, kterou koupíte, nepřekročí naše hodnocení. Ale kvůli variabilitě výroby se často díly, které dostanete, často ani zdaleka neblíží tomu nejhoršímu scénáři. Někdy vyrábíme díly do konkrétní přihrádky a někdy díly vykládáme z důvodů, jako je poptávka nebo požadavky. To je důvod, proč existují společnosti třetích stran, které přicházejí, kupují spoustu dílů, testují je, zjišťují, které fungují nejlépe, a prodávají nejrychlejší díly. Pro ně je to jen využití přirozených výrobních variací.
Ian Cutress: Slyšel jsem tedy, že až Intel vydá nový díl, potřeboval bych 10+ vzorků, abych si mohl variabilitu ověřit sám?
Guy Therien: Pokud jde o tiskové ukázky, nejsem za to zodpovědný! (smích) Ale v Intelu můžeme říci, že postupem času, jak vytváříme více procesorů, rozumíme a zlepšujeme výrobní proces. Můžeme se podívat na únik procesoru a zjistit, kde je v plánovaném rozsahu všech milionů dílů, které jsme vyrobili. Naše data jsou obvykle opravdu těsná, i když zpočátku mohou existovat nějaké předpovědi, protože část se stává zralejší. S některými ranými díly, zejména věcmi, jako jsou technické vzorky, které se stejně neprodávají koncovým uživatelům, proces stále ladíme a připravujeme. Ale když jsme připraveni poskytnout CPU k tisku ke kontrole, jsou stejné jako maloobchodní CPU, protože nechceme zkreslovat trh.
Ian Cutress: Jedna z věcí, o kterých jsme mluvili v minulosti, souvisí s tím, jak funguje TDP a turbo a jak fungují turbo rozpočty. Mým argumentem je, že obecnému lidu není nutně jasné, jak Intel koreluje tyto hodnoty s masami. Zajímalo by mě, jestli jste ochotni nám poskytnout rychlý přehled.
Guy Therien: Jasně. Obecná koncepce je tedy taková, že máme frekvenční limity – kdykoli je aktivní jádro, takže každý CPU má jedno nebo dvoujádrovou turbo frekvenci, kterou zveřejňujeme. Kromě toho, v závislosti na počtu aktivních jader, máme maximální limit na frekvenci. Ale pro tento systémový limit je to frekvenční limit a to, co ve skutečnosti děláme, je vynucování TDP. TDP je průměrný výkon, který se vynucuje v průběhu času. To je důležité – není to jen ojedinělá hodnota. V důsledku toho turbo ve skutečnosti řídí výkon spíše než frekvenci.
V rámci procesoru definujeme limit výkonu, který nazýváme limit výkonu 2 (PL2), ve srovnání s TDP, což je limit výkonu 1 (PL1). V procesoru je spuštěn algoritmus, který zajišťuje, že TDP je po určitou dobu vynuceno jako průměrný výkon. Algoritmus není jednoduchý klouzavý průměr, ale je to exponenciální vážený klouzavý průměr, což znamená, že nejvíce záleží na nejnovější spotřebě energie – je to standardní algoritmus.
To ale znamená, že pokud jste nějakou dobu nečinní, máte stanovený rozpočet na energii. Procesor může využívat energii až do svého limitu výkonu PL2 a limitu frekvence, dokud nevyčerpá rozpočet, a poté se procesor přesune tak, aby dosáhl hodnoty průměrného výkonu PL1/TDP. Je to jako vana, která se naplní vodou – pokud ji vypustíte, můžete vypustit jen tolik, než bude muset být znovu napuštěna.
Tento limit PL2 a energetický rozpočet lze konfigurovat. Ve skutečnosti na všech klientských částech můžete nakonfigurovat jak dobu, po kterou je vynuceno TDP, tak i výšku limitu výkonu, na který můžete prasknout. Pamatujete si, že jste mluvili o složitosti pracovní zátěže? Ukazuje se, že pokud spustíte jednoduchou pracovní zátěž, můžete získat veškerou možnou turbo frekvenci, ale protože pracovní zátěž je nízká, ve skutečnosti tolik nevyčerpáte energetický rozpočet a můžete turbo při tak vysoké frekvenci delší. Je to energetický rozpočet, který je nakonec prosazován. Ale složitější pracovní zátěž může prasknout úplně nahoru, zasáhnout PL2 a velmi rychle vyčerpat velkou část tohoto rozpočtu, takže jste najednou bez rozpočtu. V takovém případě interně snížíme frekvenci, abychom udrželi CPU v rámci dlouhodobého limitu výkonu (PL1 / TDP), dokud nebudete moci znovu získat rozpočet podle výše uvedeného algoritmu.
Pokud tedy vezmeme v úvahu systém v nečinnosti, má rozpočet na plný výkon. Jak se pracovní zátěž dostává na jádra, interní vážené časové algoritmy vás napumpují na nejvyšší frekvenci, pokud je k dispozici pro počet aktivních jader. Pak se podíváme na spotřebovávanou energii, a pokud je nižší než váš limit výkonu PL2, jste dobří. Takže pokračujeme v této frekvenci. Algoritmus exponenciálního váženého klouzavého průměru začne počítat a vidí výkon, který je rozptylován/udržován. Potom se po čase dívá na čas, po který potřebuje vynutit průměrnou sílu, kterou nazýváme Tau (τ). Když je dosaženo Tau, algoritmus se spustí a zjistí, zda potřebuje snížit spotřebu energie, aby mohl zasáhnout a zůstat v limitu TDP. To znamená, že dostanete nápor výkonu dopředu. Po vyčerpání tohoto výkonu, tohoto energetického rozpočtu, začne procesor interně snižovat výkon snížením frekvence, aby bylo zajištěno, že TDP bude vynuceno po dobu, po kterou je nakonfigurován. Tau je tedy časová osa, ve které je TDP vynuceno algoritmem.
Jak PL2, tak Tau jsou konfigurovatelné OEM a ODM a jsou „ve specifikaci“. Takže máte samozřejmě možnost tyto hodnoty upravit, pokud dodávka energie podporuje vyšší limit výkonu a také pokud má systém tepelnou kapacitu (protože to nedává smysl, pokud se chystáte pouze tepelně škrtit). Výrobci základních desek a ODM tedy investují do svých řešení pro dodávku energie a tepelné energie, aby jim umožnili maximalizovat výkon nebo získat určitou dobu trvání turba bez omezení – v maximální možné míře. V důsledku toho můžete investovat různé částky peněz do dodávky energie, tepelného řešení, tenkosti systému a tak dále – je to schopnost navrhnout něco, co je pro publikum odlišné, a to jak z hlediska tvarového faktoru, tak i výkon.
Je třeba si zapamatovat, že můžete navrhnout systém, který je přehnaný pro mnoho prostředí – nad rámec toho, co je obvykle vyžadováno při běžném používání. Pokud je zátěž aplikována na 65W CPU a 95W CPU a oba se rozběhnou na stejných 200W a skončí před použitím algoritmu řízení turbo, tak se mohou OEM a výrobci odlišit ve svém designu. To znamená, že pokud mají oba procesory stejné nastavení frekvence turba, budou mít v Cinebench stejné skóre, dokonce i s rozdílem 30W TDP. U mobilních systémů jde o omezenou schopnost chlazení systému, kterého se dotýkáte, a o to, že hlava nemusí procházet skrz a být nepříjemná na dotyk. U stolního počítače je možná starost o akustiku nebo teplotu vzduchu odváděného ventilátorem. Ale partner může jasně navrhnout systém tak, aby měl tříminutové turbo okno, během kterého je vynuceno TDP. Takže v závislosti na schopnostech systému máme TDP a pak lze nakonfigurovat související parametry Turbo (PL2 a Tau) tak, aby vyhovovaly schopnostem systému.
Ian Cutress: Jedna z věcí, kterou jsme viděli u dílů, které kontrolujeme, je, že přebíráme základní desky pro spotřebitele nebo pracovní stanice od společností ASUS, ASRock a a implementují své vlastní hodnoty pro tento limit PL2 a také turbo okno – mohou tyto hodnoty posouvat až na maximum, které mohou dosáhnout, jako je (maximální) limit 999 W po dobu 4096 sekund. Zkresluje to podle vašeho názoru způsob, jakým provádíme recenze, protože to nutně znamená, že jim docházejí specifikace definované společností Intel?
Guy Therien: I s těmito hodnotami vám nedochází specifikace, chci velmi jasně říci – běžíte ve specifikaci, ale máte delší dobu trvání turba.
Budeme velmi přesní v naší definici toho, jaký je rozdíl mezi in-spec a out-of-spec. Na našich procesorech je „bit“/příznak přetaktování. Jakákoli změna, která vyžaduje, abyste nastavili tento bit přetaktování, aby bylo přetaktování povoleno, se považuje za operaci mimo specifikace. Pokud tedy výrobce základní desky nechá procesor s jeho běžnými hodnotami turba, ale uvádí, že limit výkonu je 999W, nevyžaduje změnu bitu přetaktování, takže je in-spec.
Ian Cutress: Otázka tedy zní – jak by Intel preferoval, abychom testovali pro recenze?
Guy Therien: Dovolte mi, abych s vámi o tom trochu pohovořil. Pokud se díváte na i9-9900K a jednu z nejlepších základních desek pro přetaktování. Tento výrobce základních desek řekne, že rozlišují, mohli by na VRM umístit bajillion fází, mohli by předpokládat, že budete kapalinou chladit CPU, a tak nastaví své výchozí nastavení na podporu maximálního výkonu. deska se může rozptýlit – i když je to defacto „neomezený“ maximální výkon. Ve skutečnosti to začnou ořezávat, pokud procesor někdy spotřebuje více, než je možné. Umožňují odlišení úpravou schopností desky a poté nastavení, ale stále ve specifikaci, dokud tento bit přetaktování nepřehodíte. Pak možná bude další skupina lidí, kteří nepostaví desku pro přetaktování, ale desku pro herní nadšence nebo firemní systém. Tito uživatelé mohou stále chtít špičkový procesor i7 nebo i9, i když je to procesor K, protože chtějí nejlepší výkon podle specifikace.
Musíte se tedy zeptat, jak budete hodnotit schopnosti procesoru, jako je i9-9900K. Zkontroloval bych to v základní desce shora, něco uprostřed a návrh rozpočtu nebo nejlevnější/nejcennější návrh, abych ukázal, jak to lze nakonfigurovat. Pak můžete říci, že v různých provedeních bude fungovat tak, jak výrobci základních desek navrhli systémy.
Otázka se ale také stává jedním z benchmarků. Něco jako TouchXPRT nebo SYSMark vám poskytne dobrou výdrž, protože zátěž při těchto testech nespotřebovává moc energie. Ale něco jako Cinebench může být klamné, protože s dobrým systémem může potenciálně běžet úplně v nakonfigurovaném turbo burst okně. Když se díváte a měříte něco jako Cinebench, musíte být opatrní. To je jeden z důvodů, proč nejsme zastánci toho, abychom to používali jako relevantní měřítko.
Ian Cutress: Jak tedy Intel spolupracuje se svými partnery na straně notebooku s ohledem na hodnoty turbo a hodnoty turbo okna?
Guy Therien: Je to zajímavá historie, která nemá na růžích ustláno. Zabýval jsem se definicí a vytvořením turba, a tak konkrétně notebooky byly místem, kde jsme se snažili vydolovat veškerý možný výkon, a zjistili jsme, že existuje období, kdy můžeme běžet nad základní frekvenci s turbem. , a přinášejí výhody plného výkonu. Ptali jsme se tedy, na jaké hodnoty by toto turbo mělo být nastaveno. Když jsme se na tento problém před mnoha lety poprvé podívali, podívali jsme se na tyto notebooky a zkoumali jsme, jak jsou tlusté, jak rychle by se teplo šířilo z místa, kde je CPU, nahoru přes klávesnici a opěrku rukou, jaká byla velikost výměníku tepla a podobně. Udělali jsme to kompletní analýzou, protože myšlenkou bylo, že jsme nechtěli říct něco jako ‚tady je frekvence turba, je opravdu vysoká, nikdy ji nedostanete‘. Bylo by hloupé říkat, uvádět čísla, která by mohla být možná jen na desetinu sekundy – chtěli jsme poskytnout data, která byla realistická.
Udělali jsme krok zpět, abychom se podívali na celkový obrázek o tom, jak budeme odvozovat hodnoty turbo. Bylo vynaloženo dlouhé úsilí, abychom se podívali na spoustu pracovních zátěží na křivce složitosti a výkonu, abychom se pokusili pochopit, na co by tyto hodnoty PL2 a Tau měly být nakonfigurovány vzhledem k tomu, jak dlouho by trvalo zahřátí počítače. Tyto hodnoty mohou být vyšší nebo nižší než to, co může ODM považovat za vhodnou teplotu pro opěrku rukou, hluk ventilátoru nebo teplotu výfuku. Takže to bylo vyladěno tak, aby se zajistilo, že období, které jste dostali s turbem, bylo takové, že jste neškrtili plyn. Původní PL2 a Tau byly nastaveny na turbo asi 28 sekund v mobilu.
Zpočátku jsme se bohužel na tento bod rok co rok znovu nezaměřovali, abychom zajistili, že tyto hodnoty budou průběžně aktualizovány podle toho, jak se přistupuje k moderním mobilním designům, což zpětně ovlivnilo optimální implementace. Nyní poskytujeme meziroční aktualizace interních výchozích nastavení, protože stále poskytujeme vyšší výkon za generaci. V budoucnu se budeme ještě více zaměřovat na naše partnery a zákazníky, abychom definovali, jaká by měla být výchozí nastavení, a abychom zajistili, že nedojde k žádnému tepelnému škrcení, ale stále budou moci využívat výhody turba.
Budoucnost
Ian Cutress: Jak vidíte vývoj Intelu, jak bude v budoucnu hlásit TDP a Turbo? Máte nějaké poznatky o tom, jak k tomu Intel přistupuje odsud, o jeho zapojení turba a jak se bude vyvíjet?
Guy Therien: Zaměříme se na poskytování funkcí, které podle nás mohou uživatelé využít. Jak jsme tedy zmínili na keynote Computex, v prostoru HEDT se spoustou jader rozšíříme naše definice Turbo Boost Max na více než jen jedno jádro, na více než jen dvě jádra, jak to bude vhodné. Jak si dokážete představit, jak počet jader narůstá, vyvstává otázka, kdy potřebujete všechna tato jádra a kdy jich potřebujete jen několik a můžete využít prostor navíc.
Je to ale druh toku tam a zpět, zvláště u věcí, jako je hraní her – lví podíl konzolí tvoří osm jader, takže nemusíte nutně vidět hry přesahující osm jader, protože pro ně není příliš využití . Vývojáři her se budou muset rozhodnout, kam vloží své úsilí. Takže jsme viděli to, co byste mohli nazvat sladkým počtem jader pro hraní her, mezi čtyřmi a osmi, a tak vpřed uvidíte, že naše úsilí zaměřujeme na optimalizaci frekvence a výkonu v této oblasti.
Myslím, že jsem se na blogu Intel v jednu chvíli zmínil o tom, že bez ohledu na to, kolik jader lidé potřebují, a poptávka po aplikacích jak využít výhody, tak poskytnout výhody s tolika jádry, provádíme analýzu po celou dobu s respektem na souběžně běžící software, jak se škáluje s počtem jader a tak dále. Pro většinu spotřebitelů jsou tedy prozatím čtyři jádra tou nejpříjemnější, přičemž čtyři až osm pro hraní her. Kromě toho vyžaduje několik věcí spuštěných současně, protože jednotlivé aplikace nemají tendenci se škálovat tak vysoko, pokud nepřejdete na HEDT. Budeme se tedy i nadále zaměřovat na poskytování funkcí, jako je Turbo a Turbo Boost Max, pro sladký spot počet jader, z nichž si myslíme, že lidé mohou mít největší užitek, a samozřejmě se podíváme na to, jak to přesunout do jiných segmentů CPU mimo HEDT. přesčas.
Ian Cutress: Jedna věc, kterou Intel a AMD dělají odlišně, je to, že Intel poskytuje specifické turbo tabulky pro turbo frekvence podle toho, kolik jader je aktivních, zatímco AMD používá přístup více zaměřený na výkon a posiluje jádra podle toho, kolik energie v tabulce zbývá v systému. Vzhledem k tomu, že rozumíte výhodám obou implementací, můžete říci, proč jsou doporučení Intelu lepší než to, co nabízí AMD, nebo poskytnout trochu náhledu na různé přístupy z vašeho pohledu?
Guy Therien: Mohu tedy skutečně mluvit pouze o fungování implementace Intel, ale rád bych upozornil, že naše turbo tabulky jsou spíše o limitech absolutní frekvence – stále existuje energetický rozpočet prvek do rovnice a tyto hodnoty jsou pouze špičkové hodnoty, ale stále je to založeno na výkonu.
Možná se ptáte, proč nenecháme frekvenci „vyplavat“ nahoru nebo frekvenci celého jádra, pokud to výkon dovolí. Toto je diskuse o technikách a neříkám, která je lepší, ale řeknu vám dva důvody, proč naše turbo tabulky existují tak, jak existují.
První se týká situace, kdy máte velkou rozmanitost typů instrukcí, jako je AVX, které mohou být najednou prezentovány na procesoru. Musíte být schopni velmi rychle reagovat na změny v instrukčním mixu procesoru, jinými slovy, na změny ve výkonu, který jádro spotřebovává, aby byl zajištěn nepřetržitý provoz, jinak dojde k poklesu napětí a potenciálně k selhání (v závislosti na na tom, jak blízko je napětí k poruchovému stavu, což souvisí s odběrem energie, pokud se přidá další rezerva). Takže vynucujeme tyto výkonové stavy na hranici vstupu/výstupu stavu C. Nejde o pravidelný průzkum, abychom viděli, co se zde děje, a možná provedli nějaké změny – pokaždé, když jádro změní svůj C-stav, změní se výkon a limity na základě počtu aktivních jader, což zajišťuje spolehlivost. Je v tom určitá vrozená konzervativnost, ale jak víte, kvalita a konzistentní běh jsou králem. Naše turbo tabulky jsou tedy obvykle nastaveny poměrně vysoko a my zajišťujeme, aby instrukce náročné na energii, jako je AVX, reagovaly na jinou sadu pravidel, s ještě dalšími pravidly pro větší instrukce AVX, než jsou standardní. Ale kvůli velkému kolísání výkonu mezi touto jednoduchou smyčkou a nejsložitější zátěží power viru (a/nebo zátěží TDP) existuje konzervatismus, který používáme k zajištění kvality a provozu, a proto je počet jader, které jsou aktivní nárůsty, postupně snižujeme frekvenční limity, což chrání jádro před selháním. Nyní můžete vidět některé z našich produktů, které ve skutečnosti nejdou po schodech, ale ve skutečnosti udržují vše na stejné frekvenci – je to proto, že se jedná o speciální stíněné díly, u kterých víme, že můžeme frekvenci udržet na základě vlastností křemíku ta část. Ale když jich vyrábíte miliony a miliony, naučíte se různé materiálové charakteristiky a my máme zavedeny kontroly, které zajistí spolehlivý provoz všech dílů, které prodáváme.
Druhým důvodem je oddělení SKU. Máme řadu produktů a každý z nich přesně specifikujeme pro dlouhodobou spolehlivost a nepřetržitý provoz, s předdefinovanými provozními frekvencemi, jak to někteří z našich největších zákazníků požadují pro konzistenci a předvídatelnost, poskytující maximální nastavení frekvence pro zákazníky, kteří to potřebují.
Třetím důvodem je, že musíme zajistit, aby naše díly vydržely dlouho. Pokud je prvním důvodem, aby díly nezemřely kvůli náhlému napětí, druhým důvodem je to, že se velmi pečlivě zabýváme životností dílů a zajištěním, že když si koupíte díl Intel, v průměru vydrží daný cílová životnost. Nikdo nechce být výrobcem, od kterého si koupíte, kde po uplynutí záruky díl do druhého dne zemře – chceme zajistit, abychom to byli my, kdo bude dlouhodobě spolehlivý provoz. Takže z tohoto pohledu máme cíle opotřebení, které nutně ovlivňují tyto hodnoty, abychom zajistili nepřetržitý provoz. Musíme také vzít v úvahu, jak různí zákazníci používají díly v průběhu životnosti, zejména s vysokým výkonem vždy na hardwaru. Jiní výrobci CPU tedy mohou mít jiné kvalitativní cíle než my.
Velké díky Intel PR a Guy za jejich čas. Velké díky také Gavinu Bonshorovi za přepis.
Související čtení