Една от най-неразбраните основни технически точки през последното десетилетие е свързана с консумацията на енергия и как различните процесори реагират по различен начин на натоварване. Основната предпоставка е, че когато има наличен допълнителен бюджет за мощност, отделните ядра могат да повишат своята честота и напрежение, за да увеличат максимално производителността в кратки времеви мащаби, намалявайки, когато са необходими повече ядра. Объркването идва от това как работи това, преплетено с това как TDP се свързва с консумацията на енергия. След някои интересни лични дискусии в Computex, сътрудникът на Intel Гай Териен, главният архитект на сегмента за ефективност на клиентите на Intel, се съгласи да говори за това как Intel е дефинирал и адаптирал своето обяснение за TDP и Turbo, както и да говори за новия Performance Maximizer на Intel инструмент за овърклок. Ние също така покриваме подхода на Intel към пазара за ентусиасти.
За да направя това в перспектива: имам много разговори в Computex, които не са записани, далеч от зоната за представяне на съответната компания. Това може да са случайни чатове с моите преки PR контакти, относно предстоящи подробности или отзиви за пресата, или може да са по-задълбочени разговори зад кулисите с инженери. Това е нормалният начин на нещата – повечето от това, което в крайна сметка правим на търговско изложение, никога не стига до публикуване, но ни помага да доставяме бъдещо съдържание чрез разбиране на графика, процеса и концепцията, дори ако не можем да докладваме директно събития. Винаги е била моята цел да отида зад черната кутия на начина, по който работят тези компании, за да разбера вътрешните сделки и работа, дори само за да разбера как се вземат решения и какви насоки могат да бъдат посочени по-нататък.
Няколко от тези разговори тази година на Computex се случиха с Intel, най-вече около демонстрациите на новите 10nm процесори Ice Lake '10th Gen Core', както и Core i9-9900KS и новия инструмент за автоматично овърклокване Performance Maximizer на Intel. Сега през ноември, когато публикувах задълбочено гмуркане в това защо стойностите на TDP и турбо на Intel могат да бъдат донякъде подвеждащи за мнозинството потребители, сътрудникът на Intel Гай Териен се обърна към мен по това време, за да ми помогне да изясня няколко неща. Имахме няколко разногласия относно тълкуването на стойностите и тази дискусия възникна отново въз основа на съобщенията на Intel за Computex. Гай и аз проведохме дълбоки интересни дискусии, някои от които бяха чисто от философска гледна точка на потребителския опит.
Въз основа на тези дискусии Intel ме покани да говоря с Гай в протокола относно някои от тези точки, за да помогна за изясняване. За протокола, обичам да говоря с Гай – като всеки добър инженер, той е откровен и точен и се радва да води разгорещен дебат по отделни теми. Това не означава, че се отнесох лесно към него.
| |
Dr. Ian Cutress Старши редактор, AnandTech | Guy Therien Корпоративен сътрудник, Intel |
table>Guy Therien е един от онези дългогодишни инженери на Intel, които са „доживотни“, които изглежда са останали от десетилетия. Той е в компанията от февруари 1993 г., преминавайки през различни инженерни позиции на платформи, докато не стане корпоративен сътрудник през януари 2018 г. Той притежава 25 патента в САЩ, почти изключително в областта на състоянията на производителност на процесора, управление на мощността, управление на топлината, миграция на нишки и разпределение на бюджета за мощност. Гай е бил с Intel, тъй като тя е адаптирала използването на TDP върху процесорите и един от последните му проекти е идентифицирането на това как TDP и turbo трябва да бъдат внедрени и интерпретирани от OEM производителите и партньорите на дънните платки. Тъй като сега сме в ситуация, в която случайните потребители виждат, че консумацията на енергия нарушава това TDP число в кутията, дори и в дълги времеви мащаби, сега повече от OEM производителите трябва да разберат как Intel определя своите спецификации. Понастоящем Гай заема позицията на корпоративен сътрудник и главен архитект за сегментиране на производителността в клиентската компютърна група в Intel, като допринася за техническото лидерство на Intel.
Общност
Иън Кътрес: Когато говорихме на Computex, една от темите, които засегнахме, беше връзката на Intel с общността на ентусиастите и как се е развила през последните 10 до 15 години. Преминахме през добрите стари времена на висока производителност и натискане на овърклок до момента, в който имаме няколко поколения подобни продукти. Сега се връщаме към пълна война за x86 между Intel и AMD. От ваша гледна точка, като главен архитект в Intel, как Intel подхожда към общността по отношение на набора от продукти в наши дни?
Гай Териен: Знаете, че исторически се е случило интересно нещо – имахме много продукти в цялата ни SKU линия и те бяха използвани за различни цели от различни хора. Но след това открихме, че има определена подгрупа от тези хора, които сега наричаме овърклокъри и ентусиасти, които искаха да извлекат повече от продуктите. Както знаете, част от това да сме голяма корпорация е, че когато правим милиони и милиони продукти, има определени изисквания, които трябва да спазваме, за да гарантираме, че нашите хора, които не са ентусиасти (т.е. по-голямата част от клиентската база на Intel), получават това, което те очакват от нашите продукти по отношение на производителност и надеждност, живот на износване и подобни неща.
Така че в резултат на тези изисквания за качеството на нашите продукти, ние поставяме някои контроли и ограничения върху производителността на частите, въпреки че може да е възможно моментално да постигнат по-висока производителност. Днешните ентусиасти са склонни да поемат рискове и може би не вземат предвид ефективността на износване, която е насочена към общото население, и така те започнаха, нали разбирате, да правят овърклок и да модифицират работата на процесора извън стандартния контролен набор на Intel, използвайки контроли, които са извън работата на самия процесор, неща като BCLK и повишаване на скоростите на паметта и тактовите честоти. Дълго време си мислехме „хей, това ще бъде лошо“ и износване на процесора и знаете, че имаше някои вътрешни опасения по отношение на хората, които правят това. Бих казал, че в старите времена имаше общо облекчение, че хората, които правеха това, по някакъв начин не износваха процесорите. Но с течение на времето се случи интересен преход, при който осъзнахме, че има голяма част от хората, които наистина искат да направят това. Всички неща се събират заедно с времето, за да създадат тези продукти.
Така че идеята всъщност се превърна от опит да попречи на хората да променят външните си часовници, за да задвижи тези контроли вътрешни за процесора, за да ги направи по-еднородни по много начини. Сега, разбира се, както знаете, ние имаме вътрешни контроли и способност за овърклок и така, ако желаете да поемете рисковете от промяна на настройките по подразбиране извън стандартните съотношения, които идват с K SKU процесорите, можете да отключите множителя и да зададете съотношенията програмно и действително програмират съотношенията, за да увеличат тяхната производителност. Разбира се, понякога това има недостатък, което означава, че няма да продължи толкова дълго.
Така че, ако може би помислите за общността на ентусиастите днес, как се е развил нашият възглед: премина от гледане на тях като на може би предизвикателство към качеството на нашия продукт до всъщност като актив. Знаете, че произвеждаме много продукти и наистина искаме да запазим максималните възможности на продуктите да блестят и след това чрез отваряне и възприемане на тези контроли по публичен начин успяхме да предоставим допълнителна производителност на хората, които наистина се нуждаят го или го искам.
Иън Кътрес: И така, накарахме Intel да направи много рекламни материали през последните няколко години по отношение на ентусиастите. Какво бихте казали за състоянието на отношенията с ентусиастите днес в Intel? Как Intel гледа на ентусиастите днес? Колко силен е стремежът към прокарване на производителен хардуер в ръцете на тези ентусиасти?
Гай Териен: Разбира се, тълпата от ентусиасти е важен фокус, който преследваме – чували сте за усилията ни за създаване на компютри и цялата ни K SKU линия е ориентирана както към тези хора, са ентусиасти, които са потребители, но и това, което бихте могли да наречете професионални ентусиасти, които наистина трябва да извлекат всяка частица от представянето в своя бизнес. Така че днес вече сме напълно зад страната на ентусиастите с продукти за овърклок и непрекъснато натискаме допълнителни бутони за овърклок в нашите продукти. Това е както и максимално увеличаване на производителността, която сте виждали в 9900K и 9900KS, това, което наричаме "тънки" неща, всъщност в някои случаи знаете, че има специализирани части или части с по-малък обем, продавани чрез процес на търг, за хората да извлекат повече производителност от процесорите с най-висок брой ядра. Така че това е много силно и пряко признание за фокуса, който се поставя и се опитваме да направим продукти, които отговарят на нуждите на ентусиастите, като ги разбираме и предлагаме продукти с тънък контейнер, които да ги поддържат.
Иън Кътрес: И така, бихте ли казали, че Intel подхожда към ентусиастите и овърклокърите като към различни групи?
Guy Therien: Има хора, които наричаме овърклокъри, които са хора, които ще изпълняват и работят извън спецификацията. Ние приемаме [операция] извън спецификациите, ако приемете присъщите рискове. За разлика от това ентусиастите са хора, които се нуждаят от производителност и ние се опитваме да увеличим максимално производителността „в спецификациите“ за ентусиастите. Със сигурност има силен кросоувър и има ентусиасти, готови да поемат рисковете от овърклок, така че определено има смесица между двете. Но ние също така сме фокусирани върху операциите „в спецификациите“, както и възможността да излизаме извън спецификациите. Лично аз се опитвам да увелича максимално производителността „в спецификациите“, като i9-9900KS, като W-3175X, но можете да излезете извън спецификациите и да получите още повече.
Intel Performance Maximizer
Ian Cutress: Едно от нещата, които обсъдихме на Computex, беше по отношение на новия инструмент на Intel Performance Maximizer и способността да се излиза от спецификациите производителност. Този нов инструмент рестартира компютъра в персонализиран UEFI режим, тества процесора и осигурява овърклок. Intel иска да го направи достъпен за хора, които не е задължително да са добре с това как работят тези инструменти за овърклок. Знам, че вършите много работа по отношение на този инструмент – можете ли да ми разкажете за вътрешното мислене как Intel премина от отношението „да останем в спецификациите“, след това да проектираме предишния инструмент Intel XTU, за да имаме сега Инструментът Intel Performance Maximizer (IPM) и групите хора, към които е насочен?
Гай Териен: За да дам малко предистория на това. Моята история е в софтуера, а след това се насочих към управлението на захранването и в крайна сметка към взаимодействията процесор-ОС, за да контролирам функциите на процесора, така че бях един от хората, отговорни за Speed Step, а хардуерните P-състояния също бяха моят проект. След това с течение на времето, докато разглеждах подобряването на турбото, започнах да проучвам какво допълнително можем да направим. Тогава започнах да гледам как не всички ядра в пакета са създадени еднакви и започнах да разглеждам как някои ядра имат същото напрежение, но дават по-висока честота при това напрежение. Това в крайна сметка доведе до Turbo Boost Max, но по пътя трябваше да науча много за производството и за надеждността. Това в крайна сметка доведе един ден до дискусии с компании, които овърклокват бизнес системи – те купуват процесори от нас и ги тестват, сами поемат гаранцията и продават своите системи на клиенти на финансови услуги и ги поддържат.
Така че чрез всички тези усилия се натъкнахме и на интересен проблем, който се случваше от страната на сървъра. Когато продаваме нашите части, по отношение на нашите вътрешни инструменти, ние правим моделиране, за да определим колко дълго се очаква да издържат. Има математически израз за износване, който е нашата спецификация. Тази спецификация се основава на прогнозираното износване на процесора и колко време смятаме, че типичните части или най-лошия случай (или най-използваните) части ще прекарат в турбо. Нашите вътрешни таблици с данни уточняват процента на частите, за които се предвижда да издържат определено време с какво натоварване. Така че нашите потребители разбират това, те ще купуват нашите части (говорим за хора от наистина висок клас сървъри) и ще кажат, че разбират, че има ограничение за това колко дълго ще издържат, когато се използват при условията Intel уточни, но че няма да го използва при тези условия. Питат ни, че ако го сложат в турбо и го оставят в турбо, 24 часа в денонощието, 7 дни в седмицата, колко време ще издържи? Гледат ни, разбират какво продаваме и на каква цена, но ни питат колко издържат продуктите ни при техните специфични условия. Когато това започна да се случва за първи път, казахме, че не знаем, но ще се опитаме да го разберем.
Затова започнаха опити за измерване на износването на тези системи. Само за да бъде ясно, всички системи бавно се износват и стават по-бавни / нуждаят се от по-високо напрежение за същата честота с течение на времето. Това, което правим, като това, което правят всички в индустрията, е да добавим малко напрежение, граница на износване, за да гарантираме, че частта продължава да работи според спецификациите през определен живот на частта. Така че можете да измерите от колко напрежение се нуждаят частите, докато се износват с течение на времето, и да се надяваме да разберете кога частите се износват (ако изобщо се износват, тъй като някои изобщо не се износват много). Те искаха да знаят дали можем да оценим това офлайн и да им дадем индикатор кога дадена част ще се износи. Оказа се, че е имало дълъг опит да се направи това. Тъй като наличността на сървъра трябва да е през 99,999% от времето, в крайна сметка проектът беше неуспешен. Имахме фалшиви положителни и фалшиви отрицателни резултати и не можехме да им кажем точно кога всяка конкретна част ще се износи, а когато им казахме, че няма да се износи, в крайна сметка това стана. Така че това е много трудна задача, нали? Така че научих за това усилие и едно от разкритията, които екипът имаше, беше, че за да подобрят своята точност, те не могат да предприемат мерки, докато операционната система работи, поради променливостта, причинена от операционната система, поради прекъсвания и друг фон процеси, така че те се научиха да правят измерванията в среда офлайн извън операционната система.
Така че направихме това заключение и разгледахме много други помощни програми, които казаха, че имат функции за автоматично овърклокване и възможности за автоматична настройка. Много от тези помощни програми не бяха много успешни, главно поради променливостта на времето за изпълнение, докато сте в операционната система, а също и защото често накланят нещата до максимум, което с течение на времето поради износване означава, че настройките не са приложими / не не работи повече. Тези помощни програми никога не се връщат и оценяват отново ситуацията, за да видят дали трябва да се отдръпнат малко или да добавят малко повече напрежение или нещо подобно, за да поддържат системата работеща. Така че без реални данни, които казват, че много хора, които купуват най-добрия процесор, не овърклокват, подозирахме, че това наистина е вярно. Предположихме, че голяма част от тези клиенти, които купуват нашите най-високи крайни продукти, искат максимална производителност, но не правят overlock, въпреки че имат възможност с K SKU. Така че идеята беше, като разгледахме какво можем да направим ръчно със сложни инструменти като XTU или BIOS, където трябва да коригирате много параметри за овърклок, видяхме, че вътрешната способност на повечето процесори е средно значително над спецификацията. Не е като един или два контейнера над спецификацията, често понякога беше четири или пет контейнера. Затова решихме, че трябва да предоставим начин на хората, които купуват най-доброто, да могат да получат малко повече производителност от частта, която са закупили.
Сега, тъй като има известна променливост в частите и сред милионите части, които създаваме, има някои, които са много по-добри от други по отношение на техните максимални възможности. Но със сигурност по-голямата част от тях, лъвският дял от тях, могат да постигнат поне няколко бина (1 бин = 100 MHz) над спецификацията без голям риск за ежедневната работа.
Резултатът от всичко това беше, че се замислихме защо хората, които купуват най-добрите процесори, K процесорите, не се овърклокват. Защото може да бъде доста страшно, нали? С всички тези настройки, като повишаване на текущите ограничения, повишаване на напрежението, промяна на мощността и как всички тези настройки си взаимодействат, и какво ще кажете за овърклок на паметта и така нататък. Така че възприехме по-опростен подход за потребителя, като се фокусирахме само върху овърклокването на съотношението, предоставяйки начин, който е лесен за крайния потребител с няколко щраквания с нашия нов инструмент Intel Performance Maximizer (IPM). Ако потребителят приеме условията [за използване], това става много лесно изживяване. Така че за много от хората, които са купили най-добрите части, сега става доста лесно да получат малко повече производителност, до около 10-15%, което ще зависи от качеството на процесора, но това е пътят към него.
В крайна сметка този IPM инструмент е насочен към всеки, който купува K процесор и е доволен от приемането на малко количество риск при изпълнение извън спецификациите в замяна на повече производителност от продукта, който вече са закупили.
Ian Cutress: Каква е позицията на Intel към овърклокването на лаптопи в сравнение с настолни компютри и работни станции? Или тези видове устройства се разглеждат като независими вътрешно за типовете потребители, които може да се интересуват от максимизиране на производителността на техния хардуер в различните пазарни сегменти.
Guy Therien: Независимо от устройството, ако купувате първокласния SKU, който е отключен, искаме да уведомим тези хора, че могат да получат малко повече производителност по лесен и прост начин с IPM инструмента в процесорите за настолни компютри, стига те да поемат риска.
Ian Cutress: Вие споменахте други инструменти за овърклок, които вече съществуват, и че Intel е уникален с това, че имате способността да оптимизирате овърклок извън операционната система. Виждаме инструменти от Asus, MSI, ASRock и други големи партньори на Intel, които създават инструменти през по-голямата част от последните 10 години. Какво може да предложи IPM на масата, което тези момчета не могат?
Гай Териен: И така, първото е простотата и лекотата на използване. Ние вярваме, че много от инструментите, които са там, са преобладаващи за мнозинството потребители и че има само малка част от потребителите, които желаят да се опитат да разберат и научат всички нюанси на инструментите.
Вторият е нивото на надеждност, което идва с това, че не натискате целия път до ръба и имате някои резерви. IPM избира 100 MHz по-ниска от пиковата честота на преминаване. Това е инструмент, който позволява на потребителите да работят непрекъснато без никакъв страх, като повишават овърклокването твърде високо. С IPM ние вярваме, че той със сигурност е по-стабилен от другите инструменти – ние осигуряваме ниво на надеждност, което другите инструменти не осигуряват, като добавяме маржове и не го притискаме до границите на всеки процесор.
Друга характеристика на IPM е, че когато се използват другите помощни програми, те задават поредица от параметри като честота и напрежение и след това го тестват при стрес, за да видят дали работи. Ако увисне, те се отдръпват и опитват отново, след това се оттеглят и опитват отново и кой знае какви индивидуални избори има потребителят на нивото на стрес теста. Разбира се, винаги е имало някаква автоматична настройка в приложенията на трети страни, но винаги се свежда до стрес теста – някои потребители казват, че Prime95 е добър стрес тест, но от нашата страна на оградата трябва да покрием широк диапазон от напрежения за всички неща, които могат да се объркат при увеличаване на скоростта над спец. Така че IPM има специален набор от тестове, които провежда, които ние сме разработили вътрешно, за да осигурим това, което смятаме, че е добър набор от покритие за всички ъглови случаи в цялата система, които могат да бъдат повлияни от висока честота, като както критични, така и некритични изчислителни пътища. Така че с нашето интензивно тестване, плюс допълнителния резерв, който предоставяме, вие знаете, че системата трябва да бъде с много висока производителност с добро ниво на стабилност. Тъй като познаваме процесора така, както го познаваме, никой друг не може да се сравни с начина, по който тестваме.
TDP и Turbo: Какво означават и как трябва да тестваме
Ian Cutress: IPM е насочен към хора, които искат да овърклокнат или да извлекат максимума от своя процесор. Но повечето ентусиасти просто искат да използват стандартен процесор и все пак да имат най-добрата производителност – в този смисъл те разчитат на спецификации като TDP на Intel и турбо честотите. Можете ли да обясните връзката на Intel с това как определя TDP и Turbo и причините, които стоят зад тези определения?
Гай Териен: Преди няколко години бях отговорен за прецизиране на езика, за да се уверя, че имаме описателни термини в цялата корпорация за това какво е TDP и какво е Turbo. Това се основава на това, че няколко хора се събират и говорят за това как сме тествали нашите части и какво всъщност прилагаме по отношение на TDP.
TDP е средното разсейване на мощността при максимална граница на работното състояние на температурата на свързване, посочено в инженерния лист с данни на Intel за този процесор, за който процесорът е валидиран по време на производството и при изпълнение на свързано с Intel специфично работно натоварване с висока сложност при тази честота. Това означава, че когато цитираме базова честота, мислим за най-лошия случай на среда и работно натоварване с висока сложност в реалния свят, което потребителят би поставил на платформата – когато частта работи при определена температура, ние обещаваме, че всяка част ще получите ще постигнете тази базова честота в рамките на мощността на TDP. Така че това е – позволява на нашите клиенти, нашите ODM клиенти и производителите да знаят колко топлинна способност и способност за доставка на енергия да внедрят в своите системи, така че да получат базовата честота, която може би в миналото сме наричали наша „маркирана“ честота.
За това референтно натоварване – ние също трябва да се справим със сложността на това натоварване. Ако вземете две работни натоварвания, като например обикновен 100% цикъл на въртене „без работа, но поддържане на захранване“, който предизвиква турбо, и 100% сложно работно натоварване, разликата в консумацията на енергия между двете може да бъде много десетки вата. Ако дефинираме енергийния вирус като нещо, което кара всеки транзистор и всеки гейт да превключват на всеки часовник, n считаме за абсолютния най-лош случай енергийния вирус - нашето работно натоварване на TDP не е това. Ние определяме TDP с работно натоварване, което е процент от този най-лош сценарий (висок процент, но не 100%), тъй като рядко се доближавате до абсолютния най-лош случай на мощен вирус при условия на реалния свят (дори при рендиране на видео). Този процент може да се промени въз основа на поколението на процесора, въз основа на възможностите на всеки процесор, колко вероятно е да се използват различни части на процесора с развитието на работните натоварвания. Можем да коригираме работното си натоварване, за да съответства навсякъде от този основен цикъл на въртене до мощния вирус и всички между тях или дори два комплекта работни натоварвания едновременно. Трябва да направим целия този анализ, за да се опитаме да разберем какво според нас е типично натоварване в най-лошия случай във всяко дадено поколение, особено с всички налични софтуерни приложения. Например, стриймър на игра може да изпълнява 87% от очакваното ни работно натоварване или нещо подобно, така че може да се възползва от по-ниската консумация на енергия при базова честота или да получи честота над базовата в турбо диапазона – може би дори максималната турбо честота за дълъг период от време.
Съществува и естествената променливост на производството на частите. Някои силикони са по-щастливи от други. Не забравяйте, че когато посочваме TDP, това е за всички части, които някога ще закупите. Така че, ако сте OEM и купувате милион процесора, ние уточняваме, че всяка част, която закупите, нито една от тях няма да надхвърли нашите оценки. Но поради променливостта в производството, често понякога частите, които получавате, не са близо до най-лошия сценарий. Понякога правим частите в конкретен кош, а понякога слагаме частите надолу по причини като търсене или заявки. Ето защо има компании от трети страни, които идват, купуват куп части, тестват ги, определят кои работят най-добре и препродават най-бързите части. За тях това е просто да се възползват от естествената вариация на производството.
Иън Кътрес: И така, това, което чувам е, че когато Intel пусне нова част, ще ми трябват 10+ проби, за да мога сам да проверя променливостта?
Guy Therien: Що се отнася до проби от пресата, аз не отговарям за това! (смее се) Но това, което можем да кажем в Intel е, че с времето, когато създаваме повече процесори, разбираме и подобряваме производствения процес. Можем да погледнем изтичането на процесор и да видим къде е той в прогнозния обхват на всичките милиони части, които сме произвели. Нашите данни обикновено са наистина ограничени, дори ако първоначално може да има някои прогнози, когато дадена част стане по-зряла. С някои ранни части, особено неща като инженерни проби, които така или иначе не се продават на крайните потребители, ние все още променяме процеса и го подготвяме. Но когато сме готови да предоставим процесори за натискане за преглед, те са същите като процесорите на дребно, защото не искаме да представяме погрешно пазара.
Иън Кътрес: Едно от нещата, за които сме говорили в миналото, е връзката между TDP и турбо и как работят турбо бюджетите. Моят аргумент е, че не е непременно ясно за широката публика как Intel свързва тези стойности с масите. Чудех се дали желаете да ни дадете бърз преглед.
Гай Териен: Разбира се. Така че общата концепция е, че имаме честотни ограничения – винаги когато едно ядро е активно, така че всеки процесор да има едно- или двуядрена турбо честота, която ние публикуваме. Освен това, в зависимост от броя на активните ядра, имаме максимално ограничение на честотата. Но за това системно ограничение това е ограничение на честотата и това, което наистина правим, е да наложим TDP. TDP е средна мощност, която се налага с течение на времето. Това е важно – не е просто единична стойност. В резултат на това това, което наистина прави турбото, е да контролира мощността, а не честотата.
В рамките на един процесор дефинираме ограничение на мощността на пакета, което наричаме Power Limit 2 (PL2), в сравнение с TDP, което е Power Limit 1 (PL1). Има алгоритъм, който се изпълнява в процесора, който гарантира, че TDP за определен период от време се прилага като средна мощност. Алгоритъмът не е проста подвижна средна, а е експоненциална претеглена подвижна средна, което означава, че най-скорошната консумация на енергия има най-голямо значение – това е стандартен алгоритъм.
Но това означава, че ако сте били неактивни известно време, имате определен бюджет за захранване. Процесорът може да използва мощност до своя лимит на мощност PL2 и лимит на честота, докато бюджетът изтече, след което процесорът ще се премести, за да осигури средната стойност на мощността PL1/TDP. Това е като вана, която се пълни с вода – ако я източите, можете да източите само толкова много, преди да трябва да се напълни отново.
Това ограничение на PL2 и бюджетът за захранване могат да се конфигурират. Всъщност във всички клиентски части можете да конфигурирате както периода, през който се прилага TDP, така и височината на лимита на мощността, до който можете да избухнете. Спомняте ли си, че говорихте за сложността на работното натоварване? Ами оказва се, че ако изпълнявате просто работно натоварване, може да получавате цялата възможна турбо честота, но тъй като работното натоварване е малко, вие всъщност не източвате бюджета за енергия толкова много и можете да турбо с тази висока честота за повече време. Бюджетът за мощност в крайна сметка се прилага. Но по-сложно работно натоварване може да избухне докрай, да достигне PL2 и да изтощи голяма част от този бюджет много бързо, така че внезапно да останете без бюджет. В този случай вътрешно ще намалим честотата, за да поддържаме процесора в рамките на по-дългосрочния лимит на мощността (PL1 / TDP), докато можете отново да възстановите бюджета според алгоритъма, споменат по-горе.
Така че, ако разгледаме система в неактивен режим, тя има пълен бюджет за мощност. Тъй като работното натоварване идва върху ядрата, вътрешните претеглени времеви алгоритми ви изпомпват до най-високата честота, стига да е налична за броя на активните ядра. След това ще разгледаме мощността, която се консумира и стига тя да е по-малка от вашата граница на мощност PL2, вие сте добри. Така че продължаваме на тази честота. Тъй като алгоритъмът за експоненциално претеглена подвижна средна започва да изчислява и вижда мощността, която се разсейва/поддържа. След това, след известно време, той разглежда времето, през което трябва да наложи тази средна мощност, която наричаме Тау (τ). Когато се достигне Tau, алгоритъмът се задейства и вижда дали трябва да намали консумираната мощност, така че да може да достигне и да остане в границите на TDP. Това означава, че получавате прилив на производителност отпред. След като тази производителност, този бюджет за мощност, е изчерпан, вътрешно процесорът ще започне да намалява мощността чрез намаляване на честотата, за да гарантира, че TDP се прилага през времето, през което е конфигуриран. Така че Tau е времевата линия, върху която TDP се прилага от алгоритъма.
Както PL2, така и Tau могат да се конфигурират от OEM и ODM и са „в спецификации“. Така че имате възможност, разбира се, ако захранването поддържа по-висока граница на мощността, а също и ако системата има термична способност (защото няма смисъл, ако просто ще термично дроселирате), да коригирате тези стойности. Така че производителите на дънни платки и производителите на ODM инвестират в своите решения за доставка на енергия и топлина, за да им позволят да увеличат максимално производителността или да получат определена продължителност на турбо без дроселиране – до максималната възможна степен. В резултат на това можете да инвестирате различни суми пари в захранването, топлинното решение, тънкостта на системата и така нататък – това е способността да проектирате нещо, което да е диференцирано за аудиторията, както по отношение на форм фактор, така и производителност.
Нещото, което трябва да запомните е, че можете да проектирате система, която е прекомерна за много среди - отвъд това, което обикновено се изисква при нормална употреба. Ако се приложи работно натоварване към 65W CPU и 95W CPU и и двата избухнат до едни и същи 200W и завършат, преди да се приложи алгоритъмът за турбо контрол, това е начинът, по който OEM и производителите могат да се разграничат в дизайна си. Това означава, че ако и двата процесора имат едни и същи настройки за турбо честота, те ще постигнат еднакъв резултат в Cinebench, дори с 30W TDP разлика. При мобилните системи става въпрос за ограничената способност за охлаждане на системата, която докосвате, и че главата може би не преминава през нея и става неудобно за докосване. За настолен компютър проблемът може би е акустиката или температурата на изходящия въздух от вентилатора. Но партньорът може ясно да проектира система, която да има триминутен турбо прозорец, върху който се прилага TDP. Така че в зависимост от възможностите на системата, имаме TDP и след това свързаните Turbo параметри (PL2 и Tau) могат да бъдат конфигурирани, за да отговарят на възможностите на системата.
Иън Кътрес: Едно от нещата, които видяхме с частите, които преглеждаме, е, че вземаме дънни платки на ниво потребител или работна станция от ASUS, ASRock и такива, и те прилагат свои собствени стойности за това ограничение на PL2, а също и турбо прозореца – те може да увеличават тези стойности до максимума, който могат да достигнат, като (максимален) лимит от 999 W за 4096 секунди. Според вас, това изкривява ли начина, по който правим рецензии, защото непременно означава, че те изчерпват дефинираната от Intel спецификация?
Гай Териен: Дори и с тези стойности, спецификациите не ви изчерпват, искам да поясня много ясно – работите в спецификации, но получавате по-висока продължителност на турбо.
Ще бъдем много ясни в нашата дефиниция за това каква е разликата между in-spec и out-of-spec. На нашите процесори има „бит“/флаг за овърклок. Всяка промяна, която изисква да зададете този бит за овърклок, за да активирате овърклок, се счита за операция извън спецификацията. Така че, ако производителят на дънната платка остави процесора с неговите обичайни турбо стойности, но заяви, че ограничението на мощността е 999 W, това не изисква промяна в бита за овърклок, така че е в спецификацията.
Иън Кътрес: Тогава въпросът става - как Intel би предпочел да тестваме за прегледи?
Гай Териен: Позволете ми да помисля малко с вас за това. Ако гледате i9-9900K и една от най-добрите дънни платки за овърклок. Производителят на дънната платка ще каже, че прави разлика, може да сложи милион фази на VRM, може да приеме, че ще охлаждате процесора с течност, и затова те поставят настройките си по подразбиране, за да поддържат максималната мощност платката може да се разсейва – дори ако това е дефакто „неограничена“ максимална мощност. Те всъщност ще започнат да го изрязват, ако процесорът някога консумира повече от възможното. Те позволяват диференциация чрез коригиране на възможностите на платката и след това на настройките, но все още в спецификациите, докато не обърнете този бит за овърклок. Тогава може би ще има друг набор от хора, които изграждат не платка за овърклок, а дъска за ентусиасти на игри или корпоративна система. Тези потребители все пак може да искат най-добрия i7 или i9 процесор, дори ако е K процесор, защото искат най-добрата производителност в спецификациите.
Така че трябва да попитате как ще прегледате възможностите на процесор като i9-9900K. Бих го прегледал в дънна платка отгоре, нещо по средата и бюджетен дизайн или най-евтиния/най-рентабилен дизайн, за да покажа как може да бъде конфигуриран. Тогава можете да кажете, че в различните дизайни, той ще работи така, както производителите на дънни платки са проектирали системите.
Но тогава въпросът също се превръща в един от показателите. Нещо като TouchXPRT или SYSMark ще ви даде добра продължителност на пакета, тъй като натоварванията при тези тестове не черпят много енергия. Но нещо като Cinebench може да е измамно, защото с добра система може потенциално да работи изцяло в конфигурирания прозорец за турбо пакет. Трябва да внимавате, когато търсите и измервате нещо като Cinebench. Това е една от причините, поради които не подкрепяме използването му като подходящ показател.
Иън Кътрес: И така, как Intel работи с партньорите си от страна на лаптопа по отношение на турбо стойностите и стойностите на турбо прозореца?
Гай Териен: Това е интересна история, която не е само розова. Занимавах се с дефинирането и създаването на турбо и така конкретно лаптопите бяха мястото, където се опитвахме да извлечем цялата възможна производителност и разбрахме, че има период от време, в който можем да работим над базовата честота с турбо , и осигуряват ползи от производителността на пакета. Затова се запитахме на какви стойности трябва да се настрои това турбо. Когато за първи път разгледахме проблема преди много години, разгледахме тези лаптопи и проверихме колко са дебели, колко бързо ще се разпространяват термичните вълни от мястото, където е процесорът, до нагоре през клавиатурата и опората за длани, какъв е размерът на топлообменника и подобни неща. Направихме пълен анализ на това, защото идеята беше, че не искахме да кажем нещо като „ето я турбо честотата, тя е наистина висока, никога няма да я разберете“. Би било глупаво да се каже, да се дадат числа, които може да са възможни само за една десета от секундата – искахме да дадем данни, които са реалистични.
Ние направихме крачка назад, за да разгледаме голямата картина, за това как ще извлечем турбо стойностите. Имаше дълги усилия да се разгледат куп работни натоварвания на крива на сложност и мощност, за да се опитаме да разберем на какво трябва да бъдат конфигурирани тези PL2 и Tau стойности, като се има предвид колко време ще отнеме на компютъра да загрее. Тези стойности може да са над или под това, което ODM може да сметне за подходяща температура за опората за длани, или шума на вентилатора, или температурата на отработените газове. Така че беше настроен, за да се гарантира, че периодът на това, което получавате с турбото, е такъв, че да не подавате газ. Оригиналният PL2 и Tau бяха настроени за турбо от около 28 секунди в мобилен телефон.
Първоначално, за съжаление, не се върнахме, за да се фокусираме отново върху тази точка година след година, за да гарантираме, че тези стойности непрекъснато се актуализират с начина, по който се подхожда към модерните мобилни дизайни, което повлия на оптималните внедрявания в ретроспекция. Сега предоставяме годишни актуализации на вътрешните настройки по подразбиране, докато продължаваме да предоставяме по-голяма производителност, генерирана след поколение. Продължавайки напред, ще се съсредоточим още повече върху нашите партньори и клиенти, за да определим какви трябва да бъдат настройките по подразбиране и да гарантираме, че няма термично дроселиране, но все пак можем да се възползваме от турбото.
Бъдещето
Иън Кътрес: Как виждате развитието на Intel, как отчита TDP и Turbo в бъдеще? Имате ли някаква представа за това как Intel подхожда към него от тук, за неговото ангажиране на турбо и как ще се развива?
Гай Териен: Ще се стремим да предоставяме възможности, от които смятаме, че потребителите могат да се възползват. Така че, както споменахме в основната бележка на Computex, в пространството HEDT с много ядра, ние ще разширим нашите дефиниции за Turbo Boost Max до повече от едно ядро, до повече от само две ядра, както стане подходящо. Както можете да си представите, с нарастването на броя на ядрата възниква въпросът кога имате нужда от всички тези ядра и кога имате нужда само от няколко и можете да се възползвате от допълнително пространство.
Но това е вид движение напред-назад, особено при неща като игри – лъвският дял от конзолите са с осем ядра, така че не е задължително да видите игри да надхвърлят осем ядра, защото няма много полза от това . Разработчиците на игри ще трябва да решат къде ще положат усилията си. И така, ние видяхме това, което бихте могли да наречете най-добрия брой ядра за игри, между четири и осем, и така напредвайки ще видите, че фокусираме усилията си върху оптимизиране на честотата и производителността в тази област.
Мисля, че в един момент споменах в блог на Intel, че колкото и много ядра да са необходими на хората, тъй като приложението изисква както да се възползва, така и да осигури полза с толкова много ядра, ние правим анализа през цялото време с уважение до едновременно работещ софтуер, как се мащабира с броя на ядрата и т.н. Така че засега четири ядра са най-подходящото място за повечето потребители, с четири към осем за игри. Отвъд това изисква множество неща да работят едновременно, тъй като отделните приложения нямат склонност да се мащабират толкова високо, освен ако не преминете към HEDT. Така че ще продължим да търсим възможност за предоставяне на възможности като Turbo и Turbo Boost Max за най-добрия брой ядра, от които смятаме, че хората могат да извлекат най-голяма полза, и разбира се ще разгледаме преместването на това в други сегменти на процесора извън HEDT с течение на времето.
Иън Кътрес: Едно нещо, което Intel и AMD правят по различен начин е, че Intel предоставя специфични турбо таблици за турбо честотите за това колко ядра са активни, докато AMD използва по-ориентиран към мощността подход, при който и увеличава ядрата въз основа на това колко бюджетна мощност остава в системата. Като се има предвид, че разбирате предимствата на двете реализации, можете ли да кажете защо препоръките на Intel са по-добри от това, което предлага AMD, или да дадете малко представа за различните подходи от ваша гледна точка?
Гай Териен: Така че мога да говоря само за работата на внедряването на Intel, но бих искал да отбележа, че нашите турбо таблици са по-скоро за абсолютни ограничения на честотата – все още има бюджет за мощност елемент към уравнението и тези стойности са само пиковите стойности, но все още се базира на мощност.
Така че може би се чудите защо просто не оставим честотата да „изплува“ нагоре или честотата на всички ядра да се повиши, ако захранването го позволява. Това е дискусия за техники и не казвам кое е по-добро, но ще ви дам две причини защо нашите турбо маси съществуват така, както съществуват.
Първият е свързан с това, когато имате голямо разнообразие от типове инструкции, като AVX, които могат изведнъж да бъдат представени на процесор. Трябва да сте в състояние да реагирате много бързо на промени в микса от инструкции на процесора, с други думи, промени в мощността, която ядрото консумира, за да осигурите продължителна работа, или ще получите спад на напрежението и потенциално повреда (в зависимост от колко близо е напрежението до състояние на повреда, което е свързано с консумираната мощност, ако се добави допълнителен марж). Така че ние налагаме тези състояния на захранване на входната/изходната граница на C-състояние. Това не е периодично проучване, за да видите какво се случва тук и може би да направите някои промени – всеки път, когато едно ядро промени своето C-състояние, мощността и ограниченията се променят въз основа на броя на активните ядра, което гарантира надеждност. В това има някакъв присъщ консерватизъм, но както знаете, качеството и последователното бягане са най-важни. Така че нашите турбо таблици обикновено са зададени доста високо и ние се уверяваме, че енергоемките инструкции като AVX реагират на различен набор от правила, с още допълнителни правила за по-големи AVX инструкции извън стандартните. Но поради голямото колебание в мощността между този прост цикъл и най-сложното работно натоварване на мощния вирус (и/или работното натоварване на TDP), има консерватизъм, който прилагаме, за да гарантираме качество и работа, и затова като брой ядра, които са активни увеличения, ние постепенно спускаме честотните граници, което предпазва ядрото от повреда. Сега може да видите някои от нашите продукти, които всъщност не са стъпаловидни, те всъщност поддържат всичко на една и съща честота – това е, защото това са специални екранирани части, за които знаем, че можем да поддържаме честотата въз основа на характеристиките на силиция на тази част. Но когато правите милиони и милиони от тях, има различни характеристики на материалите, които научавате, а ние разполагаме с контроли, за да гарантираме надеждна работа за всички части, които продаваме.
Втората причина е разделянето на SKU. Разполагаме с набор от продукти и ние определяме всеки точно за дългосрочна надеждност и продължителна работа, с предварително зададени работни честоти, както се изисква от някои от най-големите ни клиенти за последователност и предвидимост, осигурявайки максимални честотни настройки за клиенти, които се нуждаят от това.
Третата причина за това е, че трябва да сме сигурни, че нашите части издържат дълго време. Ако първата причина е да накараме частите да не умрат поради внезапно напрежение, втората причина е, че ние сме много прилежни в разглеждането на живота на частите и гарантираме, че когато купувате част на Intel, средно тя ще издържи даден целеви живот. Никой не иска да бъде производителят, от когото купувате, при който веднага щом гаранцията изтече, частта умира на следващия ден – искаме да гарантираме, че сме тези с дълга надеждна работа. Така че от тази гледна точка имаме нашите цели за износване, които непременно оказват влияние върху тези стойности, за да гарантираме продължителна работа. Трябва също така да вземем предвид как различните клиенти използват частите през целия живот, особено при висока производителност винаги на хардуер. Така че други производители на процесори може да имат различни цели за качество от нашите.
Много благодаря на Intel PR и Guy за отделеното време. Много благодаря и на Гавин Боншор за транскрипцията.
Свързано четене