HardCore i7

 | 20.36

 

Петь осанну процессорам Core 2 уже даже как-то неприлично. Все мы знаем, насколько удачными они получились, как с точки зрения производительности, так и в плане энергоэффективности. Чего же было ожидать от Core i7 (Nehalem), нового процессора Intel, использующего «старый» (хотя, по IT-шным меркам для технологии, которой уже исполнился год, возможно, это слово корректно было бы использовать и без кавычек) 45 нм техпроцесс? Тем более, что сами по себе вычислительные ядра особой модернизации Intel подвергать не собиралась. В момент перехода с Pentium 4/Pentium D на Core/Core 2 и так пережили серьезнейшую метаморфозу.

А ожидать следовало примерно того, что и произошло. Когда на рынке есть всего два лидера, «фирменная» пошаговая стратегия развития Intel, в принципе, может охарактеризовать и весь рынок в целом. Логика простая: когда один из конкурентов находит и внедряет удачное решение, второй берет идею на карандаш и старается повторить его у себя в следующем поколении своей продукции. В то же время, у второго конкурента тоже есть свои ноу-хау, которые первая компания со временем перенимает.

Core i7 — теперь у Intel тоже есть настоящие четырехъядерники

Углубляться в историю вопроса не станем, об этом уже говорилось (и не раз), но на данном этапе на процессорном рынке мы имеем следующую картину. Intel вышла далеко вперед по частотам и энергоэффективности — прежде всего, конечно, благодаря 45-нанометровому техпроцессу и удачной микроархитектуре. Но в активе AMD имеются настоящая многопроцессорная архитектура Phenom (которой теоретически под силу масштабироваться до 8, 16 или даже большего количества ядер), встроенный контроллер памяти и шина HyperTransport, которая является залогом спокойного апгрейда хотя бы в пределах одного поколения процессоров (и у пользователя не болит голова о том, выдержит ли его материнская плата нужную частоту FSB).

Мы с замиранием сердца ждем появления 45-нанометровых процессоров Phenom II (AMD обещала предоставить их нашей редакции в начале 2009 года), которые имеют все шансы восстановить равновесие между Intel и AMD. Ведь все остальное (кроме высоких частот и низкого энергопотребления, гарантируемых техпроцессом) у Phenom’ов есть. Ну а недавно вышедший Core i7, будучи революционным для Intel, скорее выглядит симметричным ответом на наработки AMD в плане архитектуры. Такие вот качели, одни сконцентрировали силы на инновациях в дизайне, а другие вырвались вперед по части технологий. Сейчас-то видно, чей расчет был выгоднее… Хотя это тоже зависит от того, с какой стороны смотреть. Благодаря HyperTransport’у и встроенным контроллерам памяти серверные Opteron’ы объединяются в многопроцессорных системах без лишней возни. Неудивительно, что до появления Core i7 компания AMD сохраняла сильные позиции в серверном сегменте. Впрочем, если 45 нм технология AMD окажется удачной, то начнет выравниваться и пользовательский сегмент. Только уже в другую сторону.

Ну, хватит досужих рассуждений, перейдем ближе к предмету разговора — новой архитектуре от Intel.

Lego Intel

Новый Core i7 заметно крупнее, чем Core 2

В последней итерации процессоры Core 2 были хороши по всем статьям, кроме одной — масштабируемости. Проблема создания четырехъядерных процессоров была решена просто (хотя не скажешь, что особо изящно) — «склеиванием» двух двухъядерных кристаллов на одной подложке через внутреннюю шину QPB (Quad Pumped Bus). Однако пропускная способность внешней шины (FSB) оставалась прежней, к тому же на нее приходилась и вся нагрузка по обмену данными между процессором и памятью (транзитом через северный мост чипсета). Наращивать скорость FSB по мере роста мощности процессоров можно было только поднятием частоты. А это, как известно, не самый простой и, в конечном итоге, ограниченный метод. Вдобавок и сама QPB вряд ли смогла бы обеспечить нормальную взаимосвязь между восемью и более ядрами.

Теперь все вышеперечисленные проблемы решены внедрением шины QuickPath Interconnect (QPI). Ее пропускная способность (25.6 Гб/с) превышает даже производительность HyperTransport 3.0 (24 Гб/с), которая сама по себе сделана с огромным запасом. Четыре, восемь, шестнадцать ядер — теперь Intel спокойно может выпускать процессоры любой конфигурации. Собственно, ничто не мешает сделать свой аналог Phenom X3 с тремя ядрами и выпускать бюджетные одноядерные модели.

Параллельно Intel внедряет встроенный контроллер памяти, разгружающий внешнюю шину еще больше. Да и самого по себе трехканального (!) контроллера DDR3 должно хватить надолго — чтобы не менять с процессором материнскую плату и саму память. С другой стороны, обязательное использование DDR3 вряд ли может радовать в свете того, что цены на этот тип памяти и без всяких кризисов слишком высоки.

Кристалл Core i7 (4 ядра) получился довольно крупным, но при этом гораздо меньше, чем два двухъядерника, склееных вместе

В Core i7 возвращается кеш третьего уровня, теперь именно он будет общим для всех ядер. Кеш L2 при этом становится раздельным, у каждого ядра свой и чуть более быстрый, чем раньше.

Собственно, все вышеперечисленное трудно назвать новаторством на фоне Phenom, но теперь и Intel имеет полное право говорить о «настоящих n-ядерных процессорах». Причем вместо n можно подставлять любое число в пределах разумного.

Хорошо забытое старое

Кроме сугубо аппаратного задела на масштабирование архитектуры процессоров, в Core i7 возродилась и технология Hyper Threading, которую теперь правильнее называть Simultaneous Multi-Threading (SMT). Суть ее осталась прежней, одно физическое ядро может «разделять» себя на два логических для оптимизации выполнения сложных вычислений. Вроде бы, неплохо, но если вспомнить, что у нас не так уж и много пользовательского софта, способного разделиться на четыре потока, то уж с восемью (четырехъядерник с SMT) и более виртуальными ядрами сможет справиться только редкий узкоспециализированный набор программ. Для серверных систем это, безусловно, плюс, но для домашнего юзера польза от SMT сможет проявиться разве что на бюджетных одно-двухъядерных процессорах Core i7, если таковые вообще появятся.

Внешне Socket 1366 мало чем отличается от LGA775. Но новый разъем крупнее, так что не спутаем

Отдельно надо отметить видеоконтроллер, который Intel планирует встраивать в процессоры нового поколения. Пока что, правда, основной кристалл никто трогать не будет, видеоядро будет просто расположено внутри упаковки CPU, как это было с упомянутыми ранее «ненастоящими» четырехъядерниками. Тем не менее, чем ближе к процессору и контроллеру памяти — тем лучше. Авось, и на встроенном Intel’е можно будет в Crysis играть. Когда-нибудь. Но в любом случае, под «видео-CPU» придется использовать отдельные сокеты с большим количеством контактов. Это вряд ли порадует тех, кто планирует пользоваться встроенным видео до появления денег на хорошую видеокарту, зато в серверах, которым разве что двухмерные интерфейсы надо отображать, такая технология может быть уместной.

Промежуточный итог

Пока что образец Core i7, который находится в нашем тестлабе, не дает повода для упреков. Несмотря на кардинальные изменения в архитектуре (а я рассказал только о самых заметных, опуская множество более мелких дополнений и улучшений) новый Core из расчета на такт умудряется быть немного быстрее своих 45-нанометровых собратьев из прошлого поколения. Хотя, казалось бы, куда уж быстрее?

Но о тестах Core i7 — уже в следующем номере.

 

КРУТОЙ И ТИХИЙ

Подсознательно название технологии «Cool’n’Quiet» от AMD хочется перевести именно так. Хотя не факт, что такое прочтение слова «Cool» не подразумевалось… Впрочем, речь не о том. В новых процессорах Core i7 появился симметричный ответ энергоменеджменту от AMD в виде цельного блока PCU (Power Control Unit). Этот замечательный контроллер отслеживает нагрузку на ядра и температуру процессора, в зависимости от которых он может изменять напряжение и тактовую частоту всех ядер по отдельности. Когда «скучают» все ядра, PCU может переводить в режим пониженного энергопотребления контроллеры памяти и QPI.

Но по сравнению с AMD у Intel появилась одна уникальная фишка, имя которой Turbo Boost. Суть ее заключается в том, что при недогруженности части ядер процессор может самостоятельно «подразогнать» на 133 МГц те ядра, которые работают на полную катушку, либо же одно из ядер, но уже на 266 МГц. Ну что, братцы? Кто боялся разгонять свои процессоры? Теперь процессор сам себя разгонит, а PCU при этом проследит, чтобы общее тепловыделение оставалось в пределах паспортных значений.

Есть и еще одна технология, «намертво» вшитая в процессоры Core i7, которая следит за тем, чтобы процессор не превышал допустимого энергопотребления — Overspeed Protection. Принудительное самовольное снижение процессором тактовой частоты вряд ли порадовало бы оверклокеров, поэтому Intel гарантирует, что эта технология будет свободно отключаться в BIOS. Зато у пользователей ноутбуков не будет болеть голова по поводу перегрева процессора.

 

КЭШ ОТСЮДА!

Отклонившись от идеологии инклюзивного кеша в предыдущих процессорах, в Core i7 компания Intel снова возвращается к этому «перестраховочному» решению. Напомню, что инклюзивный кеш предполагает дублирование данных из кешей более низкого уровня в кэшах более высокого. То есть, данные из L1 кэша должны в обязательном порядке находиться и в кэше L2, отъедая там часть полезного места. Однако в отличие от эксклюзивного кэша, которому верна компания AMD, такой подход может уменьшить задержки при работе нескольких ядер над одним и тем же блоком данных. С другой стороны, из-за этого Intel приходится делать кеш практически вдвое большего объема, чем у AMD, чтобы общее количество полезных данных, которое в нем умещается, было таким же.

Впрочем, пока никто не делает одинаковых процессоров с инклюзивным и эксклюзивным кешем на выбор, более-менее объективно сравнить оправданность каждого из подходов вряд ли удастся. Поэтому, как и прежде, будем сравнивать производительность процессоров в целом.

Robo User
Web-droid editor

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *