Мне кажется, что от 2021 года мир ожидал чуть-чуть другого развития событии, во всяком случае нам в компании так казалось. В частности, мы думали, что будем вспоминать карантин и прочие ограничения 2020 года как прошедшие уникальные события, но оказалось, что и 2021 и возможно следующие годы еще долго будут напоминать различными факторами, то в одной сфере нашей жизни, то в другой.
В марте и апреле текущего года AMD и Intel соответственно представили обновленные серверные процессоры, а Intel даже изменил платформу и сокет. Эти события были запланированы и мы ожидали обычный плавный переход на новые решения и даже разместили заказа на новые материнские платы X12D от Supermicro под процессоры Xeon Ice Lake-SP и процессоры Epyc третьего поколения с кодовым названием Milan. Но в какой-то момент все пошло не по плану, к концу весны 2021 года с выходом новой криптовалюты Chia начали пропадать с рынка жесткие диски больших объемов и быстрые SSD. Цены на эти детали стали расти с огромной скоростью. Затем нам сообщили, что нам не могут отгрузить детали к новой платформе. На тот момент нам не показалось это чем-то необычным, платформы новые и еще не доступны полноценно, хотя во всю шли разговоры о дефиците комплектующих в кремниевой индустрии. Сказались сразу несколько факторов: отложенный спрос, простой фабрик в период пандемии и небывалая засуха в Тайване.
В итоге получилось так, что к концу лета нам еще не удалось в живую протестировать новые процессоры как от AMD так и от Intel, мало того, есть проблемы с отгрузкой даже платформ предыдущей генерации. Шторм дефицита комплектующих набрал свою силу и говорят будет бушевать как минимум до конца текущего года. Закон спроса и предложения никто не отменял, поэтому отсутствие предложения при огромном спросе вызвало и поднятие цен почти на весь спектр комплектующих используемых в серверах. Даже такая компания как Samsung, которая по идее не должна ощущать дефицит комплектующих, ибо сама их и производит не смогла обеспечить себя в полном объеме необходимыми деталями и вынуждена была отменить некоторые модели к выпуску.
Поэтому, придется изучать новые процессоры и платформы по сухим данным, которые нам предоставили производители. Начинать думаю нужно в хронологическом порядке. И так, AMD представила новые процессоры Milan построенные на архитектуре Zen3, которые можно назвать следующим этапом развития линейки. Каких-то кардинальных изменений не произошло. Даже совместимость с предыдущими платформами сохранилась, т.е. речь идет о платформах поддерживающих процессоры Rome, это линейка Epyc 7002. В линейке Supermicro это материнские платы серии H12. Сообщается, что более ранняя линейка плат для платформы Naples (H11 по модельному ряду Supermicro) не будет поддерживать новые процессоры. Хотя H11 то и процессоры Rome поддерживала с ограничениями, в частности был недоступен интерфейс PCI-E 4.0.
Новая линейка процессоров от AMD получила больше ядер и в некоторых моделях подросли тактовые частоты, за ними выросли цены и тепловой пакет. Переход на новую архитектуру Zen3 позволил увеличить IPC производительность почти на пятую часть по сравнению с предыдущей линейкой. В первую очередь за счет оптимизации внутри архитектуры. Новые CCX модули теперь слеплены целиком из 8 ядер и имеют общий кэш третьего уровня равный 32Мб. Это позволило избавиться от задержек, которые ранее формировались между блоками четырех ядерных CCX связанных шиной Infinity Fabric. Причем благодаря различным комбинациям этих модулей АМД может создавать различные модели процессоров под разные задачи. Более высокочастотные модели, но с меньшим кол-во ядер или наоборот многоядерные модели, но с низкими тактовыми частотами, но уже блоками по 8 ядер.
Линейка актуальных процессоров представлена ниже:
Технические характеристики и цены AMD EPYC 7003 | ||||||||||||
Модель | Ядра | Потоки | Базовая частота, ГГц | Boost-частота, ГГц | TDP, Вт | cTDP Min, Вт | cTDP Max, Вт | Объём L3-кеша, Мбайт | Каналы памяти DDR4 | Частота памяти (1DPC) | Линии PCIe 4.0 | Цена (1Ku) |
7763 | 64 | 128 | 2,45 | 3,50 | 280 | 225 | 280 | 256 | 8 | 3200 | x128 | $7 890 |
7713 | 64 | 128 | 2,00 | 3,675 | 225 | 225 | 240 | 256 | 8 | 3200 | x128 | $7 060 |
7713P | 64 | 128 | 2,00 | 3,675 | 225 | 225 | 240 | 256 | 8 | 3200 | x128 | $5 010 |
7663 | 56 | 112 | 2,00 | 3,50 | 240 | 225 | 240 | 256 | 8 | 3200 | x128 | $6 366 |
7643 | 48 | 96 | 2,30 | 3,60 | 225 | 225 | 240 | 256 | 8 | 3200 | x128 | $4 995 |
7543 | 32 | 64 | 2,80 | 3,70 | 225 | 225 | 240 | 256 | 8 | 3200 | x128 | $3 761 |
7543P | 32 | 64 | 2,80 | 3,70 | 225 | 225 | 240 | 256 | 8 | 3200 | x128 | $2 730 |
7513 | 32 | 64 | 2,60 | 3,65 | 200 | 165 | 200 | 128 | 8 | 3200 | x128 | $2 840 |
7453 | 28 | 56 | 2,75 | 3,45 | 225 | 225 | 240 | 64 | 8 | 3200 | x128 | $1 570 |
7443 | 24 | 48 | 2,85 | 4,00 | 200 | 165 | 200 | 128 | 8 | 3200 | x128 | $2 010 |
7443P | 24 | 48 | 2,85 | 4,00 | 200 | 165 | 200 | 128 | 8 | 3200 | x128 | $1 337 |
7413 | 24 | 48 | 2,65 | 3,60 | 180 | 165 | 200 | 128 | 8 | 3200 | x128 | $1 825 |
7343 | 16 | 32 | 3,20 | 3,90 | 190 | 165 | 200 | 128 | 8 | 3200 | x128 | $1 565 |
7313 | 16 | 32 | 3,00 | 3,70 | 155 | 155 | 180 | 128 | 8 | 3200 | x128 | $1 083 |
7313P | 16 | 32 | 3,00 | 3,70 | 155 | 155 | 180 | 128 | 8 | 3200 | x128 | $913 |
F-серия (оптимизация по частотам и объёму L3-кеша) | ||||||||||||
75F3 | 32 | 64 | 2,95 | 4,00 | 280 | 225 | 280 | 256 | 8 | 3200 | x128 | $4 860 |
74F3 | 24 | 48 | 3,20 | 4,00 | 240 | 225 | 240 | 256 | 8 | 3200 | x128 | $2 900 |
73F3 | 16 | 32 | 3,50 | 4,00 | 240 | 225 | 240 | 256 | 8 | 3200 | x128 | $3 521 |
72F3 | 8 | 16 | 3,70 | 4,10 | 180 | 165 | 200 | 256 | 8 | 3200 | x128 | $2 468 |
Так же была доработана система безопасности, в частности были оптимизированы методы шифрования и работы с оперативной памятью, что позволило еще больше изолировать отдельные блоки памяти виртуальных машин.
В целом, линейка процессоров стала выглядеть еще лучше, сильные стороны подтянули, слабые же остались как минимум на том же уровне. Если сравнивать новые процессоры AMD c линейкой Intel Xeon Cascade Lake Refresh, то сразу же бросается в глаза ряд преимуществ, это и 8 канальный контроллер памяти с шиной на 3200Мгц во всей линейке семейства и 128 линии PCI-E и высокая плотность ядер на сокет, которая позволяет создавать бюджетные однопроцессорные конфигурации, но с хорошими процессорными мощностями.
Реальное применение AMD
Здесь начинают всплывать нюансы, которые не видны за этими промо материалами, когда мы окунаемся в реальность и пытаемся собрать недорогой сервер с одним хорошим процессором, начинаются проблемы. Ядер ведь много зачем городить два процессора в 1U? Неожиданно, приходит понимание, что заказчик планирует использовать RAID, причем бюджетный на SATA. Портов SATA процессор поддерживает до 16 шт., но распаяли на плате только 8, а функции RAID не завезли вовсе, приходиться докупать пусть и простой, но дополнительный контроллер. Вроде есть огромное кол-во линии PCI-E, но нет аналога VROC. Да и сама платформа, от нашего любимого Supermicro в один процессор получается дороже аналогичной для Intel. Вот и выходит, что AMD становится интересным в среднем ценовом сегменте и выше, а здесь у Intel есть уже свои киллер фичи, такие как 4-х процессорная конфигурация, оперативная память Optane оптимизация всего и вся под свои платформы. А с выходом новой линейки процессоров Xeon Ice Lake-SP все это будет выглядеть еще ярче.
Пусть даже это требует переход на новый сокет. В этом сегмента рынка очень редко встречается такая ситуация, когда заказчик вдруг решил модернизировать процессоры, обычно к этому времени, когда клиент решился на модернизацию, целесообразнее купить уже новую платформу или обновиться на топы в своей линейке, чтобы ничего сильно не менять. Благо, что к тому моменту, когда это наступает, обычно топовые когда-то модели процессоров становятся доступнее младших моделей актуальной линейки. Конкретный пример: у нас часто встречаются заказчики, которые меняют купленные когда-то Xeon E5-2620v3 на топовые E5-2690v4 не меняя своей платформы, но получая заметный скачок в производительности за адекватную цену. Если у вас когда-то уже были E5-2699v4 и вдруг их стало не хватать, целесообразнее переходит уже на актуальную платформу.
Путаница с Cooper-Lake и Ice Lake SP
В ответ на выходки конкурента, Intel представляет полностью обновленную линейку Intel Xeon на LGA 4189 (Socket P+) c кодовым названием Ice Lake-SP, на самом деле на этом сокете ранее уже выходили процессоры Cooper Lake, это какое-то промежуточное поколение между Cascade Lake Refresh и Ice Lake-SP, причем в линейке процессоров Cooper Lake были только 4 и 8 процессорные модели из линейки Gold и Platinum и они не совместимы с платами которые будут выпущены под процессоры Ice Lake-SP хоть и имеют одинаковый сокет и цифровое поколение. Эти процессоры можно узнать по префиксам H или HL в конце наименования модели. Это важно. Сами по себе эти процессоры действительно выглядят промежуточно, они выполнены по литографии 14 nm, но уже поддерживают PCI-E 4.0 и модели Platinum могут работать с памятью на шине до 3200Мгц. Модели имеют до 6 UPI, что делает возможным построение платформ с 4 и 8 центральными процессорами. На момент публикации у Supermicro доступна только одна система совместимая с этим процессорами, это модель MP SuperServer SYS-240P-TNRT. Большой объем работ был произведен в области оптимизации процессоров для работы с машинным обучением, внедрены новые блоки, а объем поддерживаемой оперативной памяти вырос до 4,5ТБ у некоторых моделей, причем поддерживается Intel® Optane™ persistent memory 200 серии. Т.е. эти процессоры это такой задел для больших и очень мощных серверов, которые могут выполнять огромный спектр задач с высокой нагрузкой и не спасовать переда задачами ИИ, которые в последнее время на себя брали только видеокарты. Intel серьезно задумывается над тем, какую часть рынка они теряют видя успехи Nvidia на этом поприще. Сейчас в разработке находятся графические карты, которые смогут составить конкуренцию уже в среднем ценовом сегменте для AMD и Nvidia. В тоже время Intel планомерно развивает свою платформу OpenVINO, которая является бесплатным инструментом и позволяет на железе от Intel строить модели для Deep Learning и других интересных задач из области ИИ. Поэтому развитие линейки процессоров в том числе в этом направлении выглядит логично.
Так выглядит модельный ряд процессоров Cooper Lake
А теперь о Ice Lake — SP в отдельности
В первую очередь это действительно массовый продукт который приходит на смену второму поколению Scalable Xeon и его Refresh версии с литерой R. Интел обещает прирост производительности за такт (IPC) до полутора раз в обычных задачах и до 1.74 раза при работе с ИИ по сравнению с предыдущим поколением линейки и прирост в 2.65 раза по сравнению с вышеупомянутым Xeon E5-2699v4, который вышел 5 лет назад. Кстати, сравнение идет между процессорами Xeon Platinum 8280 и 8380. Как же достигаются такие результаты? Во-первых, это первые процессоры от Intel выполненные по 10нм тех.процессу, что позволило произвести ряд оптимизации, добавить ядра, увеличить кэш всех уровней, например, прошлая линейка обладала след. характеристиками 32Кб\1Мб\1.375Мб, а теперь 48Кб\1.25Мб\1.5Мб на ядро. Во-вторых, на общую производительность сказалось добавление еще двух каналов памяти, причем с поддержкой шины до 3200Мгц и объёмом до 6ТБ на сокет. Поддерживается память DCPMM. В-третьих, теперь процессор выдает 64 линии PCI-E вместо 48 в прошлой генерации, так еще и поколение теперь 4.0. В-четвертых, шина UPI теперь на 11.2GT\s, вместо 10.4GT\s. В-пятых, добавилось много новых инструкции и команд. Например, добавилась технология Deep Learning Boost, призванная ускорить вычисления в области ИИ. Теперь ИИ становится общим трендом в индустрии.
А еще Intel уверят, что снизилась цена, а кол-во ядер увеличилось и это скорее главный аргумент в борьбе с конкурентом. Теперь Интел готов предложить до 40 ядер на сокет. Давайте посмотрим на всю линейку процессоров в таблице ниже.
Заранее стоит оговорить индексы, которые говорят о многом, а иногда в корне меняют характеристики процессора:
Y — поддержка технологии Intel Speed Select — Performance Profile 2.0 (Intel SST PP)
U — поддержка только однопроцессорной конфигурации
S — поддержка Intel Speed Select — Performance Profile 2.0.
Q — предназначен для водяного охлаждения
P — для облачных провайдеров предлагается использовать в IaaS
V — для облачных провайдеров для SaaS в платформах виртуализации
N — для решении с высокой нагрузкой на сетевые ресурсы, виртуализация сетевых интерфейсов и так далее.
T — соответствует стандарту NEBS, т.е. могут работать под длительными и высокими нагрузками.
Казалось бы вот эти процессоры обречены на успех, они дешевле, производительнее и так далее, но реальность накладывает свои корректировки. Из-за дефицита процессоры все еще сложно получить в необходимом кол-ве, причем даже самые массовые модели. Цена тоже стала заметно выше рекомендованной, а платформа на которую они рассчитаны уже изначально дороже по сравнению с предыдущим поколением, память на частоте 3200Мгц дороже и тоже ограниченна в доступности. Поэтому и выходит, что на бумаге все хорошо, а мы все еще массово предлагаем заказчикам решения на предыдущих поколениях, которые хоть как-то еще доступны к заказу и имеют адекватный срок поставки.
Уже совсем скоро на горизонте появится новая линейка процессоров Xeon 4-го поколения с кодовым названием Sapphire Rapids, и платформой Intel Eagle Stream (LGA 4677) построенной на наработках десктопных процессоров Alder Lake.