62 процессора и 80 различных конфигураций
На календаре сменился очередной год, нами были подготовлены новые методики тестирования компьютерных систем, а это значит, что пришла пора подводить итоги тестирования процессоров (которое является частным случаем тестирования систем) в 2015 году. Прошлогодние итоги были достаточно краткими - в них вошли результаты всего 36 систем, различающихся только процессорами и полученные исключительно при использовании встроенного в них GPU. Такой подход по понятным причинам оставил «за бортом» немалое количество платформ, лишенных интегрированной графики, так что мы решили его немного модифицировать, начав иногда использовать и дискретную видеокарту - по крайней мере там, где она необходима. Впрочем, тесты 2015 года стали в какой-то степени «учебно-тренировочными» - в 2016-м мы планируем еще немного доработать подход к тестированию с целью его дальнейшего приближения к реальной жизни. Но как бы то ни было, сегодня у нас будут представлены результаты уже 62 процессоров (точнее, разных тут 61, однако благодаря cTDP один из них идет за два). И это еще не все: 14 из них были протестированы с двумя «видеокартами» - интегрированным GPU (у всех разным) и дискретным Radeon R7 260X. Также четыре процессора для новейшей платформы LGA1151 были протестированы нами с двумя типами памяти: DDR4-2133 и DDR3-1600. Таким образом, общее число конфигураций составило 80 - это куда меньше, чем 149 в позапрошлых итогах , но для тех мы собирали информацию два с половиной года, а «срок жизни» текущей тестовой методики составил примерно восемь месяцев, т. е. почти в три раза меньше. Кроме того, унификация тестов для разных систем позволяет сравнивать результаты с полученными при тестировании ноутбуков, моноблоков и других законченных систем.
Но в данной конкретной статье мы, как уже было сказано выше, ограничимся процессорами. Точнее, системами, различающимися в основном только процессорами - понятно, что никакого иного смысла «тестирование процессоров» (в особенности для разных платформ) давно уже не имеет, хотя для некоторых это и сейчас является откровением:)
Конфигурация тестовых стендов
Поскольку испытуемых много, расписывать подробно их характеристики не представляется возможным. Поразмыслив немного, мы решили и от обычной краткой таблицы отказаться: все равно она становится слишком уж необозримой, а некоторые параметры мы по просьбам трудящихся все равно вынесли прямо на диаграммы. В частности, раз уж просят некоторые указывать прямо там количество ядер/модулей и выполняемых одновременно потоков вычислений, а также диапазоны рабочих тактовых частот - мы попробовали сделать именно так. Если результат читателям понравится, мы его в наступившем году сохраним и для других тестирований. Формат простой: «ядра/потоки; минимальная/максимальная тактовая частота ядер в ГГц».
Ну а все остальные характеристики придется смотреть в других местах - проще всего у производителей, а цены - в магазинах. Тем более, что для части устройств цены все равно неопределяемые, поскольку в рознице сами по себе эти процессоры отсутствуют (все BGA-модели, например). Впрочем, вся эта информация есть, разумеется, и в обзорных статьях, посвященных этим моделям, а сегодня мы занимаемся несколько иной задачей, нежели собственно изучение процессоров: собираем все полученные данные вместе и смотрим на получившиеся закономерности. В том числе, обращая внимание и на относительное положение не процессоров, а целых платформ, их включающих. Из-за этого и группировка данных на диаграммах - именно по платформам.
Поэтому осталось только сказать пару слов об окружении. Что касается памяти, то практически всегда использовалась максимально быстрая, поддерживаемая по спецификации. Исключений два: то, что мы назвали «Intel LGA1151 (DDR3)» и Core i5-3427U. Для второго просто не нашлось подходящих модулей DDR3-1600, поэтому его пришлось тестировать с DDR3-1333, а первое - процессоры под LGA1151, но в паре с DDR3-1600, а не более быстрой (и «основной» по спецификациям) DDR4-2133. Объем же памяти в большинстве случаев одинаковый - 8 ГБ, за исключением двух версий LGA2011 - здесь было 16 ГБ DDR3 или DDR4 соответственно, благо четырехканальный контроллер прямо провоцирует использовать больший объем ОЗУ. Системный накопитель (Toshiba THNSNH256GMCT емкостью 256 ГБ) - одинаковый для всех испытуемых. Насчет видеочасти все уже было сказано выше: дискретный Radeon R7 260X и встроенное видеоядро. Видеоядро использовалось всегда, когда оно было у процессора (исключение - Core i5-655K, поскольку первая версия Intel HD Graphics уже не поддерживается современными ОС), дискретная же видеокарта применялась там, где встроенного видео нет. И еще в некоторых случаях - там, где встроенное видео есть: для сравнения результатов.
Методика тестирования
Для оценки производительности мы использовали нашу методику измерения производительности с применением бенчмарка . Все результаты тестирования мы нормировали относительно результатов референсной системы, которая в прошедшем году была одинаковой и для ноутбуков, и для всех остальных компьютеров, чтобы облегчить читателям нелегкий труд сравнения и выбора.
Таким образом, эти нормированные результаты можно сравнивать с полученными в той же версии бенчмарка для других систем (например, берем и сравниваем его с настольными платформами). Тем же, кого интересуют абсолютные результаты, мы предлагаем их в виде файла в формате Microsoft Excel .
Видеоконвертирование и видеообработка
Как мы уже не раз отмечали, в этой группе дискретная видеокарта позволяет увеличить производительность, но хорошо заметен этот эффект только на старых платформах (типа LGA1155), где мощность интегрированных GPU была сама по себе невелика. Собственно, вот он и ответ - зачем в новых поколениях ее увеличивали: а чтоб не было стимула покупать еще и видеокарту:)
Также здесь хорошо заметна зависимость производительности от количества потоков выполняемого кода. В итоге приходим к очень широкому диапазону результатов - они отличаются более чем на порядок, поскольку младшие двух- и четырехъядерные CULV-решения (типа старого Celeron 1037U или чуть более нового, но уже тоже устаревшего Pentium J2900) выдают лишь ≈55 баллов, а топовый восьмиядерный Core i7-5960X - все 577. Но основная «давка» разворачивается в массовом сегменте (до $200): современные Core i5 позволяют увеличить производительность (относительно «уровня пола») в пять раз, а вот дальнейшие вложения поднимают ее лишь еще вдвое. Собственно, ничего удивительного в этом нет: чем выше - тем дороже.
Что же касается сравнения платформ, то... их можно и не сравнивать. Действительно: настольная AMD FM2+ примерно соответствует лишь ультрабучным процессорам Intel, а формально топовая АМ3+ - лишь давно устаревшей LGA1155. Впрочем, у Intel прирост от поколения к поколению невелик - даже в таких хорошо оптимизированных задачах можно говорить лишь о 15-20% на каждом шаге. (Это, впрочем, иногда приводит к качественным изменениям - к примеру, Core i7-6700K фактически догнал некогда топовый шестиядерник i7-4960X, несмотря на существенно более низкую цену и более простое устройство.) В общем, видно, что производители занимаются совсем другими вопросами, а вовсе не попытками сильно увеличить производительность настольных систем.
Создание видеоконтента
Как мы уже не раз писали, в этой группе порядочную свинью нам подложил многопоточный тест в Adobe After Effects CC 2014.1.1. Для его нормальной работы рекомендуется иметь как минимум 2 ГБ на каждый поток вычисления - в противном случае тест может «выпасть» в однопоточный режим и начать работать еще медленнее, чем без задействования технологии Multiprocessing (как ее называет Adobe). В общем, для полноценной работы в восемь потоков желательно наличие 16 ГБ оперативной памяти, а восьмиядерному процессору с НТ потребуется минимум 32 ГБ памяти. Мы же на большинстве систем используем 8 ГБ памяти, чего «восьмипоточникам» хватает при использовании интегрированного видео (если оно у них есть: для настольных Core i7 это выполняется, а вот FX-8000, например, приходится хуже), но не дискретного. Очередной камешек в огород тех, кто до сих пор верует в «тестирование процессоров» как чего-то самостоятельного - в отрыве от платформы и иного окружения: как видим, иногда попытки сделать его равным приводят к крайне любопытным эффектам. «Чистое» сравнение возможно, пожалуй, только в рамках одной платформы, да и то не всегда: необходимый некоторым программам объем памяти может зависеть от, собственно, процессора и не только его. Что как раз сильно бьет по топовым моделям, поскольку им нужно больше , а «больше» в данном случае значит дороже.
Впрочем, в любом случае, в данной группе приложений «процессорозависимость» выражена слабее, чем в предыдущей - там старшие Core i5 обгоняли низковольтных суррогатов в пять раз, а здесь лишь чуть больше, чем в четыре. Кроме того, и более мощная видеокарта способна увеличить результаты заметно слабее, хотя ей пренебрегать (по возможности) тоже не стоит.
Обработка цифровых фотографий
Данная группа интересна тем, что абсолютно не похожа на предыдущие - в частности, здесь намного ниже степень «утилизации многопоточности», что заметно сокращает диапазон полученных результатов, но вот различия между Core i5 (мы и дальше будем привязываться к этому семейству, как к верхнему уровню массового сегмента - продажи систем на базе более дорогих процессоров несравнимо меньше) и устройствами начального уровня превышает шесть раз. С чем это связано? Во-первых, заметна зависимость производительности от GPU. В первую очередь - интегрированного: дискретный не может развернуться в полную силу из-за необходимости частой пересылки данных. Но как раз мощность интегрированной графики в младших и старших процессорах различается в разы! А еще не стоит забывать о том, что до сих пор сохраняются не только количественные, но и качественные различия между младшими и старшими процессорами - например, по поддерживаемым наборам инструкций. Это сильно «бьет» как по младшим семействам Intel (напомним, что Pentium, к примеру, до сих пор не поддерживают AVX), так и по устаревшим процессорам обеих компаний.
Векторная графика
Но вот показательный пример того, что современное программное обеспечение бывает разным. Даже если речь идет о мягко говоря не самых дешевых программах, причем не «домашнего назначения». По сути, как мы уже не раз отмечали, какие-либо серьезные оптимизации Illustrator последний раз производились лет 10 назад, так что программе для быстрой работы нужны процессоры, максимально похожие на Core 2 Duo: максимум пара ядер с максимальной однопоточной производительностью и без поддержки новых наборов команд. В итоге наиболее выигрышно (с учетом цены) выглядят современные Pentium, а процессоры более высокого класса могут оказаться быстрее их лишь из-за более высокой тактовой частоты. Процессорам же других архитектур в таких условиях становится совсем плохо. Собственно, даже в линейке Intel такие интенсивные методы увеличения производительности, как добавление кэш-памяти четвертого уровня, в данном случае только мешают, а не помогают. Впрочем, в любом случае, пытаться сильно ускорить работу в этой программе (и подобных ей) - занятие не слишком многообещающее: всего четырехкратная разница между лучшими Core i5 и суррогатными платформами говорит сама за себя.
Аудиообработка
Перед нами пример ситуации, когда, вроде бы, и вычислительные ядра не лишние, и даже GPU имеет значение, и т. п., но разница между Celeron N3150 (самым медленным в этом тесте) и Core i7 для массовых платформ лишь порядка пяти раз. Причем немалая ее часть может быть списана на суррогатность младших архитектур - уже очень старый Celeron 1037U (пусть сильно ограниченный, но полноценный Core) быстрее, чем N3150 почти в полтора раза, а младшие настольные Pentium - в три. А вот дальше... чем дороже, тем менее эффективен размер «доплаты за процессор». Даже в рамках одной архитектуры - «строительная техника» AMD со своей «бюджетной многопоточностью» в данном случае способна конкурировать лишь с теми же Pentium: шесть потоков быстрее четырех того же производителя, но не убедительно выглядят на фоне всего-то двух ядер конкурирующей разработки.
Распознавание текста
Совсем не так, как в предыдущем случае - вот здесь FX-8000 до сих пор с легкостью обгоняют любые Core i5. Заметим, что компания AMD так их и позиционировала на момент выпуска: между i5 и i7. В том числе, и по цене. Которую потом, к сожалению, пришлось радикально снижать, поскольку количество таких вот «удобных» задач оказалось не слишком велико. Однако если пользователя интересуют именно они - это дает возможность неплохо сэкономить. Учитывая, конечно, что это семейство не обновлялось уже больше трех лет (серьезным образом, во всяком случае), а процессоры Intel медленно, но растут.
А еще хорошо заметна проблема масштабируемости - сколь бы хороши не были дополнительные ядра и потоки, но чем их больше, тем меньший эффект дает увеличение количества. Собственно, в итоге не стоит удивляться тому, что в массовых процессорах этот процесс давно прекратился - нужны еще более убедительные аргументы за многоядерность, чем до сих пор удается найти. Вот четыре современных ядра - хорошо. Четыре двухпоточных ядра - еще лучше. А дальше - все.
Архивирование и разархивирование данных
Если при архивации задействуются все ядра (и дополнительные вычислительные потоки) процессоров, то обратный процесс - однопоточный. С учетом того, что им приходится пользоваться чаще, это могло бы считаться неприятностью, не будь сам процесс существенно более быстрым. Да, собственно, и упаковка стала достаточно простой операцией, чтобы обращать на нее пристальное внимание при выборе процессора. Во всяком случае, это верно для массовых настольных моделей - низкопотребляющие специализированные платформы до сих пор могут с такими задачами «возиться» долго.
Скорость инсталляции и деинсталляции приложений
В принципе, и эта задача была введена нами в тестовую методику в основном из-за необходимости тестировать готовые системы: и на одном и том же процессоре в разном окружении, как мы уже знаем , производительность может отличаться в полтора-два раза. А вот когда в системе используется быстрый накопитель и памяти достаточно, собственно процессоры отличаются друг от друга не принципиально. Впрочем, суррогатные платформы вполне могут оказаться как раз в те же два-три раза медленнее «нормальных» настольных. Но вот последние уже друг от друга отличаются слабо - будь там Pentium или Core i7. По сути все, что может понадобиться от процессора - один поток вычислений с максимальной производительностью. Но если отбросить мобильные системы, это практически всегда выполняется в примерно равной степени.
Файловые операции
А это тем более «платформенно-накопительные» тесты, нежели процессорные. Мы же в рамках этой линейки тестов используем одинаковый накопитель - со всеми вытекающими. А вот «платформа» может иметь значение - некоторым сюрпризом, например, оказались результаты LGA1156: вроде бы не худшее настольное решение, которое до последнего времени можно было считать даже быстрым (до сих пор встречающаяся у пользователей LGA775 еще хуже), но вот оказалось, что сравнивать ее при таких нагрузках можно разве что с Bay Trail или Braswell. Да и то - сравнение будет не в пользу некогда близкой к топовому уровню «старушки». А вот современные бюджетные системы уже практически не отличаются от небюджетных - просто потому, что и первых уже достаточно, чтобы производительность начала определяться другими компонентами системы, не «упираясь» в процессор или даже в чипсет.
Итого
В принципе, основные выводы по семействам процессоров нами делались непосредственно в обзорах, так что в данной статье они не требуются - это в первую очередь обобщение всей полученной ранее информации, не более того. А обобщения, как видим, иногда могут оказаться интересными. Во-первых, несложно заметить, что влияние дискретных видеокарт на производительность в программах массового назначения в общем и целом можно считать отсутствующим. Точнее, в отдельных приложениях оно есть, но будучи «размазанным» по всем тестам - тихо-мирно испаряется. Во всяком случае, это справедливо для более-менее современных платформ - несложно заметить, что слабая интегрированная графика времен LGA1155 даже в общем зачете может снизить результаты процентов на пять, что уже более-менее заметно, хоть и не критично. То же самое должно касаться и старых дискретных видеокарт, которые также будут проигрывать чуть более новым, но в этом случае граница между «хорошими» и «плохими» решениями отодвигается уже не на три, а на пять и более лет от текущего момента. Словом, современные платформы таких проблем лишены. Так что для качественного сравнения вовсе не обязательно требовать одинаковой видеочасти, а значит, если нужно, например, сравнить ноутбук с настольной системой, находим подходящую статью о ноутбуке (не обязательно даже о том самом - подойдет и другой на аналогичной платформе) и сравниваем. Система хранения данных и то имеет большее значение, так что если по ней паритета в статьях нет, придется ограничиться результатами групп тестов, от накопителя не зависящих. Что же касается видео... Повторимся: среди массовых приложений так уж сильно привязанных к нему нет, а игровое применение - совсем отдельная история.
А теперь попробуем (как обычно) посмотреть на диапазон производительности, который удалось охватить за этот год. Минимальный результат в общем зачете - у Celeron N3150: 54,6 балла. Максимальный - у Core i7-6700K: 258,4 балла. «Профессиональным» платформам типа LGA2011/2011-3 не удалось выбраться на первое место, хотя в части тестов ее «многоядерные» представители уверенно лидировали. Причины этого были озвучены не раз: производители массового ПО в основном ориентируются на имеющийся у пользователей парк техники, а вовсе не на какие-то «сверкающие вершины». Есть (причем всегда были и всегда будут) такие задачи, для решения которых вычислительных ресурсов «всегда мало», и именно для них требуются топовые системы (иногда выходящие далеко за рамки наших тестирований), но основная масса задач легко решается на массовом компьютере. Зачастую даже на устаревшем.
В этой связи интересно сравнить текущие «Итоги» не с прошлыми, а с позапрошлыми . Тогда тестирования делались совсем по другой схеме - всегда с использованием мощной дискретной видеокарты. И приложений профессионального назначения было больше, так что топовые шестиядерные процессоры в общем итоге все-таки оказывались быстрее, чем лучшие решения для массовых платформ. Однако при этом Core i7-4770K набрал 242 балла - что как раз сравнимо с 258,4 у Core i7-6700K (с точки зрения позиционирования с поправкой на время эти процессоры одинаковы: один был самым быстрым решением для массовой LGA1150 2013 года, а второй - то же самое в 2016-м для LGA1151). При этом и тогда, и сейчас разнообразные Pentium/Core i3/Core i5 толкались в диапазоне 100-200 баллов - ничего не изменилось. Разве что баллы стали другими: про программное обеспечение выше было сказано, но ведь и эталон сменился тоже. Ранее таковым был AMD Athlon II X4 620 (бюджетный, но настольный и четырехъядерный процессор) с дискретной видеокартой на базе Nvidia GeForce GTX 570. А теперь это (ультрабучный) Intel Core i5-3317U без какой-либо дискретки. Вроде бы, все другое. А на практике - то же самое: бюджетный десктоп дает сотню баллов, любые вложения в него в лучшем случае могут увеличить производительность (в среднем по классам задач) в два с половиной раза, а компактный неттоп на суррогатной платформе будет работать в два-три раза медленнее. Такое положение дел в сегменте настольных компьютеров устоялось и сохраняется уже давно, что хорошо показывают наши сводные итоги. В общем, собираясь в магазин за новым компьютером, вам не нужно читать никакие статьи - достаточно проанализировать количество денег в кошельке:)
А когда все-таки нужны тесты? В основном - когда возникает задача сменить старый компьютер на новый. В особенности - когда при этом планируется «перейти в другой класс»: поменяв десктоп на неттоп или ноутбук, например. Приобретая же новое решение прежнего класса, можно и не дергаться: новый Core i5, к примеру, всегда будет быстрее старого того же класса, поэтому большой необходимости в точных оценках «на сколько» нет. А вот то, что медленно, но верно растет производительность процессоров разного предназначения, может привести к приятным сюрпризам - когда, например, окажется, что старый десктоп легко заменит ультрабук, причем без каких-либо негативных последствий. Что ж, как видим, и такое вполне возможно, поскольку «растут» все.
ARM процессор - мобильный процессор для смартфонов и планшетов.
В этой таблице представлены все известные на сегодняшний день ARM процессоры. Таблица ARM процессоров будет дополнятся и модернизироваться по мере появления новых моделей. В данной таблице используется условная система оценки производительности CPU и GPU. Данные о производительности ARM процессоров были взяты из самых разных источников, в основном исходя из результатов таких тестов, как: PassMark , Antutu , GFXBench .
Мы не претендуем на абсолютную точность. Абсолютно точно ранжировать и оценить производительность ARM процессоров невозможно, по той простой причине, что каждый из них, в чем-то имеет преимущества, а в чем-то отстает от других ARM процессоров. Таблица ARM процессоров позволяет увидеть, оценить и, главное, сравнить различные SoC (System-On-Chip) решения. Воспользовавшись нашей таблицей, Вы сможете сравнить мобильные процессора и достаточно точно узнать, как позиционируется ARM-сердце Вашего будущего (или настоящего) смартфона или планшета.
Вот мы провели сравнение ARM процессоров. Посмотрели и сравнили производительность CPU и GPU в различных SoC (System-оn-Chip). Но у читателя может возникнуть несколько вопросов: Где используются ARM процессора? Что такое ARM процессор? Чем отличается архитектура ARM от x86 процессоров? Попробуем разобраться во всем этом, не сильно углубляясь в подробности.
Для начала определимся с терминологией. ARM - это название архитектуры и одновременно название компании, ведущей ее разработку. Аббревиатура ARM расшифровывается как (Advanced RISC Machine или Acorn RISC Machine), что можно перевести как: усовершенствованная RISC-машина. ARM архитектура объединяет в себе семейство как 32, так и 64-разрядных микропроцессорных ядер, разработанных и лицензируемых компанией ARM Limited. Сразу хочется отметить, что компания ARM Limited занимается сугубо разработкой ядер и инструментария для них (средства отладки, компиляторы и т.д), но никак не производством самих процессоров. Компания ARM Limited продает лицензии на производство ARM процессоров сторонним фирмам. Вот неполный список компаний, получивших лицензию на производство ARM процессоров сегодня: AMD, Atmel, Altera, Cirrus Logic, Intel, Marvell, NXP, Samsung, LG, MediaTek, Qualcomm, Sony Ericsson, Texas Instruments, nVidia, Freescale ... и многие другие.
Некоторые компании, получившие лицензию на выпуск ARM процессоров, создают собственные варианты ядер на базе ARM архитектуры. Как пример можно назвать: DEC StrongARM, Freescale i.MX, Intel XScale, NVIDIA Tegra, ST-Ericsson Nomadik, Qualcomm Snapdragon, Texas Instruments OMAP, Samsung Hummingbird, LG H13, Apple A4/A5/A6 и HiSilicon K3.
На базе ARM процессоров сегодня работают
фактически любая электроника: КПК, мобильные телефоны и смартфоны
, цифровые плееры, портативные игровые консоли, калькуляторы, внешние жесткие диски и маршрутизаторы. Все они содержат в себе ARM-ядро, поэтому можно сказать, что ARM - мобильные процессоры для смартфонов
и планшетов.
ARM процессор представляет из себя SoC , или "систему на чипе". SoC система, или "система на чипе", может содержать в одном кристалле, помимо самого CPU, и остальные части полноценного компьютера. Это и контроллер памяти, и контроллер портов ввода-вывода, и графическое ядро, и система геопозиционирования (GPS). В нем может находится и 3G модуль, а также многое другое.
Если рассматривать отдельное семейство ARM процессоров, допустим Cortex-A9 (или любое другое), нельзя сказать, что все процессоры одного семейства имеют одинаковую производительность или все снабжены GPS модулем. Все эти параметры сильно зависят от производителя чипа и того, что и как он решил реализовать в своем продукте.
Чем же отличается ARM от X86 процессоров
? Сама по себе RISC (Reduced Instruction Set Computer) архитектура подразумевает под собой уменьшенный набор команд. Что соответственно ведет к очень умеренному энергопотреблению. Ведь внутри любого ARM чипа находится гораздо меньше транзисторов, чем у его собрата из х86 линейки. Не забываем, что в SoC-системе все периферийные устройства находится внутри одной микросхемы, что позволяет ARM процессору быть еще более экономным в плане энергопотребления. ARM архитектура изначально была предназначена для вычисления только целочисленных операций, в отличии от х86, которые умеют работать с вычислениями с плавающей запятой или FPU. Нельзя однозначно сравнивать эти две архитектуры. В чем-то преимущество будет за ARM. А где-то и наоборот. Если попробовать ответить одной фразой на вопрос: в чем разница между ARMи X86 процессорами, то ответ будет таким: ARM процессор незнает того количества команд, которые знает х86 процессор. А те, что знает, выглядят гораздо короче. В этом его как плюсы, так и минусы. Как бы там ни было, в последнее время все говорит о том, что ARM процессора начинают медленно, но уверенно догонять, а кое в чем и перегонять обычные х86. Многие открыто заявляют о том, что в скором времени ARM процессоры заменят х86 платформу в сегменте домашних ПК. Как мы уже , в 2013 году уже несколько компаний с мировым именем полностью отказались от дальнейшего выпуска нетбуков в пользу планшетных пк. Ну а что будет на самом деле, время покажет.
Мы же будем отслеживать уже имеющиеся на рынке ARM процессоры.
Почти каждый год на рынок выходит новое поколение центральных процессоров Intel Xeon E5. В каждом поколении попеременно меняются сокет и технологический процесс. Ядер становится всё больше и больше, а тепловыделение понемногу снижается. Но возникает естественный вопрос: «Что даёт новая архитектура конечному пользователю?»
Для этого я решил протестировать производительность аналогичных процессоров разных поколений. Сравнивать решил модели массового сегмента: 8-ядерные процессоры 2660, 2670, 2640V2, 2650V2, 2630V3 и 2620V4. Тестирование с подобным разбросом поколений является не совсем справедливым, т.к. между V2 и V3 стоит разный чипсет, память нового поколения с большей частотой, а самое главное - нет прямых ровесников по частоте среди моделей всех 4-х поколений. Но, в любом случае, это исследование поможет понять в какой степени выросла производительность новых процессоров в реальных приложениях и синтетических тестах.
Выбранная линейка процессоров имеет много схожих параметров : одинаковое количество ядер и потоков, 20 MB SmartCache, 8 GT/s QPI (кроме 2640V2) и количество линий PCI-E равное 40.
Для оценки целесообразности тестирования всех процессоров, я обратился к результатам тестов PassMark .
Ниже привожу сводный график результатов:
Так как частота существенно отличается, сравнивать результаты не совсем корректно. Но несмотря на это, с ходу напрашиваются выводы:
1. 2660 эквивалентен по производительности 2620V4
2. 2670 превосходит по производительности 2620V4 (очевидно, что за счёт частоты)
3. 2640V2 проседает, а 2650V2 бьёт всех (также из-за частоты)
Я поделил результат на частоту и получил некое значение производительности на 1 ГГц:
Вот тут уже результаты получились более интересные и наглядные:
1. 2660 и 2670 - неожиданный для меня разбег в рамках одного поколения, 2670 оправдывает только то, что общая производительность у него весьма высока
2. 2640V2 и 2650V2 - весьма странный низкий результат, который хуже чем у 2660
3. 2630V3 и 2620V4 - единственный логический рост (видимо как раз за счёт новой архитектуры...)
Проанализировав результат я решил отсеять часть неинтересных моделей, которые не имеют ценности для дальнейшего тестирования:
1. 2640V2 и 2650V2 - промежуточное поколение, и не очень удачное, на мой взгляд - убираю из кандидатов
2. 2630V3 - отличный результат, но стоит необоснованно дороже 2620V4, учитывая аналогичную производительность и, к тому же - это уже уходящее поколение процессоров
3. 2620V4 - адекватная цена (сравнивая с 2630V3), высокая производительность и, самое главное - это единственная модель 8-ядерного процессора последнего поколения с Hyper-threading в нашем списке, поэтому однозначно оставляем для дальнейших тестов
4. 2660 и 2670 - отличный результат в сравнении с 2620V4. На мой взгляд, именно сравнение первого и последнего (на данный момент) поколения в линейке Intel Xeon E5 представляет особый интерес. К тому же у нас на складе остались достаточные запасы процессоров первого поколения, поэтому для нас это сравнение весьма актуально.
Стоимость серверов на базе процессоров 2660 и 2620V4 может отличаться почти до 2 крат не в пользу последних, поэтому сравнив их производительность и выбрав сервер на процессорах V1 - можно существенно сократить бюджет на покупку нового сервера. Но об этом предложении я расскажу после результатов тестирования.
Для тестирования было собрано 3 стенда:
1. 2 x Xeon E5-2660, 8 x 8Gb DDR3 ECC REG 1333, SSD Intel Enterprise 150Gb
2. 2 x Xeon E5-2670, 8 x 8Gb DDR3 ECC REG 1333, SSD Intel Enterprise 150Gb
3. 2 x Xeon E5-2620V4, 8 x 8Gb DDR4 ECC REG 2133, SSD Intel Enterprise 150Gb
PassMark PerformanceTest 9.0
При отборе процессоров на тесты я уже пользовался результатами синтетических тестов, но сейчас интересно сравнить эти модели более детально. Сравнение сделал группами: 1-ое поколение против 4-го.Более подробный отчёт о тестировании позволяет сделать некоторые выводы:
1. Математика, в т.ч. и с плавающей точкой, в основном зависит от частоты. Разница в 100 МГц позволила 2660 опередить 2620V4 в расчётных операциях, в шифровании и компрессии (и это не смотря на существенную разницу в частоте памяти)
2. Физика и вычисления с использованием расширенных инструкций на новой архитектуре выполняются лучше, не смотря на низкую частоту
3. Ну и, разумеется, тест с использованием памяти прошёл в пользу процессоров V4, так как в данном случае соревновались уже разные поколения памяти - DDR4 и DDR3.
Это была синтетика. Посмотрим что покажут специализированные бенчмарки и реальные приложения.
Архиватор 7ZIP
Тут результаты перекликаются с предыдущим тестом - прямая привязка к частоте процессора. При этом не важно, что установлена более медленная память - процессоры V1 уверенно берут первенство частотой.
CINEBENCH R15
CINEBENCH - это бенчмарк для оценки рабочих характеристик компьютера для работы с профессиональной программой для создания анимации MAXON Cinema 4D.Xeon E5-2670 вытянул по частоте и побил 2620V4. А вот E5-2660, имеющий не столь видимое преимущество по частоте, проиграл процессору 4-го поколения. Отсюда вывод - этот софт использует полезные дополнения новой архитектуры (хотя возможно всё дело в памяти...), но не на столько, чтобы это было решающим фактором.
3DS MAX + V-Ray
Для оценки производительности процессоров при рендеринге в реальном приложении я взял связку: 3ds Max 2016 + V-ray 3.4 + реальная сцена с несколькими источниками света, зеркальными и прозрачными материалами, и картой окружения.Результаты получились схожи с CINEBENCH: Xeon E5-2670 показал самое низкое время рендеринга, а 2660 не смог обойти 2620V4.
1С: SQL/File
В заключение тестирования прилагаю результаты тестов gilev для 1С.При тестировании базы с файловым доступом уверенно лидирует процессор E5-2620V4. В таблице приведены средние значения 20 прогонов одного и того же теста. Разница между результатами каждого стенда в случае с файловой базой была не больше 2%.
Однопоточный тест базы SQL показал весьма странные результаты. Разница получилась незначительной, учитывая разную частоту у 2660 и 2670, и разную частоту у DDR3 и DDR4. Была попытка оптимизировать настройки SQL, но результаты оказались хуже, чем было, поэтому я решил тестировать все стенды на базовых настройках.
Результаты многопоточного теста SQL оказались ещё куда более странными и противоречивыми. Максимальная скорость 1 потока в МБ/с была эквивалентна индексу производительности в предыдущем однопоточном тесте.
Следующим параметром была максимальная скорость (всех потоков) - результат получился практически идентичным у всех стендов. Так как результаты разных прогонов сильно колебались (+-5%) - иногда они были у разных стендов с существенным отрывом как в одну так и в другую сторону. Одинаковые средние результаты многопоточного теста SQL наводят меня на 3 мысли:
1. Такая ситуация вызвана неоптимизированной конфигурацией SQL
2. SSD стал узким местом системы и не позволил процессорам разогнаться
3. Разницы между частотой памяти и процессоров под эти задачи почти нет (что крайне маловероятно)
Также оказался необъяснимым результат по параметру «Рекомендуемое кол-во пользователей». Средний результат у 2660 оказался выше всех - и это при низких результатах всех тестов.
По этому вопросу также буду рад увидеть Ваши комментарии.
Выводы
Результаты нескольких разносторонних вычислительных тестов показали, что частота процессора в большинстве случаев оказалась важней поколения, архитектуры и даже частоты памяти. Безусловно есть современный софт, который использует все улучшения новой архитектуры. Например, транскодирование видео иногда производится в т.ч. с использованием инструкций AVX2.0, но это специализированное ПО - а большинство серверных приложений по прежнему привязаны к количеству и частоте ядер.Разумеется я не заявляю, что разницы между процессорами нет совсем никакой, я лишь хочу отметить, что для определённых приложений нет смысла в «плановом» переходе на новое поколение.
Если Вы со мной не согласны или у Вас есть предложения для тестирования - стенды пока не разобраны, и я буду рад произвести тестирование Ваших задач.
Экономическая выгода
Как я уже писал в начале статьи - мы предлагаем линейку серверов на базе процессоров Xeon E5 первого поколения, которые по стоимости существенно бюджетней серверов на E5-2620V4.Это такие же новые серверы (не путать с б/у) с гарантией 3 года.
Ниже привожу ориентировочный расчет.
Лучший процессор для игр | Эффект снижения выгоды
Цены на процессоры верхнего уровня растут стремительно, но прирост производительности в играх будет всё меньше и меньше. Поэтому вряд ли стоит рекомендовать процессор дороже, чем Core i5-7600K. Тем более что при наличии хорошего кулера эту модель можно разогнать до 5 ГГц – если требуется более высокая производительность.
Однако есть небольшое количество игр, которые раскрывают возможности процессоров Core i7 с технологией Hyper-Threading. Мы считаем, что тенденция оптимизации игр под несколько ядер будет продолжаться, поэтому мы добавили в список Core i7-5820K. В большинстве игр разницы между Core i7 и Core i5 практически не будет, но если вы относитесь к энтузиастам, которым нужны перспектива на будущее и высокая производительность в многопоточных приложениях, этот CPU может потребовать дополнительных затрат.
С появлением интерфейса LGA 2011-v3 появились все основания построить на его основе непревзойдённую игровую платформу. У процессоров на базе Haswell-E больше доступного кэша, а также на четыре ядра больше по сравнению с ведущими моделями с разъёмом LGA 1150/1155. К тому же, благодаря четырёхканальному контроллеру, обеспечивается большая пропускная способность памяти. Благодаря 40 линиям PCIe третьего поколения, доступных на процессорах Sandy Bridge-E, платформа изначально поддерживает два слота х16 и один слот х8, либо один слот х16 и три слота х8, удаляя потенциальные "узкие места" в конфигурациях CrossFire или SLI на три и четыре видеокарты.
Хотя всё вышесказанное звучит впечатляюще, оно не обязательно приводит к существенному повышению производительности в современных играх. Наши тесты демонстрируют совсем небольшую разницу между Core i5-4690K на LGA 1150 за $240 и Core i7-4960X на LGA 2011 за $1000, даже когда установлены три видеокарты в SLI. Выходит, что пропускная способность памяти и PCIe не слишком влияют на производительность текущих систем на архитектуре Sandy Bridge.
По-настоящему потенциал Haswell-E проявляется в играх, сильно нагружающих процессор, таких как мультиплеер в Battlefield 1. Если вы используете три или четыре видеокарты, вполне возможно, что у вас уже достаточно производительности. Разогнанный Core i7-5960X или Core i7-5930K могут помочь оставшейся части платформы догнать чрезвычайно мощную видеосистему.
В общем, хотя мы и не рекомендуем покупать процессор дороже Core i5-7600K с точки зрения соотношения цена/производительность (сэкономленную сумму деньги можно потратить на графический адаптер и системную плату), всегда найдутся те, кто не пожалеет денег в стремлении добиться максимально возможной производительности.
Лучший процессор для игр | Сравнительная таблица
Как насчёт других процессоров, которых нет в списке наших рекомендаций? Стоит ли их покупать или нет?
Подобные вопросы вполне уместны, поскольку доступность разных моделей и цены на них меняются ежедневно. Как узнать, будет ли процессор, на который вы положили глаз, лучшей покупкой в данном ценовом диапазоне?
Мы решили помочь вам в этом нелёгком деле, представив таблицу иерархии CPU, где процессоры одного уровня игровой производительности находятся на одной строчке. В верхних строчках приведены самые производительные геймерские CPU и по мере продвижения вниз по строчкам производительность снижается.
Предлагаемая иерархическая таблица различных моделей процессоров Intel и AMD изначально была основана на средней производительности каждой из них в нашем наборе тестов. Позже мы добавили в качестве одного из критериев оценки новые игровые данные, однако следует иметь в виду, что разные игры ведут себя по-разному из-за уникальных особенностей их программного кода. К примеру, некоторые из них чрезвычайно зависимы от мощности графической подсистемы, но другие положительно реагируют на большее число ядер, кэш-памяти или даже на конкретную архитектуру.
У нас нет возможности протестировать каждый CPU на рынке, поэтому в некоторых случаях распределение мест зависит от результатов аналогичных моделей. По сути, эта иерархическая таблица полезна в качестве общего руководства по выбору, но она не является универсальным средством сравнения разных процессоров . За более подробной информацией обращайтесь к (англ.) или к регулярно обновляемому разделу " Лучший процессор для игр: текущий анализ рынка ".
Возможно, вы заметили, что мы разбили на два уровня раздел флагманских процессоров и на одном из них разместили несколько четырёхъядерных моделей AMD. Учитывая, что множество старых платформ могут использоваться с графическими подсистемами нескольких разных поколений, мы хотели выделить самые высокопроизводительные модели, чтобы поддержать баланс между системой и видеоускорителем. К примеру, на данный момент, любой владелец Core i7 поколения Sandy Bridge почувствует существенный прирост при переходе на Kaby Lake или Broadwell-E. А помещение флагманских процессоров AMD серии FX на одну ступень с несколькими Core i7 и более старыми Core i5 означает повышение их статуса.
Иерархия процессоров Intel и AMD | Таблица
Intel | AMD |
Core i7
-3770, -3770K, -3820, -3930K, -3960X, -3970X, -4770, -4771, -4790, -4770K, -4790K, -4820K, -4930K, -4960X, -5775C, -5820K, 5930K, -5960X, -6700K, -6700, -7700K, -7700, -6800K, -6850K, -6900K, -6950X Core i5 -7600K, -7600, -7500, -7400, -6600K, -6600, -6500, -5675C, -4690K, 4670K, -4590, -4670, -4570, -4460, -4440, -4430, -3570K, -3570, -3550 |
|
Core i7
-2600, -2600K, -2700K, -965, -975 Extreme, -980X Extreme, -990X Extreme Core i5 -3470, -3450P, -3450, -3350P, -3330, 2550K, -2500K, -2500, -2450P, -2400, -2380P, -2320, -2310, -2300 |
FX -9590, 9370, 8370, 8350, 8320, 8300, 8150 |
Core i7
-980, -970, -960 Core i7 -870, -875K Core i3 -7350K, -7320, -7300, -7100, -4360, -4350, -4340, -4170, -4160, -4150, -4130, -3250, -3245, -3240, -3225, -3220, -3210, -2100, -2105, -2120, -2125, -2130 Pentium G4620, G4600, G4560 |
FX
-6350, 4350 Phenom II X6 1100T BE, 1090T BE Phenom II X4 Black Edition 980, 975 |
Core i7
-860, -920, -930, -940, -950 Core i5 -3220T, -750, -760, -2405S, -2400S Core 2 Extreme QX9775, QX9770, QX9650 Core 2 Quad Q9650 |
FX
-8120, 8320e, 8370e, 6200, 6300, 4170, 4300 Phenom II X6 1075T Phenom II X4 Black Edition 970, 965, 955 A10 -6800K, 6790K, 6700, 5800K, -5700, -7700K, -7800, -7850K, 7870K A8 -3850, -3870K, -5600K, 6600K, -7600, -7650K Athlon X4 651K, 645, 641, 640, 740, 750K, 860K |
Core 2 Extreme
QX6850, QX6800 Core 2 Quad Q9550, Q9450, Q9400 Core i5 -650, -655K, -660, -661, -670, -680 Core i3 -2100T, -2120T |
FX
-6100, -4100, -4130 Phenom II X6 1055T, 1045T Phenom II X4 945, 940, 920 Phenom II X3 Black Edition 720, 740 A8 -5500, 6500 A6 -3650, -3670K, -7400K Athlon II X4 635, 630 |
Core 2 Extreme
QX6700 Core 2 Quad Q6700, Q9300, Q8400, Q6600, Q8300 Core 2 Duo E8600, E8500, E8400, E7600 Core i3 -530, -540, -550 Pentium G3470, G3460, G3450, G3440, G3430, G3420, G3260, G3258, G3250, G3220, G3420, G3430, G2130, G2120, G2020, G2010, G870, G860, G850, G840, G645, G640, G630 |
Phenom II X4
910, 910e, 810 Athlon II X 4 620, 631 Athlon II X3 460 |
Core 2 Extreme
X6800 Core 2 Quad Q8200 Core 2 Duo E8300, E8200, E8190, E7500, E7400, E6850, E6750 Pentium G620 Celeron G1630, G1620, G1610, G555, G550, G540, G530 |
Phenom II X4
905e, 805 Phenom II X3 710, 705e Phenom II X2 565 BE, 560 BE, 555 BE, 550 BE, 545 Phenom X4 9950 Athlon II X 3 455, 450, 445, 440, 435, 425 |
Core 2 Duo
E7200, E6550, E7300, E6540, E6700 Pentium Dual-Core E5700, E5800, E6300, E6500, E6600, E6700 Pentium G9650 |
Phenom X4
9850, 9750, 9650, 9600 Phenom X3 8850, 8750 Athlon II X2 265, 260, 255, 370K A6 -5500K A4 -7300, 6400K, 6300, 5400K, 5300, 4400, 4000, 3400, 3300 Athlon 64 X2 6400+ |
Core 2 Duo
E4700, E4600, E6600, E4500, E6420 Pentium Dual-Core E5400, E5300, E5200, G620T |
Phenom X4
9500, 9550, 9450e, 9350e Phenom X3 8650, 8600, 8550, 8450e, 8450, 8400, 8250e Athlon II X2 240, 245, 250 Athlon X2 7850, 7750 Athlon 64 X2 6000+, 5600+ |
Core 2 Duo
E4400, E4300, E6400, E6320 Celeron E3300 |
Phenom X4
9150e, 9100e Athlon X2 7550, 7450, 5050e, 4850e/b Athlon 64 X2 5400+, 5200+, 5000+, 4800+ |
Core 2 Duo
E5500, E6300 Pentium Dual-Core E2220, E2200, E2210 Celeron E3200 |
Athlon X2
6550, 6500, 4450e/b, Athlon X2 4600+, 4400+, 4200+, BE-2400 |
Pentium Dual-Core
E2180 Celeron E1600, G440 |
Athlon 64 X
2 4000+, 3800+ Athlon X2 4050e, BE-2300 |
Pentium Dual-Core
E2160, E2140 Celeron E1500, E1400, E1200 |
В настоящее время наша таблица состоит из 13 уровней. Нижняя половина списка в большинстве своём уже неактуальна: эти чипы будут демонстрировать недостаточную производительность в современных играх, вне зависимости от установленной видеокарты. Если ваш процессор относится к этой половине списка, то апгрейд действительно повысит удовольствие от игр.
В действительности, только чипы в пяти верхних уровнях можно считать сегодня подходящими для игр. И в этой верхней части таблицы смысл в апгрейде появляется лишь тогда, если вы выбираете процессор
как минимум двумя уровнями выше. В противном случае улучшений будет явно недостаточно, чтобы оправдать затраты на новый ЦП, материнскую плату и память, не говоря уже о видеокарте и накопителях, о замене которых вы также задумаетесь.
|