встроенный контроллер памяти в процессоре что это
Контроллер памяти: структура и синхронизация
Введение
Много ли вы слышали о контроллере памяти? Возможно, вы когда-то пытались найти информацию о контроллере памяти, но толком ничего не находили. Даже в книгах, к сожалению, есть только небольшие упоминания. Получается, что все знают про то, что контроллер памяти существуют, но никто не имеет представление, что это такое (именно на таких читателей рассчитана данная статья). Мне повезло наткнуться на статьи инженеров, которые решают проблемы проектирования и синхронизации контроллеров памяти в своих проектах. Эту информацию мы используем, чтобы понять, как устроен и как работает КП на высоком уровне.
Для самых маленьких
реклама
Процессору необходимо обращаться в память, как для получения инструкций, так и для данных, требуемых при исполнении инструкций. В качестве памяти может служить и основная оперативная память. Здесь появляется контроллер памяти, обрабатывающий запросы процессора. В общем-то о его предназначении вы узнаете, если прочитаете статью полностью.
Как устроена память
Во-первых, разберёмся с тем, как устроена память в принципе. Вы наверняка знаете, что у плашки оперативной памяти есть чипы памяти. Характеристика «плотность чипов» как раз обозначает объём в чипе памяти. Всё просто. Если есть чипы, емкость которых по 8 гигабит каждая (по одному гигабайту каждая), то 8 таких в сумме дадут 8 гигабайт (64 гигабит), поэтому мы и скажем, что это плашка на 8гб. Сам чип состоит из нескольких банок, а в свою очередь банки состоят из совокупности ячеек. Объём всех ячеек в чипе памяти одинаковый, причем ячейка по объёму не обязательно равна одному биту.
реклама
Важно сказать, что в реальности данные и адреса не направлены в разные стороны. Это единая шина, у которой линии разделены соответственно на информационные (D) и адресные (A) линии. А могут быть не разделены, если применяется мультипелксная шина. В такой реализации и адреса, и данные передаются по одним и тем же линиям последовательно. Это может решить проблему расфазировки шины (когда данные приходят быстрее адреса), но мультиплекс будет медленнее. Помимо всего прочего в статье И.А Петрова упоминается DDR4 3DS, использующая стеки чипов (друг на друга кладутся), которые взаимодействуют через связь сквозь кремний (through silicon via, TSV). Один такой чип в стеке называется логическим ранком. Логической страницей называется матрица внутри банка.
Механизм интерливинга и конвейерная шина памяти
Теперь разбираемся с механизмом интерливинга. Из статьи И.А Петрова: «В каждом логическом банке (размером от 256 Мбайт до 2 Гбайт) можно одновременно задействовать лишь одну страницу памяти (8 Кбайт). Переход к другой странице в рамках одного логического банка возможен через 45–50 нс». Далее написано, что механизм интерливинга, то есть перемешивание страниц памяти, находящихся в других банках памяти, избавляет от этой проблемы. Сначала непонятно каким образом, но это действительно так. Оказывается, банки для того и были введены, чтобы осуществлять несколько параллельных запросов к ним. Это так называемая конвейерная архитектура шины памяти. Если вы знакомы с конвейерной архитектурой ядер процессора, тогда вы примерно понимаете насколько круто, что у памяти такая тоже есть.
реклама
Здесь CK — это линия, по которой идут импульсы от тактового генератора с определенной частотой. Можно сказать, что шина работает на частоте CK или синхронизируется по CK. Как мы видим, циклом шины является период от фронта (переход от логического 0 к 1, поднятие по импульсу) синхросигнала до фронта следующего синхросигнала. Группа управляющих линий обозначена CMD, адресных — ADDR, а информационных — DATA.
Запрос к памяти состоит из трёх этапов:
1) Открытие строки для подготовки к обращениям (ACT).
2) Обращение к отдельным словам строки или к нескольким словам при использовании пакетного режима (длина пакета фиксирована).
3) Закрытие строки (PRECHARGE) и подготовка к следующей активизации.
В нашем примере важно, чтобы фаза активизации (ACT) предшествовала фазе READ (или WRITE) на 2 цикла (обязательно смотрите на рисунок). Также известно, что данные готовы на следующем цикле после фазы READ (WRITE), а PRECHARGE происходит минимум на два цикла позже фазы READ (WRITE). Данные обязательные условия называются протоколом. Все операции занимают определенное число циклов шины, поэтому известно, когда получать данные, когда открывать и закрывать строку. Конвейерный режим нужен, чтобы исключить простои. Ещё раз смотрите на рисунок: без конвейерного режима на цикле 1 образовался бы пустой цикл. Вместо простоя происходит активизация строки из другого банка. Преимущества очевидны.
Структура контроллера памяти
реклама
Это КП планировшегося Эльбруса 16CB. В контроллерах памяти есть буферы записи и чтения (в нашем примере этот буфер расположен за пределами КП). Когда КП получает данные от основной ОЗУ, данные сначала помещаются в буфер чтения. Аналогично с записью: данные от ядер поступают в буфер записи. Буферы выступают в роли промежуточной памяти для хранения, так как удобно получать данные большего объёма. Ведь ядру, которому понадобились данные по адресу A, с большой вероятностью понадобятся данные по адресу A+1. Это так называемый принцип локальности, на нем также основывается принцип кэширования. Буфер записи в свою очередь реализует отложенную запись.
В реестре запросов, как ни странно, хранятся запросы обращения к основной памяти. Каждая ячейка реестра включает в себя адрес, тип операции, признак готовности данных для записи, возраст запроса и стадию обработки запроса.
Планировщик занимается тем, что выбирает порядок запросов так, чтобы сократить среднее время на обработку одной заявки. Как это достигается? С помощью последовательно соединенных фильтров планировщика. На выходе планировщика расположен блок формирования операций для шины памяти, в котором запросы полностью перекрываются (отсутствуют пустые циклы на шине, что уже было описано выше).
В Эльбрус 16CB фильтры соединены в таком порядке:
фильтр ресурсов, задерживающий запросы, выполнение которых невозможно вследствие недостаточности объемов буферов чтения или записи
фильтр адресной зависимости, обеспечивающий корректную последовательность обращений в случае обращений по одному адресу (запросу по одному адресу должны выполняться последовательно. Представим ситуацию, что в реестр поступает запрос на запись данных в оперативную память на адрес A, а следующий запрос — чтение данных по адресу A. Без этого фильтра, так как чтение имеет более высокий приоритет над записью, считались бы устаревшие данные)
фильтр приоритета выполнения запроса в открытую страницу логического банка, исключающий дополнительные операции открытия страниц (ACT). Запрос отсеивается, если он попадает в закрытую страницу, хотя в то же время есть запросы, адресованные в открытую страницу. Данный фильтр минимизирует команды активизации, что и уменьшит среднее время обработки заявки в реестре.
фильтр на приоритет операций чтения. Чтение гораздо важнее записи для производительности, поэтому у планировщика в приоритете запросы чтения
фильтр протокольных блокировок, задерживающий запросы, нарушающий протокол (об этом было раньше и ещё будет позже)
фильтр возраста. Выбирается самый старший запрос, то есть, который вошёл раньше всех в реестр.
О фильтрах почти полностью скопировано со статьи И.А Петрова, но кое-где добавлены собственные пояснения. Ниже приложен схематичный рисунок планировщика
Теперь про протокольные блокировки. Когда мы говорили о конвейерной шине памяти, я написал, что есть некий протокол. Его необходимо соблюдать для каждого банка памяти с помощью счетчиков-таймеров внутри контроллера протокольных блокировок. Из книги Танебаума: «Как Core i7 узнает, когда следует ожидать возвращения данных команды READ и когда можно выдавать новый запрос к памяти? Для этого он осуществляет полное моделирование внутренней деятельности каждой подключенной микросхемы DDR3. Соответственно он ожидает возвращения данных в правильно выбранном цикле и знает, что операцию предзаряда не следует начинать раньше чем через два цикла после последней операции чтения. Core i7 может прогнозировать все эти события, потому что интерфейс памяти DDR3 работает синхронно, так что все операции занимают четко определенное количество тактов шины DDR3.»
Моделированием внутренней деятельности как раз занимается контроллер блокировок. Фильтр протокольных блокировок в планировщике использует это и отсеивает невозможные запросы. Основой динамической памяти (любая SDRAM DDR относится к динамической памяти) является конденсатор. Конденсатор может хранить заряд в течении короткого времени, иными словами может служить битом памяти. Ведь у бита, как и у конденсатора, есть два состояния. У конденсатора либо есть заряд (бит 1, логический 1), либо его нет (бит 0, логический 0). При считывании конденсатор разряжается, и если заряд был, то значение однобитной ячейки равно единице, и это значение мы можем использовать. Также после считывания нужно заряжать конденсатор заново, если заряд был (другими словами: значение однобитной ячейки должно быть равно одному, если её значение было равно одному до разрядки). Контроллер регенерации памяти как раз занимается тем, что выдает команды регенерации памяти.
Обычно для реализации многоканального режима работы устанавливают несколько рассмотренных нами одноканальных контроллеров памяти. Как, например, двухканальный контроллер памяти Эльбруса S2 включает по сути два отдельных контроллера памяти, находящиеся в одном блоке.
Синхронизация подсистемы памяти
В подсистеме памяти чаще всего различают три частотных домена: системный домен, домен контроллера памяти и домен самой памяти. Пример представлен ниже.
Решение проблемы синхронизации включает в себя следующие вопросы: какие тактовые частоты будут у доменов и каким образом они будут взаимодействовать в совокупности. От этого будет зависеть задержка обращения в память и максимально допустимая частота памяти, ведь частота контроллера памяти может её ограничить. Итак, синхронизация подсистемы памяти влияет на её эффективность.
Для начала рассмотрим проблему метастабильности на примере триггеров. Что такое триггеры? Это защелки, которые синхронизируются на фронте или спаде тактового импульса. Много непонятных слов? О том, как работают защелки знать не обязательно. Достаточно понимать, что защелка может хранить один бит информации. Но синхронная защелка может записать бит информации только тогда, когда на одном из входов защелки есть тактовый импульс. Таким образом, тактовый импульс является своего рода сигналом, что данные с входа данных можно записать. А триггер отличается тем, что ему нужен не весь тактовый импульс, а только его фронт или спад.
В нашем случае триггеры будут синхронизироваться по фронтам, так что далее рассматривать будем только фронт, но помним, что для спада всё то же самое.
Для правильной работы триггера необходимо, чтобы входные данные триггера некоторое время оставались неизменны до фронта импульса. Этот временной интервал называется Time Setup (Ts). Аналогично после фронта импульса данные также некоторое время должны оставаться неизменными, и это временное требование называется Time Hold (Th).
Если требования для входных данных выполняются, то на выходе триггера данные также появляются. А иначе верное выходное значение триггера устанавливается через большее время. Такое состояние называется метастабильностью. В метастабильном состоянии сигнал пребывает в состоянии, которое нельзя назвать ни логическим нулём, ни логической единицей. Дальнейшее распространение метастабильного сигнала может привести к сбою всей системы.
Данная проблема характерна для передачи данных между доменами с разными частотами. Вы узнаете почему позже, а пока просто покажу частоты доменов подсистемы памяти в разных проектах.
Эльбрус-С+:
системный домен с частотой 500 МГц (системная частота);
домен оперативной памяти, частота которого относится к системной как 4/5, 2/3, 3/5 или 1/2;
домен ядра контроллера оперативной памяти, отношение его частоты к частоте памяти равно 1/2.
Один из КП А.С Кожина:
Системный домен (System domain) – 800/1000 МГц
Домен оперативной памяти (DDR domain) – 800, 666, 533, 400 МГц
Домен ядра контроллера (MC domain) – частота в 2 раза ниже частоты памяти
Домен оперативной памяти ровно в два раза меньше эффективной частоты оперативной памяти.
В двух случаях мы наблюдаем подсистему памяти, частотные домены которой имеют разные частоты (логично).
Возвращаемся к проблеме метастабильности. На рисунке (а) мы видим, что фронт CLKB захватывает нестабильный сигнал DA. Временной интервал между фронтами оказался недостаточным. В итоге мы имеем метастабильный сигнал DB.
Одними из решений данной проблемы является добавление ещё одного триггера. Совокупность триггеров на приемной стороне образует синхронизатор (рисунок б). Дополнительный триггер помог избавиться от дальнейшего распространения метастабильности сигналов, ведь DB2 принимает правильное значение. Однако не всегда такой синхронизатор решает проблему метастабильности. Например, здесь.
В первом случае CLKB не успевает захватить сигнал данных DA, а во втором случае CLKB захватывает DA три раза, то есть по сути одиночную посылку воспринимает, как множество посылок. В первом случае наблюдается передача из высокочастного домена в низкочастотный домен, а во втором — из низкочастотного в высокочастотный. Рассмотрим другой метод.
W_ADR соответствует значению Write Pointer, R_ADR соответствует значению Write Read.
Так как буфер асинхронный, то и write control logic, и read control logic функционируют на разных частотных доменах (имеют разные частоты).
Блок Flag Logic служит для формирования информационных сигналов о заполнении. Ниже представлена та же схема на более низком уровне.
Сначала указатель записи формируется в модуле в GRAYCOUNTER в коде Грея. Код Грея характерен тем, что в последовательности предыдущее значение от данного отличается только одним битом.
То есть в двоичной системе счисления будет так:
000
001 (отличается от предыдущего(000) одним битом)
010 (отличается от предыдущего(001) уже двумя битами в двух позициях)
011
100 (а здесь данное слово отличается всеми тремя битами от предыдущего)
101
110
111
Тогда как в коде Грея это будет выглядеть вот так:
000
001
011
010
110
111
101
100
Если мы возьмем любое значение, то опять же увидим, что оно отличается от предыдущего и от следующего только одним битом в какой-либо позиции. А зачем он нужен здесь вы узнаете совсем скоро. Далее из GRAYCOUNTER данные указателя отправляются в приемник через шину wrptr_g, а приемник работает на другой частоте. Здесь под шиной мы понимаем только совокупность проводников, по которым идет по биту информации. Но для исключения метастабильности на этом этапе к каждой линии шины подведен дополнительный триггер на передающей стороне, на рисунке он также изображен, и три триггера на принимающей стороне (на рисунке синхронизатор). Тогда возможно такое (при изменении указателя записи, то есть данных в GRAYCOUNTER), что сигналы на линиях шины будут задержаны относительно друг-друга, а это приведет к тому, что в одних линиях приемник захватит новые значения, а в других — старые. А в коде Грея новое значение отличается всего на один бит. У нас будет всего два варианта: либо старое (пусть будет 011), либо новое значение (пусть будет 010). А это к сбою работы FIFO-буфера не приведет. Далее gray2bin модуль сможет преобразовать код Грея в двоичное число. Также в любом FIFO-буфере с помощью сравнений указателей записи и чтения, узнается пуст ли или полон буфер. Верхняя граница известна, а при равенстве указателей мы понимаем, что буфер пуст. Ведь нельзя считать пустотой буфер или записать данные в переполненный, так что устанавливаются флаги из Flag Logic.
Асинхронные FIFO-буферы используются очень часто из-за того, что они могут передать данные доменов с очень разным соотношением частот. Да и вообще это очень удобно, ведь можно их заказывать готовые. Но, к сожалению, задержки будут гораздо больше: прохождение сигналов через триггеры, преобразование в код Грея и обратно — это довольно долго.
Ещё один интересный метод пересинхронизации я вычитал из статьи А.С Кожина, какую я укажу в источниках. Этот метод использовался в Эльбрус-C+, он предусматривает метки (сигналы) для высокочастотного домена. Причем для входа высокочастотного домена предусматривается метка clabel_i, служащая для того, чтобы высокочастотный домен не воспринимал одну посылку, как несколько (об этом было сказано, когда мы рассматривали синхронизаторы). Для выхода высокочастотного домена используется метка clabel_o, гарантирующая, что низкочастотный приемник примет данные (об этом тоже было сказано).
Здесь метка clabel_o разрешает изменение данных на выходе триггеров со стороны высокочастотного домена (обращайте внимание на data_out). На следующем фронте импульса приемника (приемник работает на частоте 2/5 Fsys), данные захватываются (это второй импульс 2/5 Fsys. Соотнесите его с data_out). Таким образом выполняется передача данных из высокочастотного домена в низкочастотный.
Здесь важно правильно формировать метки, чтобы соблюдались следующие требования: новые данные на data_out не должны захватываться предыдущим фронтом импульса (если бы первый импульс 2/5 Fsys захватил данные вместо второго), новые данные должны успеть переключиться до следующего фронта импульса (такое произошло, если бы второй импульс cabel_o появился позже).
Всё аналогично при передаче из низкочастотного домена в высокочастотный. Только в этому случае метка cabel_i обеспечивает выбор только одного фронта высокой частоты. Метки формируются в специальном блоке формирования меток.
Он состоит из регистра (такая память, состоящая из триггеров). Значение в регистре определяет, в какие такты периода биений (T align) разрешено выдавать метку. Период биений здесь, как вы можете посмотреть на предыдущем рисунке с меткой cabel_o — это период, при котором совпадают фронты импульсов. Ширина регистра определяется количеством тактовых импульсов за период биений (в Fsys было 5 таких). Основная метка выдается на частоте большего домена. Сигнал mode задает режим работы блоку формирования в зависимости от частот передающего и принимающего доменов. Указатель (Pointer) указывает на значение регистра, отвечающее за состояние метки (будет ли выдана или нет). Сигнал beat — это комбинационный сигнал биений, который определяет начало периода биений. Он помогает восстановить правильное значение указателя, если в нем изменился разряд.
Также синхронизация невозможна без самого блока пересинхронизации. Здесь всё стандартно, но всё-таки требуется раскрыть передачу из одного домена в другой, когда частоты доменов близки. Близкими частоты будут, если на низкочастотный импульс приходится один фронт высокочастотного домена или f1/f2 f2). Прием/передача могут быть невозможны из-за несоблюдения временнЫх интервалов. В этом случае используются триггеры, задерживающие на половину такта данные, и дополнительная метка, определяющая, когда задержанные данные можно использовать.
Подобный метод пересихронизации не так удобен и универсален, как асинхронный FIFO-буфер, но зато имеет меньшие задержки.
На этом всё. Спасибо за внимание, критикуйте, обсуждайте и задавайте вопросы.
Источники
Архитектура компьютера, 6-ое издание, Э. Танебаум и Т. Остин (Отсюда я взял про триггеры и прочее на цифровом логическом уровне, устройство памяти и шины)
Контроллер памяти DDR2 SDRAM и его система синхронизации в составе системы на кристалле «Эльбрус-S2», А. С. Кожин (по факту источник-пустышка, отсюда впервые услышал про метки, но взял только картинку с кп)
Метастабильность триггера и межтактовая синхронизация, «nerudo» (статья с хабра. Взял отсюда картинку, где Ts и Th интервалы)
Одно- и двухпортовая память. FIFO-буфер. Проблемы метастабильности, юутб-канал «Электроника и наноэлектроника» (типо лекция, мне показалась она достаточно сомнительной, но разобраться действительно помогла)
Что такое кэш процессора, и как он работает, Сергей Пахомов (здесь было про промежуточную память)
Флэш-память на любой вкус, Сергей Пахомов (про регенерацию памяти на уровне конденсаторов)
Как правильно конфигурировать оперативную память
Содержание
Содержание
Практически каждый начинающий пользователь, начавший апгрейд компьютера, сталкивается с вопросом конфигурирования оперативной памяти. Что лучше, одна планка на 16 Гб или две по 8 Гб? Как включить двухканальный режим? В какие слоты ставить планки памяти — ближние или дальние от процессора? Как включить XMP профиль? Какой прирост производительности дает двухканальный режим, включение XMP профиля и разгон памяти?
В идеале конфигурирование памяти желательно начать еще до ее покупки, прикинув, какой объем памяти (ОЗУ) достаточен для ваших задач. Однако зачастую приходится добавлять память к уже имеющейся, что несколько усложняет дело.
Современные приложения и игры стали требовательны к подсистеме памяти, и важно, чтобы она работала в двухканальном режиме для максимальной отдачи. Почему так происходит?
В первую очередь из-за роста производительности процессоров. ОЗУ должна успевать загрузить работой все ядра процессоров, которых становится все больше с каждым годом.
В играх требования к скорости памяти растут в первую очередь от того, что проекты становятся все реалистичнее, увеличиваются в объемах и детализации 3D-моделей. Новые игры вплотную подбираются к отметке в 100 Гб, и этот объем в первую очередь состоит из текстур высокого разрешения, которые надо переместить с накопителя и обработать.
Недорогие ПК и ноутбуки со встроенной в процессор графикой получают приличный прирост от быстрой памяти и включения двухканального режима. Ведь обычная ОЗУ там используется и видеоядром. Поэтому давайте для начала разберем все о двухканальном режиме ОЗУ.
Двухканальный режим работы памяти
На большинстве материнских плат устанавливаются два или четыре слота под ОЗУ, которые могут работать в двухканальном режиме. Слоты материнской платы обычно помечаются разными цветами.
Чтобы реализовать самый оптимальный режим работы памяти в двухканале, нужно установить два одинаковых модуля ОЗУ в слоты одинакового цвета. Слоты для двух модулей ОЗУ в двухканале обычно называются DIMMA1(2) и DIMMB1(2). Желательно уточнить это в инструкции к вашей материнской плате.
Не всегда у пользователей бывают модули, совпадающие по частотам и таймингам. Не беда, двухканал просто заработает на скорости самого медленного модуля.
Двухканальный режим работы ОЗУ довольно гибок и позволяет установить и разные по объему модули. Например — 4 Гб и 2 Гб в канале A и 4 Гб и 2 Гб в канале B.
Как вариант, можно установить 8 Гб ОЗУ как 4 Гб в канале A и 2+2 Гб в канале B.
И даже конфигурация 4 Гб в канале A и 2 Гб в канале B будет работать в двухканальном режиме, но только для первых 2 Гб ОЗУ.
Но бывают такие ситуации, когда пользователь специально выбирает одноканальный режим работы ОЗУ с одним модулем. Например, если ставит только 16 Гб памяти и только через пару-тройку месяцев накопит на второй модуль на 16 Гб.
Ниже я протестирую, можно ли увеличить производительность одного модуля, разогнав его. А заодно протестирую все возможные режимы работы ОЗУ: с настройками по умолчанию, с включенным XMP профилем и с разгоном. Все тесты проведу как для одноканального режима работы, так и для двухканального.
Серверных материнских плат с четырехканальным режимом работы ОЗУ мы касаться не будем из-за их малого распространения.
Сколько модулей памяти оптимально для производительности?
Теперь нам надо решить, сколько модулей памяти лучше ставить в компьютер.
Если у вас материнская плата с двумя разъемами под ОЗУ, то выбор очевиден — вам нужно ставить две планки с подходящим вам объемом.
А вот если слотов под память у вас четыре, то, поставив четыре планки в четыре слота, можно получить небольшой прирост производительности. Прочитать об этом можно тут.
Но минусы такого решения перевешивают — у вас не остается слотов под апгрейд, модули памяти меньшего объема быстрее устаревают морально и меньше ценятся на вторичном рынке.
Какого объема ОЗУ достаточно?
При выборе объема ОЗУ ориентируйтесь на 8 Гб для офисного ПК и 16 Гб для игрового.
Выбирая 32 Гб ОЗУ, вы получите еще и прирост производительности, ведь большинство модулей DDR4 на 16 Гб — двухранговые. Это значит, что контроллер памяти в процессоре может чередовать запросы к такой памяти, повышая производительность в рабочих приложениях и играх.
Популярная двухранговая память
То есть, 2х16 Гб ОЗУ будут быстрее 2х8 Гб с той же частотой. Но есть и небольшой минус — у двухранговых модулей более низкий разгонный потенциал.
Посмотреть тип памяти можно программой CPU-Z, во вкладке SPD.
В какие слоты ставить модули памяти — ближние или дальние от процессора?
Раньше ОЗУ чаще ставили в самые ближние к процессору слоты (левые), но теперь все не так однозначно. Надо смотреть инструкцию к материнской плате и ставить по указаниям производителя.
Например, ASUS почти всегда рекомендует ставить память во второй слот.
Включение XMP профилей
Память с высокой частотой недостаточно просто установить в материнскую плату, чтобы она заработала на заявленной скорости. Как правило, скорость ограничится стандартной частотой для вашего процессора и материнской платы. В моем случае это 2400 МГц.
Чтобы активировать для ОЗУ скорость работы, которая записана в XMP профиле, надо зайти в BIOS и в разделе, посвященном настройке памяти, включить нужный XMP профиль. Вот так это выглядит на материнской плате MSI B450-A PRO MAX.
Тестирование разных режимов работы памяти
А теперь давайте протестируем память в разных режимах работы. Главной целью тестов будет разница работы в одно- и двухканальных режимах и разгоне.
Начнем с тестирования пропускной способности чтения ОЗУ в AIDA64, в Мб/сек.
На графиках одноканальный режим работы отмечен как (S), а двухканальный — как (D), вместе с частотой работы памяти.
ОЗУ в двухканале прилично выигрывает.
Тестирование в архиваторе WinRAR 5.40 преподносит первый сюрприз. Одна планка памяти в разгоне до 3400 МГц работает быстрее, чем две на частоте 2933 МГц.
Архиватор 7-Zip 19.0, итоговая скорость распаковки в MIPS. Опять одна планка в разгоне обошла две на 2933 МГц.
Скорость работы архиваторов имеет важное практическое значение — чем она быстрее, тем быстрее будут устанавливаться программы и игры.
Из игр я выбрал Assassin’s Creed Odyssey и Shadow of the Tomb Raider. Для минимизации воздействия видеокарты на результаты я отключил сглаживание и выставил разрешение в 720p.
В Assassin’s Creed Odyssey даже при 50 % разрешения кое-где производительность упиралась в GeForce GTX 1060, ее загрузка доходила до 99 %.
Более быстрая видеокарта позволила бы еще нагляднее увидеть прирост производительности от режимов работы ОЗУ.
Assassin’s Creed Odyssey, средний FPS. Одна планка ОЗУ, работающая с разгоном, сумела обогнать две планки в двухканале, на частоте 2400 МГц.
Shadow of the Tomb Raider, DX12, средний FPS. Картина повторяется, и одна планка памяти в разгоне быстрее, чем две низкочастотные.
Демонстрация плавности геймплея в Shadow of the Tomb Raider с одним модулем ОЗУ на 3400 МГц. Надо учесть, что запись съела пару кадров результата.
Выводы
В моих тестах один двухранговый модуль памяти на 16 Гб в разгоне обогнал в архиваторах модули с частотой 2933 МГц, работающие в двухканале. А в играх обогнал модули, работающие с частотой 2400 МГц.
Это значит, что вы можете купить быстрый модуль на 16 Гб и добавить еще 16 Гб, когда его станет не хватать.
Но самый идеальный вариант компоновки памяти — два одинаковых модуля в двухканальном режиме.
И совсем хорошо, если вы потратите немного времени на ее разгон. Благо, есть много хороших гайдов на эту тему.