Надёжность SSD: результаты ресурсных испытаний. Как узнать информацию по SSD и протестировать его с помощью SSD-Z

Проверка SSD диска при помощи утилит представляет собой универсальный метод, который выполняет сразу несколько задач.

  • Первая – проверка накопителя на наличие ошибок.
  • Вторая – контроль эксплуатационного срока устройства.

Наличие и периодическое использование таких программ для владельца не только желательно, но и необходимо.

Ведь ресурсы этих комплектующих современных ПК и ноутбуков ограничены по сравнению с HDD, а опасность потери данных – выше.

Хотя эти недостатки вполне компенсируются значительным количеством плюсов от использования SSD, обусловленных отличием их конструкции от стандартных жёстких дисков.

Особенности использования дисков SSD

Диски SSD представляют собой твердотельные энергонезависимые накопители, принцип действия которых напоминает работу флеш-памяти – SD и microSD карт, USB-флешек и других носителей информации.

Такие устройства не имеют движущихся частей, а для передачи данных используют микросхему DDR DRAM.

Параллельная запись информации одновременно на несколько элементов памяти и отсутствие необходимости в перемещении считывающих информацию головок (характерных для HDD) позволяют увеличить скорость процесса в несколько раз.

И, если средняя скорость чтения современного жёсткого диска составляет около 60 МБ/с, даже средний SSD-диск способен выдать показатели в 4–5 раз выше.

При записи данных превышение может оказаться меньшим, однако процесс происходит всё равно намного быстрее.

Рис. 1. Сравнение показателей скорости чтения и записи диска SSD и HDD.

Особое значение скорость загрузки имеет для тех компьютеров, на которых установлено несколько ресурсоёмких приложений.

В этом случае только загрузка системы Windows происходит в течение 15–20 с для твердотельного накопителя и от 30 до 60 с для жёсткого диска.

Такое же улучшение скорости происходит и в процессе запуска программ, и записи данных.

К другим преимуществам от использования SSD-дисков (подробнее читайте ) стоит отнести:

  • стойкость к ударам и падениям. Параметр, важный для ноутбуков, жёсткие диски в которых часто выходят из строя именно из-за механических повреждений;
  • компактность – многие диски ненамного превышают по размеру аккумулятор мобильного телефона, другие имеют габариты планки памяти;
  • расширенный температурный диапазон работы диска;
  • минимальное энергопотребление и отсутствие шума при работе.

Рис. 2. Сравнение размеров HDD, стандартного SSD и накопителя формата mSATA.

Вместе с тем, работа SSD связана и с определёнными недостатками. К ним относят сравнительно высокую стоимость накопителя, хотя при увеличении ёмкости соотношение цены к объёму становится меньшей.

Второй важный минус – ограниченный ресурс SSD-дисков, из-за чего их рекомендуется периодически проверять.

Настройка SSD под Windows 10: Полная step-by-step инструкция

Диагностика накопителей

Главная задача проверок дисков SSD заключается в диагностике его состояния и выдаче информации о наличии ошибок, ресурсе и предполагаемом эксплуатационном сроке.

Это даёт возможность пользователю заранее узнать о будущих проблемах с накопителем, ведущих к непредсказуемой потере информации.

Кроме того, по результатам проверки можно запланировать финансовые расходы на покупку , стоимость которого может не позволить быстро найти такую сумму, если проблема возникла неожиданно.

Кроме того, проверка накопителя не занимает много времени и даже не требует покупки дорогого программного обеспечения.

Утилиты можно скачать в сети бесплатно или приобрести за сумму, не превышающую стоимость стандартной антивирусной программы.

Тогда как восстановление утраченной информации с SSD, в отличие от жёстких дисков, невозможно.

Лучшие утилиты для проверки SSD-дисков

Для проверки состояния жёсткого диска производители накопителей и сторонние разработчики выпустили уже десятки приложений.

Большая их часть бесплатная или условно бесплатная, то есть требующая оплаты только через некоторое время после начала использования.

Эффективность у них практически одинаковая, а отличия заключаются в удобстве использования и функциональности.

SSD Life

SSD Ready

Проверяя состояние SSD-диска, можно воспользоваться приложением SSDReady , работающим только с твердотельными накопителями. Результатом проверки является оценка предполагаемой продолжительности работы устройства на основании собираемой статистики о записи и чтении данных. Программа работает в фоновом режиме и практически не требует никаких ресурсов.

Рис. 6. Приложение SSDReady.

Hard Disk Sentinel

Особенностью приложения Hard Disk Sentinel , предназначенного для контроля жёстких дисков, является отслеживание снижения производительности или превышение допустимого уровня температуры и сообщение об этом пользователю. Приложение постоянно проверяет скорость передачи информации, температурный режим и другие параметры. Среди его возможностей:

  • работа с дисками SSD, с накопителями IDE и SATA, и даже USB-носителями;
  • отображение информации о текущей и минимальной температуре;
  • указание количества ошибок и наработки диска в часах;
  • указание не только текущего, но и максимально возможного для диска режима передачи информации.

Рис. 7. Работа с программой Hard Disk Sentinel.

HDDScan

Находящаяся в свободном доступе программа HDDScan позволяет провести диагностику жёстких дисков любого типа, проверить их на наличие ошибок и проконтролировать состояние «здоровья» накопителей. Утилита работает в режиме реального времени и, при необходимости, выдаёт на экран подробный отчёт о состоянии диска, который можно сохранить для дальнейшего использования.

Рис. 8. Отчёт программы HDDScan.

SSD Tweaker

Бесплатное приложение SSD Tweaker отличается простотой работы и даёт возможность пользователю не просто контролировать состояние твердотельных накопителей, но и отключить в операционной системе лишние операции, уменьшающие срок службы диска. Например, такие как служба индексирования и дефрагментации Windows. Параметры могут настраиваться вручную или автоматически.

Рис. 9. Рабочее окно программы SSD Tweaker.

HD Tune

Приложение HD Tune выпускается в нескольких вариантах – бесплатная версия и платная HD Tune Pro. Первая обеспечивает тестирование состояния жёстких дисков (включая SSD) и карт памяти. Условно-бесплатная утилита, за которую придётся заплатить $38, обладает расширенной функциональностью, позволяя контролировать практически все параметры дисков и проводить ряд дополнительных тестов.

Рис. 10. Диагностика с помощью HD Tune Pro.

Независимо от выбранной для диагностики своего SSD-диска программы, хотя бы одна из них должна быть установлена на компьютере (или время от времени запускаться при невозможности инсталлирования на рабочем ПК).

При этом, если слишком важной информации на накопителе не содержится, периодичность проверки можно изменить, установив, например, диагностику не каждые 4 часа, а раз в сутки. Более того, несмотря на больший уровень надёжности дисков HDD, с помощью большинства тех же приложений можно периодически контролировать и их состояние, повышая безопасность хранения данных.

Эпиграф

«Никогда не доверяй компьютеру, который не можешь выбросить из окна»
Стив Возняк

Два месяца назад поставил себе в ноутбук SSD диск. Работал он великолепно, но на прошлой неделе он внезапно умер из-за истощения ячеек (как я полагаю). Эта статья посвящена тому, как это случилось, и тому, что я делал неправильно.

Описание окружения

  • Пользователь: Веб-разработчик. То есть в ходу такие вещи как: виртуалки, eclipse, частые обновления репозиториев.
  • ОС: Gentoo. То есть часто «пересобирается мир».
  • ФС: ext4. То есть пишется журнал.

Итак, история начинается в апреле, когда, наконец, у меня дошли руки, чтобы скопировать разделы на 64Гб SSD веник, купленный ещё в сентябре. Намеренно не сообщаю производителя и модель, ибо пока я ещё не сильно разобрался что случилось, да это и не имеет большого значения.

Что я сделал, чтобы он работал дольше

Конечно же, я изучил многочисленные публикации, о том как беречь SSD-диски. И вот что я сделал:
  • Поставил noatime для разделов, чтобы при обращению к файлу не обновлялась запись о времени последнего доступа.
  • Увеличил оперативку до максимума и отключил своп.
Больше я ничего не делал, так как считал, что компьютер должен служить пользователю, а не наоборот, и излишние пляски с бубном - неправильно.

S.M.A.R.T.

За три дня до падения я озаботился вопросом: а как узнать насколько мне хватит счастья? Я попробовал утилиту smartmontools , но она выводила неверную информацию. Пришлось скачать Datasheet и написать патч для них.
Написав патч, я нарыл один интересный параметр: среднее_количество_стираний/максимальное_количество_стираний = 35000/45000. Но прочитав, что MLC ячейки выдерживают только 10000 циклов, я решил, что эти параметры значат не совсем то, что я думаю, и забил на них.

Хроника падения

Внезапно, во время работы стали происходить необъяснимые вещи, например новые программы не запускались. Ради интереса посмотрел на тот самый S.M.A.R.T. параметр, было уже 37000/50000 (+2000/5000 за три дня). Перезапуститься уже не удалось, не читалась файловая система основного раздела.
Я запустился с компакта и начал проверку. Проверка показала, много битых нодов. В процессе починки утилита начала тестировать на битые сектора и их помечать. Завершилось это всё на следующий день со следующим результатом: 60Гб из 64Гб оказались помеченными как плохими.
На заметку: В SSD винчестерах ячейка считается битой, если туда нельзя записать новую информацию. Чтение из такой ячейки по прежнему будет возможным. По этому эли запустить утилиту badblocks в режиме только чтения, то врядли она что-то найдёт.

Я решил запустить утилиту перепрошивки, ибо она не только перепрошивает, но и переформатирует диск. Утилита начала форматировать, покряхтела и выдала, что превышено разумное допустимое количество битых секторов, а также что есть сбои, поэтому завершить форматирование не возможно.
После этого диск стал определяться как диск с очень странным именем, номером модели и размером в 4Гб. И, в дальнейшем, кроме специализированных, утилит его никто не видит.
Я написал письмо в поддержку производителя. Они порекомендовали мне перепрошить, если не получится, то вернуть продавцу. Гарантии ещё 2 года, так что попробую.
Завершаю данный раздел благодарностями Стиву Возняку, который научил делать меня периодические бекапы.

Что произошло

Честно говоря, я и сам не знаю. Предполагаю следующее: S.M.A.R.T. не врал и ячейки действительно поизносились (это косвенно подтверждает бекап, который я делал за два дня до падения, он при распаковке показал, что даты создания некоторых файлов обнулены). А при проверке на бед сектора контроллер диска просто разрешил помечать все ячейки как битые, в которых превышено допустимое количество циклов записи.

Что нужно делать, если у вас SSD

Windows
Поставить Windows 7 в ней максимально всё оптимизировано для таких дисков. Также поставить много оперативки.
MacOs
Скорее всего оптимизированы только те компьютеры, которые будут сразу продаваться с SSD.
FreeBSD
Поставить 9.0. Почитать советы для линукса, подумать что из них можно сделать.
Linux
  • Поставить ядро 2.6.33, в котором есть оптимизация для таких дисков в виде команды TRIM.
  • Увеличить памяти, чтобы можно было безболезненно отключить своп.
  • Поставить для монтируемых разделов noatime .
  • Использовал файловую систему, сделанную по принципу copy-on-write или нежурналируемую файловую систему (например ext2).
    На текущий момент copy-on-write ФС использовать достаточно сложно. ZFS пока работает только через FUSE. А nilfs и btrfs при монтировании ругаются, что их формат ещё окончательно не финализирован.
  • Включить NOOP IO Scheduler он позволит не выполнять лишних бесполезных действий для SSD.
  • Концептуально верно, но не сильно поможет диску - переброс временных файлов на tmpfs .
  • Для систем интенсивно пишущих в лог нужно хранить в другом месте. В основном это актуально для серверов, для которых без проблем подымается лог сервер.
  • Обзавестись S.M.A.R.T.-утилитами корректно отображающих состояние SSD-диска, чтобы можно было периодически следить за диском.
  • Просто щадить диск. А для гентушников это дополнительно значит не «пересобирать мир».

Вопросы к хабрасообществу

  • Действительно ли за 2 месяца можно убить MLC-ячейки? Я, конечно понимаю, что диск я не жалел, но ничего сверхъестественного я не делал, просто работал как обычно.
  • Гарантийный ли это случай?

UPD : Диск у меня был Transcend TS64GSSD25S-M.
UPD2 : В комментах очень хорошие отзывы о SSD Intel и SAMSUNG. Кроме того люди удивляются как можно так быстро убить SSD веник. Поверьте мне, я недоумевал точно также. Тем не менее возможно, что это наспех скроенная SSD серия и её можно быстро убить.
UPD3 : В комментах и

Последовательность действий при наличии S.M.A.R.T. ошибки жесткого диска или SSD . Как исправить диск и восстановить утерянные данные. При загрузке компьютера или ноутбука появляется S.M.A.R.T. ошибка жесткого диска или SSD? После данной ошибки компьютер не работает как прежде, и вы опасаетесь о сохранности ваших данных? Не знаете как исправить ошибку?

Актуально для ОС : Windows 10, Windows 8.1, Windows Server 2012, Windows 8, Windows Home Server 2011, Windows 7 (Seven), Windows Small Business Server, Windows Server 2008, Windows Home Server, Windows Vista, Windows XP, Windows 2000, Windows NT.

Что делать со SMART ошибкой?

Шаг 1: Прекратите использование сбойного HDD

Получение от системы сообщения о диагностике ошибки не означает, что диск уже вышел из строя. Но в случае наличия S.M.A.R.T. ошибки, нужно понимать, что диск уже в процессе выхода из строя. Полный отказ может наступить как в течении нескольких минут, так и через месяц или год. Но в любом случае, это означает, что вы больше не можете доверить свои данные такому диску.

Необходимо побеспокоится о сохранности ваших данных, создать резервную копию или перенести файлы на другой носитель информации. Одновременно с сохранностью ваших данных, необходимо предпринять действия по замене жесткого диска. Жесткий диск, на котором были определены S.M.A.R.T. ошибки нельзя использовать – даже если он полностью не выйдет из строя он может частично повредить ваши данные.

Конечно же, жесткий диск может выйти из строя и без предупреждений S.M.A.R.T. Но данная технология даёт вам преимущество предупреждая о скором выходе диска из строя.

Шаг 2: Восстановите удаленные данные диска

В случае возникновения SMART ошибки не всегда требуется восстановление данных с диска. В случае ошибки рекомендуется незамедлительно создать копию важных данных, так как диск может выйти из строя в любой момент. Но бывают ошибки при которых скопировать данные уже не представляется возможным. В таком случае можно использовать программу для восстановления данных жесткого диска – Hetman Partition Recovery .

Для этого:

  1. Загрузите программу , установите и запустите её.
  2. По умолчанию, пользователю будет предложено воспользоваться Мастером восстановления файлов . Нажав кнопку «Далее» , программа предложит выбрать диск, с которого необходимо восстановить файлы.
  3. Дважды кликните на сбойном диске и выберите необходимый тип анализа. Выбираем «Полный анализ» и ждем завершения процесса сканирования диска.
  4. После окончания процесса сканирования вам будут предоставлены файлы для восстановления. Выделите нужные файлы и нажмите кнопку «Восстановить» .
  5. Выберите один из предложенных способов сохранения файлов. Не сохраняйте восстановленные файлы на диск с ошибкой.

Шаг 3: Просканируйте диск на наличие «битых» секторов

Запустите проверку всех разделов жесткого диска и попробуйте исправить найденные ошибки.

Для этого, откройте папку «Этот компьютер» и кликните правой кнопкой мышки на диске с SMART ошибкой. Выберите Свойства / Сервис / Проверить в разделе Проверка диска на наличия ошибок .

В результате сканирования обнаруженные на диске ошибки могут быть исправлены.

Шаг 4: Снизьте температуру диска

Иногда, причиной возникновения “S M A R T” ошибки может быть превышение максимально допустимой температуры работы диска. Такая ошибка может быть устранена путём улучшения вентиляции компьютера. Во-первых, проверьте оборудован ли ваш компьютер достаточной вентиляцией и все ли вентиляторы исправны.

Если вами обнаружена и устранена проблема с вентиляцией, после чего температура работы диска снизилась до нормального уровня, то SMART ошибка может больше не возникнуть.

Шаг 5:

Откройте папку «Этот компьютер» и кликните правой кнопкой мышки на диске с ошибкой. Выберите Свойства / Сервис / Оптимизировать в разделе Оптимизация и дефрагментация диска .

Выберите диск, который необходимо оптимизировать и кликните Оптимизировать .

Примечание . В Windows 10 дефрагментацию и оптимизацию диска можно настроить таким образом, что она будет осуществляться автоматически.

Шаг 6: Приобретите новый жесткий диск

Если вы столкнулись со SMART ошибкой жесткого диска то, приобретение нового диска – это только вопрос времени. То, какой жесткий диск нужен вам зависит от вашего стиля работы за компьютером, а также цели с которой его используют.

На что обратить внимание приобретая новый диск:

  1. Тип диска: HDD, SSD или SSHD . Каждому типу присущи свои плюсы и минусы, которые не имеют решающего значения для одних пользователей и очень важны для других. Основные из них – это скорость чтения и записи информации, объём и устойчивость к многократной перезаписи.
  2. Размер . Два основных форм-фактора дисков: 3,5 дюймов и 2,5 дюймов. Размер диска определяется в соответствии с установочным местом конкретного компьютера или ноутбука.
  3. Интерфейс . Основные интерфейсы жестких дисков:
    • SATA;
    • IDE, ATAPI, ATA;
    • SCSI;
    • Внешний диск (USB, FireWire и.т.д.).
  4. Технические характеристики и производительность :
    • Вместимость;
    • Скорость чтения и записи;
    • Размер буфера памяти или cache;
    • Время отклика;
    • Отказоустойчивость.
  5. S.M.A.R.T . Наличие в диске данной технологи поможет определить возможные ошибки его работы и вовремя предупредить утерю данных.
  6. Комплектация . К данному пункту можно отнести возможное наличие кабелей интерфейса или питания, а также гарантии и сервиса.

Как сбросить SMART ошибку?

SMART ошибки можно легко сбросить в BIOS (или UEFI). Но разработчики всех операционных систем категорически не рекомендуют этого делать. Если же для вас не имеют ценности данные на жестком диске, то вывод SMART ошибок можно отключить.

Для этого необходимо сделать следующее:

  1. Перезагрузите компьютер , и с помощью нажатия указанной на загрузочном экране комбинации клавиш (у разных производителей они разные, обычно “F2” или “Del” ) перейдите в BIOS (или UEFI).
  2. Перейдите в: Аdvanced > SMART settings > SMART self test . Установите значение Disabled .

Примечание: место отключения функции указано ориентировочно, так как в зависимости от версии BIOS или UEFI, место расположения такой настройки может незначительно отличаться.

Целесообразен ли ремонт HDD?

Важно понимать, что любой из способов устранения SMART ошибки – это самообман. Невозможно полностью устранить причину возникновения ошибки, так как основной причиной её возникновения часто является физический износ механизма жесткого диска.

Для устранения или замены неправильно работающих составляющих жесткого диска, можно обратится в сервисный центр специальной лабораторией для работы с жесткими дисками.

Но стоимость работы в таком случае будет выше стоимости нового устройства. Поэтому, ремонт имеет смысл делать только в случае необходимости восстановления данных с уже неработоспособного диска.

SMART ошибка для SSD диска

Даже если у вас не претензий к работе SSD диска, его работоспособность постепенно снижается. Причиной этому служит факт того, что ячейки памяти SSD диска имеют ограниченное количество циклов перезаписи. Функция износостойкости минимизирует данный эффект, но не устраняет его полностью.

SSD диски имеют свои специфические SMART атрибуты, которые сигнализируют о состоянии ячеек памяти диска. Например, “209 Remaining Drive Life”, “231 SSD life left” и т.д. Данные ошибки могут возникнуть в случае снижения работоспособности ячеек, и это означает, что сохранённая в них информация может быть повреждена или утеряна.

Ячейки SSD диска в случае выхода из строя не восстанавливаются и не могут быть заменены.

Бытует мнение, что одним из самых существенных недостатков твердотельных накопителей выступает их конечная и притом относительно невысокая надёжность. И действительно, в силу ограниченности ресурса флеш-памяти, которая обуславливается постепенной деградацией её полупроводниковой структуры, любой SSD рано или поздно теряет свою способность к хранению информации. Вопрос о том, когда это может произойти, для многих пользователей остаётся ключевым, поэтому многие покупатели при выборе накопителей руководствуются не столько их быстродействием, сколько показателями надёжности. Масла в огонь сомнений подливают и сами производители, которые из маркетинговых соображений в условиях гарантии на свои потребительские продукты оговаривают сравнительно невысокие объёмы разрешённой записи.

Тем не менее, на практике массовые твердотельные накопители демонстрируют более чем достаточную надёжность для того, чтобы им можно было доверять хранение пользовательских данных. Эксперимент, показавший отсутствие реальных причин для переживаний за конечность их ресурса, некоторое время тому назад проводил сайт TechReport . Им был выполнен тест, показавший, что, несмотря на все сомнения, выносливость SSD уже выросла настолько, что о ней можно вообще не задумываться. В рамках эксперимента было практически подтверждено, что большинство моделей потребительских накопителей до своего отказа способны перенести запись порядка 1 Пбайт информации, а особенно удачные модели, вроде Samsung 840 Pro, остаются в живых, переварив и 2 Пбайт данных. Такие объёмы записи практически недостижимы в условиях обычного персонального компьютера, поэтому срок жизни твердотельного накопителя попросту не может подойти к концу до того, как он полностью морально устареет и будет заменён новой моделью.

Однако убедить скептиков данное тестирование не смогло. Дело в том, что проводилось оно в 2013-2014 годах, когда в ходу были твердотельные накопители, построенные на базе планарной MLC NAND, которая изготавливается с применением 25-нм техпроцесса. Такая память до своей деградации способна переносить порядка 3000-5000 циклов программирования-стирания, а сейчас в ходу уже совсем другие технологии. Сегодня в массовые модели SSD пришла флеш-память с трёхбитовой ячейкой, а современные планарные техпроцессы используют разрешение 15-16 нм. Параллельно распространение приобретает флеш-память с принципиально новой трёхмерной структурой. Любой из этих факторов способен в корне изменить ситуацию с надёжностью, и в сумме современная флеш-память обещает лишь ресурс в 500-1500 циклов перезаписи. Неужели вместе с памятью ухудшаются и накопители и за их надёжность нужно снова начинать переживать?

Скорее всего - нет. Дело в том, что наряду с изменением полупроводниковых технологий происходит непрерывное совершенствование контроллеров, управляющих флеш-памятью. В них внедряются более совершенные алгоритмы, которые должны компенсировать происходящие в NAND изменения. И, как обещают производители, актуальные модели SSD как минимум не менее надёжны, чем их предшественники. Но объективная почва для сомнений всё-таки остаётся. Действительно, на психологическом уровне накопители на базе старой 25-нм MLC NAND с 3000 циклов перезаписи выглядят куда основательнее современных моделей SSD с 15/16-нм TLC NAND, которая при прочих равных может гарантировать лишь 500 циклов перезаписи. Не слишком обнадёживает и набирающая популярность TLC 3D NAND, которая хоть и производится по более крупным технологическим нормам, но при этом подвержена более сильному взаимному влиянию ячеек.

Учитывая всё это, мы решили провести собственный эксперимент, который позволил бы определить, какую выносливость могут гарантировать актуальные сегодня модели накопителей, основанные на наиболее ходовых в настоящее время типах флеш-памяти.

Контроллеры решают

Конечность жизни накопителей, построенных на флеш-памяти, уже давно ни у кого не вызывает удивления. Все давно привыкли к тому, что одной из характеристик NAND-памяти выступает гарантированное количество циклов перезаписи, после превышения которого ячейки могут начинать искажать информацию или просто отказывать. Объясняется это самим принципом работы такой памяти, который основывается на захвате электронов и хранении заряда внутри плавающего затвора. Изменение состояний ячеек происходит за счёт приложения к плавающему затвору сравнительно высоких напряжений, благодаря чему электроны преодолевают тонкий слой диэлектрика в одну или другую сторону и задерживаются в ячейке.

Полупроводниковая структура ячейки NAND

Однако такое перемещение электронов сродни пробою - оно постепенно изнашивает изолирующий материал, и в конечном итоге это приводит к нарушению всей полупроводниковой структуры. К тому же существует и вторая проблема, влекущая за собой постепенное ухудшение характеристик ячеек, - при возникновении туннелирования электроны могут застревать в слое диэлектрика, препятствуя правильному распознаванию заряда, хранящегося в плавающем затворе. Всё это значит, что момент, когда ячейки флеш-памяти перестают нормально работать, неизбежен. Новые же технологические процессы лишь усугубляют проблему: слой диэлектрика с уменьшением производственных норм становится только тоньше, что снижает его устойчивость к негативным влияниям.

Однако говорить о том, что между ресурсом ячеек флеш-памяти и продолжительностью жизни современных SSD существует прямая зависимость, было бы не совсем верно. Работа твердотельного накопителя - это не прямолинейная запись и чтение в ячейках флеш-памяти. Дело в том, что NAND-память имеет достаточно сложную организацию и для взаимодействия с ней требуются специальные подходы. Ячейки объединены в страницы, а страницы - в блоки. Запись данных возможна лишь в чистые страницы, но для того, чтобы очистить страницу, необходимо сбросить весь блок целиком. Это значит, что запись, а ещё хуже - изменение данных, превращается в непростой многоступенчатый процесс, включающий чтение страницы, её изменение и повторную перезапись в свободное место, которое должно быть предварительно расчищено. Причём подготовка свободного места - это отдельная головная боль, требующая «сборки мусора» - формирования и очистки блоков из уже побывавших в использовании, но ставших неактуальными страниц.

Схема работы флеш-памяти твердотельного накопителя

В результате реальные объёмы записи в флеш-память могут существенно отличаться от того объёма операций, который инициируется пользователем. Например, изменение даже одного байта может повлечь за собой не только запись целой страницы, но и даже необходимость перезаписи сразу нескольких страниц для предварительного высвобождения чистого блока.

Соотношение между объёмом записи, совершаемой пользователем, и фактической нагрузкой на флеш-память называется коэффициентом усиления записи. Этот коэффициент почти всегда выше единицы, причём в некоторых случаях - намного. Однако современные контроллеры за счёт буферизации операций и других интеллектуальных подходов научились эффективно снижать усиление записи. Распространение получили такие полезные для продления жизни ячеек технологии, как SLC-кеширование и выравнивание износа. С одной стороны, они переводят небольшую часть памяти в щадящий SLC-режим и используют её для консолидации мелких разрозненных операций. С другой - делают нагрузку на массив памяти более равномерной, предотвращая излишние многократные перезаписи одной и той же области. В результате сохранение на два разных накопителя одного и того же количества пользовательских данных с точки зрения массива флеш-памяти может вызывать совершенно различную нагрузку - всё зависит от алгоритмов, применяемых контроллером и микропрограммой в каждом конкретном случае.

Есть и ещё одна сторона: технологии сборки мусора и TRIM, которые в целях повышения производительности предварительно готовят чистые блоки страниц флеш-памяти и потому могут переносить данные с места на место без какого-либо участия пользователя, вносят в износ массива NAND дополнительный и немалый вклад. Но конкретная реализация этих технологий также во многом зависит от контроллера, поэтому различия в том, как SSD распоряжаются ресурсом собственной флеш-памяти, могут быть значительными и здесь.

В итоге всё это означает, что практическая надёжность двух разных накопителей с одинаковой флеш-памятью может очень заметно различаться лишь за счет различных внутренних алгоритмов и оптимизаций. Поэтому, говоря о ресурсе современного SSD, нужно понимать, что этот параметр определяется не только и не столько выносливостью ячеек памяти, сколько тем, насколько бережно с ними обращается контроллер.

Алгоритмы работы контроллеров SSD постоянно совершенствуются. Разработчики не только стараются оптимизировать объём операций записи в флеш-память, но и занимаются внедрением более эффективных методов цифровой обработки сигналов и коррекции ошибок чтения. К тому же некоторые из них прибегают к выделению на SSD обширной резервной области, за счёт чего нагрузка на ячейки NAND дополнительно снижается. Всё это тоже сказывается на ресурсе. Таким образом, в руках у производителей SSD оказывается масса рычагов для влияния на то, какую итоговую выносливость будет демонстрировать их продукт, и ресурс флеш-памяти - лишь один из параметров в этом уравнении. Именно поэтому проведение тестов выносливости современных SSD и вызывает такой интерес: несмотря на повсеместное внедрение NAND-памяти с относительно невысокой выносливостью, актуальные модели совершенно необязательно должны иметь меньшую надёжность по сравнению со своими предшественниками. Прогресс в контроллерах и используемых ими методах работы вполне способен компенсировать хлипкость современной флеш-памяти. И именно этим исследование актуальных потребительских SSD и интересно. По сравнению с SSD прошлых поколений неизменным остаётся лишь только одно: ресурс твердотельных накопителей в любом случае конечен. Но как он поменялся за последние годы - как раз и должно показать наше тестирование.

Методика тестирования

Суть тестирования выносливости SSD очень проста: нужно непрерывно перезаписывать данные в накопителях, пытаясь на практике установить предел их выносливости. Однако простая линейная запись не совсем отвечает целям тестирования. В предыдущем разделе мы говорили о том, что современные накопители имеют целый букет технологий, направленных на снижение коэффициента усиления записи, а кроме того, они по-разному выполняют процедуры сборки мусора и выравнивания износа, а также по-разному реагируют на команду операционной системы TRIM. Именно поэтому наиболее правильным подходом является взаимодействие с SSD через файловую систему с примерным повторением профиля реальных операций. Только в этом случае мы сможем получить результат, который обычные пользователи могут рассматривать в качестве ориентира.

Поэтому в нашем тесте выносливости мы используем отформатированные с файловой системой NTFS накопители, на которых непрерывно и попеременно создаются файлы двух типов: мелкие - со случайным размером от 1 до 128 Кбайт и крупные - со случайным размером от 128 Кбайт до 10 Мбайт. В процессе теста эти файлы со случайным заполнением множатся, пока на накопителе остаётся более 12 Гбайт свободного места, по достижении же этого порога все созданные файлы удаляются, делается небольшая пауза и процесс повторяется вновь. Помимо этого, на испытуемых накопителях одновременно присутствует и третий тип файлов - постоянный. Такие файлы общим объёмом 16 Гбайт в процессе стирания-перезаписи не участвуют, но используются для проверки правильной работоспособности накопителей и стабильной читаемости хранимой информации: каждый цикл заполнения SSD мы проверяем контрольную сумму этих файлов и сверяем её с эталонным, заранее рассчитанным значением.

Описанный тестовый сценарий воспроизводится специальной программой Anvil’s Storage Utilities версии 1.1.0, мониторинг состояния накопителей проводится при помощи утилиты CrystalDiskInfo версии 7.0.2. Тестовая система представляет собой компьютер с материнской платой ASUS B150M Pro Gaming, процессором Core i5-6600 со встроенным графическим ядром Intel HD Graphics 530 и 8 Гбайт DDR4-2133 SDRAM. Приводы с SATA-интерфейсом подключаются к контроллеру SATA 6 Гбит/с, встроенному в чипсет материнской платы, и работают в режиме AHCI. Используется драйвер Intel Rapid Storage Technology (RST) 14.8.0.1042.

Список моделей SSD, принимающих участие в нашем эксперименте, к настоящему моменту включает уже более пяти десятков наименований:

  1. (AGAMMIXS11-240GT-C, прошивка SVN139B);
  2. ADATA XPG SX950 (ASX950SS-240GM-C, прошивка Q0125A);
  3. ADATA Ultimate SU700 256 Гбайт (ASU700SS-256GT-C, прошивка B170428a);
  4. (ASU800SS-256GT-C, прошивка P0801A);
  5. (ASU900SS-512GM-C, прошивка P1026A);
  6. Crucial BX500 240 Гбайт (CT240BX500SSD1, прошивка M6CR013);
  7. Crucial MX300 275 Гбайт (CT275MX300SSD1, прошивка M0CR021);
  8. (CT250MX500SSD1, прошивка M3CR010);
  9. GOODRAM CX300 240 Гбайт (SSDPR-CX300-240, прошивка SBFM71.0 );
  10. (SSDPR-IRIDPRO-240 , прошивка SAFM22.3);
  11. (SSDPED1D280GAX1, прошивка E2010325);
  12. (SSDSC2KW256G8, прошивка LHF002C);
19 июня 2010 в 13:03

Как я угробил SSD за два месяца

  • Компьютерное железо

Эпиграф

«Никогда не доверяй компьютеру, который не можешь выбросить из окна»
Стив Возняк

Два месяца назад поставил себе в ноутбук SSD диск. Работал он великолепно, но на прошлой неделе он внезапно умер из-за истощения ячеек (как я полагаю). Эта статья посвящена тому, как это случилось, и тому, что я делал неправильно.

Описание окружения

  • Пользователь: Веб-разработчик. То есть в ходу такие вещи как: виртуалки, eclipse, частые обновления репозиториев.
  • ОС: Gentoo. То есть часто «пересобирается мир».
  • ФС: ext4. То есть пишется журнал.

Итак, история начинается в апреле, когда, наконец, у меня дошли руки, чтобы скопировать разделы на 64Гб SSD веник, купленный ещё в сентябре. Намеренно не сообщаю производителя и модель, ибо пока я ещё не сильно разобрался что случилось, да это и не имеет большого значения.

Что я сделал, чтобы он работал дольше

Конечно же, я изучил многочисленные публикации, о том как беречь SSD-диски. И вот что я сделал:
  • Поставил noatime для разделов, чтобы при обращению к файлу не обновлялась запись о времени последнего доступа.
  • Увеличил оперативку до максимума и отключил своп.
Больше я ничего не делал, так как считал, что компьютер должен служить пользователю, а не наоборот, и излишние пляски с бубном - неправильно.

S.M.A.R.T.

За три дня до падения я озаботился вопросом: а как узнать насколько мне хватит счастья? Я попробовал утилиту smartmontools , но она выводила неверную информацию. Пришлось скачать Datasheet и написать патч для них.
Написав патч, я нарыл один интересный параметр: среднее_количество_стираний/максимальное_количество_стираний = 35000/45000. Но прочитав, что MLC ячейки выдерживают только 10000 циклов, я решил, что эти параметры значат не совсем то, что я думаю, и забил на них.

Хроника падения

Внезапно, во время работы стали происходить необъяснимые вещи, например новые программы не запускались. Ради интереса посмотрел на тот самый S.M.A.R.T. параметр, было уже 37000/50000 (+2000/5000 за три дня). Перезапуститься уже не удалось, не читалась файловая система основного раздела.
Я запустился с компакта и начал проверку. Проверка показала, много битых нодов. В процессе починки утилита начала тестировать на битые сектора и их помечать. Завершилось это всё на следующий день со следующим результатом: 60Гб из 64Гб оказались помеченными как плохими.
На заметку: В SSD винчестерах ячейка считается битой, если туда нельзя записать новую информацию. Чтение из такой ячейки по прежнему будет возможным. По этому эли запустить утилиту badblocks в режиме только чтения, то врядли она что-то найдёт.

Я решил запустить утилиту перепрошивки, ибо она не только перепрошивает, но и переформатирует диск. Утилита начала форматировать, покряхтела и выдала, что превышено разумное допустимое количество битых секторов, а также что есть сбои, поэтому завершить форматирование не возможно.
После этого диск стал определяться как диск с очень странным именем, номером модели и размером в 4Гб. И, в дальнейшем, кроме специализированных, утилит его никто не видит.
Я написал письмо в поддержку производителя. Они порекомендовали мне перепрошить, если не получится, то вернуть продавцу. Гарантии ещё 2 года, так что попробую.
Завершаю данный раздел благодарностями Стиву Возняку, который научил делать меня периодические бекапы.

Что произошло

Честно говоря, я и сам не знаю. Предполагаю следующее: S.M.A.R.T. не врал и ячейки действительно поизносились (это косвенно подтверждает бекап, который я делал за два дня до падения, он при распаковке показал, что даты создания некоторых файлов обнулены). А при проверке на бед сектора контроллер диска просто разрешил помечать все ячейки как битые, в которых превышено допустимое количество циклов записи.

Что нужно делать, если у вас SSD

Windows
Поставить Windows 7 в ней максимально всё оптимизировано для таких дисков. Также поставить много оперативки.
MacOs
Скорее всего оптимизированы только те компьютеры, которые будут сразу продаваться с SSD.
FreeBSD
Поставить 9.0. Почитать советы для линукса, подумать что из них можно сделать.
Linux
  • Поставить ядро 2.6.33, в котором есть оптимизация для таких дисков в виде команды TRIM.
  • Увеличить памяти, чтобы можно было безболезненно отключить своп.
  • Поставить для монтируемых разделов noatime .
  • Использовал файловую систему, сделанную по принципу copy-on-write или нежурналируемую файловую систему (например ext2).
    На текущий момент copy-on-write ФС использовать достаточно сложно. ZFS пока работает только через FUSE. А nilfs и btrfs при монтировании ругаются, что их формат ещё окончательно не финализирован.
  • Включить NOOP IO Scheduler он позволит не выполнять лишних бесполезных действий для SSD.
  • Концептуально верно, но не сильно поможет диску - переброс временных файлов на tmpfs .
  • Для систем интенсивно пишущих в лог нужно хранить в другом месте. В основном это актуально для серверов, для которых без проблем подымается лог сервер.
  • Обзавестись S.M.A.R.T.-утилитами корректно отображающих состояние SSD-диска, чтобы можно было периодически следить за диском.
  • Просто щадить диск. А для гентушников это дополнительно значит не «пересобирать мир».

Вопросы к хабрасообществу

  • Действительно ли за 2 месяца можно убить MLC-ячейки? Я, конечно понимаю, что диск я не жалел, но ничего сверхъестественного я не делал, просто работал как обычно.
  • Гарантийный ли это случай?

UPD : Диск у меня был Transcend TS64GSSD25S-M.
UPD2 : В комментах очень хорошие отзывы о SSD Intel и SAMSUNG. Кроме того люди удивляются как можно так быстро убить SSD веник. Поверьте мне, я недоумевал точно также. Тем не менее возможно, что это наспех скроенная SSD серия и её можно быстро убить.
UPD3 : В комментах и