04.07.2022
Источник: ИКС медиа, Александр Барсков
Новый ГОСТ Р 70139-2022, описывающий более 200 показателей, которые характеризуют центры обработки данных, является хорошим методологическим инструментом, однако возможность его практического применения вызывает серьезные сомнения.
2 июня 2022 г. Росстандарт утвердил новый национальный стандарт: ГОСТ Р 70139-2022 «Центры обработки данных. Инженерная инфраструктура. Классификация». Разработчик стандарта – Ассоциация участников отрасли ЦОД (далее – Ассоциация), а сам стандарт закреплен за техническим комитетом по стандартизации № 120 «Центры обработки данных» (ТК120). Новый стандарт основан на модели классификации ЦОДов, которая была утверждена на правлении Ассоциации еще в 2018 г.
Для большинства экспертов и руководителей ЦОДов, с которыми мне удалось переговорить, появление нового стандарта стало неожиданностью: они узнали о нем только из пресс-релиза Ассоциации. На посвященной новому стандарту пресс-конференции президент Ассоциации Игорь Дорофеев назвал его автором Заурбека Алехина, члена Ассоциации и председателя ТК120. На просьбу уточнить, кто еще из известных экспертов отрасли участвовал в написании стандарта, И. Дорофеев перечислил ряд компаний (DataPro, Xelent (ранее SDN), IXcellerate, 3data, Stack Group, Miran, StoreData и «ТрастИнфо»), которые в свое время делегировали представителей в рабочую группу по разработке модели классификации.
Понятно, что модель классификации и ГОСТ – совсем не одно и то же. «Стандарт – это вещь оформительская», – заявил президент Ассоциации. Складывается впечатление, что к подготовке текста самого стандарта ведущие эксперты отрасли привлечены не были. В ходе небольшого опроса, проведенного изданием ComNews.ru, представители лидера отрасли компании «Ростелеком-ЦОД», а также компаний IXcellerate, 3data и Selectel сообщили, что в подготовке стандарта не участвовали.
Многих журналистов интересовало, насколько новый стандарт согласуется с хорошо известной системой Tier от Uptime Institute. Это и понятно: по данным iKS-Consulting за 2021 г., в России 33% всех стойко-мест в коммерческих ЦОДах размещаются на объектах, которые сертифицированы на соответствие требованиям Tier III, а еще 47% стойко-мест – в ЦОДах, заявленных как соответствующие Tier III. Получается, что 80% всей инфраструктуры основано на требованиях Tier III.
«Основной документ Uptime посвящен топологии. Но на функционирование <ЦОДа> оказывают влияние не только топология, но и множество других показателей. В части топологии в рамках нашей классификации учтены требования, которые Uptime предъявляет. Из 200 с лишним показателей примерно десяток соответствует документам Uptime. Но все остальные тоже важны», – пояснил З. Алехин.
Действительно, в ГОСТ Р 70139-2022 есть целые группы показателей, которые отсутствуют в документах Uptime Institute. Это, например, группы показателей назначения и безопасности. В первую группу входят, в частности, такие показатели, как габариты и вес монтажных шкафов, тип и габариты ограждений, тип электрических розеток, напряжение, частота, максимальный ток и т.д. А для описания уровня безопасности служат показатели стойкости к внешним климатическим и природным воздействиям, инженерно-технической укрепленности объекта и др.
Для классификации ЦОДов все описанные в ГОСТе показатели, очевидно, не нужны, для этой цели выделено 29 показателей. По идее создателей, это должно облегчить практическое применение стандарта для классификации конкретных объектов. Но смущает то, что для описания ключевого показателя – надежности критических инженерных систем – в стандарте предлагается использовать расчетный коэффициент готовности (те самые девятки, от которых тот же Uptime давно отказался). Таким образом, чтобы оценить уровень надежности конкретного ЦОДа (и отнести его к одному из пяти классов), необходимо иметь данные о наработке на отказ (MTBF) каждой единицы оборудования (а их в ЦОДе – тысячи), построить математическую модель всей системы и рассчитать общий коэффициент готовности. Эта задача непроста технически и очень трудоемка, да и данные о наработке на отказ предоставляют далеко не все производители. Кроме того, не всегда понятно, каким образом такие показатели рассчитываются, в особенности для новых моделей оборудования.
Впрочем, сложность применения предложенной методики «здесь и сейчас» понимает и сам З. Алехин: «Да, действительно, сегодня <кто-то> на рынке не готов оценить надежность по такой методике. Но давайте учиться. Все необходимые данные производители оборудования уже сегодня обязаны предоставлять. А если вендор отказывается предоставлять информацию по коэффициенту готовности, у каждого заказчика должен возникнуть закономерный вопрос “почему?”».
Проблема видится еще и в том, что расчетный коэффициент готовности имеет вероятностный характер. Представьте, что вы собираетесь в дальнюю дорогу на автомобиле. Обязательно берете с собой запаску. А я, отправляясь за тысячу километров в лихие 90-е, брал даже две. Это пример топологической устойчивости (N+1 и N+2). Ведь даже установка самого дорого и качественного колеса (с высоким показателем MTBF) не может обезопасить от гвоздя на дороге или иной причины выхода его из строя. Так же и в ЦОДах: оборудование, конечно, надо покупать качественное и надежное, но даже оно, пусть и с малой вероятностью, может выйти из строя уже в первые часы работы. Да и человеческий фактор никто не отменял. Поэтому топологическое резервирование и отлаженные процедуры эксплуатации – основа бесперебойной работы ЦОДов, принятая большинством игроков, в том числе в России.
То, что ГОСТ Р 70139-2022 прямо сейчас не готов к применению для классификации конкретных объектов (или отрасль не готова к выполнению требований ГОСТа), подтверждает и Дмитрий Басистый, ответственный секретарь ТК120: «Есть задача перекладывания положений стандарта классификации в некую методику, есть планы аттестации на сертификацию по этой методике органов по сертификации, чтобы… появилась возможность добровольно проводить сертификацию».
В пресс-релизе, выпущенном по итогам пресс-конференции, говорится о необходимости переходного периода (для полноценного применения ГОСТ Р 70139-2022). Такой период требуется «для появления или возрождения проектировочной практики преимущественно для сложных, расчетных показателей».
Как показывает мировой опыт, действительно полезный стандарт, не важно, оформлен он национальным органом по стандартизации или сформировался де-факто, основывается на наилучших практиках и по сути является их систематизацией. В случае же с ГОСТ Р 70139-2022 мы получили документ, которому для полноценного применения требуется «возрождение практики». Причем возрождать ее авторы предлагают в непростое время параллельного импорта, когда получить от производителей какие-либо данные о времени наработки оборудования на отказ становится практически невозможно. Хорошо, что в России соблюдение ГОСТов – дело добровольное.