Здесь комфортный уровень шума и освещения, каждый сотрудник максимально включён в процесс и работа ведётся 24/7. На линии — клиенты, подрядчики и региональные подразделения телеком-оператора по всей стране. Так обеспечиваются отказоустойчивость систем, мониторинг сети, оборудования и IT-сервисов; предотвращаются и устраняются аварии. И в таком режиме — уже 10 лет.
В ноябре единый центр управления сервисами (ЕЦУС) "МегаФона" отметил юбилей. Как проект трансформировался с годами вместе с отраслью, "ДП" рассказал директор организации Влас Тарасов.
Как ЕЦУС удаётся охватывать всю страну?
— Центр один, но площадки две: Санкт-Петербургское крыло в штатном режиме обслуживает в основном западную часть страны, Самарское — ориентировано на восточную часть. В целом же это единое подразделение, которое работает с одними и теми же объектами — но в нужный момент можем передать нагрузку и ключевые функции другому филиалу, чтобы сохранять надёжность и отказоустойчивость нашей деятельности.
Насколько быстро реагируете в случае нештатных ситуаций, если оборудование вышло из строя?
— Наше кредо — оперативность. У нас всё направлено на скорейшее принятие решений. Поэтому есть масса документов, сценариев, DRP (Disaster recovery plan), описывающих различные нештатные случаи или "ситуации-предвестники", которые мы тоже отрабатываем.
Отвечая на вопрос "насколько быстро", отмечу, что здесь нужно сразу держать в уме масштаб и степень влияния проблемы на сеть и абонентов. В каких-то случаях счёт идёт даже на минуты, но в целом мы ликвидируем проблемы в штатном рабочем режиме, пока абонент их не успевает ощутить.
Влас Тарасов, директор единого центра управления сервисами (ЕЦУС) МегаФона
Но ведь есть регионы, скажем так, более "проблемные" с точки зрения возможностей для оперативных действий...
— Конечно, есть географические нюансы: на Севере сложности могут быть связаны с климатом, на Юге — с посевным сезоном; на Кавказе некоторые базовые станции расположены в высокогорье — и доступ ограничен, что тоже накладывает отпечаток на скорость устранения нештатных ситуаций, которые случаются как на кабельной инфраструктуре, так и на системах кондиционирования, на антенно-мачтовых устройствах, и, естественно, в ряде регионов процесс работы осложнён. Это связано и с расстояниями, и с погодными условиями — там и повреждения зачастую специфичны. Но мы всё учитываем. И за такими участками у нас пристальный контроль. Поскольку прежде всего понимаем свою социальную миссию.
С другой стороны, в таких климатических зонах и плотность покрытия меньше, поэтому не возникает сложности с мониторингом. Здесь первенство у мегаполисов, потому что там базовых станций и разных возможных ситуаций очень много. Москва и Петербург — основные поставщики задач для ЕЦУС.
Как вы не раз говорили в интервью различным изданиям, полностью функционал передаётся в течение всего 15 минут — но наверняка требуется поддерживать навык?
— Да, регулярно проводим тренировки между Петербургом и Самарой, чтобы каждая из дежурных смен отработала передачу своих объектов, аварий или обращений. Потому что реальных случаев, когда это требуется, довольно мало.
Также проводим обучение для других специалистов: отрабатываем действия инженеров, менеджеров, руководителей в случае возникновения какой-то экстренной ситуации. В сценарий заложено всё: кто кому что докладывает, кто что должен сделать — это доведено до автоматизма.
Кстати, с какого пула задач начинался проект и какой закрываете сейчас?
— У нас все эти годы росли сеть и объём объектов инфраструктуры для мониторинга. При этом мы не наращивали соразмерно численность сотрудников, что говорит о постоянном росте нашей эффективности. Из года в год растёт количество анализируемых объектов, каждый день обрабатываются по несколько тысяч инцидентов.
Мы непрерывно совершенствуем свои инструменты. За 10 лет вырос парк аналитических систем и систем мониторинга — мы преодолели некую эволюцию этих решений. Поэтому сейчас мы даже готовы взять в периметр мониторинга оборудование другого оператора или инфраструктурной компании.
Однако это не единственно возможный формат организации ЕЦУС — какие ещё существуют на телеком-рынке?
— Наша концепция предполагает, что мы на своих системах с помощью своего же персонала осуществляем мониторинг, причём максимально централизованно. В других компаниях есть вариант работы нескольких центров, распределённых как географически, так и по зонам ответственности. Есть ещё решение, когда операторы связи отдают на аутсорсинг мониторинг и управление авариями. А у некоторых в принципе нет централизованных инструментов и систем.
Когда было принято решение о создании ЕЦУС, мы совершали референс-визиты в другие центры как в России, так и за рубежом, изучали опыт передовых стран и компаний в телеком-отрасли. И решили выбрать наиболее сбалансированный вариант. Этот подход мы считаем успешным, потому что это — максимально управляемая структура. Мы централизовали все инструменты, персонал и максимально расширили зону ответственности нашего центра. Для этого мы создали фундамент из зонтичных систем, на базе которых работали, одновременно развивая их. Сейчас у нас есть стремление импортозаместить все системы, но это небыстрый процесс.
Выбранный нами подход позволяет видеть все наши показатели и отклонения в одной информационной среде, что помогает оптимизировать процессы и принимать быстрое решение, а также с каждым годом повышать уровень надёжности и сохранение работоспособности.
Но концепция наверняка трансформировалась, актуализировалась со временем?
— Конечно. Мы перешли с концепции единого центра управления сетью в концепцию центра управления сервисами. Усилили мониторинг последних, внедрили массу различных решений — показатели по качеству, по статистике, а не только по отказоустойчивости оборудования, что тоже позволяет нам более точечно работать с качеством сети и сервисов, гибко управлять приоритетами с оглядкой на ущерб, видеть реакцию абонента на результат улучшений. И, исходя из этого, принимать управленческие решения.
“
Технологии развиваются, ландшафт мониторинга с каждым годом расширяется, модернизируются и ускоряются процессы. Наши подходы не изменились — но с каждым годом увеличивается глубина видения сети.