Максим Орешкин, министр экономического развития РФ: «У сотрудников Минэкономразвития полный запрет даже на попытки обсуждать статистику с коллегами из Росстата до ее выхода. Поэтому о цифре роста ВВП я узнал одновременно со всеми и так же удивился»
08:0018 февраля 201908:00
11482просмотров
08:0018 февраля 2019
Цифры экономического роста удивляют даже министра экономического развития, но это лишь вершина айсберга под названием "русская статистика". Как и в знаменитом романе Оруэлла, Росстат запросто получает пять, складывая двойки, а малый бизнес с волшебной легкостью превращает в лидеров рынка с миллиардной выручкой.
Владелица небольшой туристической компании "Контрубалт" Татьяна Чайкун в один прекрасный день неожиданно проснулась миллиардером. Методология подсчетов "ДП", базирующаяся на сведениях из баз данных корпоративных отчетностей, позволяет включить предпринимательницу (оборот фирмы — 9,6 млрд рублей) в новый рейтинг миллиардеров. И не только в него: с такими формальными показателями скромный офис с несколькими работниками может быть автоматически записан интеллектуальными системами в лидеры всей туристической отрасли Петербурга.
"Мы как раз набираем вожатых в наш языковой лагерь. Но после таких новостей радостно ожидаем силовиков с "проверками". Заодно и пригласим их поработать с нами летом. А если серьезно, то Росстат просто случайно добавил три лишних нолика", — объяснила "ДП" Татьяна Чайкун.
Не единичный случай
Сейчас ошибочные данные размещены на всех ведущих порталах, посвященных бизнес–аналитике, в том числе в одной из наиболее авторитетных баз СПАРК–Интерфакс. Реальные показатели были меньше ровно в 1000 раз, однако исправлять ошибку никто не торопится, поскольку именно такие данные прислали из Росстата.
"Мы не корректируем наши источники, а выкладываем данные в оригинальном виде", — рассказали "ДП" в СПАРК–Интерфакс.
Беглый просмотр базы данных позволил редакции "Делового Петербурга" найти еще минимум пять петербургских фирм, чьи показатели, скорее всего, введены с ошибкой в три нуля. Среди них, например, такой серьезный бизнес, как столярное дело. ООО "Носкат" смогло получить выручку 50,7 млрд рублей, хотя так и не обзавелось даже собственным сайтом. А малоизвестная на рынке фирма ООО "Престиж", предоставляющая услуги по перевозкам, смогла выполнить контрактов аж на 80,9 млрд рублей.
Еще один незаметный миллиардер обнаружился на рынке перевозок — ООО "Интер", принадлежащее Мгеру Акопяну. Выручка, согласно данным СПАРК, составила 25,6 млрд рублей. Акопян подтвердил "ДП", что это ошибка, однако никаких сложностей из–за путаницы с нулями у него не возникло. Владелица "Контурбалт" Татьяна Чайкун тоже не жалуется — никаких претензий из налоговой к ней не приходило. Максимум изменили отношение некоторые партнеры, но все это не более чем причина для шуток.
Ошибки были всегда
Генеральный директор компании INFOLine Иван Федяков уверяет, что Росстат постоянно допускает ошибки, поэтому советует относиться к данным предельно внимательно. Самый свежий пример — последний доклад о социально–экономическом положении России за январь–декабрь 2018 года. Динамика оборота пищевых продуктов за октябрь — +0,4%, за ноябрь — +1,6%, за декабрь — +1,7%, а общая за IV квартал (внезапно!) — +1,9%.
"Мы это вылавливаем каждый день. Безответственность, доведенная до предела, в госоргане, который вообще–то ничего другого не производит", — негодует Федяков.
Главный экономист РА "Эксперт" Антон Табах согласен, что такие ошибки — постоянное явление. По его мнению, именно поэтому в Росстате в декабре сменилось руководство. Новый глава ведомства Павел Малков до этого занимался созданием системы многофункциональных центров в стране. У него есть опыт налаживания работы в больших организациях.
Но не всегда причина ошибки — оплошность. Как говорят в INFOLine, в их практике были случаи, когда компании предоставляли завышенную выручку в отчетности, поскольку готовили бизнес к продаже.
"Чтобы оценить выручку, недостаточно работать с РСБУ, потому что хозяйствующий субъект один, а юрлиц может быть множество. Иногда выручка дробится, иногда удваивается, если компания совмещает производственный и торговый бизнес. Мы используем несколько источников, в том числе проводим опрос. Затем перепроверяем эти данные. Например, при оценке ретейла мы приводим выручку к квадратному метру. И когда видим, что в переводе на квадратный метр у компании заявленная выручка больше, чем у "Ашана", то задаем вопрос: действительно ли их бизнес может быть эффективнее?" — объясняет Иван Федяков.
Угроза для будущего
Ложь или ошибки в больших данных могут серьезно усложнить автоматизацию аналитических процессов. В информатике и программировании давно известен принцип: garbage in — garbage out. Это значит, система искусственного интеллекта, проанализировав статистику невысокого качества, сделает соответствующего качества выводы.
"Одним из вариантов выхода из этой ситуации я вижу применение принципов гибридной парадигмы искусственного интеллекта, когда в ИИ–систему, кроме обучения ее нейросетей, еще закладываются метаправила валидации результатов. Это что–то типа "здравого смысла" для ИИ", — рассказывает Роман Душкин, директор по науке и технологиям Агентства искусственного интеллекта.
По оценке директора компании "Профископ" Алексея Смирнова, системы простого выявления ошибок не стоят дорого. Силами действующего сопровождения системы вполне можно создать алгоритм, который будет распознавать экстремальные выбросы значений с доверительной вероятностью 0,7–0,8. А вот чтобы создать систему, которая будет выявлять аномальные отклонения в данных с уровнем доверия более 0,9, уже потребуются значимые инвестиции. Чем ближе значение к единице, тем больше денег придется вложить, и тогда счет может идти уже на миллионы и десятки миллионов рублей.
“
Честно скажу, очень редко с подобным сталкивался. Года три назад у Росстата были ошибки, но в последнее время я бы сказал, что ситуация радикально изменилась. Наоборот, Росстат дает достаточно оперативно информацию и с хорошей разбивкой. Я думаю, что проблема в анализе была из–за того, что у нас в отчетности прописываются единицы измерения, тысячи, миллиарды, миллионы. И при автоматизированной оценке данных мог пройти сбой на три порядка единиц.
Дмитрий Кумановский
начальник аналитического отдела ИК LMS