Смольный вслед за властями Ленобласти собирается использовать big data. Сотовые операторы подтвердили "ДП" интерес со стороны городских чиновников к обезличенным массивам данных абонентов. Но если в области это сотрудничество уже перешло в практическое русло (там с помощью big data собираются считать жителей), то в Петербурге пока только строят планы. Зато подходят к вопросу обстоятельно и с разных сторон.
Администрация Ленобласти ведет активную работу с "Ростелекомом" и "ВымпелКомом", а также выходит на соглашение с МТС, заявил "ДП" на ПМЭФ губернатор региона Александр Дрозденко. Вскоре подписать контракт планируется и с "МегаФоном". "Мы подтягиваем всех крупнейших операторов. У каждого из них есть свой блок данных, который мы хотели бы получить", — отметил глава Ленобласти.
По данным "ДП", аналогичные переговоры с сотовыми операторами в прошлом году вели власти Петербурга. Эту информацию подтвердили в МТС и "МегаФоне".
По словам операторов, представители городской администрации хотели выяснить, какую информацию можно получить и как ее можно использовать. Однако никакого коммерческого предложения от них так и не поступило.
Благодаря мобильным данным можно получить до 24 характеристик неперсонифицированного профиля человека и выявить его поведенческую модель, пояснила директор по развитию цифровых проектов Северо–Западного филиала "МегаФона" Елена Полякова. По ее словам, помимо маршрута передвижения абонентов операторы могут предоставить информацию об их среднем чеке за день (фактически — об уровне дохода), возрасте, поле, увлечениях, интересе к определенным сайтам или социальным сетям.
Формально данные обезличены, но игроки рынка говорят, что теоретически выяснить персональные данные конкретного человека можно. При этом big data пока не регулируется законом, не установлены и правила использования.
Дешевле переписи
Губернатор Ленобласти объяснил, что данные потребовались для анализа перемещения масс. "Исходя из расчета основного трафика и маршрутов в час пик мы сможем понять, где нам нужно расширить основные магистрали. Также важен расчет миграционного трафика: мы прекрасно понимаем, что очень много жителей области работает в Петербурге (и наоборот)", — сказал Александр Дрозденко. Данные лягут в основу стратегического развития региона в ближайшие годы.
В СПАРК нет сведений о том, что закупки данных были уже объявлены комитетом. Зато в феврале этот орган власти заключил контракт на 10,3 млн рублей с Петростатом на предоставление статистики.
Обратиться к неофициальным источникам информации власти побудило появление на границе с городом новых жилых районов, характерным примером которых является Мурино. В этом городе произошел взрывной рост населения: в 2015 году здесь зарегистрировался первый житель, а сейчас прописано около 50 тыс. человек. Но местные власти думают, что в действительности население может достигать и 100 тыс., так как не все имеют там регистрацию.
"Могу предположить, что сегодняшние источники информации — данные Росстата и последней переписи населения — потеряли свою актуальность. В Кудрово и Девяткино по переписи населения 2010 года живет, я думаю, несколько тысяч человек, хотя их там намного больше. И закупить big data попросту дешевле, чем провести новый опрос", — поделился предположением директор филиала МТС в Петербурге и Ленобласти Павел Коротин. Посчитать, сколько человек реально живет на определенной территории, с помощью мобильных операторов элементарно: надо просто посмотреть, сколько телефонов там ночует.
Неспортивный интерес
Комитет по информатизации и связи Петербурга (КИС) изучает возможность использования больших данных, получаемых от операторов сотовой связи, сообщил "ДП" его зампредседателя Андрей Соколов. Как и областных коллег, КИС интересуют места работы и проживания абонентов, их перемещение, а также пол, возраст и доход. Собранную информацию предполагается использовать для формирования Генплана и прочих документов территориального планирования, обоснования строительства новых социальных объектов, обоснования плана благоустройства районов и для оценки занятости населения.
"Наш комитет заинтересован в изучении опыта и полученных результатов Ленобласти, особенно в рамках работы над развитием агломерации и подсчетов маятниковой миграции населения", — прокомментировали в КГА.
У Смольного уже есть опыт использования данных сотовых операторов на Кубке конфедераций 2017 года. Присутствовавших на матче открытия болельщиков разделили на категории (зарубежные болельщики, группы фанатов и т. д.). Телефонная информация позволила оценить численность этих групп, проследить, как и куда они прибывали и уезжали (как распределялись по городу после матча), а также понять загрузку станций метро и наземного транспорта. Партнером города в этом проекте была американская компания Habidatum International Inc, подтвердил "ДП" ее представитель. По данным СПАРК, компанию возглавляет Алексей Новиков, который также является директором ее российского филиала — ООО "Хабидатум лаб". В СПАРК не удалось обнаружить данные об участии филиала в государственных закупках.
Смольный хочет и дальше собирать данные операторов на массовых мероприятиях, чтобы создать "паспорта мероприятий" и "прогнозировать развитие различных ситуаций", отметил Андрей Соколов.
Big data по карточке
Другой потенциальный источник big data для городских властей — Единая карта петербуржца. Пока она является по сути обычной банковской картой, Смольный не может получить информацию о транзакциях, которые являются банковской тайной. Но, создав шлюз для осуществления платежей с привязанных к карте мобильных устройств, Смольный сможет собирать массивы данных до их попадания в финансовую систему.
"Нам надо персонализировать отношения. Мы говорим, что помогаем пенсионерам или малому бизнесу, но мы их не видим, это абстрактная масса. Карта поможет решить эту проблему. Мы получим доступ к информации о том, кто какие услуги и в каком объеме получает. Это уже можно анализировать в любом разрезе: по районам, по возрастам, по полу, по профессиональным занятиям", — прокомментировал "ДП" вице–губернатор Евгений Елин. Кроме того, карта позволит взаимоувязать объем получаемых льгот с уровнем дохода человека. А также даст возможность коммерческим предприятиям предоставлять адресные скидки людям с небольшими доходами.
Известно, что в 2018 году СПб ГКУ "Санкт–Петербургский информационно–аналитический центр" заключило соглашение с "Яндекс.Такси", а затем с ООО "Городское такси 068" о предоставлении данных по всем поездкам. Система призвана снабжать органы власти транспортной аналитикой, следует из информации КИС.
Правда, нет информации, что данные как–то глубоко анализировались. Соглашения с агрегаторами "были в первую очередь призваны помочь при осуществлении контроля за соблюдением законодательства в сфере перевозок легковым такси", лаконично прокомментировали этот вопрос в комитете по транспорту.
Физика и лирика данных
Ценность данных операторов не следует преувеличивать, считает руководитель центра экспертиз "ЭКОМ" Александр Карпов. "Это очередная игрушка, — уверен он. — Люди едут, куда ведут дороги, и ориентация на большие данные (вроде собранных от сотовых операторов или такси) только законсервирует эту ситуацию". "Потоки людей управляются и направляются физической инфраструктурой", — полагает Александр Карпов. То есть впереди должно стоять градостроительное планирование, а не статистика перемещений.
Кроме того, недостаточно просто купить набор данных. Нужно еще найти тех, кто сможет провести анализ. "Нужно покупать не данные, а услугу. Например, по определению численности населения", — рассуждает Александр Карпов. В идеале нужно покупать такую услугу сразу у нескольких фирм, каждая их которых выполнит подсчет по своему способу, — это позволит снизить погрешность.
Неофициальная статистика может иметь значение, когда нужно получить сиюминутную картинку, инсайт (например, чтобы решить проблему с неосвещенным участком улицы, который люди стремятся избегать).
Главные задачи после получения данных — создание математической модели, которая позволила бы спрогнозировать потоки, и визуализация данных, сказал "ДП" советник ректора Университета ИТМО Михаил Климовский.
Данных сотовых операторов, очевидно, недостаточно, но если использовать и другие источники (например, сведения о банковских транзакциях), то можно будет предсказывать маятниковые миграции. А также, что важно для бизнеса, выяснить, кто и где тратит деньги — то есть исследовать поведенческую экономику населения. Обработанные данные и составленные на их основе прогнозы в будущем должны составить параметрическую модель города, которая позволит оценивать перспективы его развития в пространстве и времени, надеется урбанист.
Вопреки мнению Карпова, Климовский полагает, что использовать эту модель для стратегического планирования можно. "Грубо говоря, это первый заход на динамичный генеральный план, или мастер–план города. Сам генеральный план стоило бы свести просто к своду норм, правил и каких–то юридических вопросов", — добавил советник.
Умная Москва
Между тем департамент информационных технологий Москвы использует большие данные операторов с 2015 года. За это время столичные власти потратили на геоаналитику около 0,5 млрд рублей, за 2018 год — немногим больше 100 млн рублей. Информация используется преимущественно для планирования развития инфраструктуры.
В контексте
Большие данные — это, конечно, красиво и модно. Но без эффективной системы госуправления новые технологии не просто теряют эффективность, но даже могут и навредить. Гораздо больше пользы было бы, если бы власть просто научилась слушать людей на местах.
Никто не будет спорить с тем, что большие данные способны серьезно улучшить уровень аналитики в государственных структурах. Хрестоматийный пример — Москва, где была внедрена интеллектуальная система анализа трафика. Она стоила миллиарды рублей, но дала 15%–ное улучшение на дорогах (чтобы добиться того же за счет строительства физической инфраструктуры, потребовались бы триллионы рублей).
Но часто аналитика не так важна, как конкретные действия. Ведь без всяких больших данных всем очевидно, что аэропорт Пулково нуждается в современной транспортной инфраструктуре, — но где она? Точно так же известно об острой нехватке дорог в Мурино, но проблема никак не решается.
Надо помнить и о том, что big data — это инструмент обоюдоострый. Любую обезличенную информацию при большом желании можно обратно персонифицировать и увидеть совершенно конкретно, какие сайты человек просматривает, где оставляет наибольшие суммы денег, какими дорогами возвращается — одним словом, как ему эффективнее всего навредить. Важно: цифровые следы собирают все государства, но только в самых бестолковых собранные сведения потом за копейки продаются на черном рынке. Можно ли в России быть уверенными, что наши данные однажды не используют против нас, особенно если речь пойдет о больших деньгах?
А ведь многие проблемы можно решить без всяких больших данных, просто поощряя инициативу на местах. Люди по природе своей склонны к самоорганизации и при наличии постоянного дохода стремятся преобразить территории вокруг к лучшему. При этом снизу узкие места системы транспорта или благоустройства видно гораздо лучше. Если бы у граждан было чувство минимальной сопричастности процессу бюджетирования, они бы сами указали на проблемные зоны. А собранные налоги ушли бы не на фейковые праздники для молодежи, а на покупку асфальта и благоустройство детских площадок.
Приближаемся ли мы к этой цели? Судя по новостям в сфере локальных сообществ, не очень. История с закупкой big data — лишь еще одно доказательство того, что власть стремится централизовать все процессы. Вместо того, чтобы спросить людей, их проанализируют. И хорошо, если по пути ничего не утечет в сеть.
“
Благодаря обезличенным данным городские власти, планируя развитие территории, могут построить завод по производству электроники в определенной точке, поскольку рядом находится профильный институт, а по соседству живут специалисты в смежных областях. Или, например, для снижения общественной напряженности достаточно перенести остановку на 200 м — ближе к детскому саду.
Елена Полякова
директор по развитию бизнеса в государственном сегменте и специальным проектам Северо–Западного филиала "МегаФона"
“
В обезличенном виде это данные ни о чем. В 95% случаев это каша, особой ценности не представляющая, которую можно использовать для подтверждения уже имеющихся гипотез. Никакой ценности в таком решении нет, максимальная ценность — на уровне пиара из разряда "мы идем в ногу со временем". Если они хотят получать ценную информацию, нужны персональные данные.
Юрий Брюквин
директор информационно–аналитического агентства "Рустелеком"