Сколько мата в текстах песен группы "Ленинград"

2016 год прошел под знаком "Ленинграда", песни и клипы группы били всевозможные рекорды, а "в восхитительных штанах" и "в Питере — пить" стали главными мемами страны. "ДП" решил подойти к творчеству Шнура по-научному строго — прослушал все альбомы и проанализировал лексику любимых песен.

Группировка "Ленинград" основана Сергеем Шнуровым в 1996 году в Петербурге. Коллектив известен своей эпатажностью, обилием нецензурной лексики в текстах и песнями на алкогольно-бытовую тематику. В уходящем году песни "Лабутены" и "В Питере — пить" заняли первые две строчки в рейтинге мемов Яндекса.
Песней "В Питере — пить" сначала заинтересовалась прокуратура, но в итоге администрация Петербурга поблагодарила Сергея Шнурова за пропаганду города среди туристов.
"ДП" решил провести анализ текстов песен и выяснить, какую долю в них занимает обсценная лексика.
Для анализа мы скачали все тексты в один файл и с помощью специального сервиса вывели статистику по наиболее часто употребляемым и уникальным словам. По понятным причинам нецензурные выражения были изъяты вручную и посчитаны по альбомам. Мы брали альбомы, содержащие уникальные композиции, дополнительно собрали данные по синглам, который вышли в 2015-2016 годах.
Самыми частыми оказались слова "все", "любить", "баба". Много песен содержат слова о родном городе группы: "Ленинград" и "Питер" (24 раза), "Зенит" (11 раз), "Нева" (2 раза). Самые популярные женские имена: "Айседора" (11 раз), "Света" (8 раз), фамилия "Собчак" упоминается 27 раз.
Мы выяснили процент нецензурной брани в каждом альбоме, лидерами оказались "Мат без электричества" и "Фарш".
Мы проанализировали долю уникальных слов в каждом альбоме