Кратък анализ на предизборните бухалки

Преди изборите през март, медиите в гравитационното поле на Пеевски издадоха две пропагандни „книги“. „Крадци на демокрация“ и „Маските на задкулисието“. Книгите се раздаваха безплатно с всеки вестник Телеграф и бяха по 250-280 страници. Това беше една сериозна инвестиция, предизборно насочена срещу политически субекти и хора. Колко точно гласове изгуби Да, България и Нова Република заради тези книги не е ясно, но със сигурност загубиха. Дали инвестицията си е струвала, да кажат „пострадалите“ от КТБ неявни собственици на медии. Със сигурност не можем да се оправдаваме с „книгите“ за невлизането в парламента, та предлагам да не се търси опит за оправдания в тази публикация.

Макар резултатите да са видими и с просто око, реших да направя кратък анализ на текста на книгите. Те са достъпни на сайта на Монитор (няма да давам линк), като онлайн книги, съставени от картинки. Разбира се, не беше трудно да сваля всички картинки, да приложа OCR (превръщане на картинка в текст) върху тях и да получа сравнително коректен текст (няма да го качвам, че да не излезе, че нарушавам нечие авторско право – макар че книгите бяха без автор; никой не е искал да се подпише под тази помия).

Това, което направих, е да извадя най-често срещаните н-грами – т.е. съчетания от 1, 2, 3, 4, … n последователни думи (в този случай се ограничих до 4). Изключват се служебни думи („като“, „който“, „се“ и т.н.). Целта е както да се види кой е бил атакуван най-много, така и какви са клишетата, които анонимните автори се опитват да втълпят на аудиторията си. Резултатите включват думи и изрази, съставени от до 4 думи и съответния брой срещания в книгата.

Кода можете да разгледате тук. Ето и резултатите – за книга 1 и за книга 2.

А ето и моята интерпретация на данните: в първата книга фокусът е бил Прокопиев-Христо Иванов-Да,България-Сорос. Най-често срещаните думи и изрази са Прокопиев (157), Иванов (140), Сорос (110), Капитал (103), отворено общество (73), (Цветан) Василев (78), Да(й) България (46) + Да, България (18), Америка за България (39). Протестна мрежа (25). „Иванов“ в някои случаи се отнася до други хора, но сравнително рядко (в тези 140 не влиза например Мирослав Иванов). Доста споменавания има и Бивол, както и Чобанов (93) и Асен Йорданов (25). Нататък са Костов (50), Плевнелиев (33), Кристиан Таков (21), (Антоанета) Цонева (21), Радан (Кънев) (19), Асен Генов (19). Има още няколко думички като „власт“, „партия“, „хората“, „съдебната“, които са доста високо, с по 50-60 използвания. Да, познахте – Пеевски не се споменава нито веднъж в първата книга (и веднъж във втората – бил внесъл законопроект).

От това е очевидно, че основния обект на предизборна атака е бил Христо Иванов и Да, България (която по-често пишат Да(й) България). Следващите партии по брой споменавания са: ДСБ (31) + Нова Република (7), СДС (8), ГЕРБ (8), БСП (6), ДПС (3). Т.е. ДСБ/Нова Република и в по-малка степен Радан Кънев също са били обект на атаката. Споменаванията на всички останали партии са колкото да върви „разказа“.

Важна нишка тук е „Сорос“ (+ „Отворено общество“) и „Америка за България“ – и двете имат сериозна роля, съдейки по броя споменавания. Свързването на опозиционни политически движения със Сорос и други външни фондации е напоследък стандартна практика в много държави от региона (включително в Полша във връзка с последните протести), а тезата „ако някой има някаква активност против властта, значи му се плаща отвън“ явно минава лесно. Тя все пак трябва да бъде затвърждавана постоянно, поради което е сериозния брой споменавания на нищо неподозиращия Сорос.

Във втората книга фокусът малко се измества. Дали заради решението на ЦИК да забрани разпространението, дали заради добре замислен план градената с години тъмна сянка на Костов да бъде хвърлена върху цялото демократично пространство, дали случайно, не знам. Но фокусът на втората книга е Костов, като отново Христо Иванов, Прокопиев , Да, България и ДСБ са доста централни теми: Костов (342), Иванов (113) / Христо Иванов (58), Прокопиев (110), Сорос (85), (Цветан) Василев (84), Радан (57). СДС е споменато доста пъти (70), ДСБ – 43, Да(й) България – 31. СДС обаче е споменавано основно в исторически контекст.

Цветан Василев присъства силно и в двете книги, в сериозния напън да го брандират като част от „дясното“ и така да прехвърлят недоволството за загубените милиарди към нямащи нищо общо хора.

Наблюдават се и някои устойчиви словосъчетания, които се опитват да налагат отдавна, като „проваления правосъден министър“ (6), „зеления октопод“ (15), „разградския олигарх“ (7), „площадната демокрация“ (7), „банкерът беглец“ (10), „грантаджия/грантаджийски“ (9). Думата „истината“ я има общо 40 пъти в двете книги. Важно е да се повтаря, че нещо е истина, иначе може да не ти се вържат.

Върху текста могат да се правят и още анализи – например кои двойки думи/хора се срещат най-често в рамките на едно изречение, каква е конотацията на споменаването на всяко едно от имената, и т.н., но не мисля, че така ще излезе нещо много по-различно.

Всичко това не е нещо ново и неочаквано, но пък е полезно човек да представи пропагандата като сурови данни.

2 коментара

  1. Божо, подкрепям идеята ти, но ще ти препоръчам да ползваш готови библиотеки за анализ на текст. Не бях се интересувал за такива на Java, но бързо търсене и първото попаднало ми е това: http://alias-i.com/lingpipe/index.html

  2. По принцип съм съгласен и ползвам, но често те са фокусирани върху английски. А и за нещо толкова просто като n-grams няма смисъл 🙂

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *