Кои имена на градове са по-смешни?

Преди два месеца в тўитър стана дискусия, след като няколко хора приехме за смешно, че Юрая Хийп ще пеят в Тутракан. Павлина Върбанова с право зададе въпроса: @PStantchev Ако взривява Каварна, защо да не може да взриви Тутракан? Какво смешно има? И ходили ли сте в Тутракан? @bozhobg @Karavelikov — Павлина Върбанова (@pvarbanova) May 1, 2015 Само че Тутракан наистина звучи смешно. А Каварна не. И не защото Тутракан не е хубав град, или защото е твърде малък, или защото хората в нещо не са наред – просто името му е такова. Ако Юрая Хийп пеят в Сандански няма да е смешно, но ако пеят в Угърчин, ще е. Реших да подложа тези ми допускания на гласуване. Благодаря на 33-мата души, които отделиха време. И отчитам като грешка, че в списъка липсват Угърчин и Каспичан, макар и там резултатът да е предизвестен. Резултатите: Да, Тутракан е смешен. Но целта беше за разбера защо. На пръв поглед изглежда, че градовете, които имат „у“ в името си (и не са областни градове, като Бургас), се възприемат като смешни. Но не това е единственото. Реших да проверя дали рядкостта на комбинации от букви (n-grams) не играе роля – т.е. колкото по-рядко се среща в езика дадена комбинация, толкова по-смешно да звучи. Използвайки библиотеката си с езикови инструменти и речник не открих корелация (нито при биграми, нито при триграми, и т.н.) Качих файл с резултатите, ако някой успее да намери някаква корелация. Съгласен съм, че данните са малко, обаче. Колоните са: име на града, последван от степените от 1 до 5, като за всяка има процент отговорили и брой отговорили с тази степен. Накрая е общият брой отговорили и средната стойност (като се вземат предвид тежестите – от 1 до 5). Допускам, че някои комбинации от звукове наистина са смешни – „упн“, „утр“, „дуй“.

Continue reading