Рими, пароними, анаграми, ехо…

Напоследък си поиграх с така или иначе генерирания речник на български словоформи, и в допълнение на съществуващите „играчки“, направих още няколко Пълният списък е: анаграми проверката на и-кратко – далеч от перфектна, но върши работа римен речник – не зачита ударения, макар че можех поне в някои случаи да го прави пароними ехо (дайте file > download ако google docs забие) – това е списък от думи, които са „ехо“ на други думи. Напр. „античен“ е ехо на „романтичен“, а „сива“ на „красива“

Continue reading

Анаграми

„Анаграма е вид игра на думи състояща се в пренареждане на буквите от дума или фраза така, че да се образува нова дума или фраза като всяка буква от оригинала се използва само веднъж.“ (wikipedia). Това са ребусите, които всички сме решавали като деца (и не само), участват и в тестовете за интелигентност. Как от една дума (или разбъркани букви) да получим друга дума. Миналата седмица се сетих, че ще ми е доста лесно да намирам анаграмите на всяка една дума. Затова в събота вечер го направих, използвайки за основа част от i-kratko.com: http://www.i-kratko.com/anagrams. Ето някои примерни анаграми: анаграми: армагани Доган: гадно годна реклама: карамел кламера Мария: армия босилек: обелиск Барселона: необрасла Поддържа само единични думи, без изрази (слагането на интервала на всяко възможно място ще отнеме доста повече ресурси). Надявам се намирането на анаграми да е интересно (полезно надали ще е). (За заинтересованите от техническите подробности: използвам речника на OpenOffice, както и леко модифициран речник на наставките, за да генерирам всички словоформи в българския. Пазя ги в Trie, за да мога да събера всичко в паметта. След това намирам всички пермутации на въведената дума и проверявам дали съществува такава словоформа.)

Continue reading

Акценти

Чували сме всякакви забавни акценти, когато чужденци говорят английски. В не по-малка степен това се отнася и за всеки чужд за говорещия език. Чували ли сте как индийци говорят английски? А французи? Някои не можеш да разбереш какво казват. В това видео едно момче говори английски с всевъзможни акценти, като добре илюстрира ситуацията. Българите също имат акцент, който макар че не е толкова забавен като френския и индийския, все пак е разпознаваем (веднъж ми се случи да слушам човек да говори английски по скайп, без да знам откъде е, и бях убеден, че е българин. Беше.) Защо се получава така? Един от факторите е това, че звуковите системи на езиците не са унифицирани. Какво значи това – българското „р“ е различно от английското „р“ и различно от френското „р“. Мекият звук „л“, който индийците използват съществува в английски само пред „i“ (заб.: това не е универсално правило). Освен това в един език се случват звукови явления, които не се случват в другите езици. Например в български крайна звучна съгласна се чува като беззвучна (казваме „глат“, а не „глад“). Това не е така в много езици. Във френски ударението е на последната сричка, но това изобщо не е така в английски, само че французите трудно „бягат“ от това. Проблем ли е това? По принцип не е проблем, стига другите да те разбират. Английският отдавна е международен език, освен това е официален в куп държави, и не може да се каже как точно е правилно да се говори. Само че по-тежките акценти го правят труден за разбиране, особено за хора, чийто майчин език е английски. (говоря за английски, но както казах, тези наблюдения важат за много други случаи). Говорил съм с колега-индиец и не го разбирах дълго време. Всеки работил с французи е имал затруднения. И т.н. Но дори да ви разбират

Continue reading

и-кратко, отново

Преди доста време (и аз) писах за проблема с бъркането на „и“ и „й“. В последния абзац споменах написване на софтуер, който да различава грешката. Е, миналата седмица такъв се появи – http://www.i-kratko.com. Направих го, защото ми беше интересно как ще стане. А такова нещо все още няма – доста такива грешки не могат да бъдат открити от spellchecker-и. Например „полицай“ с/у „полицаи“, „който“ с/у“ които“, и т.н. – и двете форми са валидни. В момента събирам примери (всеки текст, който се въведе, се записва и след това го анализирам/поправям, ако е грешен). Все още е далеч от съвършенство, но на когото му е интересно може да го пробва. Или дори да го ползва преди да пише. Ако достигне до задоволително ниво на точност ще пусна API, и може би плъгини за wordpress, phpBB и подобни – така ще може да се ползва автоматично, без пишещият да прояви желание да бъде грамотен (много хора нямат такова желание). За стигналите дотук – малка промяна в позицията ми за причините за грешката. След разговори по темата с двама „истински лингвисти“ (аз само се правя на такъв), се съгласих, че причината е по-скоро в неразбирането на разликата между буквите отколкото объркване на фонетичните представи. „и“ не може да бъде кратко, когато е ударено, но въпреки това се появяват примери като „найстина“. Т.е. при по-грамотните остава моето твърдение за неудареното „и“, което става по-кратко, но за останалите причината е просто неразбиране на фонетичната стойност на двете букви.

Continue reading

Прабългарският език – тюркски, индоирански, или все едно?

Постоянна тема на интерес за много българи е историята. И по-точно славната българска история. Но победите на първото и второто българско царство изглежда не са достатъчни за да бъдем „единствената и най-велика нация“, много хора се обръщат по-назад – към прабългарите и Велика България. Историческата и антропологичната перспектива на въпроса няма да ги разглеждам, защото нямам достатъчно познания в сферите, а и нямам достатъчно наблюдения върху изтъкваните факти. Но много важна част от твърденията на множеството хора пишещи и интересуващи се от историята на прабългарите е езикът. Чрез езика за който има сведения (макар и малко) се правят опити за изчистване и на принадлежността на прабългарските племена към дадена етническа група (арийци или тюрки). Това, което забелязвам е пълната лингвистична неграмотност на почти всички писания по въпроса. Подходът най-често е изреждане на прабългарски думи (от писмени паметници) и показване на сходна на вид дума от някой индоевропейски (най-често индоирански) език – фарси, памирски. И за незапознатият читател тези примери изглеждат като едно неоспоримо доказателство, че прабългарският език наистина е бил индоевропейски/индоирански. Само че науката лингвистика има доста по-различни методи за потвърждаване на родство между два езика. Сравнителният метод е начинът по който се реконструират езици и се доказва родството между два и повече езика. Аз никъде не съм видял да бъде приложен сравнителният метод дори частично. Накратко, най-важното правило при използването на сравнителния метод е наличието на редовни звукови съответствия – един звук от един език винаги преминава в един и същ звук в другия език в определен контекст (фонетичен, фонологичен, морфологичен). Освен това е много важно елиминирането на т.нар. „фалшиви родства“, например заемките, които не са резултат от вътрешното развитие на езика. В сайта на лингвиста Марк Розенфелдер има следната статия, която показва каква всъщност е вероятността в кои да е два езика да има сходни думи, и дори

Continue reading

и-кратко

От години наблюдавам един пълзящ проблем. А именно бъркането на „и“ и „й“. 1-во беше по форуми и чатове, когато още правилата за задължително писане на кирилица не бяха масови. Реших, че е остатъчно влияние от писането на латиница – там „й“ може да се пише по много начини, вкл. и да съвпада с „и“. После премина през блогове, коментари под статии, разни сайтове за новини, реномирани сайтове за новини и анализи. В момента е практически навсякъде – ако не минат двама редактори да проверят правописа, остават изрази като „той ще бъде герои“ „театралните сценарий“, „политически партий“, „след нанесен побои“, „тои“, „всички статий“, „даите ми“ и тн, и тн. (фрапантните случаи като „пйтам“. „йскам“ и „най-стина“ са за щастие все още много редки) Лошо е, че хората правят такива грешки. Но те все пак пишат „както им дойде“ из форумите. Лошо е, че журналисти правят такива грешки. Очаква се те да са грамотни. Лошо е, че в един от най-сериозните вестници – Капитал – се появяват такива грешки нееднократно (в онлайн версията). Няма ли редактори? Или и те са загубили грамотността си? Не, това не е техническа грешка, каквито на всеки е позволено да допусне. Това е грешка по същество. Тя (според мен) идва от това, че в разговорната реч, когато „и“ е след гласна, и не е ударено, се изговаря по-кратко. В „партии“ никой не казва две цели „и“-та. „герои“ звучи наистина близко до „герой“. Това изглежда прави пълна каша в представите на хората както за тези думи с „и“, така и за всички думи с „й“ (евентуално с подсъзнателния въпрос „дали пък тук не беше наистина „й“?). Казах, че е лошо. И то не защото съм консервативен и съм против всяка промяна в съвременната форма на езика. Това просто не е промяна в езика. Това си е неграмотност.

Continue reading