Текстове в корпуса

За анотираните текстове на сайта

Текстовете на сайта представят различни начини за лингвистична анотация. Тук са включени съвременни български и руски примери, както едно-, така и двуезични. Бяха добавени данни от средновековни български паметници. Целта бе да се апробират различни подходи при анотацията на голям спектър от явления, които представят интерес за изследователи и преводачи. Тези явления са илюстрирани и коментирани в публикациите по проекта на неговите участници.

Съкращения и начини на маркиране

AuxCL: формите за сегашно време на бꙑти (е, са, си, съм...).

Aux: другите форми на бꙑти (бѫ, бꙑ, бѣ, би, бил и др.), имѣти, хотѣти) (повечето се срещат и в първа позиция в изречението); тук са и формите естъ, еси, есте и т.н., които са маркирани само когато са в близост до клитични елементи.

cncl : маркиране на конклузив

Conj: съюзи и съюзни думи (та, ако, аще...)

dbt: маркиране на дубитативи

Neg: Отрицателната частица 'не' – маркира се в рамките на шаблона на клитичния комплекс, с изключение на случаите, в които е в първа позиция. Обикновено се намира в близост до глаголен елемент – в такива случаи при самостоятелна поява не е маркирана като отделен клитичен елемент във файловете.

other: при двуезичните корпуси така се отбелязват конструкции в преведения текст, които се различават по граматически особености от оригиналния текст.

ReflCL: 'се' – кратката винителна форма на възвратно-личното местоимение.

ReflDatCL: 'си' – кратката дателна форма на възвратно-личното местоимение.

pass-subj: маркиране на пасивни конструкции

PossReflCL: 'си' – кратката форма на възвратно-притежателното местоимение.

prsm: маркиране на презумптив

Местоименните сѧ, мѧ, тѧ..., които се анализират и като полуклитични (Vaillant 1948; Večerka 1989), са маркирани като клитики.

wh: т.нар. к-думи и техни производни, включително неизменяемият релативен маркер 'дето'.

'да' се маркира отделно.

2P: втора позиция в рамките на изречението (clause), като в първата позиция има един прозодично силен елемент (вкл. предхождан от съюз); втора позиция в рамките на именната фраза (своите си очи).

Използвани извори и научни изследвания при лингвистичната анотация

Зализняк, Андрей А. Древнерусские энклитики. Москва: "Языки славянских культур", 2008.

Иванова, Ана, Троянски дамаскин. Български паметник от ХVІІ век. София: Издателство на БАН, 1967.

Осенова, Петя и Кирил Симов. Формална граматика на българския език. София: Институт за паралелна обработка на информацията, БАН, 2007.

Bogdan, Ioan. Documente și regeste privitoare la relațiile Țăriĭ Rumînești cu Brașovul și Ungaria în secolul XV și XVI. 1902.

Večerka, Radoslav. Altkirchenslavische (Altbulgarische) Syntax. Freiburg, 1989

Vaillant, André. Manuel du Vieux slave. Paris, 1948.


Паралелните руско-български текстове на сайта на Руския национален корпус

За целите на проекта паралелните съвременни текстове на руски и български бяха включени като подкорпус в Руския национален корпус с възможност за търсене. Актуалният списък с текстове може да бъде видян тук.

Корпусите на този сайт

В своите анотации проектът използва и публикуваните и представени от екипа начини за лингвистично оформяне на данни. Списък на тези публикувани и представени данни вж. като част от този сайт или на Research Gate.

Заглавие Резюме
Синайски псалтир Пример за външна анотация. Текстът е анотиран на страниците на проекта TOROT Treebank, който е част от по-мащабния проект PROIEL, cf. Hanne Martine Eckhoff and Aleksandrs Berdicevskis. 2015. 'Linguistics vs. digital editions: The Tromsø Old Russian and OCS Treebank'. Scripta & e-Scripta 14–15, pp. 9-25. Вж. повече в рубриката Ресурси на сайта. Съкращението А отпраща към сайта на TOROT.
Троянската притча Троянската притча за първи път е анотирана и подготвена за електронно публикуване като част от дипломната работа на Димитрина Русева на тема „Електронно издание с речник на Троянската притча“ под ръководството на проф. Андрей Бояджиев (2011 г.). Този вариант е сегментиран и нормализиран. Тук той се помества като източник, от който е направена лингвистичната анотация на клитики.
Примери от българския език. Научен текст. Презумптиви (1) Примерите са анотирани с редактора Clark, като за целта е създаден собствен модел за целите на представяне на езикови явления от български и руски език. Повече информация вж. в рубриката Ресурси на сайта. Тук са само примери от българска научна литература от областта на историята. Лингвистична анотация от студентките Ива Атанасова и Преслава Георгиева под ръководството на д-р Ласка Ласкова.
Примери от българския език. Художествен текст. Презумптиви Примерите са анотирани с редактора Clark, като за целта е създаден собствен модел за целите на представяне на езикови явления от български и руски език. Повече информация вж. в рубриката Ресурси на сайта. Тук са само примери от българската художествена литература. Лингвистична анотация в XML формат е от студентките Ива Атанасова и Преслава Георгиева под ръководството на д-р Ласка Ласкова.
Примери от българския език. Научен текст. Презумптиви (2) Примерите са анотирани с редактора Clark, като за целта е създаден собствен модел за целите на представяне на езикови явления от български и руски език. Повече информация вж. в рубриката Ресурси на сайта. Тук са само примери от българска научна литература от областта на историята. Лингвистична анотация от студентките Ива Атанасова и Преслава Георгиева под ръководството на д-р Ласка Ласкова.
Примери от преводи на руски от българска художествена литература. Двуезичен корпус. Конклузиви Примерите са анотирани с редактора Clark, като за целта е създаден собствен модел за целите на представяне на езикови явления от български и руски език. Повече информация вж. в рубриката Ресурси на сайта. Тук са примери от българска художествена литература и техните преводи на руски. Лингвистична анотация от студентките Ива Атанасова и Преслава Георгиева под ръководството на д-р Ласка Ласкова.
Примери за различни варианти на превод на руски от български текстове. Двуезичен корпус. Дубитативи Примерите са анотирани с редактора Clark, като за целта е създаден собствен модел за целите на представяне на езикови явления от български и руски език. Повече информация вж. в рубриката Ресурси на сайта. Тук са примери на различни руски преводи от един и същ български текст. Лингвистична анотация от студентките Ива Атанасова и Преслава Георгиева под ръководството на д-р Ласка Ласкова.
Примери от превод на български от руска художествена литература. Двуезичен корпус. Пасивни конструкции Примерите са анотирани с редактора Clark, като за целта е създаден собствен модел за целите на представяне на езикови явления от български и руски език. Повече информация вж. в рубриката Ресурси на сайта. Тук са примери на превод от руска класическа и съвременна литература на български език. Лингвистична анотация от студентките Ива Атанасова и Преслава Георгиева под ръководството на д-р Ласка Ласкова.
Троянската притча. Частичен корпус Анотация на клитики
Влахо-български грамоти Анотация на клитики
Троянски дамаскин от XVII век Анотация на клитики
Мариинското евангелие в сравнение с други старобългарски евангелия Анотация на клитики