Transkripsiya
Shevalar korpusida transkripsiyaning berilishi
Kompyuter lingvistika tarkibiy qismi sifatida dialektal korpuslarni tuzish muammolari yechimini topishda dunyo tajribasiga etibor bersak, Xitoy Mandarin sheva korpusi, Britancha ingliz tilining Xelsinki dialektal korpusi kabilarni tuzishda koproq fonetik, grammatik tomonlar diqqat markazida turgan bolsa, Gurjiston dialektlari korpusida urgu koproq leksik, fonetik, grammatik qurilishlar tilni kodlash fonida beriladi. Rus lingvistikasida korpus tuzishdagi Tomsk dialektologik maktabida amalga oshirilgan ishlar tahsinga loyiq. Dialektik korpus yaratish ishlari Y.A.Yurin tashabbusi ekspeditsiya qaydnomalarni skaner qilish bilan boshlagan va mahalliy aholining ogzaki sozlashuv aks etgan sheva matnlari metarazmetkalari ishlab chiqilgan. Ammo tilning boshqa korpuslarini yaratishga qaraganda shevalar korpusini tuzish uzoq va mashaqqatli mehnat talab qilgani sababli ishni shu yerda toxtatishga majbur bolingan. 1 457 579 ta soz va sozshakllardan iborat Gurjiston korpus matnlari bazasi tarkibidagi dialektologik korpusi esa 3 tipga bolinadi:
- Nashr etilgan matnlar korpusi (bu bosqichda matnlar korpusi joylashtirilish bilan shevaga oid sozlar alohidalanadi).
- Qolyozma shaklidagi jamlanmalar (arxivda saqlanayotgan malumotlar).
- Traskriptlar – (shifrlangan-belgilangan - video yoki audio shaklidagi manbalar).
Matnlar fondini tashkil qilishdan maqsad:
-nashr etilgan matnlarning elektron shaklini yaratish;
-qolyozma shaklidagi arxiv malumotlarni tartibga solish;
-mamlakatning ichki qismi va uning chegara hududlariga ilmiy safarlar uyushtirish, malumotlar va yangi video-audio manbalar yigish hamda ularni shifrlash .
Tilshunoslikda lotin alifbosiga asoslanib tuzilgan transkripsiya xalqaro fonetik alfavit hisoblanadi. Boshqird ogzaki korpusi ham keng istemolda bolgan lotin grafikasiga asoslanilgan .Bundan kelib chiqadiki, ozbek shevalari korpusini yaratishda badiiy asarlarda aks etgan sheva oid birliklar transkriptsiz, qolyozma va video-audio shakldagi manbalar transkpipsiya bilan berilishi maqsadga muvofiqdir. Barcha dialektik manbalarni traskript shaklda berilishi ishning ancha orqaga surilishi va korpusga dastlabki qadamlar qoyilishida qiyinchiliklar tugilishiga sabab bolib qoladi.
Transkripsiya (lotincha- transkriptio- qayta yozish) xalq foydalanayotgan alifboga ozgartirishlar kiritish mumkin bolgan, til tovushlarini aniq ifodalolchi, fonemalarning nutq oqimidagi turli ottenkalarini hudidiy sheva va lahjalarnining fonetik xususiyatlarini (tovushlarning qisqarishi-cho’zilishi, asos va qo’shimchalar garmonal moslashuvi) bko’rsatuvchi xizmat yozuvidir, shu sababli transkripsion belgilarning alifbo tovushlardan koproq bolishi tabiiy holatdir. Transkripsiyaning o’zaro 2 turi farqlanadi:
- Fonetik transkripsiya- bu tur fonetik qoidalar asosiga quriladi, har bir fonema uchun maxsus grafik belgilar ishlatiladi: kir/qȉr, mänä/qānȉ;
- Fonematik transkripsiya-bu tur fonologik hodisalar asosiga quriladi, fonemalar ifodasi asosiy planga chiqadi: kir/qir, mana/qani[1].
1993 yil 2-sentabrda “Lotin grafikasiga asoslangan ozbek alifbosini qabul qilish togrisida” qabul qilingan. Qarordan kelib chiqib dialektal korpus tuzishda lotin grafikasiga asoslanilsa, fonematik transkripsiyadan foydalanilsa yoxud fonologik transkripsiyadan foydalanish jarayonida yagona yunikodli transkripsion belgilarning qo’llanilishi maqsadga muvofiqdir. Shevalar korpusining transkripsiyasini ishlab chiqishda f.f.dok. Samixon Ashurboyev[2] tomonida ishlab chiqilgan transkripsiyaga asoslanildi.
1.Jadval. Transkripsiya.
t/r |
Transletera-tsiya |
Transkript |
Yunikod |
Izoh |
Misol |
|
---|---|---|---|---|---|---|
|
Kirill Yozuv |
Lotin yozuv |
Lotin yozuv asos |
|||
1. |
А а |
A a |
A a |
0041/0061 |
Orqa qator, quyi keng, lablanmagan unlini ifodalaydi |
Тошкент Toshkent Taškan |
2. |
А а |
A a |
Ä ä |
00C4/00E4 |
Old qator, quyi keng, lablanmagan unlini ifodalaydi |
арна аrna ärnä |
3. |
А а |
A a |
Ā ā |
0100/0101 |
Orqa qator, quyi keng, qisman lablangan unlini ifodalaydi |
дарахт daraxt Āγāč |
4. |
Э э |
E e |
E e |
0045/0065 |
Old qator, o’rta keng, lablanmagan unlini ifodalaydi |
Эгин Egin Iyin |
5. |
И и |
I i |
I i |
0049/0069 |
Old qator, yuqori-tor, lablanmagan unlini, singarmonizmli shevalarda qisqa, shahar shevalarda oraliq tovushni ifodalaydi |
кичик кichik kičči |
6. |
И и |
I i |
Ȉ ȉ |
0208/0209 |
Orqa qator, yuqori-tor, lablanmagan unlini, singarmo-nizmli shevalarda qisqa, shahar shevalarda oraliq tovushni ifodalaydi |
қилиқ qiliq qȉlȉγ |
7. |
У у |
U u |
U u |
0055/0075 |
Orqa qator, yuqori-tor, lablangan unlini ifodalaydi |
Худо Xudo Хudaj |
8. |
У у |
U u |
Ű ű |
0170/0171 |
Old qator, yuqori-tor, lablangan unlini ifodalaydi |
Урчуқ urchuq u rčűγ |
9. |
Ў ў |
O’ o’ |
O o |
004F/006F |
Orqa qator, o’rta keng, lablangan unli |
Тўпиқ тo’piq тo’pȉγ |
10. |
Ў ў |
O’ o’ |
Öö |
00D6/00F6 |
Old qator, o’rta keng, lablangan unli |
Ёстиқ yostiq lölabolȉš |
11. |
|
|
ϵ
|
03F5 |
Old qator, o’rta keng, lablanmagan, Boysun shevasida uchramaydi, Namangan shahar shevasida mavjud |
Икки ikki ϵkki |
12. |
Б б |
B b |
B b |
0042/0062 |
Lab-lab, portlovchi, jarangli, sof undosh |
бу ёқ bu yoq bā:γ |
13. |
Д д |
D d |
D |
0044/0064 |
Til oldi, portlovchi, jarangli, sof undosh |
Докарўмол dokaro’mol däkarömal |
14. |
Ф ф |
F f |
F f |
0046/0066 |
Lab-tish, sirg’aluvchi, jarangsiz, sof undoshi Boysun shevasida f<p ga ko’chishi kuzatiladi. |
пўта (белбоғ) po’ta pötä |
15. |
Г г |
G g |
G g |
0047/0067 |
Til orqa, portlovchi, jarangli, sof undosh |
галдир (довдир) galdir gäldȉr |
16. |
Ҳ ҳ |
H h |
H h |
0048/0068 |
Bo’giz, sirg’aluvchi, jarangsiz,sof undosh |
ҳаворламоқ (текисламоқ) havorlavoq havarlämāq |
17. |
К к |
K k |
K k |
004B/006B |
Til orqa, portlovchi, jarangsiz, sof undosh |
кўмакай (таги билан) ko’makay kömakäj |
18. |
Л л |
L l |
L l |
004C/006C |
Til oldi, sirg’aluvchi, jarangli, sof undosh |
силкинмоқ silkinmoq lo’xčȉmaq |
19. |
М м |
M m |
M m |
004D/006D |
Lablangan, portlovchi, jarangli, sof undosh |
Ўмган o’mgan ömgäk |
20. |
Н н |
N n |
N n |
004E/006E |
Til oldi, portlovchi, jarangli, sof undosh |
нор nor nār |
21. |
П п |
P p |
P p |
0050/0070 |
Lab-lab, portlovchi, jarangsiz, sof undosh |
Шофёр shofyor šopȉr |
22. |
Қ қ |
Q q |
Q q |
0051/0071 |
Chuqur til orqa, portlovchi, jarangsiz, sof undosh |
тўсатдан to’satdan tujqus |
23. |
Р р |
R r |
R r |
0052/0072 |
Til oldi, sirg’aluvchi, jarangli, ovozdor, sof undosh |
рав (тўсин) rav rav |
24. |
С с |
S s |
S s |
0053/0073 |
Til oldi, sirg’aluvchi, jarangsiz, sof undosh |
сиғаламоқ (мўраламоқ) sig’alamoq sȉγālamaq |
25. |
Т т |
T t |
T t |
0054/0074 |
Til oldi, portlovchi, jarangsiz, sof undosh |
Тайту (гаранг) taytu täjtu |
26. |
В в |
V v |
V v |
0056/0076 |
Lab-tish, sirg’aluvchi, jarangli, ovozdor, sof undosh |
васса vassa vässä |
27. |
Х х |
X x |
X x |
0058/0078 |
Chuqur til orqa, sirg’aluvchi, jarangsiz, sof undosh |
хасмол (тирноқ яраси) xasmol xasmal
|
28. |
З з |
Z z |
Z z |
005A/007A |
Til oldi, sirg’aluvchi, jarangsiz, sof undosh |
зовур zovur zäbir |
29. |
Ғ ғ |
G’ g’ |
γ γ |
03B3/03B3 |
Chuqur til orqa, sirg’aluvchi, jarangli, sof undosh |
daraxt yog’och jāγāč |
30. |
Ш ш |
Sh sh |
Š š |
0160/0161 |
Til oldi, sirg’aluvchi, jarangsiz, sof undosh |
шўх sho’x šäläjim |
31. |
Ч ч |
Ch ch |
Č č |
010C/010D |
Til oldi, qorishiq, jarangsiz |
чақимчи chaqimchi čüγülči |
32. |
Й й |
Y y |
J j |
004A/006A |
Til oldi, sirg’aluvchi, jarangli, sof undosh |
Отин ойи otin oyi ātȉnājȉ |
33. |
Нг нг |
Ng ng |
Ŋŋ |
014A/014B |
Til orqa, portlovchi, jarangli, sof undosh |
манглай manglay mäŋläj |
34. |
Ж ж |
J j |
Žž |
017D/017E |
Til oldi, portlovchi, jarangli, sof undosh |
югурдак yugurdak žökkärči |
Professor Gozi Olim Boysun hudidida yashovchi aholining shevasi haqida fikr yuritar ekan, Qarshi, Kitob, Kattaqorgon, Shahrisabz Guzor kabi shahar va qishloqlarda istiqomat qiluvchi etnik xalqlar orasida sanab otib, ularning tojik, arab, afgon va qarlug qabilasining bugungi jonli shevada sozlashini aytadi. Ammo aynan qanday belgilar asosida qarluq shevasiga daxldor ekanligini etibor qaratmaydi. Prof. S.Rahimov Surxondaryo aholisining kopchilik qismi qipchoq lahjasi vakillari ekanligi haqidagi fikrning togriligini korsatib otishini takidlaydi. Biz esa Boysun hududining Xojabulgon, Munchoq, Xomkon, Qoshshatut, ,Ortaboz, Jarqishloq, Pudina, Ajrim, Pitov, Fotimabuloq, Kofirin, Besherkak, Todi, Pulhokim, Padang, Inkabod, Omonxona, Boshrabot (ilgari Rabot deyilgan, hozirda shahar tipidagi qishloq) kabi shahardan uzoqroq masofadagi qishloq aholisining “j”lovchi sheva vakillari ekanligini aytib otishimiz joiz. Shundan kelib on [ ͮ ön] ͮ - 036E-yunikodli shaklda berishni lozim topdik.
XULOSA
Yuqoridagi fikrlardan xulosamiz shuki:
- transkriptlar ozbek dialekti korpusining oziga xos alohidaligini taminlovchi vositadir;
- ozbek dialekti korpusida transkripsiya orqali qidiruvning yagona tizimini ishlab chiqish, yani kompyuter tanishi mumkin bolgan lotin belgilarining shakl jihatdan oxshash bolgan belgilar bilan emas, qabul qilingan yunikod orqali bazani shakllantirish va qidiruv sistemasini joriy etish;
- ozbek dialekti korpusini yaratishda badiiy asarlarda berilgan sheva elementlari mavjud bolgan matnlar transliteratsiya holida berilishi lozim;
- ozbek dialekti korpusida audio va video fayllarning transkripsiya orqali qidiruvning yagona tizimini ishlab chiqish.
-transkripsiya ozbek milliy shevalar korpusinining shakllanishi va rivojlantirishininf ajralmas qismidir .
[1] Jamolxonov N. Hozirgi o’zbek adabiy tili. –T: 2005. 48-bet.
[2] S.Ashirboyev. O’zbek dialektologiyasi. 2016. 21-bet.