Transkripsiya

Shevalar korpusida transkripsiyaning berilishi

Kompyuter lingvistika tarkibiy qismi sifatida dialektal korpuslarni tuzish muammolari yechimini topishda dunyo tajribasiga etibor bersak, Xitoy Mandarin sheva korpusi, Britancha ingliz tilining Xelsinki dialektal korpusi kabilarni tuzishda koproq fonetik, grammatik tomonlar diqqat markazida turgan bolsa, Gurjiston dialektlari korpusida urgu koproq leksik, fonetik, grammatik qurilishlar tilni kodlash fonida beriladi. Rus lingvistikasida korpus tuzishdagi Tomsk dialektologik maktabida amalga oshirilgan ishlar tahsinga loyiq. Dialektik korpus yaratish ishlari Y.A.Yurin tashabbusi ekspeditsiya qaydnomalarni skaner qilish bilan boshlagan va mahalliy aholining ogzaki sozlashuv aks etgan sheva matnlari metarazmetkalari ishlab chiqilgan. Ammo tilning boshqa korpuslarini yaratishga qaraganda shevalar korpusini tuzish uzoq va mashaqqatli mehnat talab qilgani sababli ishni shu yerda toxtatishga majbur bolingan. 1 457 579 ta soz va sozshakllardan iborat Gurjiston korpus matnlari bazasi tarkibidagi dialektologik korpusi esa 3 tipga bolinadi:

  1. Nashr etilgan matnlar korpusi (bu bosqichda matnlar korpusi joylashtirilish bilan shevaga oid sozlar alohidalanadi).
  2. Qolyozma shaklidagi jamlanmalar (arxivda saqlanayotgan malumotlar).
  3. Traskriptlar – (shifrlangan-belgilangan - video yoki audio shaklidagi manbalar).

Matnlar fondini tashkil qilishdan maqsad:

-nashr etilgan matnlarning elektron shaklini yaratish;

-qolyozma shaklidagi arxiv malumotlarni tartibga solish;

-mamlakatning ichki qismi va uning chegara hududlariga ilmiy safarlar uyushtirish, malumotlar va yangi video-audio manbalar yigish hamda ularni shifrlash .

Tilshunoslikda lotin alifbosiga asoslanib tuzilgan transkripsiya xalqaro fonetik alfavit hisoblanadi. Boshqird ogzaki korpusi ham keng istemolda bolgan lotin grafikasiga asoslanilgan .Bundan kelib chiqadiki, ozbek shevalari korpusini yaratishda badiiy asarlarda aks etgan sheva oid birliklar transkriptsiz, qolyozma va video-audio shakldagi manbalar transkpipsiya bilan berilishi maqsadga muvofiqdir. Barcha dialektik manbalarni traskript shaklda berilishi ishning ancha orqaga surilishi va korpusga dastlabki qadamlar qoyilishida qiyinchiliklar tugilishiga sabab bolib qoladi.

Transkripsiya (lotincha- transkriptio- qayta yozish) xalq foydalanayotgan alifboga ozgartirishlar kiritish mumkin bolgan, til tovushlarini aniq ifodalolchi,  fonemalarning nutq oqimidagi turli ottenkalarini hudidiy sheva va lahjalarnining fonetik xususiyatlarini (tovushlarning qisqarishi-cho’zilishi, asos va qo’shimchalar garmonal moslashuvi)  bko’rsatuvchi xizmat yozuvidir, shu sababli transkripsion belgilarning alifbo tovushlardan koproq bolishi tabiiy holatdir. Transkripsiyaning o’zaro 2 turi farqlanadi:

  1. Fonetik transkripsiya- bu tur fonetik qoidalar asosiga quriladi, har bir fonema uchun maxsus grafik belgilar ishlatiladi: kir/qȉr, mänä/qānȉ;
  2. Fonematik transkripsiya-bu tur fonologik hodisalar asosiga quriladi, fonemalar ifodasi asosiy planga chiqadi: kir/qir, mana/qani[1].

 1993 yil 2-sentabrda “Lotin grafikasiga asoslangan ozbek alifbosini qabul qilish togrisida” qabul qilingan. Qarordan kelib chiqib dialektal korpus tuzishda lotin grafikasiga asoslanilsa, fonematik  transkripsiyadan foydalanilsa yoxud  fonologik transkripsiyadan foydalanish jarayonida yagona yunikodli  transkripsion belgilarning qo’llanilishi maqsadga muvofiqdir. Shevalar korpusining transkripsiyasini ishlab chiqishda f.f.dok. Samixon Ashurboyev[2] tomonida ishlab chiqilgan transkripsiyaga asoslanildi.

1.Jadval. Transkripsiya.

t/r

Transletera-tsiya

Transkript

Yunikod

Izoh

Misol

 

Kirill

Yozuv

Lotin yozuv

Lotin yozuv asos

1.      

А а

A a

A a

0041/0061

Orqa qator, quyi keng, lablanmagan unlini ifodalaydi

Тошкент

Toshkent

Taškan

2.      

А а

A a

Ä ä

00C4/00E4

Old qator, quyi keng, lablanmagan unlini ifodalaydi

арна

аrna

ärnä

3.      

А а

A a

Ā ā

0100/0101

Orqa qator, quyi keng, qisman lablangan unlini ifodalaydi

дарахт

daraxt

Āγāč

4.      

Э э

E e

E e

0045/0065

Old qator, o’rta keng, lablanmagan unlini ifodalaydi

Эгин

Egin

Iyin

5.      

И и

I i

I i

0049/0069

Old qator, yuqori-tor, lablanmagan unlini, singarmonizmli shevalarda qisqa, shahar shevalarda oraliq tovushni ifodalaydi

кичик

кichik

kičči

6.      

И и

I i

Ȉ ȉ

0208/0209

Orqa qator, yuqori-tor, lablanmagan unlini, singarmo-nizmli shevalarda qisqa, shahar shevalarda oraliq tovushni ifodalaydi

қилиқ

qiliq

qȉlȉγ 

7.      

У у

U u

U u

0055/0075

Orqa qator, yuqori-tor, lablangan unlini ifodalaydi

Худо

Xudo

Хudaj

8.      

У у

U u

Ű ű

0170/0171

Old qator, yuqori-tor, lablangan unlini ifodalaydi

Урчуқ

urchuq

u rčűγ

9.      

Ў ў

O’ o’

O o

004F/006F

Orqa qator, o’rta keng, lablangan unli

Тўпиқ

тo’piq

тo’pȉγ

10.   

Ў ў

O’ o’

Öö

00D6/00F6

Old qator, o’rta keng, lablangan unli

Ёстиқ

yostiq

lölabolȉš

11.   

 

 

ϵ

 

 

 

03F5

Old qator, o’rta keng, lablanmagan, Boysun shevasida uchramaydi, Namangan shahar shevasida mavjud

Икки

ikki

ϵkki 

12.   

Б б

B b

B b

0042/0062

Lab-lab, portlovchi, jarangli, sof undosh

бу ёқ

bu yoq

bā:γ

13.   

Д д

D d

D

0044/0064

Til oldi, portlovchi, jarangli, sof undosh

Докарўмол

dokaro’mol

däkarömal

14.   

Ф ф

F f

F f

0046/0066

Lab-tish, sirg’aluvchi, jarangsiz, sof undoshi Boysun shevasida f<p ga  ko’chishi kuzatiladi.

пўта (белбоғ)

po’ta

pötä

15.   

Г г

G g

G g

0047/0067

Til orqa, portlovchi, jarangli, sof undosh

галдир (довдир)

galdir

gäldȉr

16.   

Ҳ ҳ

H h

H h

0048/0068

Bo’giz, sirg’aluvchi, jarangsiz,sof undosh

ҳаворламоқ (текисламоқ)

havorlavoq

havarlämāq

17.   

К к

K k

K k

004B/006B

Til orqa, portlovchi, jarangsiz, sof undosh

кўмакай (таги билан)

ko’makay

kömakäj

18.   

Л л

L l

L l

004C/006C

Til oldi, sirg’aluvchi, jarangli, sof undosh

силкинмоқ

silkinmoq

lo’xčȉmaq

19.   

М м

M m

M m

004D/006D

Lablangan, portlovchi, jarangli, sof undosh

Ўмган

o’mgan

ömgäk

20.   

Н н

N n

N n

004E/006E

Til oldi, portlovchi, jarangli, sof undosh

нор

nor

nār

21.   

П п

P p

P p

0050/0070

Lab-lab, portlovchi, jarangsiz, sof undosh

Шофёр

shofyor

šopȉr

22.   

Қ қ

Q q

Q q

0051/0071

Chuqur til orqa, portlovchi, jarangsiz, sof undosh

тўсатдан

to’satdan

tujqus

23.   

Р р

R r

R r

0052/0072

Til oldi, sirg’aluvchi, jarangli, ovozdor, sof undosh

рав (тўсин)

rav

rav

24.   

С с

S s

S s

0053/0073

Til oldi, sirg’aluvchi, jarangsiz, sof undosh

сиғаламоқ (мўраламоқ)

sig’alamoq

sȉγālamaq

25.   

Т т

T t

T t

0054/0074

Til oldi, portlovchi, jarangsiz, sof undosh

Тайту (гаранг)

taytu

täjtu

26.   

В в

V v

V v

0056/0076

Lab-tish, sirg’aluvchi, jarangli, ovozdor, sof undosh

васса

vassa

vässä

27.   

Х х

X x

X x

0058/0078

Chuqur til orqa, sirg’aluvchi, jarangsiz, sof undosh

хасмол (тирноқ яраси)

xasmol

xasmal

 

28.   

З з

Z z

Z z

005A/007A

Til oldi, sirg’aluvchi, jarangsiz, sof undosh

зовур

zovur

zäbir

29.   

Ғ ғ

G’ g’

 γ γ

03B3/03B3

Chuqur til orqa, sirg’aluvchi, jarangli, sof undosh

daraxt

yog’och

jāγāč

30.   

Ш ш

Sh sh

Š š

0160/0161

 Til oldi, sirg’aluvchi, jarangsiz, sof undosh

шўх

sho’x

šäläjim

31.   

Ч ч

Ch ch

Č č

010C/010D

Til oldi, qorishiq, jarangsiz

чақимчи

chaqimchi

čüγülči

32.   

Й й

Y y

J j

004A/006A

 Til oldi, sirg’aluvchi, jarangli, sof undosh

Отин ойи

otin oyi

ātȉnājȉ

33.   

Нг нг

Ng ng

Ŋŋ

014A/014B

Til orqa, portlovchi, jarangli, sof undosh

манглай

manglay

mäŋläj

34.   

Ж ж

J j

Žž

017D/017E

 Til oldi, portlovchi, jarangli, sof undosh

югурдак

yugurdak

žökkärči

 Professor Gozi Olim Boysun hudidida yashovchi aholining shevasi haqida fikr yuritar ekan, Qarshi, Kitob, Kattaqorgon, Shahrisabz Guzor kabi shahar va qishloqlarda istiqomat qiluvchi etnik xalqlar orasida sanab otib, ularning tojik, arab, afgon va qarlug qabilasining bugungi jonli shevada sozlashini aytadi. Ammo aynan qanday belgilar asosida qarluq shevasiga daxldor ekanligini etibor qaratmaydi. Prof. S.Rahimov Surxondaryo aholisining kopchilik qismi qipchoq lahjasi vakillari ekanligi haqidagi fikrning togriligini korsatib otishini takidlaydi. Biz esa Boysun hududining Xojabulgon, Munchoq, Xomkon, Qoshshatut, ,Ortaboz, Jarqishloq, Pudina, Ajrim, Pitov, Fotimabuloq, Kofirin, Besherkak, Todi, Pulhokim, Padang, Inkabod, Omonxona, Boshrabot (ilgari Rabot deyilgan, hozirda shahar tipidagi qishloq) kabi shahardan uzoqroq masofadagi qishloq aholisining “j”lovchi sheva vakillari ekanligini aytib otishimiz joiz. Shundan kelib on [ ͮ ön] ͮ - 036E-yunikodli shaklda berishni lozim topdik.

XULOSA

Yuqoridagi fikrlardan xulosamiz shuki:

- transkriptlar ozbek dialekti korpusining oziga xos alohidaligini taminlovchi vositadir;

- ozbek dialekti korpusida transkripsiya orqali qidiruvning yagona tizimini ishlab chiqish, yani kompyuter tanishi mumkin bolgan lotin belgilarining shakl jihatdan oxshash bolgan belgilar bilan emas, qabul qilingan yunikod orqali bazani shakllantirish va qidiruv sistemasini joriy etish;

- ozbek dialekti korpusini yaratishda badiiy asarlarda berilgan sheva elementlari mavjud bolgan matnlar transliteratsiya holida berilishi lozim;

 - ozbek dialekti korpusida audio va video fayllarning transkripsiya orqali qidiruvning yagona tizimini ishlab chiqish.

-transkripsiya ozbek milliy shevalar korpusinining shakllanishi va rivojlantirishininf ajralmas qismidir .

 

 

[1] Jamolxonov N. Hozirgi o’zbek adabiy tili. –T: 2005. 48-bet.

[2] S.Ashirboyev. O’zbek dialektologiyasi. 2016. 21-bet.