Umumjahon bog'liqliklar - Universal Dependencies

Umumjahon bog'liqliklar, tez-tez qisqartiriladi UD, yaratish uchun xalqaro kooperatsiya loyihasidir daraxt qirg'oqlari dunyo tillari. Ushbu daraxt qirg'oqlari ochiq va mavjud. Asosiy dasturlar avtomatlashtirilgan matnni qayta ishlash sohasida tabiiy tilni qayta ishlash (NLP) va tabiiy til sintaksisini va grammatikasini tadqiq qilish, ayniqsa ichida lingvistik tipologiya. Loyihaning asosiy maqsadi izohlashning lingvistik izchilligiga erishish, shu bilan birga kerak bo'lganda tilga xos kengaytmalarga ruxsat berishdir. Izohlash sxemasi uchta tegishli loyihada ildiz otgan: Stenfordga bog'liqliklar,[1]Google nutqning universal qismi teglari,[2]va Interters interlingua[3] morfosintaktik teglar uchun.UD izohlash sxemasi quyidagicha tasvirni ishlatadi qaramlik daraxtlari a-dan farqli o'laroq ibora tarkibi daraxtlari. Hozirgi vaqtda (2019 yil fevral) UD inventarizatsiyasida 70 dan ortiq tillarning 100 dan ortiq daraxtzorlari mavjud.

Qaramlik tuzilmalari

UD izohlash sxemasi jumlalarni bog'liqlik grammatikasining bog'liqligi nuqtai nazaridan sintaktik tahlil qiladi. Har bir bog'liqlik sintaktik funktsiya nuqtai nazaridan tavsiflanadi, bu qaramlik chekkasidagi yorliq yordamida ko'rsatiladi. Masalan:[4]

Birinchi UD rasm

Ushbu tahlil shuni ko'rsatadiki u, univa eslatma qaramog'idagi shaxslardir chap. Olmosh u nominal sub'ekt (nsubj), olmosh sifatida aniqlanadi uni bilvosita ob'ekt sifatida (iobj) va ot iborasi eslatma to'g'ridan-to'g'ri ob'ekt sifatida (obj) - bog'laydigan yana bir bog'liqlik mavjud a ga Eslatma, garchi u ko'rsatilmagan bo'lsa ham. Ikkinchi misol:

UD rasm 2

Ushbu tahlil aniqlaydi u mavzu sifatida (nsubj), bu kopula (politsiya) va uchun case marker (case) sifatida, bularning hammasi so'zning qaram so'zlari sifatida ko'rsatilgan uni, bu olmoshdir. Keyingi misolda tushuntiruvchi va egri narsa mavjud:

UD rasm 3

Ushbu tahlil aniqlaydi U yerda tushuntirish sifatida (tushuntiradi), ovqat nominal mavzu sifatida (nsubj), oshxona oblique ob'ekti sifatida (obl) va yilda case marker (case) sifatida - bog'laydigan qaramlik ham mavjud The ga oshxona, lekin u ko'rsatilmagan. Kopula ekanligini unutmang bu bu holda gapning ildizi sifatida joylashtirilgan, bu haqiqat yuqoridagi ikkinchi misolda kopula qanday tahlil qilinganiga zid bo'lib, u erda u ildizga qaram bo'lib joylashtirilgan.

Yuqorida keltirilgan UD izohlash misollari, albatta, UD loyihasi xususiyati va uning izohlash sxemasi haqida faqat taassurot qoldirishi mumkin. UD-ga e'tibor turli xil tillarda tarkibiy parallellikni osonlashtirish uchun o'zaro bog'liqlik tahlillarini ishlab chiqarishga qaratilgan. Shu maqsadda UD barcha tillar uchun universal POS yorlig'ini ishlatadi - garchi ma'lum bir til har bir tegdan foydalanishi shart emas. Bepul morfo-sintaktik xususiyatlar to'plami yordamida har bir so'zga aniqroq ma'lumot qo'shilishi mumkin. Bog'lanish havolalarining universal yorliqlari ikkilamchi munosabatlar bilan belgilanishi mumkin, ular yo'g'on ichakning orqasida ikkilamchi yorliq sifatida ko'rsatilgan, masalan. nsubj: o'tish, quyidagilarga amal qilish "universal: kengaytma" formati.

Funktsional so'zlar

Qarama-qarshilik grammatikasi doirasidagi UD izohlash sxemasi ziddiyatli. Qarama-qarshilikning asosiy suyagi funktsional so'zlarni tahlil qilish bilan bog'liq. UD funktsional so'zlarni tarkibidagi so'zlarga bo'ysundirishni tanlaydi,[5] qaramlik grammatikasi an'analarida aksariyat ishlarga zid bo'lgan amaliyot.[6] Ushbu tortishuvni qisqacha ko'rsatish uchun UD berilgan jumlaning quyidagi tarkibiy tahlilini keltirib chiqaradi:

To'rtinchi UD rasm, funktsional so'zlarning tahlilini aks ettiradi

Ushbu misol maqoladan olingan Bu yerga.[7] Hozirda yuqoridagi konventsiyadan farqli o'laroq, bog'liqliklarni ko'rsatish uchun muqobil konventsiya qo'llanilmoqda. Sintaktik funktsiyalar mavjud nuqta uchun muhim bo'lmaganligi sababli, ular ushbu tarkibiy tahlildan chetlatilgan. Ushbu UD tahlili yordamchi fe'lga bo'ysunish usuli muhim iroda mazmun fe'liga demoq, predlog ga olmoshga siz, subordinator bu mazmun fe'liga yoqadiva zarracha ga mazmun fe'liga suzish.

Ushbu jumlaning an'anaviy semantikaga qaraganda ko'proq sintaktik mulohazalar bilan bog'liq bo'lgan an'anaviy bog'liqlik grammatik tahlili quyidagicha:[8]

UD rasm 5

Ushbu an'anaviy tahlil tarkibidagi fe'lga bo'ysunadi demoq yordamchi fe'lga iroda, olmosh siz yuklamaga ga, tarkibli fe'l yoqadi subordinatorga buva tarkibidagi fe'l suzish kesimga ga.

Izohlar

  1. ^ "Stenford qaramligi". nlp.stanford.edu. Stenford tabiiy tillarni qayta ishlash guruhi. Olingan 8 may 2020.
  2. ^ Petrov, Slav (2011 yil 11-aprel). "Nutqning universal qismi". arXiv:1104.2086 [cs.CL ].
  3. ^ "Interset". cuni.cz. Rasmiy va amaliy tilshunoslik instituti (Chexiya). Olingan 8 may 2020.
  4. ^ Ushbu bo'limda keltirilgan uchta misol tahlil UD veb-sahifasidan olingan Bu yerga, 3, 21 va 23 misollar.
  5. ^ Tanlovni Nivre (2015) boshqargan.
  6. ^ UD atrofidagi tortishuvlar va umuman bog'liqlik grammatikasidagi funktsional so'zlarning holati uzoq muhokama qilinadi Osborne va Gerdes (2019).
  7. ^ Osborne & Gerdes (2019) maqolasida tuzilish (1b).
  8. ^ Ushbu tuzilma (1c) Osborne & Gerdes (2019) maqolasida.

Adabiyotlar

  • de Marneffe, Mari-Ketrin, Bill Makkartni va Kristofer D. Manning. 2006. So'z birikmalarining tarkibiy qismlaridan tipik bog'liqlik zarralarini hosil qilish. Til resurslari va baholash konferentsiyasi materiallarida (LREC) 2006, 449–454. Genuya.
  • de Marneffe, Mari-Ketrin va Kristofer D. Manning. 2008 yil. Stenford yozilgan qaramlik vakili. O'zaro faoliyat doiralar va domenlararo tahlilni baholash bo'yicha COLING seminarining materiallari, 92-97. Sofiya. DOI: https://doi.org/10.3115/1608858.1608859
  • de Marneffe, Mari-Ketrin, Timoti Dozat, Natalya Silvaire, Katrin Xaverinen, Filip Ginter, Yoakim Nivre, Kristofer D. Manning. 2014. Universal Stanford Dependencies: Cross-lingvistik tipologiya. Til resurslari va baholash bo'yicha xalqaro konferentsiyada (LREC) 2014 yil, 4585–4592.
  • Nivre, Yoakim. 2015. Tabiiy tilni qayta ishlash uchun universal grammatika tomon. CICLING 2015: Matnni oqilona qayta ishlash va hisoblash lingvistikasi bo'yicha 16-xalqaro konferentsiya, 3-16. DOI: https://doi.org/10.1007/978-3-319-18111-0_1
  • Osborne, Timoti va Kim Gerdes. 2019. bog'liqlik grammatikasidagi funktsional so'zlarning holati: Umumjahon bog'liqliklarni tanqid qilish (UD). Glossa: Umumiy tilshunoslik jurnali 4 (1), 17. DOI: http://doi.org/10.5334/gjgl.537.
  • Petrov, Slav, Dipon Das va Rayan Makdonald. 2012. Nutqning universal qismi yorlig'i. Til resurslari va baholash bo'yicha xalqaro konferentsiya (LREC) 2012, 2089–2096. Istanbul.
  • Zeman, Doniyor. 2008. Tagset drayverlaridan foydalangan holda qayta ishlatilishi mumkin bo'lgan teglar konvertatsiyasi. Til resurslari va baholash bo'yicha xalqaro konferentsiyada (LREC) 2008 yil, 213-218. Marakeş.