DELPH-IN - DELPH-IN

DELPH-IN
Akademiklar
Intizom:
Rasmiylik:
Tabiiy tilni qayta ishlash
HPSG, XONIM
DELPH-IN sammitlari
Tantanali ochilish:Lissabon (2005)
Oxirgi:DiderotTop (2018)
Kelgusi:TBA

Deep Linguistik Pbilan rocessing HPSJ - INtakroriy (DELPH-IN) dunyo miqyosidagi hisoblash lingvistlari rivojlanadigan hamkorlikdir tabiiy tilni qayta ishlash uchun vositalar chuqur lingvistik ishlov berish inson tilining.[1] DELPH-IN ning maqsadi matnlar va so'zlar ma'nosini hisoblash uchun lingvistik va statistik ishlov berish usullarini birlashtirishdir.

DELPH-IN tomonidan ishlab chiqilgan vositalar chuqur lingvistik tahlil qilish uchun ikkita lingvistik formalizmni qabul qiladi, ya'ni. bosh bilan boshqariladigan iboralar tuzilishi grammatikasi (HPSG) va minimal rekursiya semantikasi (XONIM).[2] DELPH-IN hamkorlikidagi barcha vositalar umumiy foydalanish uchun ishlab chiqilgan ochiq manbali litsenziyalash.

2005 yildan beri DELPH-IN har yili sammit o'tkazadi. Bu erkin tuzilgan konferentsiya bu erda odamlar bir-birlari qilayotgan ishlari to'g'risida bir-birlarini yangilaydilar, hozirgi ish haqida fikr-mulohazalarni izlaydilar va vaqti-vaqti bilan standartlar va eng yaxshi amaliyot bo'yicha kelishuvlarni imzolaydilar.

DELPH-IN texnologiyalari va manbalari

DELPH-IN hamkorligi asta-sekin hisoblash vositalarini yaratmoqda chuqur lingvistik tahlil, kabi:

DELPH-IN hamkorligi chuqur lingvistik ishlov berish vositalaridan tashqari, hisoblash resurslarini etkazib beradi Tabiiy tilni qayta ishlash masalan, HPSG hisoblash grammatikalari va til prototiplari, masalan:

  • DELPH-IN grammatikalari: tegishli tillarga xos bo'lgan chuqur tilshunoslik tahlilini o'tkazish uchun qo'lda tayyorlangan hisoblash HPSG grammatikasi katalogi. [6]
  • LinGO Grammatika matritsasi: LKB bilan mos keladigan keng qamrovli aniq grammatikalarni tezda prototiplash uchun ochiq manbali boshlang'ich to'plam. Unda hisoblash grammatikalari HPSG grammatikalari uchun meros qilib oladigan umumiy til hodisalari kutubxonasi mavjud.[7]
  • CLIMB kutubxonalari (Matritsa asoslari bilan amalga oshiriladigan qiyosiy kutubxonalar): Grammatika matritsasi asosida qurilgan kengaytirilgan til kutubxonasi. CLIMB kutubxonasining maqsadi bir xil hodisani turli tillarda muqobil tahlil qilish, ularning uzoq muddatli grammatikani rivojlantirishga ta'sirini tekshirish.[8]

DELPH-IN manbalarining yana bir qatori ma'lumotlar ishlatilishidan farq qilmaydi sayoz lingvistik ishlov berish, kabi Text_corpus va daraxt qirg'oqlari:

  • MRS Test Suite: ba'zi birlarini ushlash uchun mo'ljallangan qisqa, ammo vakili jumlalar to'plami minimal rekursiya semantikasi hodisalar. Sinov to'plamlari bolgar, ingliz, frantsuz, nemis, yunon, yapon, mandarin, norveg, portugal, rus va ispan tillarida mavjud.[9]
  • Wikiwoods: WikiWoods - bu ajralgan korpus inglizcha Vikipediya uchun boy sintakto-semantik izohlarni taqdim etadi.[10]
  • DeepBank1989 yildagi Wall Street Journal matnining bir million so'zini (Penn Treebank loyihasida izohlangan bir xil jumla to'plamini) ingliz Resurs Grammatikasi bilan izohlash bo'yicha doimiy loyiha, to'liq qamrab olish uchun PCFG-ning taxminiy yaqinlashuvi.[11][12]
  • Sobor va bozor: Erik Raymond tomonidan ochiq manbaga oid dastlabki insholarning to'plami, ko'plab tillarga tarjimalari bilan. Turli grammatikalar bo'yicha tahlillarni taqqoslashimiz uchun ko'p tilli umumiy test to'plami sifatida taklif qilindi.[13][14]

DELPH-IN hamkorlikning ochiq manbali madaniyati Tabiiy tilni qayta ishlash bir qator bilan birlashma chuqur lingvistik ishlov berish vositalar va manbalar. Biroq, DELPH-IN vositalaridan foydalanish DELPH-IN ekologiyasi uchun yangi bo'lgan foydalanuvchilar va dastur ishlab chiquvchilarida muammo bo'lib kelgan.[iqtibos kerak ] DELPH-IN ishlab chiquvchilari ushbu qulaylik masalalarini bilishadi va DELPH-IN texnologiyalarining hujjatlari va o'quv qo'llanmalarini takomillashtirishga urinishlar mavjud.[15]

Shuningdek qarang

Adabiyotlar

  1. ^ DELPH-IN: Ochiq manbali chuqur ishlov berish
  2. ^ Enn Kopestak, Den Flikinger, Karl Pollard va Ivan A. Sag. 2005 yil. Minimal rekursiya semantikasi: kirish. Til va hisoblash bo'yicha tadqiqotlar to'plamida.
  3. ^ PET Parser veb-sayti
  4. ^ ACE tahlilchisi / generatorning bosh sahifasi
  5. ^ Stefan Oepen, Erik Velldal, Yan Tore Lonning, Pol Meurer, Viktoriya Rozen va Dan Flikinger. 2007 yil.Gibrid sifatli yo'naltirilgan mashina tarjimasi tomon. MTda tilshunoslik va ehtimolliklar to'g'risida. Mashinaviy tarjimada nazariy va uslubiy masalalar bo'yicha X Xalqaro konferentsiya materiallarida, 144-153 betlar. Skövde, Shvetsiya.
  6. ^ DELPH-IN katalogi
  7. ^ Fokkens, Antske, Emili M. Bender va Varvara Gracheva. 2012 yil. LinGO Grammatika Matritsasini sozlash bo'yicha tizim hujjatlari. Onlayn resurs.
  8. ^ Fokkens, A., Avgustinova, T. va Zhang, 2012 yil. Climb grammatikalari: metagramma muhandisligi yordamida uchta loyiha. Til resurslari va baholash bo'yicha sakkizta xalqaro konferentsiya (LREC'12) materiallari, Istanbul, Turkiya.
  9. ^ MRS Test Suite sahifasi
  10. ^ Dan Flikinger, Stefan Oepen va Jisl Ytrestol. 2010 yil. WikiWoods: Inglizcha Vikipediya uchun sintakto-semantik izoh. LREC-2010 ishlarida, 1665–1671 betlar.
  11. ^ Dan Flikinger, Valiya Kordoni va Yi Chjan. 2012 yil. DeepBank: Wall Street Journal jurnalining dinamik ravishda izohlangan daraxt banki. TLT-11 protsessida, Lissabon, Portugaliya.
  12. ^ DeepBank bosh sahifasi
  13. ^ DELPH-IN CatB sahifasi
  14. ^ Rasmiy sobor va Bazaar veb-sahifasi
  15. ^ DELPH-IN 2013 sammiti: foydalanish uchun maxsus qiziqish guruhi

Tashqi havolalar