Domenni moslashtirish - Domain adaptation

Odatiy mashina o'qitish sozlamalari va transferni o'rganish va domenga moslashishni joylashuvi o'rtasidagi farq.

Domenni moslashtirish[1][2][3] bilan bog'liq bo'lgan maydon mashinada o'rganish va transferni o'rganish. Ushbu stsenariy biz ma'lumotlarning taqsimlanishidan boshqacha (lekin tegishli) maqsadli tarqatishda yaxshi ishlaydigan modelni o'rganishni maqsad qilganimizda paydo bo'ladi. Masalan, umumiy vazifalardan biri spam-filtrlash muammosi modelni bir foydalanuvchidan (manba tarqatish) sezilarli darajada farqli elektron pochta xabarlarini (maqsadli tarqatish) olgan yangi foydalanuvchiga moslashtirishdan iborat. Domenga moslashish bir-biriga bog'liq bo'lmagan manbalarni o'rganish uchun ham foydali ekanligi isbotlangan.[4]Shuni esda tutingki, bir nechta manbalarni tarqatish mavjud bo'lganda, muammo ko'p manbali domenga moslashish deb nomlanadi.[5]

Umumiy nuqtai

Domenga moslashish - bu bir yoki bir nechta "manba domenlari" da o'rganilgan algoritmni boshqa (ammo tegishli) "maqsadli domen" ga qo'llash qobiliyati. Domenga moslashish - bu transferni o'rganish subkategori. Domenni moslashtirishda manba va maqsadli domenlarning barchasi bir xil bo'ladi xususiyat maydoni (lekin har xil tarqatish); Aksincha, transferni o'rganish maqsadli domenning xususiyat maydonini manba funktsiyalari maydoni yoki bo'shliqlaridan farq qiladigan holatlarni o'z ichiga oladi.[6]

Domen almashinuvi

A domen siljishi,[7] yoki tarqatish o'zgarishi,[8] bu algoritmni o'qitish ma'lumotlar to'plami o'rtasida ma'lumotlar taqsimotidagi o'zgarish va u joylashtirilganda duch keladigan ma'lumotlar to'plamidir. Ushbu domen siljishlari sun'iy intellektning amaliy qo'llanmalarida keng tarqalgan. Mashinada o'qitishning an'anaviy algoritmlari ko'pincha domen siljishlariga yomon moslashadilar. Zamonaviy mashinasozlik hamjamiyati domenni yaxshiroq moslashishga harakat qilish uchun turli xil strategiyalarga ega.[7]

Misollar

  • Yangiliklar orqali o'rganilgan algoritm biomedikal hujjatlarning yangi to'plamiga moslashishi kerak bo'lishi mumkin.[9]
  • Trening davomida elektron pochta orqali foydalanuvchilarning ma'lum bir guruhida o'qitilgan spam-filtr tarqatilganda yangi maqsadli foydalanuvchiga moslashishi kerak.[10]
  • Oldingi kasalliklar bilan bog'liq yorliqli ma'lumotlar bo'yicha o'qitilgan sun'iy intellekt diagnostikasi algoritmlarini ushbu bilan bog'liq yangi noma'lum ma'lumotlarga qo'llash Covid-19 pandemiyasi.[11]
  • Pandemiya epidemiyasi kabi to'satdan ijtimoiy o'zgarish domen siljishini tashkil qilishi va eskirgan iste'molchilar ma'lumotlari bo'yicha o'qitilgan mashinalarni o'rganish algoritmlarini ishdan chiqishiga va aralashuvni talab qilishi mumkin.[12][13]

Boshqa dasturlarga wifi lokalizatsiyasini aniqlash va ko'p jihatlari kiradi kompyuterni ko'rish.[6]

Rasmiylashtirish

Ruxsat bering kirish maydoni (yoki tavsif maydoni) bo'lsin va ruxsat bering chiqish maydoni (yoki yorliq maydoni) bo'lishi kerak. Mashinada o'rganish algoritmining maqsadi matematik modelni o'rganishdir (gipoteza) dan yorliq biriktirishga qodir misolidan . Ushbu model o'quv namunasidan o'rganiladi .

Odatda nazorat ostida o'rganish (domen moslashuvisiz), biz misollar deb o'ylaymiz i.i.d chizilgan tarqatishdan qo'llab-quvvatlash (noma'lum va belgilangan). Maqsad shundan so'ng o'rganishdir (dan.) ) tarqatishdan kelib chiqadigan yangi misollarni belgilashda mumkin bo'lgan eng kichik xatoga yo'l qo'yishi kerak .

Nazorat ostidagi o'rganish va domenga moslashish o'rtasidagi asosiy farq shundaki, keyingi vaziyatda biz ikki xil (lekin bir-biriga bog'liq) taqsimotlarni o'rganamiz va kuni [iqtibos kerak ]. Keyin domenni moslashtirish vazifasi bilimlarni manba domenidan uzatishdan iborat maqsadga . Maqsad shundan keyin o'rganishdir (ikkita domendan keladigan etiketli yoki noma'lum namunalardan), maqsadli domenda imkon qadar kam xatoga yo'l qo'yishi uchun [iqtibos kerak ].

Asosiy masala quyidagicha: agar model manba domenidan o'rganilgan bo'lsa, maqsadli domendan keladigan ma'lumotlarni to'g'ri yorliqlash qobiliyati qanday?

Domenni moslashtirishning har xil turlari

Domenni moslashtirishning bir nechta kontekstlari mavjud. Ular maqsadli vazifa uchun ko'rib chiqilgan ma'lumotlarda farqlanadi.

  1. The nazoratsiz domen moslashuvi: o'quv namunasi etiketli manba to'plamlari to'plamini, yorliqsiz manbalar to'plamlarini va belgilanmagan maqsadlar to'plamini o'z ichiga oladi.
  2. The yarim nazorat ostida domenni moslashtirish: bu vaziyatda biz "kichik" belgilangan maqsadli misollarni ham ko'rib chiqamiz.
  3. The domenning moslashuvi: ko'rib chiqilgan barcha misollar yorliqli bo'lishi kerak.

To'rt algoritmik printsip

Qayta ishlash algoritmlari

Maqsad, maqsadli namunaga "o'xshab" turadigan (ko'rib chiqilgan xato o'lchovi nuqtai nazaridan) manba deb nomlangan namunani qayta tiklash.[14][15]

Takroriy algoritmlar

Moslashtirish usuli maqsadli misollarni takroriy ravishda "avtomatik yorliqlash" dan iborat. Bu tamoyil oddiy:

  1. model etiketli misollardan o'rganiladi;
  2. ba'zi maqsadli misollarni avtomatik ravishda belgilaydi;
  3. yangi etiketli misollardan yangi model o'rganiladi.

Shuni esda tutingki, boshqa takroriy yondashuvlar mavjud, ammo ular odatda maqsadga yo'naltirilgan misollarga muhtoj.[16][17]

Umumiy vakolatxonani qidirish

Maqsad - ikkita domen uchun umumiy vakolat joyini topish yoki qurish. Maqsad, manbalarni yorliqlash vazifasida yaxshi ko'rsatkichlarni saqlab, domenlarning bir-biriga yaqin bo'lgan maydonini olishdir. Qarama-qarshi mashina o'rganish turli sohalardagi namunalardagi xususiyatlarni bir-biridan ajratib bo'lmaslikka undaydigan usullar.[18][19]

Ierarxik Bayes modeli

Maqsad Bayes iyerarxik modelini yaratishdir , bu asosan hisoblash uchun faktorizatsiya modeli , domenga bog'liq bo'lgan va global miqyosda yashirin bo'lgan omillarga imkon beruvchi domenga bog'liq bo'lgan yashirin vakilliklarni yaratish.[4]

Adabiyotlar

  1. ^ Redko, Ievgen; Morvant, Emili; Xabrard, Amauri; Sebban, Mark; Bennani, Younes (2019). Domenni moslashtirish nazariyasining yutuqlari. ISTE Press - Elsevier. p. 187. ISBN  9781785482366.
  2. ^ Bridl, Jon S.; Koks, Stiven J (1990). "RecNorm: nutqni aniqlash uchun bir vaqtning o'zida normallashtirish va tasniflash" (PDF). Neyronli axborotni qayta ishlash tizimlari bo'yicha konferentsiya (NIPS). 234-240 betlar.
  3. ^ Ben-Devid, Shay; Blitser, Jon; Krammer, Kobi; Kulesza, Aleks; Pereyra, Fernando; Wortman Vaughan, Jennifer (2010). "Turli xil sohalardan o'rganish nazariyasi" (PDF). Mashinada o'rganish. 79 (1–2): 151–175. doi:10.1007 / s10994-009-5152-4.
  4. ^ a b Xajiramezanali, Ehsan; Siamak Zamani Dadaneh; Karbalaygareh, Alireza; Chjou, Mingyuan; Qian, Xiaoning (2018). "Keyingi avlod ketma-ketligini hisoblash ma'lumotlaridan saraton turini kashf qilish uchun Bayesiya ko'p domenli o'rganish". arXiv:1810.09433 [stat.ML ].
  5. ^ Krammer, Kobi; Kerns, Maykl; Wortman, Jeniifer (2008). "Ko'p manbalardan o'rganish" (PDF). Mashinalarni o'rganish bo'yicha jurnal. 9: 1757–1774.
  6. ^ a b Quyosh, Shiliang; Shi, Xongley; Vu, Yuanbin (2015 yil iyul). "Ko'p manbali domenlarni moslashtirish bo'yicha so'rov". Axborot sintezi. 24: 84–92. doi:10.1016 / j.inffus.2014.12.003.
  7. ^ a b Sun, Baochen, Jiashi Feng va Kate Saenko. "Xavotirga soladigan osonlikcha domenga moslashishni qaytarish." Sun'iy intellekt bo'yicha AAAI o'ttizinchi konferentsiyasida. 2016 yil.
  8. ^ Amodei, Dario, Kris Ola, Yakob Shtaynxardt, Pol Kristiano, Jon Shulman va Dan Mane. "AI xavfsizligining aniq muammolari". arXiv oldindan chop etish arXiv: 1606.06565 (2016).
  9. ^ Daume III, Hal. "Domenni osongina moslashtirish." arXiv oldindan chop etish arXiv: 0907.1815 (2009).
  10. ^ Ben-Devid, Shai, Jon Blitser, Kobi Krammer va Fernando Pereyra. "Domenni moslashtirish uchun vakolatxonalarni tahlil qilish." Asabli ma'lumotlarni qayta ishlash tizimidagi yutuqlar, 137-144-betlar. 2007 yil.
  11. ^ Xu, Yipeng; Yoqub, Yusuf; Parker, Jefri J. M.; Xoks, Devid J.; Xerst, Jon R.; Stoyanov, Danayl (iyun 2020). "Sun'iy intellekt modellarini tez rivojlanayotgan pandemiyaga joylashtirish muammolari". Tabiat mashinalari intellekti. 2 (6): 298–300. doi:10.1038 / s42256-020-0185-2. ISSN  2522-5839.
  12. ^ Metyus, Dilan (2019 yil 26 mart). "AI falokati Terminatorga o'xshamaydi. U sudraluvchi bo'ladi". Vox. Olingan 21 iyun 2020.
  13. ^ "Pandemiya paytida bizning g'alati xatti-harakatlarimiz sun'iy intellekt modellarini buzmoqda". MIT Technology Review. 11 may 2020 yil. Olingan 21 iyun 2020.
  14. ^ Xuang, Tszayuan; Smola, Aleksandr J.; Gretton, Artur; Borgvardt, Karster M.; Shölkopf, Bernxard (2006). "Belgilanmagan ma'lumotlar bo'yicha namunalarni tanlab olishning to'g'riligini to'g'rilash" (PDF). Neyronli axborotni qayta ishlash tizimlari bo'yicha konferentsiya (NIPS). 601–608 betlar.
  15. ^ Shimodaira, Hidetoshi (2000). "Kovaryatlangan siljish bo'yicha prognozli xulosani jurnalga o'xshashlik funktsiyasini tortish orqali takomillashtirish". Statistik rejalashtirish va xulosalar jurnali. 90 (2): 227–244. doi:10.1016 / S0378-3758 (00) 00115-4.
  16. ^ Arief-Ang, I.B .; Salim, F.D .; Xemilton, M. (2017-11-08). DA-HOC: CO2 sensori ma'lumotlaridan foydalangan holda xonani to'ldirishni bashorat qilish uchun yarim nazorat ostida domenni moslashtirish. Energiya tejaydigan qurilgan muhit uchun tizimlar bo'yicha 4-ACM xalqaro konferentsiya (BuildSys). Delft, Gollandiya. 1-10 betlar. doi:10.1145/3137133.3137146. ISBN  978-1-4503-5544-5.
  17. ^ Arief-Ang, I.B .; Xemilton, M .; Salim, F.D. (2018-12-01). "CO2 Sensor ma'lumotlarining o'tkaziladigan vaqt seriyasining parchalanishi bilan xonani ishg'ol qilishni taxmin qilish". Sensor tarmoqlarida ACM operatsiyalari. 14 (3–4): 21:1–21:28. doi:10.1145/3217214.
  18. ^ Ganin, Yaroslav; Ustinova, Evgeniya; Ajakan, Xana; Jermen, Paskal; Larochelle, Ugo; Laviolette, Fransua; Marchand, Mario; Lempitskiy, Viktor (2016). "Neyron tarmoqlarini domen-adversarial o'qitish" (PDF). Mashinalarni o'rganish bo'yicha jurnal. 17: 1–35.
  19. ^ Xajiramezanali, Ehsan; Siamak Zamani Dadaneh; Karbalaygareh, Alireza; Chjou, Mingyuan; Qian, Xiaoning (2017). "Ochiq robotlarni tashqi ko'rinishiga qarab o'zgarishini domen adversiyasiga moslashtirish bilan hal qilish". arXiv:1703.01461 [cs.RO ].