Kengayadigan joy - Scalable locality

Kompyuter dasturiy ta'minot ko'rgazmada namoyish etiladi o'lchovli mahalliylik[1] undan foydalanishni davom ettirishi mumkin bo'lsa protsessorlar bu ularnikidan yuqori xotira tizimlari, tobora kattaroq muammolarni hal qilish uchun.Ushbu atama foydalanishning yuqori samarali uniprotsessor analogidir kengaytiriladigan parallellik murojaat qilish dasturiy ta'minot buning uchun katta miqdordagi muammolar uchun ko'p sonli protsessorlardan foydalanish mumkin.

Umumiy nuqtai

Quyidagi ko'chadan uyaning xotiradan foydalanish tartiblarini ko'rib chiqing (iterativ ikki o'lchovli) stencil hisoblash ):

uchun t := 0 ga T qil    uchun men := 1 ga N-1 qil        uchun j := 1 ga N-1 qil            yangi(men,j) := (A(men-1,j) + A(men,j-1) + A(men,j) + A(men,j+1) + A(men+1,j)) * .2        oxiri    oxiri    uchun men := 1 ga N-1 qil        uchun j := 1 ga N-1 qil            A(men,j) := yangi(men,j)        oxiri    oxirioxiri

Butun tsikl uyasi taxminan 2 * N ** 2 massiv elementlariga tegadi va 5 * T * N ** 2 suzuvchi nuqta operatsiyalarini bajaradi. balansni hisoblash (suzuvchi nuqtali hisoblashlarning suzuvchi nuqtali xotira katakchalariga nisbati) bu butun tsikl uyasining taxminan 5T / 2 ni tashkil qiladi. Hisoblash balansi muammoning kattaligi funktsiyasi bo'lganda, bu erda bo'lgani kabi, kod mavjud o'lchovli hisoblash balansi.Bu erda, biz shunchaki etarlicha kattaroqni tanlash orqali istalgan hisoblash balansiga erishishimiz mumkin edi T.

Biroq, qachon N katta, bu kod hali ham yomonligi sababli yaxshi keshni qayta ishlatishni namoyish etmaydi ma'lumotlarning joylashuvi: ikkinchi topshiriqda yangi (1,1) kerak bo'lganda yoki birinchi topshiriqni ikkinchi marotaba bajarishda, yangi (1,1) ushlab turuvchi kesh satrining birining boshqa qismining ustiga yozilgan bo'ladi massivlar.

Plitka qo'yish birinchi i / j ko'chadan uyasining kesh ishlashini yaxshilashi mumkin, ammo cheklangan omil bilan, chunki bu uyaning hisoblash balansi taxminan 5 / 2. Bu juda yuqori darajadagi joyni yaratish uchun, masalan, 500 (ushbu kodni samarali ishlatish uchun) RAMga sig`maydigan va virtual xotiraga o`tkazilgan massiv bilan), vaqt bo`yicha qadriyatlarni qayta ishlatishimiz kerak.

Vaqt bosqichlari bo'yicha optimallashtirish bir qator tadqiqot kompilyatorlarida o'rganilgan; Wonnacott asariga qarang,[1][2] Song va Li tomonidan,[3] yoki Sadayappan va boshq.[4] ba'zi yondashuvlar tafsilotlari uchun vaqtni yopish.Wonnacott[1] vaqtni plitkalashtirish yadrodan tashqari ma'lumotlar to'plamlarini optimallashtirish uchun ishlatilishi mumkinligini namoyish etdi;[2][3][4] butun massivning keshga mos kelishini talab qilmasdan o'zboshimchalik bilan yuqori xotira maydoniga ega bo'lishi kerak (keshga bo'lgan talab, kerakli joy bilan o'sib boradi).[2][4] printsipial ravishda bir vaqtning o'zida kengaytiriladigan mahalliylikni ishlab chiqarishi va kengaytiriladigan parallellik.

Adabiyotlar

  1. ^ a b v Devid Uonnakott. Vaqtni skewing yordamida kengaytiriladigan joyga erishish. Parallel dasturlash xalqaro jurnali 30.3 (2002)
  2. ^ a b v Devid Uonnakott. Xotiraning o'tkazuvchanligi va tarmoq cheklovlari tufayli bo'sh vaqtni yo'q qilish uchun Time Skewing-dan foydalanish. Xalqaro parallel va taqsimlangan ishlov berish simpoziumi 2000 yil
  3. ^ a b Yonghong Song va Zhiyuan Li. Keshning vaqtinchalik joylashuvini yaxshilash uchun yangi plitka qo'yish texnikasi. PLDI '99
  4. ^ a b v Shriram Krishnamoorti va Mutu Baskaran va Uday Bondxugula va J. Ramanujam va Atanas Rountev va P. Sadayappan. Shablonni hisoblashlarni samarali avtomatik ravishda parallellashtirish. PLDI '07