NGS ma'lumotlaridan SNV qo'ng'iroqlari - SNV calling from NGS data

NGS ma'lumotlaridan SNV qo'ng'iroqlari mavjudligini aniqlashning bir qator usullaridan biridir bitta nukleotid variantlari (SNV) natijalaridan keyingi avlod ketma-ketligi (NGS) tajribalari. Bu hisoblash texnikasi va ma'lum bo'lgan umumiy nukleotidli polimorfizmlarga asoslangan maxsus eksperimental usullardan farq qiladi (qarang. SNP genotipini yaratish ). NGS ma'lumotlarining ko'payib borishi sababli, ushbu texnikalar SNP genotipini amalga oshirishda tobora ommalashib bormoqda, aniq eksperimental dizaynlar va ilovalar uchun mo'ljallangan turli xil algoritmlar.[1] SNP genotiplashning odatiy qo'llanilish doirasiga qo'shimcha ravishda, ushbu usullar populyatsiya ichida kamdan-kam uchraydigan SNPlarni aniqlash uchun muvaffaqiyatli moslashtirildi,[2] shuningdek aniqlash badandagi Bir nechta to'qima namunalaridan foydalangan holda, bir kishi ichidagi SNVlar.[3]

Germline variantlarini aniqlash usullari

SNVni aniqlash uchun NGS asosidagi usullarning aksariyati aniqlash uchun mo'ljallangan urug'lanish shaxs genomidagi o'zgarishlar. Bular o'zlarining ota-onalaridan biologik ravishda meros qilib olgan mutatsiyalar va bu kabi tahlillarni o'tkazishda izlanadigan odatiy variantlar turi (bu erda aniq dasturlardan tashqari) somatik mutatsiyalar qidirilmoqda). Ko'pincha, qidirilayotgan variantlar populyatsiya bo'ylab ba'zi (ehtimol kamdan-kam uchraydigan) chastotalarda uchraydi va bu holda ularni shunday deb atash mumkin. bitta nukleotid polimorfizmlari (SNP). Texnik jihatdan SNP atamasi faqat ushbu turdagi o'zgarishlarni anglatadi, ammo amalda ular ko'pincha adabiyotlarda SNV bilan sinonim sifatida ishlatiladi. Bundan tashqari, germline SNVlarni aniqlash har bir lokusda shaxsning genotipini aniqlashni talab qilganligi sababli, ushbu jarayonga murojaat qilish uchun "SNP genotipi" iborasi ham ishlatilishi mumkin. Shu bilan birga, ushbu ibora, shuningdek, ma'lum SNP joylarida genotiplarni tasniflash bo'yicha nam laboratoriya tajriba protseduralariga tegishli bo'lishi mumkin.

Bunday texnikaning odatdagi jarayoni quyidagilarga asoslangan:[1]

  1. NGS to'plamini filtrlash xatolik / noaniqlik manbalarini olib tashlash uchun o'qiydi
  2. Ko'rsatkichlarni mos yozuvlar genomiga moslashtirish
  3. Algoritm yordamida statistik modelga yoki biron bir evristikaga asoslanib, har bir lokusda o'zgaruvchanlik ehtimolligini taxmin qilish uchun, ushbu lokusda o'qilgan o'qlarning sifat ko'rsatkichlari va allellar soniga asoslanib.
  4. Bashorat qilingan natijalarni filtrlash, ko'pincha dasturga tegishli ko'rsatkichlarga asoslanadi
  5. SNP izohi har bir o'zgarishning funktsional ta'sirini bashorat qilish.

Ushbu protseduralarning odatiy natijasi a VCF fayl.

Ehtimoliy usullar

Gipotetik NGS o'qishlari to'plami mos yozuvlar ketma-ketligiga mos ravishda ko'rsatilgan. Izohlangan lokusda o'qishlar A mos yozuvlar alleliga qarshi A / G nukleotidlari aralashmasini o'z ichiga oladi. Oldingi genotip ehtimoli va tanlangan xato modeliga qarab, bu geterozigotli SNV (genotip AG taxmin qilingan) deb nomlanishi mumkin, G nukleotidlari xato deb tasniflanishi mumkin va hech qanday variant (genotip AA bashorat qilinmaydi) yoki alternativa A nukleotidlari deb nomlanmaydi. xatolar va homozigotli SNV deb tasniflanishi mumkin (GG genotipi taxmin qilingan).

Ideal xatosiz dunyoda yuqori o'qish qamrov, NGS ma'lumotlarini moslashtirish natijalaridan variantni chaqirish vazifasi oddiy bo'lar edi; har birida lokus (genomdagi pozitsiya) har bir alohida nukleotidning ushbu pozitsiyada hizalanmış o'qishlar orasida paydo bo'lish sonini hisoblash mumkin va haqiqiy genotip aniq bo'ladi; yoki AA agar barcha nukleotidlar allelga to'g'ri keladigan bo'lsa A, BB agar ular allelga to'g'ri keladigan bo'lsa B, yoki AB agar aralashma bo'lsa. Biroq, haqiqiy NGS ma'lumotlari bilan ishlashda bunday sodda yondashuv qo'llanilmaydi, chunki u kirish ma'lumotidagi shovqinni hisobga olmaydi.[4] Asosiy qo'ng'iroq qilish uchun ishlatiladigan nukleotidlar soni xatolar va noaniqliklarni o'z ichiga oladi, chunki ketma-ket o'qishlar o'zlari va hizalama jarayonida. Ushbu muammoni o'qish qamrovini yanada chuqurroq bo'lishiga qarab ketma-ketlikni kamaytirish orqali ma'lum darajada yumshatish mumkin, ammo bu ko'pincha qimmatga tushadi va ko'plab amaliy tadqiqotlar past qamrovli ma'lumotlar haqida xulosa chiqarishni talab qiladi.[1]

Ehtimoliy usullar shovqinni hisobga olgan holda har bir mumkin bo'lgan genotipning ehtimoli bo'yicha taxminiy taxminlarni va shuningdek, taxminlarni yaxshilash uchun ishlatilishi mumkin bo'lgan boshqa oldingi ma'lumotlarni ishlab chiqish orqali yuqoridagi masalani engishga qaratilgan. Keyinchalik, ehtimollik asosida, genotipni taxmin qilish mumkin Xarita smeta

Variantli qo'ng'iroqning ehtimollik usullari asoslanadi Bayes teoremasi. Variant chaqirish kontekstida Bayes teoremasi har bir genotipning haqiqiy genotip bo'lish ehtimolini, kuzatilgan ma'lumotlarga ko'ra, har bir mumkin bo'lgan genotipning oldingi ehtimoli va har bir mumkin bo'lgan genotipga berilgan ma'lumotlarning taqsimlanishi nuqtai nazaridan belgilaydi. Formulasi:

Yuqoridagi tenglamada:

  • kuzatilgan ma'lumotlarga ishora qiladi; ya'ni hizalanmış o'qiladi
  • ehtimolligi hisoblab chiqilayotgan genotipdir
  • ga ishora qiladi menmumkin bo'lgan genotip n imkoniyatlar

Yuqoridagi ramkani hisobga olgan holda, SNVlarni aniqlash uchun turli xil dasturiy echimlar, ular oldingi ehtimollarni qanday hisoblashlariga qarab farqlanadi , ehtimolliklarni modellashtirish uchun foydalanilgan xato modeli va umumiy genotiplarni alohida sub-genotiplarga bo'lish, ularning ehtimoli ushbu doirada individual ravishda baholanishi mumkin.[5]

Oldindan genotip ehtimolligini taxmin qilish

Oldingi ehtimollarni hisoblash o'rganilayotgan genom ma'lumotlariga va tahlil turiga bog'liq. Ma'lum bo'lgan mutatsiyalar chastotalarini o'z ichiga olgan yaxshi ma'lumot ma'lumotlari mavjud bo'lgan tadqiqotlar uchun (masalan, inson genomlari ma'lumotlarini o'rganishda), populyatsiyada ma'lum bo'lgan genotiplarning ushbu chastotalari oldingi ko'rsatkichlarni taxmin qilish uchun ishlatilishi mumkin. Populyatsiyaning keng allel chastotalarini hisobga olgan holda, oldingi genotip ehtimolliklarini har bir lokusda bo'yicha hisoblash mumkin Hardy-Vaynberg muvozanati.[6] Bunday ma'lumotlar bo'lmasa, lokusdan mustaqil ravishda doimiy oldindan foydalanish mumkin. Bular evristik jihatdan tanlangan qiymatlar yordamida o'rnatilishi mumkin, ehtimol tadqiqot davomida izlanayotgan xilma-xilliklar haqida ma'lumot beriladi. Shu bilan bir qatorda, ushbu shaxslarning taqdim etilgan NGS ma'lumotlaridan foydalangan holda, namunadagi shaxslar uchun maqbul oldingi qiymatlarni o'rganishga intiladigan nazorat ostida mashina o'qitish protseduralari tekshirildi.[4]

Ma'lumotlarni kuzatish uchun xato modellari

Variant chaqirish uchun ehtimollik usulini yaratishda foydalanilgan xato modeli. Hisoblash uchun asosdir Bayes teoremasida ishlatilgan atama. Agar ma'lumotlar xatosiz deb hisoblangan bo'lsa, unda kuzatilgan nukleotidlar sonining har bir joyda taqsimlanishi quyidagicha bo'ladi Binomial tarqatish, 100% nukleotidlarning A yoki B allellariga mos ravishda AA va BB holatlar va har bir nukleotidning mos kelish ehtimoli 50% A yoki B ichida AB ish. Biroq, o'qilgan ma'lumotlarda shovqin bo'lsa, bu taxmin buziladi va qiymatlar har bir lokusda hizalanmış o'qishlarda xato nukleotidlar mavjudligini hisobga olish kerak.

Oddiy xato modeli - gomozigotli holatlarda ma'lumotlar ehtimoli muddatiga kichik xato kiritib, nukleotidlar bilan mos kelmaydigan kichik doimiy ehtimolga imkon beradi. A allel kuzatiladi AA nukleotidlar bilan mos kelmaydigan kichik doimiy ehtimollik B allel kuzatiladi BB ish. Shunga qaramay, ma'lumotlarning shartli ehtimolligini hisoblashda haqiqiy ma'lumotlarda kuzatilgan haqiqiy xato modellarini yanada aniq takrorlashga urinadigan yanada murakkab protseduralar mavjud. Masalan, o'qish sifatini baholash (quyidagicha o'lchanadi) Phred lokalizatorda o'qilgan har bir odamda kutilayotgan xatolik darajasini hisobga olgan holda, ushbu hisob-kitoblarga kiritilgan).[7] Xatolik modellariga muvaffaqiyatli kiritilgan yana bir usul - bu har bir mumkin bo'lgan nukleotid o'rnini bosish uchun xatolar darajasi to'g'risida oldindan ma'lum bo'lgan ma'lumotlarga asoslanib, alohida xato stavkalari hisoblab chiqilgan asosiy sifatni qayta kalibrlash. Tadqiqotlar shuni ko'rsatadiki, har bir mumkin bo'lgan nukleotid o'rnini bosish ma'lumotlarning ketma-ketligini aniqlashda xatolikka olib kelishi ehtimoli teng emas va shuning uchun xatolar ehtimolligini baholashni yaxshilash uchun asosiy sifatni qayta kalibrlash qo'llanilgan.[6]

Genotipning bo'linishi

Yuqoridagi munozarada har bir lokusdagi genotip ehtimoli mustaqil ravishda hisoblab chiqilgan deb taxmin qilingan; ya'ni butun genotip har bir lokusda mustaqil genotiplarga bo'linadi, ularning ehtimoli mustaqil ravishda hisoblab chiqiladi. Biroq, tufayli bog'lanish nomutanosibligi yaqin atrofdagi lokotiplarning genotiplari umuman mustaqil emas. Natijada, umumiy genotipni bir-biriga mos keladigan ketma-ketlikda ajratish haplotiplar ushbu korrelyatsiyalarni modellashtirishga imkon beradi, natijada ilgari populyatsiya bo'ylab haplotip chastotalarini kiritish orqali aniqroq taxminiy taxminlar paydo bo'ladi. Variantlarni aniqlash aniqligini oshirish uchun haplotiplardan foydalanish muvaffaqiyatli qo'llanildi, masalan 1000 genom loyihasi.[8]

Evristik asoslangan algoritmlar

Ehtimollik usullariga alternativa sifatida, evristik NGS ma'lumotlariga qo'ng'iroq qilish uchun usullar mavjud. Kuzatilgan ma'lumotlarning taqsimlanishini modellashtirish va Bayot statistikasi yordamida genotip ehtimolliklarini hisoblash o'rniga, turli xil evristik omillarga asoslanib, variantli qo'ng'iroqlar amalga oshiriladi, masalan, minimal allellar soni, o'qishning sifat ko'rsatkichlari, o'qish chuqurligining chegaralari va boshqalar. ular ehtimollik usullariga nisbatan amalda nisbatan mashhur bo'lmagan, amalda ularning chegaralari va kesiklaridan foydalanilganligi sababli ular ehtimollik modellarining taxminlarini buzadigan tashqi ma'lumotlarga nisbatan mustahkam bo'lishi mumkin.[9]

Hizalamada ishlatiladigan mos yozuvlar genomi

NGS ma'lumotlaridan foydalangan holda variantlarni chaqirish usullarini loyihalashtirishning muhim qismi bu NGS o'qishlari moslashtirilgan mos yozuvlar sifatida ishlatiladigan DNK ketma-ketligidir. Inson genetikasi bo'yicha tadqiqotlarda, kabi manbalardan yuqori sifatli ma'lumotlarga ega bo'lish mumkin HapMap loyihasi,[10] bu variantni chaqirish algoritmlari orqali amalga oshiriladigan variant qo'ng'iroqlarining aniqligini sezilarli darajada yaxshilashi mumkin. Bonus sifatida bunday ma'lumotnomalar Bayes asosidagi tahlil uchun oldingi genotip ehtimoli manbai bo'lishi mumkin. Biroq, bunday yuqori sifatli ma'lumotnoma bo'lmagan taqdirda, birinchi navbatda eksperiment asosida olingan o'qishlar bo'lishi mumkin yig'ilgan moslashtirish uchun mos yozuvlar ketma-ketligini yaratish uchun.[1]

Natijalarni oldindan qayta ishlash va filtrlash

Variantli chaqiruv tajribalarida ma'lumotlarni filtrlash uchun turli xil usullar mavjud, bu xato / noaniqlik manbalarini yo'q qilish. Bu variantni chaqirish algoritmi tomonidan qaytarilgan variantlar ro'yxatini moslashtirish va / yoki filtrlashdan oldin shubhali o'qishni olib tashlashni o'z ichiga olishi mumkin.

Amaldagi ketma-ketlik platformasiga qarab, ketma-ket o'qishlar to'plamida turli xil noaniqliklar mavjud bo'lishi mumkin. Masalan, ba'zi bir mahallada o'qilgan yo'nalish bo'yicha teskari yo'nalish bo'yicha oldinga va teskari yo'nalishlarning juda teng bo'lmagan taqsimlanishiga olib keladigan strand nosozligi paydo bo'lishi mumkin. Bundan tashqari, ba'zi o'qishlarning g'ayrioddiy yuqori takrorlanishi bo'lishi mumkin (masalan, noaniqlik tufayli PCR ). Bunday noaniqliklar shubhali variant qo'ng'iroqlariga olib kelishi mumkin, masalan, agar ba'zi bir lokuslarda PCR xatosini o'z ichiga olgan parcha PCR tarafkashligi sababli haddan tashqari ko'paytirilsa, bu lokus soxta allelning yuqori soniga ega bo'ladi va SNV deb nomlanishi mumkin - va shuning uchun tahliliy quvurlar tez-tez ushbu noaniqliklar asosida qo'ng'iroqlarni filtrlaydi.[1]

Somatik variantlarni aniqlash usullari

Aniqlash uchun mos keladigan usullardan tashqari o'qishlarni individual namunalardan mos yozuvlar genomigacha urug'lanish somatik variantlarni aniqlash uchun bitta odam ichida bir nechta to'qima namunalaridan o'qilganlarni genetik variantlar bilan taqqoslash va taqqoslash mumkin. Ushbu variantlar mos keladi mutatsiyalar sodir bo'lgan de novo guruhlari ichida somatik hujayralar shaxs ichida (ya'ni, ular germline hujayralarida mavjud emas). Ushbu tahlil shakli tez-tez o'rganishda qo'llanilgan saraton, saraton to'qimalarida somatik mutatsiyalar profilini o'rganish bo'yicha ko'plab tadqiqotlar ishlab chiqilgan. Bunday tadqiqotlar natijasida klinik qo'llanishni aniqlagan diagnostika vositalari paydo bo'ldi va kasallik haqida ilmiy tushunchalarni takomillashtirishda, masalan, saratonga aloqador yangi genlarni kashf qilish, kasallikka chalinganlarni aniqlash orqali foydalaniladi. genlarni tartibga solish tarmoqlari va metabolik yo'llar va o'smalar qanday o'sishi va rivojlanishi haqida modellarga ma'lumot berish orqali.[11]

So'nggi o'zgarishlar

So'nggi paytgacha ushbu tahlil shaklini o'tkazish uchun dasturiy vositalar juda kam rivojlangan va ular germline o'zgarishlarini aniqlashda ishlatiladigan algoritmlarga asoslangan edi. Bunday protseduralar ushbu vazifa uchun optimallashtirilmagan, chunki ular bir kishidan bir nechta to'qima namunalarida mavjud bo'lgan genotiplar o'rtasidagi statistik korrelyatsiyani etarlicha modellashtirmaydi.[3]

Yaqinda o'tkazilgan tadqiqotlar natijasida ko'plab to'qima namunalaridan somatik mutatsiyalarni aniqlash uchun optimallashtirilgan dasturiy vositalar ishlab chiqildi. Har bir lokusdagi barcha to'qima namunalari bo'yicha allellar sonini to'playdigan va barcha to'qimalar uchun qo'shma genotiplarning yuzaga kelish ehtimoli uchun statistik modellardan foydalangan holda va genotipni hisobga olgan holda allellar sonini taqsimlash bo'yicha taxminiy metodlar ishlab chiqilgan bo'lib, ular nisbatan ishonchli ehtimolliklarni hisoblab chiqa oladi. mavjud bo'lgan barcha ma'lumotlardan foydalangan holda har bir lokusdagi somatik mutatsiyalar.[3][12] Bundan tashqari, yaqinda ba'zi tekshiruvlar o'tkazildi mashinada o'rganish ushbu tahlilni o'tkazish uchun asoslangan texnikalar.[13]

Mavjud dasturiy ta'minot ro'yxati

Adabiyotlar

  1. ^ a b v d e Nilsen, Rasmus va Pol, Joshua S va Albrechtsen, Anders va Song, Yun S (2011). "Genotip va SNP yangi avlod ketma-ketligi ma'lumotlaridan qo'ng'iroq qilish". Genetika haqidagi sharhlar. 12 (6): 443–451. doi:10.1038 / nrg2986. PMC  3593722. PMID  21587300.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)
  2. ^ Bansal, Vikas (2010). "DNK suzish havzalarini keyingi avlodda qayta tiklash variantlarini aniqlashning statistik usuli". Bioinformatika. 26 (12): i318 – i324. doi:10.1093 / bioinformatika / btq214. PMC  2881398. PMID  20529923.
  3. ^ a b v Rot, Endryu va Ding, Djarui va Morin, Rayan va Krisan, Anamariya va Xa, Gavin va Djuliya, Rayan va Bashashati, Ali va Xirst, Martin va Turashvili, Gulisa va Oloumi, Arusha; va boshq. (2012). "JointSNVMix: [normal / o'sma juftlashgan yangi avlod ketma-ketligi ma'lumotlarida somatik mutatsiyalarni aniq aniqlash uchun ehtimoliy model". Bioinformatika. 28 (7): 907–913. doi:10.1093 / bioinformatika / bts053. PMC  3315723. PMID  22285562.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)
  4. ^ a b Martin, Eden R va Kinnamon, DD va Shmidt, Maykl A va Pauell, EH va Zuxner, S va Morris, RW (2010). "SeqEM: yangi avlod ketma-ketligini o'rganish uchun genotipni chaqirishga moslashuvchan yondashuv". Bioinformatika. 26 (22): 2803–2810. doi:10.1093 / bioinformatika / btq526. PMC  2971572. PMID  20861027.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)
  5. ^ Siz, Na va Murillo, Gabriel va Su, Xiaoquan va Zeng, Xiaowei va Xu, Tszian va Ning, Kang va Chjan, Shoudun va Chju, Tsziankang va Tsyu, Sinping (2012). "Yuqori tezlikli ketma-ketlik ma'lumotlarida genotip modelini tanlash yordamida SNP chaqiruvi". Bioinformatika. 28 (5): 643–650. doi:10.1093 / bioinformatika / bts001. PMC  3338331. PMID  22253293.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)
  6. ^ a b Li, Ruiqiang va Li, Yingrui va Fang, Syaodun va Yang, Xuanming va Vang, Dzyan va Kristiansen, Karsten va Vang, iyun (2009). "Parallel genomni qayta tiklash uchun SNPni aniqlash". Genom tadqiqotlari. 19 (6): 1124–1132. doi:10.1101 / gr.088013.108. PMC  2694485. PMID  19420381.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)
  7. ^ Li, Xeng va Ruan, Jyu va Durbin, Richard (2008). "DNKning qisqa ketma-ketligini xaritalash xaritalari sifat ko'rsatkichlari yordamida o'qish va qo'ng'iroq qilish variantlari". Genom tadqiqotlari. 18 (11): 1851–1858. doi:10.1101 / gr.078212.108. PMC  2577856. PMID  18714091.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)
  8. ^ Abecasis, GR va Altshuler, Devid va Avton, A va Bruks, LD va Durbin, RM va Gibbs, Richard A va Xerles, Mett E va Makvin, Gil A va Bentli, DR va Chakravarti, A; va boshq. (2010). "Populyatsiya miqyosidagi ketma-ketlikdan odam genomining o'zgarishi xaritasi". Tabiat. 467 (7319): 1061–1073. Bibcode:2010 yil natur.467.1061T. doi:10.1038 / tabiat09534. PMC  3042601. PMID  20981092.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)
  9. ^ Koboldt, Deniel S va Chjan, Kunyuan va Larson, Devid E va Shen, Dong va Makellan, Maykl D va Lin, Ling va Miller, Kristofer A va Mardis, Eleyn R va Ding, Li va Uilson, Richard K (2012). "VarScan 2: ekzome sekanslash yo'li bilan saraton kasalligida somatik mutatsiya va nusxa ko'chirish sonining o'zgarishini aniqlash". Genom tadqiqotlari. 22 (3): 568–576. doi:10.1101 / gr.129684.111. PMC  3290792. PMID  22300766.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)
  10. ^ Gibbs, Richard A va Belmont, Jon V va Hardenbol, Pol va Uillis, Tomas D va Yu, Fuli va Yang, Xuanming va Chang, Lan-Yang va Xuan, Vey va Lyu, Bin va Shen, Yan; va boshq. (2003). "Xalqaro HapMap loyihasi" (PDF). Tabiat. 426 (6968): 789–796. Bibcode:2003 yil natur.426..789G. doi:10.1038 / tabiat02168. hdl:2027.42/62838. PMID  14685227. S2CID  4387110.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)
  11. ^ Shir, Derek; Liu, Qi; va boshq. (2013). "Saratonni o'rganish va klinik qo'llanilishida keyingi avlod ketma-ketligi". Onlayn biologik protseduralar. 15 (4): 4. doi:10.1186/1480-9222-15-4. PMC  3599179. PMID  23406336.
  12. ^ Larson, Devid E va Xarris, Kristofer S va Chen, Ken va Koboldt, Deniel S va Ebbott, Travis E va Duling, Devid J va Ley, Timoti J va Mardis, Eleyn R va Uilson, Richard K va Ding, Li (2012) . "SomaticSniper: butun genom ketma-ketligi ma'lumotlarida somatik nuqta mutatsiyalarini aniqlash". Bioinformatika. 28 (3): 311–317. doi:10.1093 / bioinformatika / btr665. PMC  3268238. PMID  22155872.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)
  13. ^ Ding, Jiarui va Bashashati, Ali va Rot, Endryu va Oloumi, Arusha va Tse, Keyn va Zeng, Tomas va Xaffari, Golamreza va Xirst, Martin va Marra, Marko A va Kondon, Anne; va boshq. (2012). "Shishdagi somatik mutatsiyani aniqlash uchun xususiyatlarga asoslangan tasniflagichlar - normal juftlashgan ketma-ketlik ma'lumotlari". Bioinformatika. 28 (2): 167–175. doi:10.1093 / bioinformatika / btr629. PMC  3259434. PMID  22084253.CS1 maint: bir nechta ism: mualliflar ro'yxati (havola)