PS4-Bioinformatics.pdf

‫تمرین چهارم درس بیوانفورماتیک‬
‫دی ماه ‪39‬‬
‫سوال اول‬
‫ثابت کنید رشتهی 𝑆 دارای ‪ L-Spectrum‬ای است که با ‪ L-Spectrum‬رشتهی دیگری یکسان است‪ ،‬اگر و تنها اگر حداقل یکی از‬
‫شرایط زیر اتفاق بیفتد‪:‬‬
‫الف‪𝑆 = 𝛼𝑋𝛽𝑌𝛼 -‬‬
‫ب‪𝑆 = 𝑋𝛼𝑌𝛼𝑍𝛼𝑊 -‬‬
‫پ‪𝑆 = 𝑋𝛼𝑌𝛽𝑍𝛼𝑊𝛽𝑈 -‬‬
‫که در آنها 𝛼 و 𝛽 دو رشتهی دلخواه با طول ‪ 𝐿 − 1‬هستند‪.‬‬
‫سوال دوم‬
‫𝐿‬
‫ثابت کنید اگر دو قطعه با طول ‪ L‬بر روی یکدیگر قرار گیرند آنگاه احتمال یکسان بودن آنها از )⃗𝑝(‪ 2−2𝐻2‬کوچکتر است‪.‬‬
‫‪𝐻2 (𝑝⃗) = − log ∑ 𝑃𝑎2‬‬
‫‪𝑎∈Σ‬‬
‫سوال سوم‬
‫تقریب پواسون برای تعداد تکرارهای سه تایی با طول ‪ L‬در یک ژنوم ‪ i.i.d.‬با طول ‪ G‬را بیابید‪.‬‬
‫سوال چهارم‬
‫ثابت کنید برای ‪ shotgun sequencing‬به روش ‪ multi-bridging‬اگر شرایط زیر برقرار باشد‪ ،‬آنگاه میتوان رشته را بازسازی‬
‫نمود‪:‬‬
‫الف‪ -‬تمام تکرارهای ‪ interleaved‬شده توسط یک خوانده‪ bridge 1‬شده باشند‪.‬‬
‫ب‪ -‬تمام تکرارهای سه تایی کامال ‪ bridge‬شده باشند (یعنی هر یک از سه بخش توسط یک خوانده ‪ bridge‬شده باشد‪).‬‬
‫پ‪ -‬رشتهی اصلی توسط خواندهها پوشش داده شده باشد‪.‬‬
‫‪Read 1‬‬
‫سوال پنجم‬
‫الف‪ -‬الگوریتمی ارائه کنید که به ازای یک رشته ‪ ،DNA‬تعداد زیر رشتههای متمایز آن را بدست میآورد؟ بهترین مرتبه پیچیدگی‬
‫این الگوریتم چیست؟‬
‫ب‪ -‬بخش الف سوال را درصورتی که رشته ‪ DNA‬حلقوی باشد‪ ،‬چگونه حل میکنید؟‬
‫پ‪ -‬ثابت کنید یک رشته حلقوی ‪ DNA‬به طول ‪ 4k‬وجود دارد به طوری که شامل همه زیر رشتههای ممکن به طول حداکثر ‪k‬‬
‫باشد‪.‬‬
‫ت‪( -‬نمره اضافه) حداکثر تعداد زیر رشته های‪ DNA‬متمایز در یک رشته (حلقوی یا غیر حلقوی) به طول ‪ n‬چقدر است؟‬