MM-F08-Midterm2-Sol.pdf

‫‪Student Name:‬‬
‫‪Student ID:‬‬
‫‪In The Name of God, The Merciful, The Compassionate‬‬
‫‪Multimedia Systems: CE 40-342 - Fall 2008‬‬
‫‪Department of Computer Engineering‬‬
‫‪Sharif University of Technology‬‬
‫‪Midterm (90 Minutes: Good Luck!): H. R. Rabiee‬‬
‫ﺗﻮﺟ‪‬ﻪ‪ :‬ﻧﺎم و ﺷﻤﺎره داﻧﺸﺠﻮﯾﯽ ﺧﻮد را ﺣﺘﻤﺎً ﺑﻨﻮﯾﺴﯿﺪ‪ 5 .‬ﻧﻤﺮه‪ ،‬ﻧﻤﺮه اﺿﺎﻓﻪ در ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪه اﺳﺖ‪.‬‬
‫‪ (1‬اﻟﻒ( آﻧﺘﺮوﭘﯽ ﭼﯿﺴﺖ؟ )‪ 4‬ﻧﻤﺮه(‬
‫ﻣﺘﻮﺳ‪‬ﻂ ﻣﯿﺰان اﻃّﻼﻋﺎﺗﯽ ﮐﻪ از ﻫﺮ ﻋﻼﻣﺖ ﯾﮏ ﻣﻨﺒﻊ ﻋﻼﻣﺖ ﺑﺪﺳﺖ ﻣﯽآﯾﺪ را آﻧﺘﺮوﭘﯽ آن ﮔﻮﯾﻨﺪ و از‬
‫ﻓﺮﻣﻮل زﯾﺮ ﻣﺤﺎﺳﺒﻪ ﻣﯽﺷﻮد‪:‬‬
‫ﮐﻪ )‪ p(si‬اﺣﺘﻤﺎل رﺧﺪاد ﻋﻼﻣﺖ ‪ si‬و )‪ I(si‬ﻣﯿﺰان اﻃّﻼﻋﺎت آن و ﻣﻌﺎدل ﻣﻌﮑﻮس اﺣﺘﻤﺎل رﺧﺪاد آن اﺳﺖ‪.‬‬
‫ﻣﻨﺒﻊ‬
‫)‪MMPart1.pdf‬‬
‫ﺻﻔﺤﻪ ‪(22-21‬‬
‫ب( آﻧﺘﺮوﭘﯽ ﯾﮏ ﻣﻨﺒﻊ ﻗﻄﻌﯽ )‪ (deterministic‬را ﻣﺤﺎﺳﺒﻪ ﮐﻨﯿﺪ )‪ 3‬ﻧﻤﺮه(‬
‫از آﻧﺠﺎﯾﯿﮑﻪ ﻣﻨﺒﻊ ﻗﻄﻌﯽ اﺳﺖ ﭘﺲ ﻗﻄﻌﺎً )ﺑﻪ اﺣﺘﻤﺎل ‪ (1‬ﻣﯽداﻧﯿﻢ ﻋﻼﻣﺖ ﺑﻌﺪي ﭼﯿﺴﺖ ﻟﺬا دارﯾﻢ‬
‫‪H(S)= S(p(si)*I(si))= S(1*0)=0‬‬
‫ج( آﻧﺘﺮوﭘﯽ ﯾﮏ ﻣﻨﺒﻊ در ﭼﻪ ﺣﺎﻟﺘﯽ ﺑﯿﺸﯿﻨﻪ اﺳﺖ؟ آن را ﻣﺤﺎﺳﺒﻪ ﮐﻨﯿﺪ‪ 3) .‬ﻧﻤﺮه(‬
‫زﻣﺎﻧﯽ ﮐﻪ اﺣﺘﻤﺎل ﻫﻤﻪ ﮔﺮهﻫﺎ ﻣﺴﺎوي ﺑﺎﺷﺪ‪ .‬ﭼﺮاﮐﻪ ﻫﯿﭻﮔﻮﻧﻪ اﻃّﻼﻋﺎﺗﯽ در ﻣﻮرد داده ﺑﻌﺪي ﺑﻪ ﮔﯿﺮﻧﺪه‬
‫ﻣﻨﺘﻘﻞ ﻧﻤﯽﮐﻨﺪ‪.‬‬
‫‪H(S)= S(p(si)*I(si))= S(1/n*lgn)=lgn‬‬
‫د( ﺟﺪول ﻋﻼﻣﺎت ﺑﻪ ازاي ﻫﺮ دو ﺣﺮف داده ﺷﺪه اﺳﺖ‪ .‬ﮐﺪ ﻫﺎﻓﻤﻦ ﺑﺮاي ﻫﺮ دو ﺣﺮف را ﺑﺪﺳﺖ آورده‪،‬‬
‫ﺑﺎزده ﻣﻨﺒﻊ زﯾﺮ را ﺣﺴﺎب ﮐﻨﯿﺪ )‪ 12‬ﻧﻤﺮه(‪:‬‬
‫ﺟﺪول ‪ :1‬اﺣﺘﻤﺎل ﺗﻮﻟﯿﺪ ﻫﺮ ﻋﻼﻣﺖ در ﻣﻨﺒﻊ )ﻋﻼﻣﺖ ﺷﺎﻣﻞ دو ﺣﺮف اﺳﺖ(‬
‫‪، %3‬‬
‫‪da‬‬
‫‪، %3‬‬
‫‪ca‬‬
‫‪،%18‬‬
‫‪ba‬‬
‫‪%36‬‬
‫‪،%1.5‬‬
‫‪db‬‬
‫‪،%1.5‬‬
‫‪cb‬‬
‫‪، %9‬‬
‫‪bb‬‬
‫‪،%18‬‬
‫‪،%0.25‬‬
‫‪dc‬‬
‫‪cc ،%0.25‬‬
‫‪،%1.5‬‬
‫‪bc‬‬
‫‪ac ،%3‬‬
‫‪،%0.25‬‬
‫‪dd‬‬
‫‪cd‬‬
‫‪،%1.5‬‬
‫‪bd‬‬
‫‪، %3‬‬
‫‪،%0.25‬‬
‫‪aa ،‬‬
‫‪ab‬‬
‫‪ad‬‬
‫‪Student ID:‬‬
‫‪Student Name:‬‬
‫اﯾﻦ ﺳﺆال ﻣﺜﺎل اﺳﻼﯾﺪﻫﺎ اﺳﺖ ) ‪ MMPart1.pdf‬ﺻﻔﺤﻪ ‪(32‬‬
‫∑‬
‫)( ∗‬
‫‪= 1.43‬‬
‫‪2‬‬
‫) (‬
‫‪1.4‬‬
‫=‬
‫‪= 0.98‬‬
‫‪1.43‬‬
‫=‬
‫=‬
‫ﺗﻮﺟ‪‬ﻪ ﮐﻨﯿﺪ ﮐﻪ ﭼﻮن ﻋﻼﻣﺎت دو ﺣﺮﻓﯽ را ﮐﺪ ﮐﺮدهاﯾﻢ ﻣﺘﻮﺳ‪‬ﻂ ﺗﻌﺪاد ﺑﯿﺖ ﺑﻪ ازاي ﻫﺮ ﺣﺮف ﻧﺼﻒ‬
‫ﻣﺘﻮﺳ‪‬ﻂ ﻃﻮل ﮐﺪ ﺑﺪﺳﺖ آﻣﺪه ﺧﻮاﻫﺪ ﺑﻮد‪ .‬ﺑﺪﻟﯿﻞ ﻣﺤﺎﺳﺒﺎت زﯾﺎد ﻣﻘﺪار )‪ H(s‬ﺳﺮ ﺟﻠﺴﻪ اﻣﺘﺤﺎن ﺑﻪ‬
‫داﻧﺸﺠﻮﯾﺎن داده ﺷﺪ‪.‬‬
‫‪ (2‬اﻟﻒ( ﺗﻔﺎوت ‪ Quantizer‬ﻫﺎي زﯾﺮ را ﻫﻤﺮاه ﺑﺎ رﺳﻢ ﺷﮑﻞ ﺑﺮاي ﻫﺮ ﮐﺪام ﺗﻮﺿﯿﺢ دﻫﯿﺪ‪ 9) .‬ﻧﻤﺮه(‬
‫ﻣﻨﺒﻊ ‪78 -74‬‬
‫در‬
‫‪MMPart1.pdf‬‬
‫‪Uniform Quantizer‬‬
‫ﺳﻄﻮح ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن در ﻓﻮاﺻﻞ ﯾﮑﺴﺎﻧﯽ از ﻫﻢ ﻗﺮار دارﻧﺪ )اﻧﺪازه ﮔﺎمﻫﺎ ﺑﺎ ﻫﻢ‬
‫ﺑﺮاﺑﺮ اﺳﺖ(‬
‫وﻟﯽ در ‪ Lloyd-Max quantizer‬ﻣﯽﺧﻮاﻫﯿﻢ ﺧﻄﺎﯾﯽ ﺣﺎﺻﻞ از ﻋﻤﻞ ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن را ﺑﺎ داﺷﺘﻦ ‪ N‬ﭘﻠّﻪ ﮐﻤﯿﻨﻪ‬
‫ﮐﻨﯿﻢ‪ .‬زﻣﺎﻧﯽ ﮐﻪ اﯾﻦ ﺧﻄﺎ را ﺑﺮاﺳﺎس ﻣﻌﯿﺎر ‪ MSE‬ﻣﺤﺎﺳﺒﻪ ﮐﻨﯿﻢ ﺑﻪ آن ‪ Lloyd-Max quantizer‬ﻣﯽﮔﻮﯾﻨﺪ‪.‬‬
‫در واﻗﻊ اﮔﺮ ﺑﻪ ازاي ﻣﻘﺪار ‪ x‬ﮐﻪ ﺑﻪ ‪) ri‬ﺳﻄﺢ ‪ i‬ام ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن( ﻧﮕﺎﺷﺖ ﺷﺪه ﻣﯿﺰان ﺧﻄﺎ ﺑﺮاﺑﺮ ﺑﺎ‬
‫‪(x-ri)2‬‬
‫‪Student ID:‬‬
‫‪Student Name:‬‬
‫در ﻧﻈﺮ ﺑﮕﯿﺮﯾﻢ و ﻣﻘﺪار ‪ x‬ﺑﻪ اﺣﺘﻤﺎل )‪ p(x‬در ﺳﯿﮕﻨﺎل ﻣﺎ وﺟﻮد داﺷﺘﻪ ﺑﺎﺷﺪ ﻣﯽﺧﻮاﻫﯿﻢ ﻣﺠﻤﻮع ﺧﻄﺎ در‬
‫ﺳﯿﮕﻨﺎل ﺑﺎزﺳﺎزي ﺷﺪه را ﮐﻤﯿﻨﻪ ﮐﻨﯿﻢ‪.‬‬
‫ﻼ در ﺷﮑﻞ زﯾﺮ ﭼﻮن دادهﻫﺎي زﯾﺎدي داﺷﺘﻪاﯾﻢ ﮐﻪ در ﺳﻄﻮح ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن ﺣﻮل ﺻﻔﺮ ﺑﻮدﻧﺪ )اﺣﺘﻤﺎل‬
‫ﻣﺜ ً‬
‫ﺳﻄﻮح ﺣﻮل ﺻﻔﺮ ﺑﯿﺸﺘﺮ ﺑﻮده اﺳﺖ( اﯾﻦ ﺳﻄﻮح را رﯾﺰﺗﺮ ﮐﺮدهاﯾﻢ ﺗﺎ ﺧﻄﺎي دادهﻫﺎي ﻣﻮﺟﻮد در اﯾﻦ ﺑﺎزه‬
‫ﮐﻤﺘﺮ ﺷﻮد‪.‬‬
‫زﻣﺎﻧﯽ ﻣﻨﺎﺳﺐ اﺳﺖ ﮐﻪ ﺳﻄﻮح ﺧﺮوﺟﯽ ﺑﻪ ﺻﻮرت ﮐﺪﻫﺎﯾﯽ ﺑﺎ ﻃﻮل ﺛﺎﺑﺖ ﮐﺪ ﺷﻮﻧﺪ‪.‬‬
‫در ‪ Entropy-Constrained Quantizer‬زﻣﺎﻧﯽ ﮐﻪ اﻣﮑﺎن ﮐﺪﮐﺮدن ﺑﺎ ﻃﻮل ﻣﺘﻐﯿ‪‬ﺮ وﺟﻮد داﺷﺘﻪ ﺑﺎﺷﺪ‪ ،‬ﻫﺪف‬
‫ﻋﻼوه ﺑﺮ ﮐﻢ ﮐﺮدن ﺧﻄﺎي ﻧﺎﺷﯽ از ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن‪ ،‬ﮐﻢ ﮐﺮدن آﻧﺘﺮوﭘﯽ ﮐﺪﻫﺎي ﺗﻮﻟﯿﺪي ﭘﺲ از آن اﺳﺖ ﺑﻪ‬
‫ﺷﮑﻠﯽ ﮐﻪ آﻧﺘﺮوﭘﯽ ﮐﺪﻫﺎي ﺧﺮوﺟﯽ ﺑﺮاﺑﺮ ﺑﺎ ﯾﮏ ﻣﻘﺪار از ﭘﯿﺶ ﺗﻌﯿﯿﻦ ﺷﺪه ﺑﺎﺷﺪ‪.‬‬
‫ب( ﮐﺎرﺑﺮد ﻫﺮ ﯾﮏ را ﺑﻨﻮﯾﺴﯿﺪ‪ ،‬در ﮐﺎرﺑﺮد از ﮐﺪام ﯾﮏ از ﻣﻮارد زﯾﺮ ﺑﯿﺸﺘﺮ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ‪ .‬ﭼﺮا؟ )‪12‬‬
‫ﻧﻤﺮه(‬
‫‪(a‬‬
‫‪(b‬‬
‫‪(c‬‬
‫‪Uniform quantizer‬‬
‫‪Lloyd-Max quantizer‬‬
‫‪Entropy-constrained quantizer‬‬
‫‪Entropy-constrained‬‬
‫ﺑﺮاي زﻣﺎﻧﯽ اﺳﺖ ﻣﺤﺪودﯾ‪‬ﺘﯽ روي ﻣﯿﺰان آﻧﺘﺮوﭘﯽ ﮐﺪ ﺣﺎﺻﻞ دارﯾﻢ و ﻣﯽﺧﻮاﻫﯿﻢ ﺧﻄﺎي‬
‫ﺑﺎزﺳﺎزي ﺳﯿﮕﻨﺎل ﮐﻤﯿﻨﻪ ﺑﺎﺷﺪ و ﻣﯽﺗﻮاﻧﯿﻢ ﮐﺪﻫﺎﯾﯽ ﺑﺎ ﻃﻮل ﻣﺘﻐﯿ‪‬ﺮ داﺷﺘﻪ ﺑﺎﺷﯿﻢ‪.‬‬
‫‪Lloyd-Max‬‬
‫ﺑﺮاي زﻣﺎﻧﯽ اﺳﺖ ﮐﻪ ﻣﯽﺧﻮاﻫﯿﻢ ﺧﻄﺎي ﺑﺎزﺳﺎزي ﺳﯿﮕﻨﺎل ﮐﻤﯿﻨﻪ ﺑﺎﺷﺪ و ﮐﺪﻫﺎي ﺗﻮﻟﯿﺪي ﻃﻮﻟﯽ ﺛﺎﺑﺖ‬
‫دارﻧﺪ‪.‬‬
‫در دو روش ﺑﺎﻻ ﺑﺎﯾﺪ ﺳﯿﮕﻨﺎل ورودي را از ﭘﯿﺶ داﺷﺘﻪ ﺑﺎﺷﯿﻢ‪ .‬ﻟﺬا دو روش ﺑﺎﻻ در ﮐﺎرﺑﺮدﻫﺎي ‪ live‬و‬
‫ﻗﺎﺑﻞ اﺳﺘﻔﺎده ﻧﯿﺴﺘﻨﺪ‪.‬‬
‫‪real-time‬‬
‫‪Student ID:‬‬
‫‪Student Name:‬‬
‫‪ Uniform‬از آﻧﺠﺎﯾﯿﮑﻪ ﮐﺎراﯾﯽ اﯾﻦ روش ﺑﺮاي ﻣﻨﺎﺑﻊ ﺑﺪون ﺣﺎﻓﻈﻪ ﺑﺴﯿﺎر ﻧﺰدﯾﮏ ﺑﻪ دو روش ﻗﺒﻠﯽ اﺳﺖ و ﺑﻪ دﻟﯿﻞ‬
‫ﺳﺎدﮔﯽ و ﻣﺤﺎﺳﺒﺎت ﮐﻤﺘﺮ در ﺑﯿﺸﺘﺮ ﮐﺎرﺑﺮدﻫﺎ از اﯾﻦ روش اﺳﺘﻔﺎده ﻣﯽﺷﻮد‪ .‬و در اداﻣﻪ آن ﯾﮏ ﻣﺎژول‬
‫‪entropy‬‬
‫‪ coder‬ﺑﺮاي ﻓﺸﺮدهﺳﺎزي ﺳﯿﮕﻨﺎل ﻗﺮار ﻣﯽدﻫﻨﺪ‪.‬‬
‫‪ (3‬در ﻓﺸﺮدهﺳﺎزي ﺻﺪا از ﭼﻪ ﺧﺼﻮﺻﯿ‪‬ﺎت ﺻﺪا و ﮔﻮش اﻧﺴﺎن اﺳﺘﻔﺎده ﻣﯽﺷﻮد؟ )‪ 15‬ﻧﻤﺮه(‬
‫ﻣﻨﺒﻊ ‪(36-33) MMAudioIntro.pdf‬‬
‫ﺧﺼﻮﺻﯿ‪‬ﺎت ﮔﻮش اﻧﺴﺎن‪:‬‬
‫‪ .1‬اﺳﺘﻔﺎده از ﺣﺴ‪‬ﺎﺳﯿ‪‬ﺖ ﻣﺘﻔﺎوت ﮔﻮش اﻧﺴﺎن ﺑﻪ ﺳﯿﮕﻨﺎلﻫﺎي ﺑﺎ ﻓﺮﮐﺎﻧﺲ ﻣﺨﺘﻠﻒ )اﺧﺘﺼﺎص ﺗﻌﺪاد ﺑﯿﺖ‬
‫ﺑﯿﺸﺘﺮ ﺑﻪ ﻓﺮﮐﺎﻧﺲﻫﺎي ﺑﺎ ﺣﺴ‪‬ﺎﺳﯿ‪‬ﺖ ﺑﯿﺸﺘﺮ و ﺑﺮﻋﮑﺲ(‬
‫‪ .2‬اﺳﺘﻔﺎده از ‪ :Frequency masking‬ﮐﺪ ﻧﮑﺮدن ﺳﯿﮕﻨﺎل ﻣﺎﺳﮏ ﺷﺪه‪:‬‬
‫‪ :Temporal Masking .3‬ﮐﺪ ﻧﮑﺮدن آن ﺑﺨﺶ از ﺳﯿﮕﻨﺎل ﮐﻪ ﻣﺎﺳﮏ ﺷﺪه اﺳﺖ‪ .‬اﮔﺮ ﯾﮏ ﺻﺪاي ﺑﻠﻨﺪي‬
‫ﺑﺸﻨﻮﯾﻢ و ﺳﭙﺲ آن ﺻﺪا ﻣﺘﻮﻗﻒ ﺷﻮد‪ ،‬ﻣﺪ‪‬ﺗﯽ ﻃﻮل ﻣﯽﮐﺸﺪ ﺗﺎ ﮔﻮش ﻣﺎ ﺑﺘﻮاﻧﺪ ﺻﺪاﻫﺎي ﺑﺎ ﮐﻮﺗﺎهﺗﺮ‬
‫ﺑﻌﺪي را ﺑﺸﻨﻮد‪.‬‬
‫ﺧﺼﻮﺻﯿ‪‬ﺎت ﺻﺪا‪:‬‬
‫‪ .1‬در ﻓﺸﺮدهﺳﺎزي ﺻﺪا ﻫﺪف ﮐﺎﻫﺶ‬
‫‪redundancy‬‬
‫آن اﺳﺖ‪ .‬اﯾﻦ ﮐﺎر ﺑﺎ روشﻫﺎي ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن‬
‫‪DPCM‬‬
‫اﻧﺠﺎم ﻣﯽﺷﻮد‪ .‬ﺑﻪ ﺷﮑﻠﯽ ﮐﻪ ﺑﺎ ﺗﻮﺟ‪‬ﻪ ﺑﻪ ﺷﺒﺎﻫﺖ ﻣﻘﺪار ﮐﻨﻮﻧﯽ ﺑﺎ ﻣﻘﺪار ﮔﺬﺷﺘﻪ آن ﺗﻨﻬﺎ ﺗﻔﺎوت آن را ﮐﺪ‬
‫ﻣﯽﮐﻨﻨﺪ‪ .‬ﻫﻤﭽﻨﯿﻦ روش دﯾﮕﺮ ﮐﺪ ﮐﺮدن ﺻﺪا ﺑﺮﺣﺴﺐ ﭘﺎﯾﻪﻫﺎي ﻓﺮﮐﺎﻧﺴﯽ ﺳﯿﮕﻨﺎل و اﻓﺰوﻧﮕﯽ اﯾﻦ ﺣﻮزه‬
‫‪Student Name:‬‬
‫‪Student ID:‬‬
‫ص ﻓﺮﮐﺎﻧﺴﯽ )‪ (formant‬ﺑﺎﺷﺪ ﻣﯽﺗﻮان ﺻﺪا‬
‫ﺑﺎﺷﺪ‪ .‬ﻣﺜﻼً اﮔﺮ ﺻﺪا ﻣﺜﻞ ﺻﻮت اﻧﺴﺎن ﺗﻨﻬﺎ ﺷﺎﻣﻞ اﻟﮕﻮﻫﺎي ﺧﺎ ‪‬‬
‫را ﺑﺮاﺳﺎس اﯾﻦ ‪ formant‬ﻫﺎ ﮐﺪ ﮐﺮد‪.‬‬
‫‪ (4‬اﻟﻒ( دﯾﺎﮔﺮام ﺑﻠﻮﮐﯽ ﯾﮏ ‪ JPEG Encoder‬را رﺳﻢ ﮐﻨﯿﺪ )‪ 3‬ﻧﻤﺮه(‬
‫ﻣﻨﺒﻊ ‪ MMpart1.pdf‬ﺻﻔﺤﻪ ‪107‬‬
‫ب( دﻟﯿﻞ اﺳﺘﻔﺎده از ﺗﺒﺪﯾﻞ‪ ،‬ﺧﺼﻮﺻ ًﺎ ﺗﺒﺪﯾﻞ ‪ DCT‬در اﯾﻦ ‪ Encoder‬ﭼﯿﺴﺖ؟ )‪ 5‬ﻧﻤﺮه(‬
‫از ﺗﺒﺪﯾﻞ ﺑﺮاي ﺑﺎزﻧﻤﺎﯾﯽ ﺳﯿﮕﻨﺎل در ﯾﮏ ﻓﻀﺎي ﺟﺪﯾﺪ اﺳﺘﻔﺎده ﻣﯽﮐﻨﯿﻢ ﺑﺎ ﻫﺪف ﯾﺎﻓﺘﻦ ﻣﺸﺨّﺼﺎت ﺟﺪﯾﺪ ﯾﺎ‬
‫ﻧﻤﺎﯾﺶ ﺑﻬﺘﺮ آﻧﻬﺎ و ﻓﺸﺮدهﺳﺎزي‪ .‬در اﯾﻦ‬
‫‪DCT‬‬
‫‪Encoder‬‬
‫ﺟﻬﺖ رﺳﯿﺪن ﺑﻪ ﻧﺮخ ﻓﺸﺮدهﺳﺎزي ﺑﺎﻻﺗﺮ از ﺗﺒﺪﯾﻞ‬
‫اﺳﺘﻔﺎده ﻣﯽﺷﻮد ﺗﺎ اﻃّﻼﻋﺎت ﺳﯿﮕﻨﺎل ﺗﺼﻮﯾﺮ را در ﺿﺮاﯾﺐ ﮐﻤﺘﺮي ﺟﻤﻊآوري ﮐﻨﻨﺪ )‬
‫‪ (Compaction‬و ﺳﭙﺲ در‬
‫‪Quantization‬‬
‫ﺳﯿﮕﻨﺎل اﯾﺠﺎد ﺷﻮد‪ .‬ﻫﻤﭽﻨﯿﻦ ﺗﺒﺪﯾﻞ‬
‫‪DCT‬‬
‫و‬
‫‪ZigZag Coding‬‬
‫‪Energy‬‬
‫ﺑﺎ ﺣﺬف ﺿﺮاﯾﺐ ﺑﺎﻻﺗﺮ ﺧﻄﺎي ﮐﻤﺘﺮي در‬
‫ﺑﺪﻟﯿﻞ ﺗﻮﻟﯿﺪ ﺧﺮوﺟﯽ ﺣﻘﯿﻘﯽ ﺑﻪ ازاي ورودي ﺣﻘﯿﻘﯽ‪ ،‬وﺟﻮد‬
‫ﭘﯿﺎدهﺳﺎزيﻫﺎي ﺳﺮﯾﻊ‪ ،‬و اﻧﺮژي ﺳﯿﮕﻨﺎل را در ﭘﺎﯾﻪﻫﺎي ﻓﻀﺎي ﺧﺮوﺟﯽ ﺑﻪ ﺧﻮﺑﯽ ﺟﻤﻊ ﻣﯽﮐﻨﺪ )ﺑﺴﯿﺎر‬
‫ﺷﺒﯿﻪ ‪ KLT‬اﺳﺖ(‪.‬‬
‫ج( ‪ Quantization‬در اﯾﻦ روش ﭼﮕﻮﻧﻪ اﻧﺠﺎم ﻣﯽﺷﻮد؟ )‪ 5‬ﻧﻤﺮه(‬
‫ﺑﺎ اﺳﺘﻔﺎده از ﺗﻘﺴﯿﻢ دادهﻫﺎي ﺑﺪﺳﺖآﻣﺪه در ﻣﺮﺣﻠﻪ ﻗﺒﻞ ﺑﺮ ﻣﺎﺗﺮﯾﺲ ‪ Normalization‬ﺑﺪﺳﺖ ﻣﯽآﯾﺪ‪ .‬اﻋﺪاد‬
‫ﻣﻮﺟﻮد در اﯾﻦ ﻣﺎﺗﺮﯾﺲ ﻣﯿﺰان ﭘﻠّﻪ ‪ Quantization‬را ﺑﻪ ازاي ﻫﺮ دراﯾﻪ ﻣﺎﺗﺮﯾﺲ ﺗﺒﺪﯾﻞ ﺷﺪه از ﻣﺮﺣﻠﻪ ﻗﺒﻞ‬
‫ﺗﻌﯿﯿﻦ ﻣﯽﮐﻨﻨﺪ‪ .‬ﻟﺬا ﺑﺎ ﺗﻐﯿﯿﺮ اﻋﺪاد اﯾﻦ ﻣﺎﺗﺮﯾﺲ ﻣﯽﺗﻮان ﮐﯿﻔ ﯿ‪‬ﺖ ﺗﺼﻮﯾﺮ را ﺗﻐﯿﯿﺮ داد‪.‬‬
‫د( ﭼﻬﺎر دﺳﺘﻪ ﭘﺎراﻣﺘﺮ ﺗﺄﺛﯿﺮﮔﺬار روي ﻃﺮّاﺣﯽ ﻣﮑﺎﻧﯿﺰم ‪ Quantization‬در اﯾﻦ روش را ﻧﺎم ﺑﺮده ﺑﻪ ازاي ﻫﺮ‬
‫ﮐﺪام ﺣﺪاﻗﻞ دو ﻧﻤﻮﻧﻪ ﻣﺜﺎل ﺑﺰﻧﯿﺪ‪ 12) .‬ﻧﻤﺮه(‬
‫ﻣﻨﺒﻊ ‪ MMPart1.pdf‬ﺻﻔﺤﻪ ‪.125‬‬
‫‪ .1‬ﺧﺼﻮﺻﯿ‪‬ﺎت ﺗﺼﻮﯾﺮ )ﻧﻮﯾﺰ‪ ،‬وﺿﻮح‪ ،‬ﺟﺰﺋﯿﺎت ﺗﺼﻮﯾﺮ(‬
‫‪ .2‬ﺧﺼﻮﺻﯿ‪‬ﺎت ﻧﻤﺎﯾﺸﮕﺮ )‪ ،MTF ،Dynamic Range‬ﻧﻮﯾﺰ(‬
‫‪ .3‬ﺷﺮاﯾﻂ ﻣﺸﺎﻫﺪه )ﻓﺎﺻﻠﻪ ﻣﺸﺎﻫﺪه‪ ،‬ﻣﯿﺰان ﻧﻮر ﻣﺤﯿﻂ(‬
‫‪Student Name:‬‬
‫‪Student ID:‬‬
‫‪ .4‬رﻧﮓ )ﮐﺪﯾﻨﮓ رﻧﮓ ‪ ،HVS‬درﯾﺎﻓﺖ رﻧﮓ ‪(HVS‬‬
‫‪ (5‬اﻟﻒ( ﺗﻔﺎوت ﺳﻪ ﻓﻀﺎي رﻧﮓ ‪ YCrCb ،RGB‬و ‪ HSV‬را ﺗﻮﺿﯿﺢ دﻫﯿﺪ؟ )‪ 6‬ﻧﻤﺮه(‬
‫ﻣﻨﺒﻊ‬
‫‪Color spaces (lecture 9).pdf‬‬
‫ﻓﻀﺎي رﻧﮓ ‪ :RGB‬ﺷﺎﻣﻞ رﻧﮓﻫﺎي ﻗﺮﻣﺰ‪ ،‬ﺳﺒﺰ‪ ،‬و آﺑﯽ اﺳﺖ و از ﻧﻮع ﺟﻤﻊﭘﺬﯾﺮ اﺳﺖ در ﺳﯿﺴﺘﻢﻫﺎي ﻧﻤﺎﯾﺶ‬
‫ﺗﺼﻮﯾﺮ و وﯾﺪﯾﻮ اﺳﺘﻔﺎده ﻣﯽﺷﻮد‪ .‬ﭘﯿﺎدهﺳﺎزي و ﮐﺎرﺑﺮد آن آﺳﺎن اﺳﺖ وﻟﯽ ﻣﻨﻄﺒﻖ ﺑﺎ ﻣﯿﺰان ﺣﺴ‪‬ﺎﺳﯿ‪‬ﺖ ﭼﺸﻢ‬
‫اﻧﺴﺎن ﻧﯿﺴﺖ‪ .‬ﻫﻤﭽﻨﯿﻦ ﻣﻤﮑﻦ اﺳﺖ ﺗﺮﮐﯿﺐﻫﺎي ﻣﺨﺘﻠﻔﯽ از ﻣﻘﺎدﯾﺮ آن ﯾﮏ رﻧﮓ را ﺗﻮﻟﯿﺪ ﮐﻨﻨﺪ )ﺟﻤﻊ ﻣﯿﺰان‬
‫اﻧﺮژي ﺳﯿﮕﻨﺎل درﯾﺎﻓﺘﯽ در ﭼﺸﻢ اﻧﺴﺎن ﯾﮑﺴﺎن ﻣﯽﺷﻮد(‬
‫ﻓﻀﺎي رﻧﮓ ‪ :YCbCr‬اﯾﻦ ﻓﻀﺎي رﻧﮕﯽ ﻋﻤﺪﺗ ًﺎ در ﺗﺼﺎوﯾﺮ وﯾﺪﯾﻮي دﯾﺠﯿﺘﺎل و در ﮐﺎرﺑﺮدﻫﺎﯾﯽ ﮐﻪ روي اﯾﻦ‬
‫ﺗﺼﺎوﯾﺮ اﻧﺠﺎم ﻣﯽﺷﻮد‪ ،‬ﻣﻮرد اﺳﺘﻔﺎده ﻗﺮار ﻣﯽﮔﯿﺮد‪ .‬در اﯾﻦ ﻓﻀﺎي رﻧﮕﯽ ‪ Y‬ﻟﻮﻣﯿﻨﺎﻧﺲ )ﻣﯿﺰان روﺷﻨﺎﯾﯽ( ﺑﻮده و‬
‫‪Cb‬‬
‫و‬
‫‪Cr‬‬
‫ﻧﺸﺎﻧﺪﻫﻨﺪه ﮐﺮوﻣﯿﻨﺎﻧﺲ )رﻧﮓ( ﻫﺴﺘﻨﺪ‪ .‬ﺑﺎ ﺗﻮﺟ‪‬ﻪ ﺑﻪ ﺣﺴ‪‬ﺎﺳﯿ‪‬ﺖ ﺑﯿﺸﺘﺮ ﭼﺸﻢ اﻧﺴﺎن ﺑﻪ ﻣﯿﺰان روﺷﻨﺎﯾﯽ‬
‫ﺗﺼﻮﯾﺮ ﺟﺪاﺳﺎزي ﻣﯿﺰان روﺷﻨﺎﯾﯽ اﻣﮑﺎن ﻓﺸﺮدهﺳﺎزي ﺑﺎ ﮐﯿﻔﯿ‪‬ﺖ ﺑﻬﺘﺮ )از ﻧﻈﺮ اﻧﺴﺎن( را ﻣﯽدﻫﺪ‪ .‬ﻫﻤﭽﻨﯿﻦ‬
‫ﺳﯿﺴﺘﻢﻫﺎي ﺳﯿﺎه و ﺳﻔﯿﺪ ﺑﺪون ﺗﻐﯿﯿﺮ ﺳﯿﮕﻨﺎل ﻣﯽﺗﻮاﻧﻨﺪ ﺗﻨﻬﺎ از ﺑﺨﺶ ‪ Y‬آن اﺳﺘﻔﺎده ﮐﻨﻨﺪ‪.‬‬
‫‪ :HSV‬ﺑﻪ دﻟﯿﻞ ﺷﺒﺎﻫﺖ آن ﺑﻪ ﺳﯿﺴﺘﻢ ﺑﯿﻨﺎﯾﯽ اﺳﻨﺎن ﺟﻬﺖ ﭘﺮدازش ﺗﺼﻮﯾﺮ ﺑﻪ ﮐﺎر ﻣﯽرود‪ .‬ﭼﺮاﮐﻪ دو ﭘﺎراﻣﺘﺮ‬
‫‪H‬‬
‫)ﺗﻪ رﻧﮓ( و ‪) S‬اﺷﺒﺎع رﻧﮕﯽ( ﺑﻪ ﺷﯿﻮهاي ﮐﻪ اﻧﺴﺎن رﻧﮓ را ﺗﺸﺨﯿﺺ ﻣﯽدﻫﺪ‪ ،‬ﺑﺴﯿﺎر ﻧﺰدﯾﮏ اﺳﺖ‪ .‬ﻫﻤﭽﻨﯿﻦ از‬
‫آﻧﺠﺎﯾﯿﮑﻪ ﻣﯿﺰان روﺷﻨﺎﯾﯽ ﻧﯿﺰ )ﺑﻪ ﻧﺤﻮي ﺧﺎص( از ﭘﺎراﻣﺘﺮﻫﺎي رﻧﮕﯽ ﺟﺪا ﺷﺪه اﺳﺖ اﻣﮑﺎن ﭘﺮدازش روي‬
‫روﺷﻨﺎﯾﯽ را ﺑﻬﺘﺮ ﻓﺮاﻫﻢ ﻣﯽﮐﻨﺪ‪ .‬اﯾﻦ ﻓﻀﺎي رﻧﮕﯽ ﺑﺴﯿﺎر ﺷﻬﻮدي اﺳﺖ و رﻧﮓﻫﺎ را در ﻓﻀﺎﯾﯽ ﮐﺮوي )ﻧﻪ‬
‫ﮐﺎرﺗﺰﯾﻦ( ﺗﻮﺻﯿﻒ ﻣﯽﮐﻨﺪ‪.‬‬
‫ب( در ‪ H.263‬از ﮐﺪام ﯾﮏ از اﯾﻦ ﻓﻀﺎي رﻧﮓﻫﺎ اﺳﺘﻔﺎده ﻣﯽﺷﻮد ﭼﺮا؟ )‪ 5‬ﻧﻤﺮه(‬
‫ﻣﻨﺒﻊ‬
‫‪H263.pdf‬‬
‫ﺻﻔﺤﻪ ‪ .26-28‬از ﻓﻀﺎي رﻧﮓ‬
‫‪YCbCr‬‬
‫اﺳﺘﻔﺎده ﻣﯽﺷﻮد ﭼﺮاﮐﻪ ﺑﺎ ﺗﻮﺟ‪‬ﻪ ﺑﻪ اﯾﻨﮑﻪ ﭼﺸﻢ‬
‫اﻧﺴﺎن ﺣﺴ‪‬ﺎﺳﯿ‪‬ﺖ ﮐﻤﺘﺮي ﻧﺴﺒﺖ ﺑﻪ رﻧﮓ )‪ (CbCr‬دارد ﺗﺎ روﺷﻨﺎﯾﯽ‪ ،‬ﻣﯽﺗﻮاﻧﯿﻢ اﻃّﻼﻋﺎت ﻣﺮﺑﻮط ﺑﻪ رﻧﮓ را‬
‫ﺑﺎ ﻧﺮخ ﮐﻤﺘﺮي )‪ subsample‬ﻣﯽﮐﻨﻨﺪ( ارﺳﺎل ﮐﻨﯿﻢ‪.‬‬
‫ج( ﺳﻪ ﻣﻮرد ﺑﻬﺒﻮد در‬
‫‪Advance Prediction Mode‬‬
‫در‬
‫‪H.263‬‬
‫ﮐﻪ در ﻣﻮرد‬
‫‪Motion Vector‬‬
‫ﻫﺎ ا‪‬ﻋﻤﺎل‬
‫ﻣﯽﺷﻮد را ﺑﺎ رﺳﻢ ﺷﮑﻞ ﺗﻮﺿﯿﺢ دﻫﯿﺪ‪ 9) .‬ﻧﻤﺮه(‬
‫ﻣﻨﺒﻊ ‪ H263.pdf‬ﺻﻔﺤﻪ ‪ 47‬ﺗﺎ ‪58‬‬
‫‪.1‬‬
‫‪Vector‬‬
‫‪ :Unrestricted Motion‬ﺑﻪ ﺑﺮدارﻫﺎي ﺣﺮﮐﺘﯽ اﻣﮑﺎن اﺷﺎره ﺑﻪ ﺧﺎرج ﻣﺮزﻫﺎي ﺗﺼﻮﯾﺮ را ﻧﯿﺰ‬
‫ﻣﯽدﻫﺪ‪ .‬در اﯾﻦ ﻓﺮآﯾﻨﺪ ﺑﻪ ﺟﺎي ﭘﯿﮑﺴﻞ ﻫﺎﯾﯽ ﮐﻪ وﺟﻮد ﻧﺪارﻧﺪ ﭘﯿﮑﺴﻞﻫﺎي ﻟﺒﻪ را ﺗﮑﺮار ﻣﯽﮐﻨﻨﺪ‪ .‬اﯾﻦ‬
‫ﮐﺎر ﻓﺸﺮدهﺳﺎزي را زﻣﺎﻧﯽ ﮐﻪ ﮐﻪ ﺣﺮﮐﺘﯽ دارﯾﻢ ﮐﻪ از ﻟﺒﻪ ﺗﺼﻮﯾﺮ رد ﻣﯽﺷﻮد ﺑﻬﺒﻮد ﻣﯽدﻫﺪ‪.‬‬
‫‪Student Name:‬‬
‫‪Student ID:‬‬
‫‪ :Extended Motion Vector .2‬ﻣﯽﺗﻮان ﺑﺎزه ﺑﺮدارﻫﺎي ﺣﺮﮐﺘﯽ را از ]‪ [16,25.5‬ﺗﺎ ]‪) [-31.5,31.5‬ﺑﺎ ﺑﻌﻀﯽ‬
‫ﻣﺤﺪودﯾ‪‬ﺖﻫﺎ( ﮔﺴﺘﺮش داد‪ .‬اﯾﻦ ﮐﺎر ﺻﺤﻨﻪﻫﺎي ﺑﺎ ﭘﺮﺗﺤﺮّك را ﺑﻬﺘﺮ ﮐﺪ ﻣﯽﮐﻨﺪ‪.‬‬
‫‪ .3‬اﻣﮑﺎن اﺳﺘﻔﺎده از ‪ 4‬ﺑﺮدار ﺣﺮﮐﺘﯽ ﺑﺮاي ﺑﻠﻮكﻫﺎي‬
‫‪.4‬‬
‫ﺑﻠﻮكﻫﺎي ‪16*16‬‬
‫‪Overlapped Motion Compensation‬‬
‫‪8*8‬‬
‫ﺑﻪ ﺟﺎي اﺳﺘﻔﺎده از ﯾﮏ ﺑﺮدار ﺣﺮﮐﺘﯽ ﺑﺮاي‬