Student Name: Student ID: In The Name of God, The Merciful, The Compassionate Multimedia Systems: CE 40-342 - Fall 2008 Department of Computer Engineering Sharif University of Technology Midterm (90 Minutes: Good Luck!): H. R. Rabiee ﺗﻮﺟﻪ :ﻧﺎم و ﺷﻤﺎره داﻧﺸﺠﻮﯾﯽ ﺧﻮد را ﺣﺘﻤﺎً ﺑﻨﻮﯾﺴﯿﺪ 5 .ﻧﻤﺮه ،ﻧﻤﺮه اﺿﺎﻓﻪ در ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪه اﺳﺖ. (1اﻟﻒ( آﻧﺘﺮوﭘﯽ ﭼﯿﺴﺖ؟ ) 4ﻧﻤﺮه( ﻣﺘﻮﺳﻂ ﻣﯿﺰان اﻃّﻼﻋﺎﺗﯽ ﮐﻪ از ﻫﺮ ﻋﻼﻣﺖ ﯾﮏ ﻣﻨﺒﻊ ﻋﻼﻣﺖ ﺑﺪﺳﺖ ﻣﯽآﯾﺪ را آﻧﺘﺮوﭘﯽ آن ﮔﻮﯾﻨﺪ و از ﻓﺮﻣﻮل زﯾﺮ ﻣﺤﺎﺳﺒﻪ ﻣﯽﺷﻮد: ﮐﻪ ) p(siاﺣﺘﻤﺎل رﺧﺪاد ﻋﻼﻣﺖ siو ) I(siﻣﯿﺰان اﻃّﻼﻋﺎت آن و ﻣﻌﺎدل ﻣﻌﮑﻮس اﺣﺘﻤﺎل رﺧﺪاد آن اﺳﺖ. ﻣﻨﺒﻊ )MMPart1.pdf ﺻﻔﺤﻪ (22-21 ب( آﻧﺘﺮوﭘﯽ ﯾﮏ ﻣﻨﺒﻊ ﻗﻄﻌﯽ ) (deterministicرا ﻣﺤﺎﺳﺒﻪ ﮐﻨﯿﺪ ) 3ﻧﻤﺮه( از آﻧﺠﺎﯾﯿﮑﻪ ﻣﻨﺒﻊ ﻗﻄﻌﯽ اﺳﺖ ﭘﺲ ﻗﻄﻌﺎً )ﺑﻪ اﺣﺘﻤﺎل (1ﻣﯽداﻧﯿﻢ ﻋﻼﻣﺖ ﺑﻌﺪي ﭼﯿﺴﺖ ﻟﺬا دارﯾﻢ H(S)= S(p(si)*I(si))= S(1*0)=0 ج( آﻧﺘﺮوﭘﯽ ﯾﮏ ﻣﻨﺒﻊ در ﭼﻪ ﺣﺎﻟﺘﯽ ﺑﯿﺸﯿﻨﻪ اﺳﺖ؟ آن را ﻣﺤﺎﺳﺒﻪ ﮐﻨﯿﺪ 3) .ﻧﻤﺮه( زﻣﺎﻧﯽ ﮐﻪ اﺣﺘﻤﺎل ﻫﻤﻪ ﮔﺮهﻫﺎ ﻣﺴﺎوي ﺑﺎﺷﺪ .ﭼﺮاﮐﻪ ﻫﯿﭻﮔﻮﻧﻪ اﻃّﻼﻋﺎﺗﯽ در ﻣﻮرد داده ﺑﻌﺪي ﺑﻪ ﮔﯿﺮﻧﺪه ﻣﻨﺘﻘﻞ ﻧﻤﯽﮐﻨﺪ. H(S)= S(p(si)*I(si))= S(1/n*lgn)=lgn د( ﺟﺪول ﻋﻼﻣﺎت ﺑﻪ ازاي ﻫﺮ دو ﺣﺮف داده ﺷﺪه اﺳﺖ .ﮐﺪ ﻫﺎﻓﻤﻦ ﺑﺮاي ﻫﺮ دو ﺣﺮف را ﺑﺪﺳﺖ آورده، ﺑﺎزده ﻣﻨﺒﻊ زﯾﺮ را ﺣﺴﺎب ﮐﻨﯿﺪ ) 12ﻧﻤﺮه(: ﺟﺪول :1اﺣﺘﻤﺎل ﺗﻮﻟﯿﺪ ﻫﺮ ﻋﻼﻣﺖ در ﻣﻨﺒﻊ )ﻋﻼﻣﺖ ﺷﺎﻣﻞ دو ﺣﺮف اﺳﺖ( ، %3 da ، %3 ca ،%18 ba %36 ،%1.5 db ،%1.5 cb ، %9 bb ،%18 ،%0.25 dc cc ،%0.25 ،%1.5 bc ac ،%3 ،%0.25 dd cd ،%1.5 bd ، %3 ،%0.25 aa ، ab ad Student ID: Student Name: اﯾﻦ ﺳﺆال ﻣﺜﺎل اﺳﻼﯾﺪﻫﺎ اﺳﺖ ) MMPart1.pdfﺻﻔﺤﻪ (32 ∑ )( ∗ = 1.43 2 ) ( 1.4 = = 0.98 1.43 = = ﺗﻮﺟﻪ ﮐﻨﯿﺪ ﮐﻪ ﭼﻮن ﻋﻼﻣﺎت دو ﺣﺮﻓﯽ را ﮐﺪ ﮐﺮدهاﯾﻢ ﻣﺘﻮﺳﻂ ﺗﻌﺪاد ﺑﯿﺖ ﺑﻪ ازاي ﻫﺮ ﺣﺮف ﻧﺼﻒ ﻣﺘﻮﺳﻂ ﻃﻮل ﮐﺪ ﺑﺪﺳﺖ آﻣﺪه ﺧﻮاﻫﺪ ﺑﻮد .ﺑﺪﻟﯿﻞ ﻣﺤﺎﺳﺒﺎت زﯾﺎد ﻣﻘﺪار ) H(sﺳﺮ ﺟﻠﺴﻪ اﻣﺘﺤﺎن ﺑﻪ داﻧﺸﺠﻮﯾﺎن داده ﺷﺪ. (2اﻟﻒ( ﺗﻔﺎوت Quantizerﻫﺎي زﯾﺮ را ﻫﻤﺮاه ﺑﺎ رﺳﻢ ﺷﮑﻞ ﺑﺮاي ﻫﺮ ﮐﺪام ﺗﻮﺿﯿﺢ دﻫﯿﺪ 9) .ﻧﻤﺮه( ﻣﻨﺒﻊ 78 -74 در MMPart1.pdf Uniform Quantizer ﺳﻄﻮح ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن در ﻓﻮاﺻﻞ ﯾﮑﺴﺎﻧﯽ از ﻫﻢ ﻗﺮار دارﻧﺪ )اﻧﺪازه ﮔﺎمﻫﺎ ﺑﺎ ﻫﻢ ﺑﺮاﺑﺮ اﺳﺖ( وﻟﯽ در Lloyd-Max quantizerﻣﯽﺧﻮاﻫﯿﻢ ﺧﻄﺎﯾﯽ ﺣﺎﺻﻞ از ﻋﻤﻞ ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن را ﺑﺎ داﺷﺘﻦ Nﭘﻠّﻪ ﮐﻤﯿﻨﻪ ﮐﻨﯿﻢ .زﻣﺎﻧﯽ ﮐﻪ اﯾﻦ ﺧﻄﺎ را ﺑﺮاﺳﺎس ﻣﻌﯿﺎر MSEﻣﺤﺎﺳﺒﻪ ﮐﻨﯿﻢ ﺑﻪ آن Lloyd-Max quantizerﻣﯽﮔﻮﯾﻨﺪ. در واﻗﻊ اﮔﺮ ﺑﻪ ازاي ﻣﻘﺪار xﮐﻪ ﺑﻪ ) riﺳﻄﺢ iام ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن( ﻧﮕﺎﺷﺖ ﺷﺪه ﻣﯿﺰان ﺧﻄﺎ ﺑﺮاﺑﺮ ﺑﺎ (x-ri)2 Student ID: Student Name: در ﻧﻈﺮ ﺑﮕﯿﺮﯾﻢ و ﻣﻘﺪار xﺑﻪ اﺣﺘﻤﺎل ) p(xدر ﺳﯿﮕﻨﺎل ﻣﺎ وﺟﻮد داﺷﺘﻪ ﺑﺎﺷﺪ ﻣﯽﺧﻮاﻫﯿﻢ ﻣﺠﻤﻮع ﺧﻄﺎ در ﺳﯿﮕﻨﺎل ﺑﺎزﺳﺎزي ﺷﺪه را ﮐﻤﯿﻨﻪ ﮐﻨﯿﻢ. ﻼ در ﺷﮑﻞ زﯾﺮ ﭼﻮن دادهﻫﺎي زﯾﺎدي داﺷﺘﻪاﯾﻢ ﮐﻪ در ﺳﻄﻮح ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن ﺣﻮل ﺻﻔﺮ ﺑﻮدﻧﺪ )اﺣﺘﻤﺎل ﻣﺜ ً ﺳﻄﻮح ﺣﻮل ﺻﻔﺮ ﺑﯿﺸﺘﺮ ﺑﻮده اﺳﺖ( اﯾﻦ ﺳﻄﻮح را رﯾﺰﺗﺮ ﮐﺮدهاﯾﻢ ﺗﺎ ﺧﻄﺎي دادهﻫﺎي ﻣﻮﺟﻮد در اﯾﻦ ﺑﺎزه ﮐﻤﺘﺮ ﺷﻮد. زﻣﺎﻧﯽ ﻣﻨﺎﺳﺐ اﺳﺖ ﮐﻪ ﺳﻄﻮح ﺧﺮوﺟﯽ ﺑﻪ ﺻﻮرت ﮐﺪﻫﺎﯾﯽ ﺑﺎ ﻃﻮل ﺛﺎﺑﺖ ﮐﺪ ﺷﻮﻧﺪ. در Entropy-Constrained Quantizerزﻣﺎﻧﯽ ﮐﻪ اﻣﮑﺎن ﮐﺪﮐﺮدن ﺑﺎ ﻃﻮل ﻣﺘﻐﯿﺮ وﺟﻮد داﺷﺘﻪ ﺑﺎﺷﺪ ،ﻫﺪف ﻋﻼوه ﺑﺮ ﮐﻢ ﮐﺮدن ﺧﻄﺎي ﻧﺎﺷﯽ از ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن ،ﮐﻢ ﮐﺮدن آﻧﺘﺮوﭘﯽ ﮐﺪﻫﺎي ﺗﻮﻟﯿﺪي ﭘﺲ از آن اﺳﺖ ﺑﻪ ﺷﮑﻠﯽ ﮐﻪ آﻧﺘﺮوﭘﯽ ﮐﺪﻫﺎي ﺧﺮوﺟﯽ ﺑﺮاﺑﺮ ﺑﺎ ﯾﮏ ﻣﻘﺪار از ﭘﯿﺶ ﺗﻌﯿﯿﻦ ﺷﺪه ﺑﺎﺷﺪ. ب( ﮐﺎرﺑﺮد ﻫﺮ ﯾﮏ را ﺑﻨﻮﯾﺴﯿﺪ ،در ﮐﺎرﺑﺮد از ﮐﺪام ﯾﮏ از ﻣﻮارد زﯾﺮ ﺑﯿﺸﺘﺮ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ .ﭼﺮا؟ )12 ﻧﻤﺮه( (a (b (c Uniform quantizer Lloyd-Max quantizer Entropy-constrained quantizer Entropy-constrained ﺑﺮاي زﻣﺎﻧﯽ اﺳﺖ ﻣﺤﺪودﯾﺘﯽ روي ﻣﯿﺰان آﻧﺘﺮوﭘﯽ ﮐﺪ ﺣﺎﺻﻞ دارﯾﻢ و ﻣﯽﺧﻮاﻫﯿﻢ ﺧﻄﺎي ﺑﺎزﺳﺎزي ﺳﯿﮕﻨﺎل ﮐﻤﯿﻨﻪ ﺑﺎﺷﺪ و ﻣﯽﺗﻮاﻧﯿﻢ ﮐﺪﻫﺎﯾﯽ ﺑﺎ ﻃﻮل ﻣﺘﻐﯿﺮ داﺷﺘﻪ ﺑﺎﺷﯿﻢ. Lloyd-Max ﺑﺮاي زﻣﺎﻧﯽ اﺳﺖ ﮐﻪ ﻣﯽﺧﻮاﻫﯿﻢ ﺧﻄﺎي ﺑﺎزﺳﺎزي ﺳﯿﮕﻨﺎل ﮐﻤﯿﻨﻪ ﺑﺎﺷﺪ و ﮐﺪﻫﺎي ﺗﻮﻟﯿﺪي ﻃﻮﻟﯽ ﺛﺎﺑﺖ دارﻧﺪ. در دو روش ﺑﺎﻻ ﺑﺎﯾﺪ ﺳﯿﮕﻨﺎل ورودي را از ﭘﯿﺶ داﺷﺘﻪ ﺑﺎﺷﯿﻢ .ﻟﺬا دو روش ﺑﺎﻻ در ﮐﺎرﺑﺮدﻫﺎي liveو ﻗﺎﺑﻞ اﺳﺘﻔﺎده ﻧﯿﺴﺘﻨﺪ. real-time Student ID: Student Name: Uniformاز آﻧﺠﺎﯾﯿﮑﻪ ﮐﺎراﯾﯽ اﯾﻦ روش ﺑﺮاي ﻣﻨﺎﺑﻊ ﺑﺪون ﺣﺎﻓﻈﻪ ﺑﺴﯿﺎر ﻧﺰدﯾﮏ ﺑﻪ دو روش ﻗﺒﻠﯽ اﺳﺖ و ﺑﻪ دﻟﯿﻞ ﺳﺎدﮔﯽ و ﻣﺤﺎﺳﺒﺎت ﮐﻤﺘﺮ در ﺑﯿﺸﺘﺮ ﮐﺎرﺑﺮدﻫﺎ از اﯾﻦ روش اﺳﺘﻔﺎده ﻣﯽﺷﻮد .و در اداﻣﻪ آن ﯾﮏ ﻣﺎژول entropy coderﺑﺮاي ﻓﺸﺮدهﺳﺎزي ﺳﯿﮕﻨﺎل ﻗﺮار ﻣﯽدﻫﻨﺪ. (3در ﻓﺸﺮدهﺳﺎزي ﺻﺪا از ﭼﻪ ﺧﺼﻮﺻﯿﺎت ﺻﺪا و ﮔﻮش اﻧﺴﺎن اﺳﺘﻔﺎده ﻣﯽﺷﻮد؟ ) 15ﻧﻤﺮه( ﻣﻨﺒﻊ (36-33) MMAudioIntro.pdf ﺧﺼﻮﺻﯿﺎت ﮔﻮش اﻧﺴﺎن: .1اﺳﺘﻔﺎده از ﺣﺴﺎﺳﯿﺖ ﻣﺘﻔﺎوت ﮔﻮش اﻧﺴﺎن ﺑﻪ ﺳﯿﮕﻨﺎلﻫﺎي ﺑﺎ ﻓﺮﮐﺎﻧﺲ ﻣﺨﺘﻠﻒ )اﺧﺘﺼﺎص ﺗﻌﺪاد ﺑﯿﺖ ﺑﯿﺸﺘﺮ ﺑﻪ ﻓﺮﮐﺎﻧﺲﻫﺎي ﺑﺎ ﺣﺴﺎﺳﯿﺖ ﺑﯿﺸﺘﺮ و ﺑﺮﻋﮑﺲ( .2اﺳﺘﻔﺎده از :Frequency maskingﮐﺪ ﻧﮑﺮدن ﺳﯿﮕﻨﺎل ﻣﺎﺳﮏ ﺷﺪه: :Temporal Masking .3ﮐﺪ ﻧﮑﺮدن آن ﺑﺨﺶ از ﺳﯿﮕﻨﺎل ﮐﻪ ﻣﺎﺳﮏ ﺷﺪه اﺳﺖ .اﮔﺮ ﯾﮏ ﺻﺪاي ﺑﻠﻨﺪي ﺑﺸﻨﻮﯾﻢ و ﺳﭙﺲ آن ﺻﺪا ﻣﺘﻮﻗﻒ ﺷﻮد ،ﻣﺪﺗﯽ ﻃﻮل ﻣﯽﮐﺸﺪ ﺗﺎ ﮔﻮش ﻣﺎ ﺑﺘﻮاﻧﺪ ﺻﺪاﻫﺎي ﺑﺎ ﮐﻮﺗﺎهﺗﺮ ﺑﻌﺪي را ﺑﺸﻨﻮد. ﺧﺼﻮﺻﯿﺎت ﺻﺪا: .1در ﻓﺸﺮدهﺳﺎزي ﺻﺪا ﻫﺪف ﮐﺎﻫﺶ redundancy آن اﺳﺖ .اﯾﻦ ﮐﺎر ﺑﺎ روشﻫﺎي ﮐﻮاﻧﺘﯿﺰاﺳﯿﻮن DPCM اﻧﺠﺎم ﻣﯽﺷﻮد .ﺑﻪ ﺷﮑﻠﯽ ﮐﻪ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﺷﺒﺎﻫﺖ ﻣﻘﺪار ﮐﻨﻮﻧﯽ ﺑﺎ ﻣﻘﺪار ﮔﺬﺷﺘﻪ آن ﺗﻨﻬﺎ ﺗﻔﺎوت آن را ﮐﺪ ﻣﯽﮐﻨﻨﺪ .ﻫﻤﭽﻨﯿﻦ روش دﯾﮕﺮ ﮐﺪ ﮐﺮدن ﺻﺪا ﺑﺮﺣﺴﺐ ﭘﺎﯾﻪﻫﺎي ﻓﺮﮐﺎﻧﺴﯽ ﺳﯿﮕﻨﺎل و اﻓﺰوﻧﮕﯽ اﯾﻦ ﺣﻮزه Student Name: Student ID: ص ﻓﺮﮐﺎﻧﺴﯽ ) (formantﺑﺎﺷﺪ ﻣﯽﺗﻮان ﺻﺪا ﺑﺎﺷﺪ .ﻣﺜﻼً اﮔﺮ ﺻﺪا ﻣﺜﻞ ﺻﻮت اﻧﺴﺎن ﺗﻨﻬﺎ ﺷﺎﻣﻞ اﻟﮕﻮﻫﺎي ﺧﺎ را ﺑﺮاﺳﺎس اﯾﻦ formantﻫﺎ ﮐﺪ ﮐﺮد. (4اﻟﻒ( دﯾﺎﮔﺮام ﺑﻠﻮﮐﯽ ﯾﮏ JPEG Encoderرا رﺳﻢ ﮐﻨﯿﺪ ) 3ﻧﻤﺮه( ﻣﻨﺒﻊ MMpart1.pdfﺻﻔﺤﻪ 107 ب( دﻟﯿﻞ اﺳﺘﻔﺎده از ﺗﺒﺪﯾﻞ ،ﺧﺼﻮﺻ ًﺎ ﺗﺒﺪﯾﻞ DCTدر اﯾﻦ Encoderﭼﯿﺴﺖ؟ ) 5ﻧﻤﺮه( از ﺗﺒﺪﯾﻞ ﺑﺮاي ﺑﺎزﻧﻤﺎﯾﯽ ﺳﯿﮕﻨﺎل در ﯾﮏ ﻓﻀﺎي ﺟﺪﯾﺪ اﺳﺘﻔﺎده ﻣﯽﮐﻨﯿﻢ ﺑﺎ ﻫﺪف ﯾﺎﻓﺘﻦ ﻣﺸﺨّﺼﺎت ﺟﺪﯾﺪ ﯾﺎ ﻧﻤﺎﯾﺶ ﺑﻬﺘﺮ آﻧﻬﺎ و ﻓﺸﺮدهﺳﺎزي .در اﯾﻦ DCT Encoder ﺟﻬﺖ رﺳﯿﺪن ﺑﻪ ﻧﺮخ ﻓﺸﺮدهﺳﺎزي ﺑﺎﻻﺗﺮ از ﺗﺒﺪﯾﻞ اﺳﺘﻔﺎده ﻣﯽﺷﻮد ﺗﺎ اﻃّﻼﻋﺎت ﺳﯿﮕﻨﺎل ﺗﺼﻮﯾﺮ را در ﺿﺮاﯾﺐ ﮐﻤﺘﺮي ﺟﻤﻊآوري ﮐﻨﻨﺪ ) (Compactionو ﺳﭙﺲ در Quantization ﺳﯿﮕﻨﺎل اﯾﺠﺎد ﺷﻮد .ﻫﻤﭽﻨﯿﻦ ﺗﺒﺪﯾﻞ DCT و ZigZag Coding Energy ﺑﺎ ﺣﺬف ﺿﺮاﯾﺐ ﺑﺎﻻﺗﺮ ﺧﻄﺎي ﮐﻤﺘﺮي در ﺑﺪﻟﯿﻞ ﺗﻮﻟﯿﺪ ﺧﺮوﺟﯽ ﺣﻘﯿﻘﯽ ﺑﻪ ازاي ورودي ﺣﻘﯿﻘﯽ ،وﺟﻮد ﭘﯿﺎدهﺳﺎزيﻫﺎي ﺳﺮﯾﻊ ،و اﻧﺮژي ﺳﯿﮕﻨﺎل را در ﭘﺎﯾﻪﻫﺎي ﻓﻀﺎي ﺧﺮوﺟﯽ ﺑﻪ ﺧﻮﺑﯽ ﺟﻤﻊ ﻣﯽﮐﻨﺪ )ﺑﺴﯿﺎر ﺷﺒﯿﻪ KLTاﺳﺖ(. ج( Quantizationدر اﯾﻦ روش ﭼﮕﻮﻧﻪ اﻧﺠﺎم ﻣﯽﺷﻮد؟ ) 5ﻧﻤﺮه( ﺑﺎ اﺳﺘﻔﺎده از ﺗﻘﺴﯿﻢ دادهﻫﺎي ﺑﺪﺳﺖآﻣﺪه در ﻣﺮﺣﻠﻪ ﻗﺒﻞ ﺑﺮ ﻣﺎﺗﺮﯾﺲ Normalizationﺑﺪﺳﺖ ﻣﯽآﯾﺪ .اﻋﺪاد ﻣﻮﺟﻮد در اﯾﻦ ﻣﺎﺗﺮﯾﺲ ﻣﯿﺰان ﭘﻠّﻪ Quantizationرا ﺑﻪ ازاي ﻫﺮ دراﯾﻪ ﻣﺎﺗﺮﯾﺲ ﺗﺒﺪﯾﻞ ﺷﺪه از ﻣﺮﺣﻠﻪ ﻗﺒﻞ ﺗﻌﯿﯿﻦ ﻣﯽﮐﻨﻨﺪ .ﻟﺬا ﺑﺎ ﺗﻐﯿﯿﺮ اﻋﺪاد اﯾﻦ ﻣﺎﺗﺮﯾﺲ ﻣﯽﺗﻮان ﮐﯿﻔ ﯿﺖ ﺗﺼﻮﯾﺮ را ﺗﻐﯿﯿﺮ داد. د( ﭼﻬﺎر دﺳﺘﻪ ﭘﺎراﻣﺘﺮ ﺗﺄﺛﯿﺮﮔﺬار روي ﻃﺮّاﺣﯽ ﻣﮑﺎﻧﯿﺰم Quantizationدر اﯾﻦ روش را ﻧﺎم ﺑﺮده ﺑﻪ ازاي ﻫﺮ ﮐﺪام ﺣﺪاﻗﻞ دو ﻧﻤﻮﻧﻪ ﻣﺜﺎل ﺑﺰﻧﯿﺪ 12) .ﻧﻤﺮه( ﻣﻨﺒﻊ MMPart1.pdfﺻﻔﺤﻪ .125 .1ﺧﺼﻮﺻﯿﺎت ﺗﺼﻮﯾﺮ )ﻧﻮﯾﺰ ،وﺿﻮح ،ﺟﺰﺋﯿﺎت ﺗﺼﻮﯾﺮ( .2ﺧﺼﻮﺻﯿﺎت ﻧﻤﺎﯾﺸﮕﺮ ) ،MTF ،Dynamic Rangeﻧﻮﯾﺰ( .3ﺷﺮاﯾﻂ ﻣﺸﺎﻫﺪه )ﻓﺎﺻﻠﻪ ﻣﺸﺎﻫﺪه ،ﻣﯿﺰان ﻧﻮر ﻣﺤﯿﻂ( Student Name: Student ID: .4رﻧﮓ )ﮐﺪﯾﻨﮓ رﻧﮓ ،HVSدرﯾﺎﻓﺖ رﻧﮓ (HVS (5اﻟﻒ( ﺗﻔﺎوت ﺳﻪ ﻓﻀﺎي رﻧﮓ YCrCb ،RGBو HSVرا ﺗﻮﺿﯿﺢ دﻫﯿﺪ؟ ) 6ﻧﻤﺮه( ﻣﻨﺒﻊ Color spaces (lecture 9).pdf ﻓﻀﺎي رﻧﮓ :RGBﺷﺎﻣﻞ رﻧﮓﻫﺎي ﻗﺮﻣﺰ ،ﺳﺒﺰ ،و آﺑﯽ اﺳﺖ و از ﻧﻮع ﺟﻤﻊﭘﺬﯾﺮ اﺳﺖ در ﺳﯿﺴﺘﻢﻫﺎي ﻧﻤﺎﯾﺶ ﺗﺼﻮﯾﺮ و وﯾﺪﯾﻮ اﺳﺘﻔﺎده ﻣﯽﺷﻮد .ﭘﯿﺎدهﺳﺎزي و ﮐﺎرﺑﺮد آن آﺳﺎن اﺳﺖ وﻟﯽ ﻣﻨﻄﺒﻖ ﺑﺎ ﻣﯿﺰان ﺣﺴﺎﺳﯿﺖ ﭼﺸﻢ اﻧﺴﺎن ﻧﯿﺴﺖ .ﻫﻤﭽﻨﯿﻦ ﻣﻤﮑﻦ اﺳﺖ ﺗﺮﮐﯿﺐﻫﺎي ﻣﺨﺘﻠﻔﯽ از ﻣﻘﺎدﯾﺮ آن ﯾﮏ رﻧﮓ را ﺗﻮﻟﯿﺪ ﮐﻨﻨﺪ )ﺟﻤﻊ ﻣﯿﺰان اﻧﺮژي ﺳﯿﮕﻨﺎل درﯾﺎﻓﺘﯽ در ﭼﺸﻢ اﻧﺴﺎن ﯾﮑﺴﺎن ﻣﯽﺷﻮد( ﻓﻀﺎي رﻧﮓ :YCbCrاﯾﻦ ﻓﻀﺎي رﻧﮕﯽ ﻋﻤﺪﺗ ًﺎ در ﺗﺼﺎوﯾﺮ وﯾﺪﯾﻮي دﯾﺠﯿﺘﺎل و در ﮐﺎرﺑﺮدﻫﺎﯾﯽ ﮐﻪ روي اﯾﻦ ﺗﺼﺎوﯾﺮ اﻧﺠﺎم ﻣﯽﺷﻮد ،ﻣﻮرد اﺳﺘﻔﺎده ﻗﺮار ﻣﯽﮔﯿﺮد .در اﯾﻦ ﻓﻀﺎي رﻧﮕﯽ Yﻟﻮﻣﯿﻨﺎﻧﺲ )ﻣﯿﺰان روﺷﻨﺎﯾﯽ( ﺑﻮده و Cb و Cr ﻧﺸﺎﻧﺪﻫﻨﺪه ﮐﺮوﻣﯿﻨﺎﻧﺲ )رﻧﮓ( ﻫﺴﺘﻨﺪ .ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﺣﺴﺎﺳﯿﺖ ﺑﯿﺸﺘﺮ ﭼﺸﻢ اﻧﺴﺎن ﺑﻪ ﻣﯿﺰان روﺷﻨﺎﯾﯽ ﺗﺼﻮﯾﺮ ﺟﺪاﺳﺎزي ﻣﯿﺰان روﺷﻨﺎﯾﯽ اﻣﮑﺎن ﻓﺸﺮدهﺳﺎزي ﺑﺎ ﮐﯿﻔﯿﺖ ﺑﻬﺘﺮ )از ﻧﻈﺮ اﻧﺴﺎن( را ﻣﯽدﻫﺪ .ﻫﻤﭽﻨﯿﻦ ﺳﯿﺴﺘﻢﻫﺎي ﺳﯿﺎه و ﺳﻔﯿﺪ ﺑﺪون ﺗﻐﯿﯿﺮ ﺳﯿﮕﻨﺎل ﻣﯽﺗﻮاﻧﻨﺪ ﺗﻨﻬﺎ از ﺑﺨﺶ Yآن اﺳﺘﻔﺎده ﮐﻨﻨﺪ. :HSVﺑﻪ دﻟﯿﻞ ﺷﺒﺎﻫﺖ آن ﺑﻪ ﺳﯿﺴﺘﻢ ﺑﯿﻨﺎﯾﯽ اﺳﻨﺎن ﺟﻬﺖ ﭘﺮدازش ﺗﺼﻮﯾﺮ ﺑﻪ ﮐﺎر ﻣﯽرود .ﭼﺮاﮐﻪ دو ﭘﺎراﻣﺘﺮ H )ﺗﻪ رﻧﮓ( و ) Sاﺷﺒﺎع رﻧﮕﯽ( ﺑﻪ ﺷﯿﻮهاي ﮐﻪ اﻧﺴﺎن رﻧﮓ را ﺗﺸﺨﯿﺺ ﻣﯽدﻫﺪ ،ﺑﺴﯿﺎر ﻧﺰدﯾﮏ اﺳﺖ .ﻫﻤﭽﻨﯿﻦ از آﻧﺠﺎﯾﯿﮑﻪ ﻣﯿﺰان روﺷﻨﺎﯾﯽ ﻧﯿﺰ )ﺑﻪ ﻧﺤﻮي ﺧﺎص( از ﭘﺎراﻣﺘﺮﻫﺎي رﻧﮕﯽ ﺟﺪا ﺷﺪه اﺳﺖ اﻣﮑﺎن ﭘﺮدازش روي روﺷﻨﺎﯾﯽ را ﺑﻬﺘﺮ ﻓﺮاﻫﻢ ﻣﯽﮐﻨﺪ .اﯾﻦ ﻓﻀﺎي رﻧﮕﯽ ﺑﺴﯿﺎر ﺷﻬﻮدي اﺳﺖ و رﻧﮓﻫﺎ را در ﻓﻀﺎﯾﯽ ﮐﺮوي )ﻧﻪ ﮐﺎرﺗﺰﯾﻦ( ﺗﻮﺻﯿﻒ ﻣﯽﮐﻨﺪ. ب( در H.263از ﮐﺪام ﯾﮏ از اﯾﻦ ﻓﻀﺎي رﻧﮓﻫﺎ اﺳﺘﻔﺎده ﻣﯽﺷﻮد ﭼﺮا؟ ) 5ﻧﻤﺮه( ﻣﻨﺒﻊ H263.pdf ﺻﻔﺤﻪ .26-28از ﻓﻀﺎي رﻧﮓ YCbCr اﺳﺘﻔﺎده ﻣﯽﺷﻮد ﭼﺮاﮐﻪ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ اﯾﻨﮑﻪ ﭼﺸﻢ اﻧﺴﺎن ﺣﺴﺎﺳﯿﺖ ﮐﻤﺘﺮي ﻧﺴﺒﺖ ﺑﻪ رﻧﮓ ) (CbCrدارد ﺗﺎ روﺷﻨﺎﯾﯽ ،ﻣﯽﺗﻮاﻧﯿﻢ اﻃّﻼﻋﺎت ﻣﺮﺑﻮط ﺑﻪ رﻧﮓ را ﺑﺎ ﻧﺮخ ﮐﻤﺘﺮي ) subsampleﻣﯽﮐﻨﻨﺪ( ارﺳﺎل ﮐﻨﯿﻢ. ج( ﺳﻪ ﻣﻮرد ﺑﻬﺒﻮد در Advance Prediction Mode در H.263 ﮐﻪ در ﻣﻮرد Motion Vector ﻫﺎ اﻋﻤﺎل ﻣﯽﺷﻮد را ﺑﺎ رﺳﻢ ﺷﮑﻞ ﺗﻮﺿﯿﺢ دﻫﯿﺪ 9) .ﻧﻤﺮه( ﻣﻨﺒﻊ H263.pdfﺻﻔﺤﻪ 47ﺗﺎ 58 .1 Vector :Unrestricted Motionﺑﻪ ﺑﺮدارﻫﺎي ﺣﺮﮐﺘﯽ اﻣﮑﺎن اﺷﺎره ﺑﻪ ﺧﺎرج ﻣﺮزﻫﺎي ﺗﺼﻮﯾﺮ را ﻧﯿﺰ ﻣﯽدﻫﺪ .در اﯾﻦ ﻓﺮآﯾﻨﺪ ﺑﻪ ﺟﺎي ﭘﯿﮑﺴﻞ ﻫﺎﯾﯽ ﮐﻪ وﺟﻮد ﻧﺪارﻧﺪ ﭘﯿﮑﺴﻞﻫﺎي ﻟﺒﻪ را ﺗﮑﺮار ﻣﯽﮐﻨﻨﺪ .اﯾﻦ ﮐﺎر ﻓﺸﺮدهﺳﺎزي را زﻣﺎﻧﯽ ﮐﻪ ﮐﻪ ﺣﺮﮐﺘﯽ دارﯾﻢ ﮐﻪ از ﻟﺒﻪ ﺗﺼﻮﯾﺮ رد ﻣﯽﺷﻮد ﺑﻬﺒﻮد ﻣﯽدﻫﺪ. Student Name: Student ID: :Extended Motion Vector .2ﻣﯽﺗﻮان ﺑﺎزه ﺑﺮدارﻫﺎي ﺣﺮﮐﺘﯽ را از ] [16,25.5ﺗﺎ ]) [-31.5,31.5ﺑﺎ ﺑﻌﻀﯽ ﻣﺤﺪودﯾﺖﻫﺎ( ﮔﺴﺘﺮش داد .اﯾﻦ ﮐﺎر ﺻﺤﻨﻪﻫﺎي ﺑﺎ ﭘﺮﺗﺤﺮّك را ﺑﻬﺘﺮ ﮐﺪ ﻣﯽﮐﻨﺪ. .3اﻣﮑﺎن اﺳﺘﻔﺎده از 4ﺑﺮدار ﺣﺮﮐﺘﯽ ﺑﺮاي ﺑﻠﻮكﻫﺎي .4 ﺑﻠﻮكﻫﺎي 16*16 Overlapped Motion Compensation 8*8 ﺑﻪ ﺟﺎي اﺳﺘﻔﺎده از ﯾﮏ ﺑﺮدار ﺣﺮﮐﺘﯽ ﺑﺮاي
© Copyright 2025 Paperzz