「情報科学概論」 映像1年 前期・選択 担当:浦谷 則好 http://uratani-n.com/info-science/ uratani@cs.t-kougei.ac.jp 第2回 量子化とビット数 標本化 情報量 M者択一の情報量は log2(M) ビット と決めることができる nビットで2n者択一から1つを選べる! 2bit なら 4, 3bit なら 8, 4bit なら 16 nビットあれば2n個の数を表現できる 符号化(2進符号化) (1) コンピュータは2値しか扱えない スイッチのON/OFF; 電流の有/無 通常これを0と1で表している 符号:対象に割り当てられた0と1の組み合わせ 符号化:対象の符号を決めること 解釈:符号から元の対象を求めること 符号化(2進符号化) (2) 4者択一なら2ビットで符号化できる 0と1の順番にも意味があることに注意! 選択肢 「花粉が多い」 「花粉がちょっと多い」 「花粉が少ない」 「花粉がほとんどない」 ビット列 00 01 10 11 符号化(2進符号化) (3) 漢字の符号化の例 情 シフトJIS 0x8FEE EUCコード 0xBEF0 UTF-8 0xE68385 1000111111101110 1011111011110000 111001101000001110000101 報 0x95F1 0xCAF3 0xE5A0B1 指数 累乗: a1,a2,a3, ・・・ をaの累乗(power) という。(またはベキという) 右肩の1, 2, 3,・・・が指数(exponent) a は底(base) 累乗根: n a (n乗すればaとなる数)をaのn乗根 という。 a , 3 a , 4 a ・・・をまとめて累乗根 (root)という。2乗根は平方根(square root)、3乗根は立方根(cube root)と いうこともある。 指数の公式 a,x,y を実数とし、(ただしa≠0) m,n を自然数とすると、 1) a0=1, a1=a x 2) a 1 ax 3) ax×ay=ax+y ax x y 4) y a 5) (ax)y=axy 6) (ab)x=axbx a x ax a 7) x b m b 1 8) a>0のとき、a n n a m 特に、m=1のとき a n n a 指数の問題 25×27= 212 29÷23= 26 (29)3= 227 20= 1 対数 (logarithm) 指数の逆関数である a>0, a≠1 のとき、正の実数x に対して、 x=ay となる実数y がただ1つ定まる。 このy をa を底とするx の対数といい、 y=loga x と表記する。 また、loga x におけるx を真数という。 一般に n=logaan が成立 対数の公式 a,c を正数とし、(ただしa≠1, c ≠1) M>0, N>0, b>0 とすると、 1) loga1=0, logaa=1 2) logaMN=logaM+logaN M log a M log a N 4) log a M p p log a M 3) log a N 5) log b log c b 特に、 log b 1 a a log c a log b a 対数の問題(1) 以下の式の値を求めよ 1) log24096 2) log232+log2128 【解答】 1) log 2 4096 log 2 2 12 12 2) log 2 32 log 2 128 log 2 2 log 2 2 5 5 7 12 7 対数の問題(2) 以下の式の値を求めよ 1) log432 2) log927 【解答】 1) 2) 5 log 2 32 log 2 2 5 log 4 32 2 log 2 4 log 2 2 2 3 log 3 27 log 3 3 3 log 9 27 2 log 3 9 log 3 3 2 デジタルの有利な点 コピーしたとき劣化しない → カセットテープや複写では劣化するのが当然! 経年変化を受けない → カセットテープや印画紙の経年変化は 避けられない コンピュータで処理 できる! → 格納場所の圧縮。複製が容易。 アナログ量をデジタル化 量子化 連続量を離散値に 36.538…. → 36.5 標本化(サンプリング) 時間的に連続 → 離散的な時間のみ 量子化 di ≤ gs[n]+Δd/2 < di+1 のとき,di を割り当てる 今、元の値が 0 q 256 で、mビットで量子化す るとします。(mは4~8) (Δd = di+1 – di) m=8 のとき 0,1,2,3,・・・,254,255 m=6 のとき 0,4,8,12, ・・・,248,252 q=59.3 のとき m=8 なら量子化誤差は? m=7 なら量子化誤差は? m=5 なら量子化誤差は? 0.3 0.7 ← 59.3-60 3.3 ← 59.3-56 ビット数は? アルファベット(大文字だけ;26文字)を符号化 するためのビット数は? 5ビット(25=32) ひらがな(97文字)を符号化するためのビット 7ビット(27=128) 数は? 第1水準漢字(2,965文字)を符号化するため のビット数は? 12ビット(212=4096) 全漢字(諸説あるが約6万字とする) を符号化 するためのビット数は? 16ビット(216=65536) 標本化定理(1) ある関数f(x)をフーリエ変換した関数F(s)の成分 (スペクトル)が, s W の範囲でF(s)=0である ような関数f(x)に対して,s=2W に相当する周期 より小さい周期をもつ標本化関数で標本化したとき に得られる関数は、そのスペクトルのうち s W が原関数のスペクトルに一致する。 原信号に含まれる最大周波数成分f の2倍以上の 周波数 fs (≧2f)で標本化すれば原信号を完全に 復元することができる 標本化定理(2) 原信号が復元可能な最大周波数 fs /2 を 「ナイキスト周波数」と言う もし原信号が最大周波数 fs /2より大きな周波数f を含んでいると、この周波数成分は fs-f が偽信 号(エイリアス信号)として復元される ※標本化定理は1928年ハリー・ナイキストが予想。1949年 にクロード・E・シャノンと日本の染谷勲によってそれぞれ独立 に証明された。 標本化定理(3) 信号x(t) の復元 ここで ts=1/fs (つまりサンプリング間隔) 標本化関数 標本化関数 × π サンプリング周波数 人の可聴域は 20Hz~20kHz (老人など高音が聞こえぬくい人は15kHz以下) それでは、CDなどのサンプリング周波数は いくら以上にする必要があるか? 40kHz 実際のCDのサンプリング周波数は? 44.1kHz AD変換,DA変換 AD変換 (Analog Digital変換) アナログ量 → デジタル量 デジタル体温計,デジタル体重計 DA変換 (Digital Analog変換) デジタル量 → アナログ量 CDプレーヤ アンプ(増幅器)やスピーカーはアナログ信号しか 扱えない AD変換の例 (CDの作成) DA変換の例 (CDプレーヤ) アナログ化 ディスク(HD,CD,DVD)の構造 トラック:円の部分(右図のA) セクタ( 「扇形」)は数学的(幾何学的) には、右図のB デイスク上でデータのかたまり(一度 に扱う大きさ)を示す領域をセクタと 呼ぶ 右図のC (つまり AとBの共通部分) 磁気ディスクでは、1セクタは512バイトが典型的 光ディスクでは、1セクタは2048バイトが典型的 セクタの(読み書きのための)集まりをクラスタとよぶ CD-ROMの容量 約333,000セクタ、1セクタあたりのデータ容量 は2,048バイト(実際はヘッダやエラー訂正を 含めて2,352バイト)だから、 333,000×2,048=682,000,000 バイト =650MB 約360,000セクタのものなら 360,000×2,048=737,000,000 バイト =703MB 音楽CD (CD-DA)の容量 約333,000セクタ、1セクタあたりのデータ容量 は2,352バイトだから、 333,000×2,352=783,000,000 バイト =746MB (これを前述の定義から 650MB と言っている) 360,000セクタ(700MBと称する方)なら 360,000×2,352=847,000,000 バイト =807MB 音楽CDには何分の音楽が入る? サンプリング周波数44.1kHz, 量子化16ビット なので,1秒当たり ステレオ(2ch) で 16×44,100×2÷8= 176,400 バイト 650MBのCDなら(実質746MB)だから 746×1024/172 = 4441秒= 74 分 700MBのCDなら(実質807MB)だから 807×1024/172 = 4804秒= 80 分 写真1枚(1280 × 960 ピクセル)の容量は? RGB各8ビット(1バイト)として 1280×960×3=3.52MB 実際にはJPEGで符号化すると 200KB ~ 1MB DVDの容量は? 約2,300,000セクタ、1セクタあたりのデータ 容量は2,048バイトだから 2,300,000×2,048=4,710,000,000 B =4,490 MB =4.38 GB 次回(第3回:4/28)の予定 2進数と基数変換
© Copyright 2025 Paperzz