量子化とビット数

「情報科学概論」
映像1年 前期・選択
担当:浦谷 則好
http://uratani-n.com/info-science/
uratani@cs.t-kougei.ac.jp
第2回
 量子化とビット数
 標本化
情報量
 M者択一の情報量は log2(M) ビット
と決めることができる
 nビットで2n者択一から1つを選べる!
2bit なら 4, 3bit なら 8, 4bit なら 16
 nビットあれば2n個の数を表現できる
符号化(2進符号化) (1)
 コンピュータは2値しか扱えない
スイッチのON/OFF; 電流の有/無
 通常これを0と1で表している
 符号:対象に割り当てられた0と1の組み合わせ
 符号化:対象の符号を決めること
 解釈:符号から元の対象を求めること
符号化(2進符号化) (2)
 4者択一なら2ビットで符号化できる
 0と1の順番にも意味があることに注意!
選択肢
「花粉が多い」
「花粉がちょっと多い」
「花粉が少ない」
「花粉がほとんどない」
ビット列
00
01
10
11
符号化(2進符号化) (3)
 漢字の符号化の例
情
シフトJIS
0x8FEE
EUCコード
0xBEF0
UTF-8
0xE68385
1000111111101110
1011111011110000
111001101000001110000101
報
0x95F1
0xCAF3
0xE5A0B1
指数
 累乗: a1,a2,a3, ・・・ をaの累乗(power)
という。(またはベキという)
右肩の1, 2, 3,・・・が指数(exponent)
a は底(base)
 累乗根: n a (n乗すればaとなる数)をaのn乗根
という。 a , 3 a , 4 a ・・・をまとめて累乗根
(root)という。2乗根は平方根(square
root)、3乗根は立方根(cube root)と
いうこともある。
指数の公式
 a,x,y を実数とし、(ただしa≠0)
m,n を自然数とすると、
1)
a0=1,
a1=a
x
2) a 
1
ax
3) ax×ay=ax+y
ax
x y
4) y  a
5) (ax)y=axy 6) (ab)x=axbx
a
x
ax
a
7)    x
b m
b
1
8) a>0のとき、a n  n a m 特に、m=1のとき a n  n a
指数の問題
 25×27= 212
 29÷23= 26
 (29)3= 227
 20= 1
対数 (logarithm)
 指数の逆関数である
 a>0, a≠1 のとき、正の実数x に対して、
x=ay となる実数y がただ1つ定まる。
このy をa を底とするx の対数といい、
y=loga x と表記する。
また、loga x におけるx を真数という。
一般に n=logaan が成立
対数の公式
 a,c を正数とし、(ただしa≠1, c ≠1)
M>0, N>0, b>0 とすると、
1) loga1=0, logaa=1
2) logaMN=logaM+logaN
M
 log a M  log a N 4) log a M p  p log a M
3) log a
N
5) log b  log c b 特に、 log b  1
a
a
log c a
log b a
対数の問題(1)
 以下の式の値を求めよ
1) log24096 2) log232+log2128
【解答】
1)
log 2 4096  log 2 2  12
12
2) log 2 32  log 2 128  log 2 2  log 2 2
5
 5  7  12
7
対数の問題(2)
 以下の式の値を求めよ
1) log432 2) log927
【解答】
1)
2)
5
log 2 32 log 2 2
5
log 4 32 


2
log 2 4 log 2 2
2
3
log 3 27 log 3 3 3
log 9 27 


2
log 3 9 log 3 3
2
デジタルの有利な点
 コピーしたとき劣化しない
→ カセットテープや複写では劣化するのが当然!
 経年変化を受けない
→ カセットテープや印画紙の経年変化は
避けられない
 コンピュータで処理 できる!
→ 格納場所の圧縮。複製が容易。
アナログ量をデジタル化
 量子化
 連続量を離散値に 36.538…. → 36.5
 標本化(サンプリング)
 時間的に連続 → 離散的な時間のみ
量子化
 di ≤ gs[n]+Δd/2 < di+1 のとき,di を割り当てる
 今、元の値が 0  q  256 で、mビットで量子化す
るとします。(mは4~8) (Δd = di+1 – di)
 m=8 のとき 0,1,2,3,・・・,254,255
 m=6 のとき 0,4,8,12, ・・・,248,252
 q=59.3 のとき
 m=8 なら量子化誤差は?
 m=7 なら量子化誤差は?
 m=5 なら量子化誤差は?
0.3
0.7 ← 59.3-60
3.3 ← 59.3-56
ビット数は?
 アルファベット(大文字だけ;26文字)を符号化
するためのビット数は? 5ビット(25=32)
 ひらがな(97文字)を符号化するためのビット
7ビット(27=128)
数は?
 第1水準漢字(2,965文字)を符号化するため
のビット数は?
12ビット(212=4096)
 全漢字(諸説あるが約6万字とする) を符号化
するためのビット数は? 16ビット(216=65536)
標本化定理(1)
 ある関数f(x)をフーリエ変換した関数F(s)の成分
(スペクトル)が, s  W の範囲でF(s)=0である
ような関数f(x)に対して,s=2W に相当する周期
より小さい周期をもつ標本化関数で標本化したとき
に得られる関数は、そのスペクトルのうち s  W
が原関数のスペクトルに一致する。
 原信号に含まれる最大周波数成分f の2倍以上の
周波数 fs (≧2f)で標本化すれば原信号を完全に
復元することができる
標本化定理(2)
 原信号が復元可能な最大周波数 fs /2 を
「ナイキスト周波数」と言う
 もし原信号が最大周波数 fs /2より大きな周波数f
を含んでいると、この周波数成分は fs-f が偽信
号(エイリアス信号)として復元される
※標本化定理は1928年ハリー・ナイキストが予想。1949年
にクロード・E・シャノンと日本の染谷勲によってそれぞれ独立
に証明された。
標本化定理(3)
 信号x(t) の復元
ここで ts=1/fs (つまりサンプリング間隔)
 標本化関数
標本化関数
×
π
サンプリング周波数
 人の可聴域は 20Hz~20kHz
(老人など高音が聞こえぬくい人は15kHz以下)
 それでは、CDなどのサンプリング周波数は
いくら以上にする必要があるか?
40kHz
 実際のCDのサンプリング周波数は?
44.1kHz
AD変換,DA変換
 AD変換 (Analog Digital変換)
 アナログ量 → デジタル量
 デジタル体温計,デジタル体重計
 DA変換 (Digital Analog変換)
 デジタル量 → アナログ量
 CDプレーヤ
 アンプ(増幅器)やスピーカーはアナログ信号しか
扱えない
AD変換の例 (CDの作成)
DA変換の例 (CDプレーヤ)
アナログ化
ディスク(HD,CD,DVD)の構造
 トラック:円の部分(右図のA)
 セクタ( 「扇形」)は数学的(幾何学的)
には、右図のB
 デイスク上でデータのかたまり(一度
に扱う大きさ)を示す領域をセクタと
呼ぶ 右図のC
(つまり AとBの共通部分)
 磁気ディスクでは、1セクタは512バイトが典型的
 光ディスクでは、1セクタは2048バイトが典型的
 セクタの(読み書きのための)集まりをクラスタとよぶ
CD-ROMの容量
 約333,000セクタ、1セクタあたりのデータ容量
は2,048バイト(実際はヘッダやエラー訂正を
含めて2,352バイト)だから、
333,000×2,048=682,000,000 バイト
=650MB
 約360,000セクタのものなら
360,000×2,048=737,000,000 バイト
=703MB
音楽CD (CD-DA)の容量
 約333,000セクタ、1セクタあたりのデータ容量
は2,352バイトだから、
333,000×2,352=783,000,000 バイト
=746MB
(これを前述の定義から 650MB と言っている)
 360,000セクタ(700MBと称する方)なら
360,000×2,352=847,000,000 バイト
=807MB
音楽CDには何分の音楽が入る?
 サンプリング周波数44.1kHz, 量子化16ビット
なので,1秒当たり ステレオ(2ch) で
16×44,100×2÷8= 176,400 バイト
 650MBのCDなら(実質746MB)だから
746×1024/172 = 4441秒= 74 分
 700MBのCDなら(実質807MB)だから
807×1024/172 = 4804秒= 80 分
写真1枚(1280 × 960 ピクセル)の容量は?
 RGB各8ビット(1バイト)として
1280×960×3=3.52MB
 実際にはJPEGで符号化すると
200KB ~ 1MB
DVDの容量は?
 約2,300,000セクタ、1セクタあたりのデータ
容量は2,048バイトだから
2,300,000×2,048=4,710,000,000 B
=4,490 MB
=4.38 GB
次回(第3回:4/28)の予定
 2進数と基数変換