Neural Network Based Footprint İdentification

Özellik Çıkarımı Olmadan Sinirsel Ağ Tabanlı Ayak
İzi ile Kişi Tanıma Sistemi
Neural Network Based Footprint İdentification
Without Feature Extraction
Onur Can KURBAN, Tülay YILDIRIM
Elektronik ve Haberleşme Mühendisliği Bölümü
Yıldız Teknik Üniversitesi
İstanbul, Türkiye
Emrah BAŞARAN
Bilgisayar Mühendisliği Bölümü
İstanbul Teknik Üniversitesi
İstanbul, Türkiye
onurcankurban@gmail.com,tulay@yildiz.edu.tr
emrahbsrn@gmail.com
Özetçe— Son yıllarda biyometrik özelliklerin kullanımı ile
kimliklendirme sistemleri oldukça ilgi görmektedir. Bunlara
örnek olarak parmak izi, avuç içi, iris, ayak izi gösterilebilir. Bu
çalışmada ayak izi resimleri kullanılarak özellik çıkarımı işlemi
yapılmaksızın kimliklendirme işlemi yapılmıştır. Kimliklendirme
için CASIA Dataset-D verileri kullanılmıştır. Dataset-D veri seti
ayak basınç ölçüm platformu üzerinden alınan ayak izi
resimlerini içermektedir. Çalışmada her bir resim RGB’den gri
skalaya alınıp normalize edilmektedir. Sonra resimler 5’te 1
oranında küçültülüp 30x15 boyutuna çekilmektedir. En son
olarak her resim 1x450 boyutlu dizilere çevrilerek TBA ile veri
daraltma işlemi yapılarak ÇKA, DVM ve Naive-Bayes ağlarına
uygulanmıştır. Özellik çıkarımı yapılmaksızın en iyi sonuç ÇKA
ağı ile elde edilmiştir.
Anahtar Kelimeler — Biyometri, ayak izi, kimliklendirme, TBA,
sınıflandırma.
Abstract — In recent years, identification systems with using
biometric features are receiving considerable attention. Iris,
palmprint, fingerprint and footprint are shown as examples. This
paper focused on footprint identification without features
extraction. CASIA Database, Dataset-D used for identification
database. Dataset-D contain footprint images taken from foot
pressure measurement plate. Firtsly, each RGB image converted
gray scale and resized the fifth and resized 30x15 matrix. İn the
end, each 30x15 matrix is converted to 1x450 input array, and
simulated by MLP, SVM and Naive-Bayes classifiers. The best
result without features extraction achived by MLP classifier.
Keywords
classification
—
Biometrics,
I.
footprint,
identification,
PCA,
GİRİŞ
Son yıllarda kamu ve özel sektörlerde gizli ve kişisel
bilgilerin saklanması konusu oldukça önemli bir problem
olarak görülmeye başladı. Akıllı kartlar, şifreli sistemler gibi
uygulamalar çok yaygın hale gelse de kaybedilme ve
unutulma ihtimalleri dezavantajları olmaktadır. Bunların
aksine biyolojik ve biyometrik özellikler daha kişisel veriler
içermektedir. Parmak izi, iris, retina, avuç içi, ayak izi gibi
fiziksel yapılar kişisel kimlik bilgilerini ifade ederler. Bu
fiziksel özelliklerin kullanılması ile kimliklendirmeye yönelik
978-1-4673-5563-6/13/$31.00 ©2013 IEEE
problemler çözülebilir.[1]
Bu çalışmada ise bu özellikler içerisinden ayak izi
kullanılmıştır. Ayak izi her kişiye göre farklılıklar içerebilen
bir biyolojik veri kaynağıdır. Bu zamana kadar yapılan
çalışmalarda, bu verilere kimliklendirme için çeşitli özellik
çıkarım işlemleri uygulanmış ve verimli sonuçlar
alınmıştır[2][3].
Ayağa ait fiziksel farklılıklara yüzey basınç değerleri,
temas alanı örnek olarak verilebilir. Ancak bu özelliklerin
toplanması ve hesaplanması aşamaları zaman alan işlemlerdir.
Alınan verilerin hızlı bir şekilde değerlendirilmesi ve
kullanılması için yeni teknikler ve metodlar üzerinde
çalışmalar devam etmektedir.[4]. Bu çalışmada veri kaynağı
olarak yaygın olarak kullanılan CASIA gait database’de yer
alan Dataset-D verileri kullanılmıştır. Bu veri seti, ayak
basınç ölçümü için oluşturulan bir platformdan alınan, ayak izi
resimlerini içermektedir. Her bir kişi için sağ ve sol ayaktan
alınan 10 grup ayak izi ve basınç değerleri yer almaktadır. Bu
resimler kırmızı-yeşil-mavi (RGB) formatında ve ortalama
olarak 110x50 piksel boyundadır.
Sınıflandırma işlemine uygulamak için öncelikle her bir
resim 0-255 piksel değerlerine sahip RGB’den gri skalaya
çevrilmiş ve yeniden boyutlandırma ile 5’te 1 oranında
küçültülmüştür. Resimlerin matris satır ve sütun değerlerinin
faklı olması sebebiyle küçültülen resimler tekrar genişletilerek
30x15 boyutuna sabitlenmiştir. Elde edilen 30x15 boyutundaki
resimler 1x450’lik diziler haline çevrilerek giriş vektörü
oluşturulmuştur. Toplamda 10 farklı kişi için toplam 108
örnek resim alınmıştır. Tüm resimler bu şekilde düzenlenerek
herhangi bir özellik çıkarımı yapılmadan veri azaltma yöntemi
temel bileşen analizi (TBA) uygulanmıştır. TBA işlemi ile öz
vektörler elde edilerek öz uzaya aktarılmış ve elde edilen
veriler sınıflama işlemine tabi tutulmuştur.[5]
Sınıflama ve kimliklendirme için, geriye yayılım
algoritması oluşturulan çok katmanlı algılayıcı (ÇKA) destek
vektör makinesi (DVM) ve Naive-Bayes sınıflayıcı yapıları
kullanılmıştır.
II.
KULLANILAN YÖNTEMLER
Bu çalışma içerisinde 3 farklı eğiticili sınıflayıcı yapısı
kullanılmıştır. Bunlar; destek vektör makineesi, yapay sinir ağı
ve naive bayes sınıflayıcılarıdır.
A. Yapay Sinir Ağı
Yapay sinir ağları için geriye yayılım alggoritması ile ÇKA
ağı oluşturulmuştur. Geriye yayılım algoritması;
a
ileri
beslemeli bir ağda bulunan hata miktarlarınnın gizli katmanda
bulunan sinir hücrelerine (neurons) geri gönderilmesi ile
hatanın azaltılması ve performansın arttırılmasını amaçlar.
Şekil 3. DVM
M Sınır Çizgileri
Bu işlemin yapılması için iki gruba da yakın ve birbirine
paralel iki sınır çizgisi çizilirr ve bu sınır çizgileri birbirine
yaklaştırılarak ortak sınır çizgissi üretilir. Bu çizgi ise hyperline
olarak tanımlanır.
max(
Şekil 1. Çok Katmanlı Algılayıcı Yaapısı
Geriye yayılım ağlarında öğrenme ikki temel adımda
gerçekleşir;
1.
Giriş katında öğrenilmesi isstenilen verilerin
modellenmesi
2.
Hatanın geriye yayılımı ile hatanın
h
minimize
edilmeli
Δwji = -ε [dE/dwji]
(1)
Şekil 2. ÇKA Hatanın Minimum Noktasına Yaklaşımı
B. Destek Vektör Makinesi
Destek vektör makineleri son yıllardaa sınıflandırmada
kullanılan oldukça popüler bir yöntemdir. Özellikle destek
boyutlarının
vektör
makinelerinin
giriş
verilerinnin
büyüklüğünden etkilenmeksizin başarılı sıınıflama yapabilir
olması, destek vektör makinelerinin tercih edilme
d
bulunan
sebeplerinden biridir. Sınıflama için bir düzlemde
gruplar arasında bir sınır çizerek iki grubu ayırmak
i
iki grubunda
mümkündür. Bu sınırın çizileceği yer ise
verilerine en uzak olan yer olmalıdır.
2
)
w
y i = +1,, w T x i + b ≥ +1
y i = −1,, w T x i + b ≤ −1
(2)
Gruplara ait en uzak nokktalardan geçen marjin çizgisi
bulunarak, hataların en aza inndirgenmesi ve en iyi sınıflama
performansı amaçlanır.
C. Naive Bayes
Bayes sınıflayıcısı oldukçça basit ve nispeten iyi bir
sınıflama performansına sahipttir. Istatiksel yöntemler yardımı
ile
sınıflama
yapar.
N
Naive
bayes
algoritmasının
uygulanmasında bir takım kabuller
k
yapılır. Bunlardan en
önemlisi niteliklerin birbirindden bağımsız olduğudur. Eğer
nitelikler birbirini etkiliyorsaa burada olasılık hesaplamak
zordur. Niteliklerin hepsinin aynı derecede önemli olduğu
kabul edilir.[6]
P(k|x)= p((x|k). p(k)/p(x)
(3)
Class of x = argmaxkP(k|x)
(4)
gk(x) = ln p(x|k). p(k)
p = ln p(x|k) + ln p(k)
(5)
D. TBA
Temel bileşen analizi (TBA
A) gereksiz verilerin atılmasında
en iyi bilinen tekniklerden biriddir. TBA ile değişkenlerin temel
bileşenlerini daha da azaltarakk hesaplama kolaylığı sağlamak
mümkündür.[7]
III.
VERI SETII OLUŞTURULMASI
Çalışma içerisinde ilk olarak
o
verilerin seçilmesi ve
gruplandırılması işlemi yapıldıı. CASIA tarafından oluşturulan
Dataset-D içerisinde her bireyy için sağ ve sol ayaklara ait
resimler alındı ve her bir kişi için
i
bir kimlik numarası atandı.
Toplamda 10 kişiye ait 108 ayaak izi resmi seçildi.
Şekil 4. Ayak izi ve piksel değerleri
Her bir resim 0-255 aralığında değerlere sahip piksellerden
oluşmaktadır. Resimler üzerinde veri boyutunu düşürmek için
RGB’den gri skalaya çevrilerek değerler normalize edilmiştir.
C. Üçüncü sınıf
Üçüncü sınıf için oluşturulan 30 kişiye ait 300 veri sırası
ile ÇKA, DVM ve Naive-Bayes ağlarına uygulandı. Verilerin
%80’si eğitim için %20’si de test işlemleri için kullanıldı.
Tablo-3 Üçüncü Sınıf Başarı Sonuçları
İkinci
sınıf
Şekil 5. Gri skalaya alınan resim
Gri skalaya alınıp normalize edilen resimler 5’te 1
oranında küçültülmüştür. Her bir resim matrisi birbirinden
farklı satır ve sütun değerlerine sahiptir. Bu sebepten
küçültülen her bir resmi kapsayacak şekilde 30x15 piksellik
bir matrise genişletildi.
(a)
(b)
Şekil 6. (a) 5’te 1 küçültülen resim (b) 30x15’e genişletilen bir resim
Son olarak 30x15 boyutundaki resimler 1x450’lik diziler
halinde kaydedildi. Bu işlen toplamda 10 ayrı kişiye ait 108
resim üzerinde uygulanarak birinci sınıflandırma grubu
oluşturuldu. Aynı işlemler 30 ayrı kişiye ait 300 resim
üzerinde uygulanarak ikinci sınıflandırma grubu oluşturuldu.
IV.
EĞITIM VE SINIFLANDIRMA
A. Birinci sınıf
Birinci sınıf için oluşturulan 10 kişiye ait 108 veri sırası ile
ÇKA, DVM ve Naive-Bayes ağlarına uygulandı. Verilerin
%50’si eğitim için %50’si de test işlemleri için kullanıldı.
Tablo-1 Birinci Sınıf Başarı Sonuçları
Birinci
sınıf
10 kişi 108 veri
Eğitim
Test
Başarı
Oranı
Doğru
Yanlış
ÇKA
%50 (54 veri)
%50 (54 veri)
%90,74
49
5
DVM
%50 (54 veri)
%50 (54 veri)
%72,22
39
15
Naive
bayes
%50 (54 veri)
%50 (54 veri)
%76,36
42
12
B. İkinci sınıf
İkinci sınıf için oluşturulan 30 kişiye ait 300 veri sırası ile
ÇKA, DVM ve Naive-Bayes ağlarına uygulandı. Verilerin
%50’si eğitim için %50’si de test işlemleri için kullanıldı.
Tablo-2 İkinci Sınıf Başarı Sonuçları
İkinci
sınıf
30 kişi 300 veri
Eğitim
Test
Başarı
Oranı
Doğru
Yanlış
ÇKA
%50 (150 veri)
%50 (150 veri)
%80
120
30
DVM
%50 (150 veri)
%50 (150 veri)
%54,67
82
68
Naive
bayes
%50 (150 veri)
%50 (150 veri)
%48
72
78
30 kişi 300 veri
Eğitim
Test
Başarı
Oranı
Doğru
Yanlış
ÇKA
%80 (240 veri)
%20 (60 veri)
%83,33
50
10
DVM
%80 (240 veri)
%20 (60 veri)
%56,67
34
26
Naive
bayes
%80 (240 veri)
%20 (60 veri)
%73,33
44
16
V.
SONUÇLAR
Sonuçlara bakıldığında birinci sınıf verilerde (Tablo-1)
ÇKA ile %90 üzerinde bir sınıflama başarısı elde edilmiştir.
Naive-Bayes ile %76,36 ve DVM ile %72,22 başarı elde
edilmiştir.
İkinci sınıf (Tablo-2) ve üçüncü sınıf (Tablo-3) verilerde
ise kişi sayısının artması ile başarı oranlarının düştüğü
görülmüştür. Yine bu gruplarda da en iyi sonuç %80 başarı ile
ÇKA’den alınmıştır.
İşlemlerin sonuçlarına bakıldığında özellik çıkarımı
yapılmaksızın verilerin sınıflandırılmasında az sayıda kişi
içeren verilerin sınıflandırılmasında yüksek kişi sayılı verilere
göre daha iyi sonuçlar elde edilmiştir. İkinci sınıf sonuçları
için eğer kişi sayısı azaltılacak olursa başarının artması
beklenmektedir. Her bir kişiye ait örnek sayısı
değiştirilmeden,
örnek alınan kişi sayısının artması
sonucunda başarının düştüğü gözlenmiştir.
Kişi başı örnek sayılarının azlığı ile grup sayılarının fazla
olması göz önüne alındığında, herhangi bir özellik çıkarımı
yapılmaksızın elde edilen sonuçların özellikle ÇKA için
başarılı sonuçlar verdiği söylenebilir. DVM sınıflayıcısının
düşük gruplu verilerde yüksek gruplu verilere göre daha iyi
başarı elde ettiği de gözlenmiştir. Yine Naive Bayes ağı için
kişi sayısının az olması ağın başarısını arttırmıştır.
KAYNAKÇA
[1] Miyoshi, M., Kahihara, Y., Nakao, M., Tsuge, S., Fukumi, M. ``
Personal Identification Method using Footsteps'', SICE Annual
Conference , p 1615-1620, Tokyo, 2011.
[2] Yi-Bo Li , Qin Yang, “Gait extraction and recognition based on
lower leg and ankle”, International Conference on Intelligent
Computation Technology and Automation , IEEE, 2010.
[3] D.Sharmila, E. Kirubakaran, “Image and Formula Based Gait
Recognition Methods” , International Journal of Computer and
Electrical Engineering, Vol. 2, No. 2, 2010.
[4] V.K. Govindan and A.P. Shivaprasad, “Character Recognition –
A review,” Pattern Recognition, Vol. 23, no. 7, pp. 671- 683,
1990.
[5] Polat, Ö., Yıldırım, T., Recognition of Patterns Without Feature
Extraction by GRNN, ICANNGA, Part II, LNCS 4432, pp. 161
--- 168, Berlin, 2007.
[6] A.Osareh, B.Shadgar, "Microarray Data Analysis for Cancer
Classification" Health Informatics and Bioinformatics
(HIBIT),5th International Symposium , pp.125-132,2010.
[7] Yaacob, N.I.,Feature Selection For Gait Recognation,
Humanities, Science and Engineering Research (SHUSER),
pp.379-383, Malaysia, 2012.