URSI-TÜRKİYE’2014 VII. Bilimsel Kongresi, 28-30 Ağustos 2014, ELAZIĞ Rasgele Sayı Üretiminde Güneş Işınımı Kaynaklı Eşit Aralıklı Örnekleme Yönteminin Başarı Ölçümü Süleyman Gökhun Tanyer1, Kumru Didem Atalay2, Sıtkı Çağdaş İnam1 (1) Elektrik – Elektronik Mühendisliği Bölümü, Başkent Üniversitesi, Bağlıca, 06810, Ankara (2) Tıp Eğitimi Anabilim Dalı, Tıp Fakültesi, Başkent Üniversitesi, Bahçelievler, Ankara gokhun.tanyer@gmail.com, {gokhuntanyer, katalay, inam}@baskent.edu.tr Özet: Kriptografi, bilimsel çalışmalardaki benzetim çalışmaları ile çekilişler ve benzeri ticari uygulamalar gibi bir çok alanda güvenilir rasgele sayı üreteçlerine ihtiyaç duyulmaktadır. Rasgele sayı üreteçlerin kullanıldığı bilimsel incelemelerde sıklıkla; bilgisayar hafızası, koşu adedi ve süresi gibi bazı pratik sınırlamalardan dolayı düşük sayılı koşulardan elde edilen sonuçlar yeterli görülebilmekte ve en temel akademik kriter olan ‘tekrar edilebilirlik’ konusunda eksiklikler yaşanabilmektedir. Bu çalışmada, Güneş’in RF ışınımlarından elde edilen sayılar üzerinde, Eşit Aralıklı Örnekleme Yöntemi (EŞARÖY) uygulanarak elde edilen doğru rasgele sayılar test edilmiştir. Güneş kaynaklı doğru rasgele sayı üreteci sistemi (G-DRÜS)’nin düşük sayılı veri kümelerinde dahi rasgelelik ve dağılıma uyum bakımından başarılı sonuçlar verdiği gösterilmiştir. Abstract: Random number generators (RNGs) are often utilized in various fields of science such as cryptology, system simulations and even some commercial applications including lotteries. Probability distribution and density functions are regarded as the fundamental tools for any statistical analysis. Unfortunately, those functions are only asymptotically valid when the number of observations converges infinity. In most of the cases, CPU time and memory are limited, and so the number of observed samples. The mandatory quality of any academic work –repeatability– is often under question. RNGs are often highly random but their goodness-of-fit suffers when there are less observed samples. In this work, the Sun’s RF emissions are used to obtain a trueRNG which is tested for randomness and its goodness-of-fit qualities. 1. Giriş Bilimin bir çok dalında, doğal bir sürecin gözlenerek incelenmesi ve gelecekteki davranışının tahmin edilebilmesine ihtiyaç duyulmaktadır. Matematiksel modellerden faydalanılarak bazı öngörülerde bulunmak mümkün olabilmektedir. Modelin geliştirilmesinde, gözlemlerin yeterli olması, matematiksel modelleme çözümümün üretilebilmesi ve sürecin herhangi bir belirsizlik içermemesi halinde, olası gözlemler hakkında oldukça kesin tahminler yapılabilmektedir. Ancak, incelenen sürecin belirsizlikler içermesi halinde, modelleme sonuçlarından elde edilen tahminler de aynı şekilde belirsizlik içerecektir. Belirsizliklerin giderilemediği koşullar altında, sonuçlardaki hata miktarlarının en aza indirilebilmesi ve daha doğru karar verilebilmesi amacıyla, modellerin rasgele değişkenler içermesi ve sonuçların istatistiksel olarak incelenmesi gerekebilmektedir. Girdi değişkenlerine ilişkin çok sayıda olası örnekler sağlandığında, olası çok sayıda çıktı örnekleri çoklu koşu hesaplamaları ile elde edilebilmektedir. Böylelikle, çok karmaşık olabilecek zor problemler için çözüm üretilebilmektedir. İhtiyaç duyulan rasgele gözlem örneklerinin elde edilebilmesi için farklı yöntemler bulunmaktadır. Sözde Rasgele Sayı Üreteçleri (SRSÜ) gibi insan etkilerinden uzak doğal kaynaklardan faydalanılarak üretilen Doğru Rasgele Sayı Üreteçleri (DRSÜ) kullanılmaktadır. Günümüzde rasgelelik özellikleri bakımından oldukça yeterli olarak kabul edilen bir çok RSÜ bulunmaktadır. Üretilen örnek sayısının sonsuza yaklaştığında istenilen dağılıma yakınsayan bu örneklerin, düşük sayılı örneklerde oldukça hatalı olduğu gösterilmiştir [1] Bilgisayarlı benzetim çalışmalarının yaygın olduğu günümüzde, bilgisayar koşu zamanı, hafıza miktarı gibi kısıtlardan dolayı yetersiz koşu sayıları ile elde edilen sonuçların kuramsal sınır değerlerine yakın olduğu kabul edilmektedir. Herhangi bir nicel ölçüt ile test edilmemiş rasgele sayı örnekleri girdi olarak kullanılmakta ve sonuçların güvenilirlikleri tartışılmamaktadır. Bilimsel çalışmalardan beklenen en temel ‘tekrar edebilirlik’ nitelikleri bakımından yetersiz çalışmaların yayınlanabildiği görülmektedir. Matlab yazılımının rand ve benzeri komutları ile kolaylıkla elde edilebilen DRSÜ sayıları gibi [2] benzeri kaynaklardan elde edilebilen D-RSÜ sayılarının rasgelelik özelliklerinin oldukça yeterli olmasına rağmen, düşük sayılı örneklerde istenilen dağılımlara yakınlığında önemli hataların bulunduğu gösterilmiştir [1]. Günümüzde, rasgelelik özelliği bakımından yeterli ve düşük sayılı veri kümelerinde dağılıma uygun rasgele sayı üreteçlerine ihtiyaç duyulmaktadır. Böylelikle, kuramsal tahminlerin geçerli olmadığı, düşük sayılı örnek URSI-TÜRKİYE’2014 VII. Bilimsel Kongresi, 28-30 Ağustos 2014, ELAZIĞ kümelerinin düşük sayılı koşularda kullanıldığı ortamlarda dahi güvenilir sonuçlar veren hesaplamaların yapılabilmesi mümkün olacaktır. Bu maksatla yakın dönemde yeni bir Y-RSÜ yöntemi önerilmiştir [1]. Bu çalışmada, bahse konu Y-RSÜ yöntemi, güneşin RF ışınımlarından faydalanılarak, D-RSÜ yöntemi haline getirilmiştir. Rasgelelik özelliği ile dağılıma uyum özellikleri bakımından düşük sayılı örnek kümelerinde dahi başarılı olacak ilk D-RSÜ yöntemi olarak önerilmekte ve rasgelelik ve dağılıma uyum başarımı bakımından oldukça başarılı sonuçlar elde edilmiştir [1, 3]. Farklı tür rasgele sayı üreteçleri hakkında bilgi [4]’te verilmiştir. 3. Kullanılan Veriler ve Rasgele Sayıların Elde Edilmesi Anakol yıldızı olarak sınıflandırılan Güneş, ağırlıklı olarak görünür ışıkta ışıma yapsa da RF bantları dahil olmak üzere elektromanyetik tayfın diğer kısımlarında ışımaya sahiptir. Gökbilimsel olarak zayıf bir radyo kaynağı olarak sınıflandırılabilecek Güneş, yine de yakınlığı sebebiyle geniş bant ışıma yapan en güçlü Dünya dışı ışıma kaynağı olma özelliğine sahiptir. Bu çalışmamızda, Radyo Güneş Teleskopu Ağı (Radio Solar Telescope Network; RSTN) teleskoplarından biri olan ve İtalya'da San Vito Amerikan Hava Üssü'nde yer alan San Vito Güneş Teleskopu'nun verileri kullanılmıştır [5]. Örnek olarak kullanılan veriler, 1 saniye örnekleme periyodu ile 8 ayrı frekans bandından 1990 Ocak ayı içinde toplam 31 günlük gözlemden elde edilen radyo akılarıdır. Bu veriler Amerikan Ulusal Jeofizik Veri Merkezi (National Geophysical Data Center; NGDC) arşivinden İnternet yoluyla indirilmiştir. Gözlenen bantlar ve bu bantlara karşılık gelen ortalama akı değerleri Tablo I'de listelenmiştir. Her gün için bütün 8 bandın verisi ayrı ayrı işlenenerek rasgele sayı içeren toplam 248 dosya elde edilmiştir. İşlenme sürecinde 1 saniye örneklenmiş 7 anlamlı rakama sahip her bir akı değerinin en az anlamlı ikişer basamağı sıralı olarak yanyana getirilip altışarlı gruplar halinde birleştirilerek 0 – 999999 arasında tamsayılar elde edilmiştir. Elde edilen sayıların birlenerek 0 ile 1 arası ile sınırlandırıldığında, sayıların beklendiği gibi eşit dağılımlı olduğu gözlenmiştir. Daha sonra Eşit Aralıklı Örnekleme Yöntemi (EŞARÖY) kullanılarak dağılıma uygunluğu ile rasgeleliği Tablo II ve III’de incelenmektedir. TABLO I. San Vito Radyo Teleskopu Radyo Bantları ile 1990 Ocak Ayı Ortalama Akı Değerleri Frekans Bandı (MHz) Ortalama Akı (10-22 W/m2.Hz-1) 245 396 628 1,415 2,696 4,996 8,840 15,400 42.41 36.34 103.0 149.9 266.2 305.7 267.5 252.3 4. Eşit Aralıklı Örnekleme Yöntemi (EŞARÖY) N örnekli bir sıralı gözlem kümesinde, = { : , = 1,2, … , } ve < ,1 ≤ p < r ≤ N için N örnekli sürekli uydurulmuş (ampirik) olasılık dağılım fonksiyonu (UODF) aşağıdaki gibi tanımlanabilmektedir [1]. , ( )= ( − 0 ( − 1)( )+ ( − 1)( 1 < ) ) − − , (1 − 1) (1) Burada xn, X rasgele değişkenine ait örnek değerleri, n sıra numarası, xn, X rasgele değişkenine ait örnek değerleri, n sıra numarası, N toplam örnek sayısı (uzunluğu) ve X ifadesini göstermektedir. Örnek sayısının sonsuza yakınsadığında geçerli olan ODF ile sonlu uzunluktaki örnek kümesi için tanımlanmış UODF’nin karşılaştırılması ile Dağılıma-Uyum-Başarımı tanımlanabilmektedir. Bu tür başarım ölçütleri genellikle aşağıdaki şekilde ifade edilebilmektedir [1]. = ( )− , ( ) (2) Burada A ve B, FX (A) ile FX (B) değerlerinin yaklaşık olarak aynı sırayla 0 ve 1 olacağı şekilde seçilmektedir. Böylelikle, (2)’nin [A, B] aralığı dışındaki değeri ihmal edilebilmektedir. Eşitlik (2), gözlem kümesinin (örneklerin) tanımlanmış olan bir istatistiksel dağılıma yakınlığını, dağılıma uyumluluğunu belirlemektedir. Eğer , ( ) gözlem örneklerin tam olarak ( ) üzerine denk gelmesi halinde (2) ile belirlenen hatanın sıfır olması gerekmektedir. Dolayısıyla rasgele sayı üretimi amacıyla, bir dizinin doğrudan ( ) grafiği üzerinden elde edilmesi halinde, Dağılıma-uyum testlerinde yüksek başarı sağlanacaktır. Eşit Aralıklı Örnekleme Yöntemi ( ) üzerinde eşit olarak adlandırılan bu örnekleme kullanıldığında, eşit aralıklı dizisi kullanılarak = örnekleme ile sayı dizisi elde edilmektedir. EŞARÖY özetlenecek olursa [1] URSI-TÜRKİYE’2014 VII. Bilimsel Kongresi, 28-30 Ağustos 2014, ELAZIĞ pn (n 1)(1 2 ) / N (3) (4) zn FX1 ( pn ) (5) p (1 2 ) / N eşitlikleri kullanılarak, ihmal edilen sınır örnekleri dahil olmak üzere y ekseninde N eşit aralık kullanılarak N+1 örnek elde edilmektedir. En-iyileme değişkeni = 1⁄(2 ) olarak seçildiği takdirde, eşit aralıkların tam orta noktalarından örnek elde edilmektedir. Dikkat edilecek olursa, N → ∞ için δo → 0 olmaktadır. Olasılık dağılımına tam uyum sağlayan bu dizinin, daha sonra güneş kaynaklı rasgele sayı dizisinden faydalanılarak karıştırılması ile Güneş kaynaklı Doğru Rasgele sayı Üreteci Sistemi (G-DRÜS) geliştirilmektedir. 5. Başarı Ölçümleri ve Sonuçlar Güneşin RF frekans bantlarındaki ışınımının uygun anten yapısı ile algılanarak temel bantta örneklenmesi ile sayısal ham işaret elde edilmektedir. Her bir örneğin fiziksel anlam taşımayan en son bitleri birleştirilerek ham rasgele sayılar elde edilerek, EŞARÖY örneklerinin karıştırılmasında kullanılmaktadır. Ham veriler ile aynı sıralama özelliklerine sahip olan EŞARÖY verileri Doğru Rasgele Sayı olarak test edilmiş ve aşağıdaki sonuçlardan beklenen başarı elde edilmiştir. TABLO II. Farklı Doğru Rasgele Sayı Üreteçleri Verilerine İlişkin Başarım Testleri Koşum (Run) Testi* (Bağımsızlık) n Kolmogorov Simirnov Testi* (Düzgün dağılıma uyum) Ortalama ± SD** (En düşük) (En büyük) Random.org verileri 10 50 100 500 1000 29/30 27/30 27/30 25/30 30/30 30/30 30/30 29/30 30/30 29/30 0.329±0.313 0.404±0.267 0.460±0.307 0.483±0.289 0.490±0.297 0.688±0.314 0.584±0.309 0.589±0.279 0.527±0.290 0.521±0.288 30/30 29/30 29/30 29/30 25/30 0.275±0.230 0.416±0.281 0.452±0.303 0.460±0.307 0.478±0.278 0.782±0.248 0.630±0.267 0.571±0.292 0.517±0.293 0.521±0.291 Güneş ışınım verileri 10 50 100 500 1000 29/30 29/30 27/30 26/30 26/30 TABLO III. Güneş ışınımı kaynaklı EŞARÖY-RSÜ Verilerine İlişkin Başarım Testleri*** Koşum (Run) Testi* Kolmogorov Simirnov Testi* Ortalama ± SD** (Bağımsızlık) (Düzgün dağılıma uyum) 10 30/30 30/30 0.550 ± 0.303 50 29/30 30/30 0.510 ± 0.291 100 27/30 30/30 0.505 ± 0.290 500 27/30 30/30 0.501 ± 0.289 1000 30/30 30/30 0.501 ± 0.289 (*) a/b; a:Teste cevap verenlerin sayısı, b:30 adet veri setini temsil etmektedir. (**) SD; Standart sapma değeri. (***) Güneş–DRSÜ sisteminin geliştirilmesi çalışmaları, Başkent Üniversitesi BA14/FM-13 (BAP) projesi kapsamında desteklenmektedir. n Kaynaklar [1] S. G. Tanyer, ‘Tam istatistiksel özelliklere sahip yarı rasgele sayı üretimi’, 22. Sinyal İşleme ve İletişim Uygulamaları Kurultayı (SİU 2014), 23-25 Nisan, 2014. [2] True Random Number Service, www.random.org. [3] K. D. Atalay, S. G. Tanyer, ‘Eşit aralıklı örnekleme yöntemiyle üretilen rasgele sayı dizilerinde başarım ölçümü’, 22. Sinyal İşleme ve İletişim Uygulamaları Kurultayı (SİU 2014), 23-25 Nisan, 2014. [4] G. Marsaglia, ‘Random number generators’, Journal of Modern Applied Statistical Methods, Vol. 2, No. 1, May, 2003, syf. 2–13. [5] D.A. Guidice, E.W. Cliver, W.R. Barron, S. Kahler, 'The Air Force RSTN System', Bulletin of the American Astronomical Society, Vol. 13, March, 1981, p.553, http://adsabs.harvard.edu/abs/1981BAAS...13Q.553G.
© Copyright 2024 Paperzz