[MD-sorular] uniform sampling
Ceyhun B. Akgül
cb.akgul at gmail.com
11 Eki 2009 Paz 20:33:11 EEST
Merhaba,
Bu sorunun yine pratik yaniti ne kadar fazla secerseniz o kadar iyidir
olmali.
Burada aslinda istatistiksel bir dagilimi, o dagilimdan uretilen orneklerle
betimlemeye calisiyoruz.
Bu turden parametrik olmayan betimlemelere de ancak asimptotik olarak
guvenilebilir.
Ornegin, duzgun dagildigini bildiginiz N tane noktadan dagilimi (ya da
parametrelerini demeli) kestirmek istiyorsunuz. Duzgun dagilimin tek
parametresi dagildigi araligin uzunlugudur. Boyle bakilinca bu bir
istatistiksel parametre kestirme problemidir, bunun icin "maximum
likelihood", "maximum a posteriori" vs kavramlarindan tureyen kestirim
yontemleri kullanilabilir. Sonucta yaptiginiz kestirim, asil dogru parametre
degerine yapilan rasgele bir yaklasikliktir. Rasgele oldugu icin de aradaki
hata da rasgele bir degiskendir. Hem rasgele kestirimin varyansi, hem de
hatanin mutlak degeri ornek sayisi artikca azalir. Hatayi ustten sinirlayip,
o ust siniri saglayan en az ornek sayisi isinizi gorebilir pratik bir yontem
olarak. Tabi burda yumurta mi tavuktan tavuk mu yumurtadan durumu var,
hatayi ancak dogru degeri biliyorsak tanimlayabiliriz, o zaman
tanimlayamadigimiz seyi nasil ustten sinirlayacagiz? Bunun da yanitlari var
elbet ancak bu mailden daha uzun bir tartisma gerektiriyor.
Diger yandan "bu pratikte de duzgun dagilmis olmalarini istiyoruz" sozu cok
anlamli degil. Ornegin akliniza ilk gelen kriteri -noktalarin arasindaki
uzakligin 0.1'den fazla olmamasi- uyguladiginizda o dagilim artik duzgun
dagilim olmus olmuyor, baska bir dagilim olmus oluyor.
Diger bir nokta da [0,1]^n hiperkubune yapilan genellemeyle ilgili.
Bu genellemeyle ilgili olarak en azindan sunu biliyoruz: belli bir uygulama
icin "gereken" nokta sayisi, ya da hiperkubun her yerini doldurmak icin
gereken nokta sayisi, boyut artikca "exponential" olarak artar - yani tek
boyutta K nokta yetiyorsa, n boyutta nK nokta yeter gibi dogrusal bir iliski
yok. Bu ayni zamanda istatistik literaturunde "curse of dimensionality"
denilen hadisenin tezahurlerinden yalnizca biri.
Ceyhun
2009/10/11 Kerem Altun <kerem.altun at gmail.com>
> Merhaba, bir sorum olacak. Aslinda matematik sorusu degil pek, daha cok
> pratige yonelik. Ama belki bir fikir veren cikar.
>
> Ornegin, [0,1]x[0,1] karesinde uniform dagilimdan noktalar sectigimizi
> dusunelim. Ama sectigimiz bu noktalarin pratikte de "duzgun dagilmis"
> olmalarini istiyoruz. Kac nokta secmeliyiz? Ornegin 1 nokta secersek olmaz
> herhalde. 2 nokta secersek de olmaz. 10 yeter mi, yoksa 100 tane mi
> secmeliyiz? Kac nokta sececegimizi hangi kritere gore belirleyebiliriz? Bu
> is icin kullanilan kriterler, ya da, "rule of thumb" gibi birtakim kurallar
> var midir?
>
> Aklima ilk gelen kriter, "her nokta icin, en yakin noktanin uzakligi
> 0.1'den fazla olmasin" olabilir ornegin. Bu sarti yuksek bir olasilikla
> saglamak icin kac nokta secmek gerektigi nasil hesaplanir? Bu, [0,1]^n
> hypercube'une nasil genellenir?
>
> Fazla hesap kitap gerektirmeyen baska kriterler ne olabilir?
>
> Tam cozum veya tam bir yanit istemiyorum elbette, her turlu fikire,
> tavsiyeye acigim. Matematikcileri boyle "gercek hayat" sorulariyla mesgul
> ediyorum galiba ama, kusura bakmayin :)
>
> Tesekkurler.
>
> Kerem
>
>
> _______________________________________________
> MD-sorular e-posta listesi
> sorular at matematikdunyasi.org
> http://lists.math.bilgi.edu.tr/cgi-bin/mailman/listinfo/md-sorular
>
--
Ceyhun Burak Akgul, PhD
Marie Curie Research Fellow
Video Processing and Analysis Group
Philips Research Europe
High Tech Campus 36, WOp122 (WO 01)
5656AE Eindhoven, The Netherlands
Phone: +31 40 27 46156 Fax: +31 40 27 42630
http://www.cba-research.com/
-------------- sonraki bölüm --------------
Bir HTML eklentisi temizlendi...
URL: http://lists.math.bilgi.edu.tr/pipermail/md-sorular/attachments/20091011/09df3c5b/attachment.htm
MD-sorular mesaj listesiyle ilgili
daha fazla bilgi