[MD-sorular] iki istatistik sorusu

Ceyhun B. Akgül cb.akgul at gmail.com
10 Mayıs 2011 Sal 00:13:09 EEST


Merhaba,

1. Tek boyutlu dagilimlar icin median tanimi P(X<m)=1/2 denkligini saglayan
m degeri olarak verilebilir. Bu m degerini X'in tanimli oldugu araligi
olasiliksal olcusu esit olan iki parcaya bolen deger olarak gorebiliriz.
Ayni olasiliksal tanimdan hareketle cok boyutlu median bir nokta olamaz,
sanirim X'in tanimli oldugu (toplam olcusu 1 olan) cok boyutlu uzayi "iki
esit parcaya bolen" hypersurface olsa gerek. Diger yandan median, ortalama
degere gore daha dayanikli (robust) bir merkezilik olcusu olarak alindiginda
http://www.pnas.org/content/97/4/1423.full.pdf adresindeki makalede oldugu
gibi soru bir optimizasyon problemi olarak ortaya cikiyor. Bu bir
optimizasyon problemi oldugu icin de cok boyutlu median tanimi hangi
objektif fonksiyonunu en iyilediginize gore degisiyor.

2. Makul boyutlarda (2, 3, 4, zorlarsaniz 5, 6) non-parametrik dagilim
kestirimine (kernel density estimation - Parzen density estimator olarak da
bilinir) dayali mean-shift algoritmasi var:
http://en.wikipedia.org/wiki/Mean-shift - Bu algoritma bir gradient ascent
proseduru oldugu icin nerden basladiginiza gore farkli sonuclar verebilir -
cunku lokal mod'lari verir. Ancak dagilimin tek modlu oldugundan eminseniz,
cok tutarsiz sonuclar vermeyecegini gozlemleyebilirsiniz.

3. Pragmatik bir cozum olarak her boyutun ayri ayri mediani alinabilir.
Dikkat edilirse bu yaklasim P(X1<m1,X2<m2,...,XN<mN)=(1/2)^N denkligini
X1,X2,...,XN rasgele degiskenlerinin birbirlerinden bagimsiz oldugu
varsayimi altinda saglayan (m1,m2,...,mN) vektorunu median olarak verir - bu
anlamda suboptimal oldugu bariz.

ceyhun



2011/5/9 Kerem Altun <kerem.altun at gmail.com>

> Merhaba, istatistikle ilgili iki sorum olacak. Asagida bahsettigim
> dagilimlar surekli (continuous) dagilimlar, ayrik (discrete) degil yani.
>
> 1. Yuksek boyutlu olasilik dagilimlari (multivariate distribution) icin
> medyan tanimi var midir? Varsa nasildir? Yuksek boyutlu dagilim derken, tek
> boyutlu degil yani, ornegin 2 boyutlu duzlemdeki bir dagilimin medyanindan
> bahsediyorum.
>
> 2. Yine yuksek boyutlu dagilimlar icin, mod tanimi herhalde 1-boyuttaki
> gibi dagilim fonksiyonunun maksimum degerini aldigi yer olarak veriliyordur.
> Elimizde bilmedigimiz bir dagilimdan orneklenmis N tane vektor olsun. Bu
> dagilimin mode'unu bulmak istiyoruz. Bir algoritma tavsiye edebilecek olan
> var mi?
>
> Uc sorum varmis.
>
> 3. Yukaridaki ikinci soru, ama mod yerine medyan olarak okuyunuz. Tabii ilk
> sorumun yaniti olumluysa.
>
> Tesekkurler.
>
> Kerem
>
>
> _______________________________________________
> MD-sorular e-posta listesi
> sorular at matematikdunyasi.org
> http://lists.math.bilgi.edu.tr/cgi-bin/mailman/listinfo/md-sorular
>



-- 
Ceyhun Burak Akgul, PhD
Senior Researcher | Vistek-ISRA Vision
cbakgul at vistek-isravision.com
www.vistek-isravision.com | www.cba-research.com
--
Ceyhun Burak Akgul, PhD
Part-time Faculty | Bogazici University Dept. of Electrical-Electronics Eng.
www.cba-research.com
-------------- sonraki bölüm --------------
Bir HTML eklentisi temizlendi...
URL: <http://lists.math.bilgi.edu.tr/pipermail/md-sorular/attachments/20110510/6e7fb12a/attachment.htm>


MD-sorular mesaj listesiyle ilgili daha fazla bilgi