Merkezi Limit Teoremi ve Normal Dağılım

Home - 6 Sigma - Merkezi Limit Teoremi ve Normal Dağılım

İstatistiksel problem kontrol sürecinde süreç davranışını analiz edebilmemiz için öncelikle sürecin nasıl bir dağılım gösterdiğinin anlaşılması gerekir ve genelde bir çok problem normal dağılım özellikleri baz alınarak çözümlenir.

Ancak, değişkenliklerin her zaman kontrol edilememesi ya da çıktıların her zaman çan eğrisine benzemediği durumlarda, süreçlerin modellenebilmesi kolay değildir.

İşte bu aşamama Merkezi Limit teoremi bize yardımcı olmaktadır.

İstatistik biliminde Merkezi Limit teoreminin çok anlamlı bir yeri vardır. Merkezi limit teoremine göre, süreç üzerinden alınan örnek sayısı artıkça ve dışarıdan bir etki olmadığı müddetçe, farklı dağılım özelliği taşıyan süreç çıktıları histogram üzerinde ortalama değer etrafında normal dağılıma yakınsar bir dağılım gösterirler.

Merkezi limit teoremi doğrultusunda, alınan örnek sayısının 30 ve üzeri olması durumlarında süreç dağılımı normal dağılıma yakınsama göstermedir. Aşağıdaki şekilde görüldüğü üzere farkı dağılım özelliği gösteren serilerin ilk davranışları, çıktılardan alınan örnek sayısı artıkça normal dağılıma benzemektedir.

Bu sayede farklı dağılım özelliği gösteren dağılımlar, örnekleme yöntemleri ile normal dağılıma yakınsaklaştırılarak, süreç modellemesinin normal dağılım kriterlerine göre (ampirik kural) yapılabilmesine olanak sağlanır.

Z Dönüşümü

Eğer süreç normal dağılım özelliği gösteriyorsa sürecin konumu ve yayılım hakkında bilgi sahibi oluruz. Bu sayede sürecin nasıl davrandığını yorumlayıp, ne oranda kararlı bir sürece sahip olduğumuzu anlayabiliriz.

Ampirik kurala göre normal dağılım özelliği gösteren bir dağılım çıktıları 99,73% oranında, dağılımın merkezinden ±3 σ uzaklık içinde yer alır. Örneğin ortalaması 100, standart sapması 2 olan bir sürecin çıktılarının 99,73 % oranda 94 ile 106 arasında yer alması beklenir. Eğer müşteri spekt değerleri sizin değerlerinizin sağında ve solunda yer alıyorsa – süreç kararlıdır diyebiliriz.

Peki süreç bu şekilde davranıyor ve müşteri beklentilerinin daha başka olduğu durumlarda süreç kararlılığını nasıl hesaplayacağız?

Yukarıdaki örnekte müşteri beklentisinin; alt spekt limitinin 93, üst spekt limitinin 103 olduğunu varsayalım.

Bu durumda, süreç normal dağılım eğrisinin sol tarafı müşteri spekt limitlerinin içinde yer alacaktır. Çünkü müşteri en küçük spekt limiti 93, bizim süreç çıktımızın en küçük değeri ise 94 olduğuna göre sol tarafta sorunumuz yoktur. Ancak, süreç normal dağılım eğrisinin sağ tarafında kalan alanın bazı kısımları müşteri spekt limitlerinin içinde yer alacaktır. Çünkü müşteri en büyük spekt limiti 103, bizim süreç çıktımızın en büyük değeri ise 106 olduğuna göre eğrinin sağ tarafta kalan bir kısım alan müşteri spektleri dışında kalacaktır.

Eğer gerçekleşen dağılım eğrisi her iki taraftan da speklerin içinde olsa idi bu durum prosesin %100 güvenilir olduğunu gösterecek idi. Ancak, mevcut durumda dağılımın bir kısmının spekt dışında olma durumu vardır. Bizim bu spekt dışındaki alanı alanını (hata olasılığı) bulmamız gerekir.

Sürecin ne oranda spekt içinde üretim gerçekleştirdiği süreç yeterliliği olarak tanımlanır. Süreç dağılım eğrisinin, müşteri spektleri içinde kalan kısmının integral hesapları ile bulunması gerekir. Bu işi yapmak hem karmaşık hem de pek kolay değildir.

Bu noktada karmaşık matematiksel formülleri kullanmak yerine, daha önceden standart normal dağılım karakteristiği için hazırlanmış hazır tablolardan faydalanıyoruz. Bu tablolardan faydalanmak için süreç normal dağılımın Z dönüşümü ile standart normal dağılım şekline dönüştürülmesi gereklidir. Bu sayede matematiksel hesaplamalar yapmadan, süreci standart normal dağılım şekline dönüştürüp,  hazır tablolar üzerin den istediğimiz yerin alanını rahatlıkla bulabiliriz. 

Standart normal dağılım;

Ortalaması x ̅ = 0, standart sapması σ =1 olan bir normal dağılım eğrisidir. Matematiksel olarak Z’nin alabileceği her değer için kümülatif alan hesabı tablolarda hazır olarak mevcuttur. Standart normal dağılım eğrisi simetrik olduğu için negatif değerler için ayrı bir tabloya gereksinim yoktur. Bu bağlamda istediğimiz değere karşılık gelen alanı bulabilmek için önce Z değerini hesaplayıp, akabinde tablodaki Z’nin karşılık geldiği değere bakılması gerekir.

Örneğin Z= 3 için tablo değeri 0,99865 demek eğrinin en başından Z=3 değerine kadar olan alanın toplamının 0,99865 olduğu anlamına gelir. Toplam alan 1 olduğuna göre Z=3 dışında kalan alan 1 – 0,99865 = 0,00135 olacaktır. Bu kısım eğrinin Z=3 den sonraki sağda kalan kısmıdır. Aynı şekilde -3 den önceki alanda aynı şekilde 0,00135’e eşittir (simetriden dolayı).

Bu iki ifadeyi toplar ve 1’den çıkarırsak -3 ile +3 arasında kalan alanı bulmuş oluruz. 1 – (0,00135 + 0,00135) = 0,9973 yani ampirik kuraldaki ortalamanın ±3s aralığındaki toplam olasılığın sonucuna ulaşırız.