0

MATLAB ile Veri Analizi : Verilerin Grafiksel Gösterimi 2

Hepinize merhaba. Bir önceki yazımda verilerin grafiksel gösterimi konusuna başlamıştık ve histogramı incelemiştik. Şimdi ise pasta grafiği, alan grafiği, Q-Q Plot, kümülatif dağılım diyagramı ve kutu diyagramları ile devam edeceğiz. Hadi başlayalım.

Pasta grafikleri veri gruplarının bütün içindeki payını gösteren bir grafiktir. MATLAB programlama dilinde pasta grafiği çizmek için kullanılan fonksiyonlar “pie” ve “pie3” tür. “pie3” ile çizdiğiniz pasta grafiği 3 boyutlu olur. Genel kullanımları ise “pie(X ,explode, ‘labels’)” ve “pie3(X, explode, ‘labels’)” şeklindedir. Burada X : verilerin bulunduğu satır vektörü, explode : pastadan ayrı görünmesini istediğimiz parçaları belirten vektör, ‘labels’ ise parça etiketleridir. Örneğin A, B, C, D ve E şeklinde 5 firmanın satış verileri elimizde olsun ve içlerinden en fazla satanı da pastadan ayrı göstermek isteyelim.

Verilerin gösteriminde kullanılan diğer bir grafiğimiz ise alan grafiğidir. Alan grafiği, bir vektör ya da matris şeklindeki verilerin elemanların toplamına ne kadar katkıda olduğunu görmemize yarayan bir grafiktir. Matrisin her satırındaki veriler üst üste bindirilerek bu değerlerden bir eğri yaratılır. Özellikle farklı veri setlerinin karşılaştırılması için kullanışlıdır. Alan grafiği çizmek için kullanılan fonksiyon “area” fonksiyonudur. Genel formatı : “area(Y, basevalue, ‘PropertyName’, PropertyValue,…)” şeklindedir. Burada basevalue : dolgulu alanın başlayacağı değeri gösterir. Örneğin az önceki verilerimiz bir de bu grafik ile ekrana yazdıralım.

 

Diğer grafik tipimiz ise Q-Q Plot grafiğidir. İki değişkeni, kantillerini birbirlerine göre noktalayarak karşılaştırır. Böylece iki değişkenin dağılımının aynı olup olmadığı anlaşılabilir. MATLAB programlama dilinde Q-Q plot çizmek için kullanılan fonksiyon “qqplot” fonksiyonudur. Verilerin normal dağılıma veya weibull dağılımına uygunluğunu araştırmak için kullanılan “normplot” ve “wblplot” fonksiyonları da aynı mantıkla çalışır.

 

qqplot(M) : M değişkeninin örnek kantillerini, Normal dağılımın teorik kantilleri ile karşılaştırarak gösterir. Eğer düz bir çizgi oluşmuşsa, değişken normal dağılımdan gelmektedir.

 

qqplot(x,y) : x ve y değişkenlerini birbiri ile karşılaştırır. Eğer düz bir çizgi oluşmuş ise, iki değişken aynı dağılımdan geliyor demektir.

 

Örneğin elimizdeki 5 veri için qqplot ile Q-Q grafiği çizdirelim.

Kümülatif dağılım diyagramları, verilerin ampirik kümülatif dağılım grafiğinin çizilmesini sağlar. “cdfplot” fonksiyonu ile çizilir.

Kutu diyagramları ise verilerin dağılımını gösterirken tercih ettiğimiz başka bir yoldur. Kutu diyagramları verilerden elde ettiği beş özet ölçüyü (kartiller, minimum ve maksimum değerler) kullanarak oluşturulur. Birden fazla değişkeni birbirleri ile karşılaştırmak için de kullanışlıdır. Çizdirmek içinse “boxplot” komutu kullanılır.

Kutu grafiklerini özelleştirmek için bazı özel parametreler kullanırız. Bunlar aşağıdaki tabloda belirtilmiştir.

 

Parametre Adı Parametre Değeri
‘notch’ Eğer ‘on’ değeri verilirse, medyanın güven aralığının robust bir tahmini kullanılarak kutu çentikli görümün kazanır. Varsayılan değeri “off” tur. Çentikleri kesişmeyen kutular için, her iki grubun medyanlarının birbirinden 0.05 önem düzeyinde farklı oldukları söylenebilir.
‘symbol’ Sapan gözlemleri göstermek için kullanılan sembol. Varsayılan değeri “r+” yani kırmızı artıdır.
‘orientation’ Kutunun yönü. ‘vertical’(dik) varsayılan değeridir. ‘horizontal’ (yatay) da kullanılabilir.
‘whisker’ iqr ‘ nin katı olarak maksimum fırça uzunluğu. Varsayılan değeri 1.5’tir.
‘labels’ Sütun etiketlerini taşıyan karakter dizisi veya hücre dizisi.

 

 

Bu yazımızda sizlerle verilerin grafiksel gösteriminde kullanılan grafiklerden beş tanesini daha inceledik. Bir daha ki yazımızda yine grafikler ile görüşmek üzere. Mutlu kalın…

 


Like it? Share with your friends!

0

0 Comments

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir