0

MATLAB ile Veri Analizi : Verilerin Grafiksel Gösterimi 1

 

Hepinize merhabalar. Hatırlayacağınız üzere bir önceki yazımızda İstatistiksel Veri Analizi için gerekli olan bilgileri tamamlamıştık. Şimdi ise verilerim grafiksel gösterimi ile devam edeceğiz.

           Elimizdeki veriler hakkında çok fazla ön bilgimiz yoksa modelleme ve tahminleme gibi daha ileri aşamalara geçmeden önce, verileri grafiksel olarak incelemek daha doğru olacaktır. Böylece verilerin genel yapısı hakkında bilgi edinebilir ve verilerdeki problemleri durumları (sapan gözlemler, trendler vs.) da görebiliriz. Bu aynı zamanda keşfedici veri analizinin de ilk kısmıdır.

 

          Verileri grafiksel olarak incelememiz bize verilerin geldiği ana kütle hakkında ve verilerdeki olası sapan değerler hakkında bilgi verecektir. Verinin simetrisi, modunun olup olmadığı, hangi değerlerde yoğunlaştığı gibi bilgileri grafiklerin üstünden anlayabiliriz. Tek değişkenli veri analizi için kullanılan en temel grafikler histogram, pasta grafiği, alan grafiği, olasılık plotları, kutu diyagramları ve zaman serisi grafikleri şeklindedir.

Histogram grafiği veri setinin frekans dağılımını grafiksel olarak göstermenin yollarından biridir. Histogram yardımı ile veri setinin dağılımının şekli, değişkenliği (yayılımı), yeri gibi bazı özet ölçüleri anlayabiliriz. Ayrıca verinin elde edildiği popülasyondaki olasılık dağılımını belirlememize de yardımcı olur. Veri içindeki beklenmedik davranışları da görünür kılar.

Veriler, belirli sınıf aralıklarında toplanarak frekans histogramı oluşturulur. Sınıf aralıkları birbirleri ile çakışmamalıdır. Sınıf sayısının ve aralığının belirlenmesi için pek çok yöntem bulunmaktadır fakat pratik olarak sınıf sayısının 5 ile 20 arasında olması ve veri sayısının karekökü kadar sınıf oluşturulması tavsiye edilir. MATLAB yazılım dilinde basit frekans histogramı çizebilmek için “hist” fonksiyonu kullanılır.

 

Önceki örneğimizdeki m matrisi için histogram çizdirelim.

Eğer fonksiyonu farklı bir şekilde yani “[n, xout] = hist(m)” şeklinde kullanırsak, frekansları (n) ve sınıf orta noktalarını (xout) vektör olarak verir, fakat grafiği çizmez. Grafiği de çizdirmek isterseniz “bar(xout, n,1)” komutu kullanılır.

Histogramı eğer göreli frekanslara göre çizmek istersek frekans ve sınıf orta noktaları bulunduktan sonra, “bar(xout,n/verisayısı,1)” yazılır. Yoğunluk histogramı ise altında kalan alan bire eşit olan histogramdır. Verilerimizi yoğunluk histogramı olarak çizersek, hangi olasılık dağılımına uyduklarını daha kolay görebiliriz ve bunu normal dağılım ile karşılaştırabiliriz. Yoğunluk histogramı çizmek için, her bir sınıf frekansını, toplam veri sayısı ile sınıf aralığı değerlerinin çarpımına bölünerek normalize ederiz. MATLAB dilinde yoğunluk histogramı için özelleştirilmiş bir komut yoktur.

 

Bu yazımızda verilerin gösterilmesinde kullanılan grafiklere giriş yaptık. Bir dahaki yazıda pasta grafiği ile devam edeceğiz. Kendinize iyi bakın mutlu kalın…

 


Like it? Share with your friends!

0

0 Comments

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir