Cemre Acar
Python Seaborn ile Veri Görselleştirme

Python Seaborn ile Veri Görselleştirme

Bir önceki yazıda Python ile Veri Görselleştirme adına en temel kütüphane olan Matplotlib'i ele almıştık. Bu yazıda Python’da ilgi çekici ve bilgilendirici istatistiksel grafikler yapmak için kullanılan bir diğer veri görselleştirme kütüphanesi olan Seaborn'u ele alıyoruz. Seaborn kütüphanesi Matplotlib kütüphanesinin üzerine inşa edilmiştir.
Veri Görselleştirme için yeni olduğunuzu düşünüyorsanız Seaborn kütüphanesi ile başlayabilirsiniz. Matplotlib kütüphanesine göre daha fazla hazır tema içerir ve kolayca daha güzel gözüken daha renkli grafikler ortaya çıkarmanızı sağlar. Aşağıda bazı sık kullanılan grafik tiplerini nasıl oluşturacağımıza değinelim. Bunu yaparken Seaborn içerisindeki "tips" adlı veri setinden yararlanacağım.

Veri Setini Dahil Edelim

Burada tips adlı veri seti üzerinden çalışacağımız için bu veri setini ortama dahil ettik. Ayrıca .copy() fonksiyonu ile orijinal veri setimizi korumak için kopyasını almış olduk. 

import seaborn as sns
tips = sns.load_dataset("tips")
df = tips.copy()

Ardından sütun isimlerini Türkçeleştirmek adına aşağıdaki işlemi yapıyorum.

df.columns = ["Toplam","Bahşiş","Cinsiyet","Sigara","Gün","Zaman","Kişi"]


BarPlot :

Bu veri setinde, sigara kullananların mı yoksa sigara kullanmayanların mı daha fazla hesap ödediğine değindik.  

sns.barplot(x="Sigara", y = "Toplam",data = df);

Sigara - Toplam Grafiği (BarPlot)

BoxPlot :

Bu grafikte, erkekler mi kadınlar mı daha fazla hesap ödemiş bunu gözlemliyoruz. Ancak boxplot kullanmamızın amacı grafikte de görüldüğü gibi aykırı gözlemleri ve veri kümesinin dörtte birlik kısımlarını gösterir.

sns.boxplot(x="Toplam",y="Cinsiyet",data=df);

BoxPlot Grafiği



ScatterPlot :

Dağılım grafikleri, bir değişkenin diğerinden ne kadar etkilendiğini gösterme girişiminde veri noktalarını yatay ve dikey bir eksende çizmek için kullanılır.

sns.scatterplot(x="Bahşiş",y="Toplam",data=df);

Scatter Plot

CatPlot :

Bu grafik türü, değişkenlerin kategorilerinin frekanslarını gösterir. 

sns.catplot(x="Bahşiş",y="Zaman", data=df);

Cat Plot



KdePlot :

Kdeplot, sürekli veya parametrik olmayan veri değişkenlerinin olasılık yoğunluk fonksiyonunu gösteren bir çekirdek dağıtım tahmin grafiğidir.

sns.kdeplot(df["Toplam"],shade = True,color="r");

Kde Plot
Python Seaborn ile Veri Görselleştirme adlı yazımı burada sonlandırıyorum. Bu yazımda Seaborn ile bazı temel grafikleri göstermeye çalıştım. Sonraki yazılarda görüşmek üzere. Sağlıkla Kalın.

Heyy ! Blog'a abone olup yazılarımdan ilk sen haberdar olmak ister misin ?

ABONE OL!

Yorumlar

Yorum Ekle

Yorumunuz onaylandıktan sonra yayınlanacaktır.