Cemre Acar
Pandas Nedir ? Pandas Kullanımı

Pandas Nedir ? Pandas Kullanımı

Pandas, Python programlama dili için yüksek performanslı, kullanımı kolay veri yapıları ve veri analiz araçları sağlayan açık kaynaklı, BSD lisanslı bir Python kütüphanesidir. Pandas kütüphanesi ile Finans, Ekonomi, İstatistik, Analitik vb. dahil olmak üzere akademik ve ticari alanlarda çok çeşitli şekilde kullanılır.
Bu yazıda, Pandas nedir, Pandas nasıl kullanılır, Pandas kurulumu, Pandas serileri, NumPy Array ile Pandas Serisi Oluşturma, Pandas temel işlemleri ve bunların pratikte nasıl kullanılacağını öğreneceğiz.
Tabii ki daha önceki yazıda ne olduğuna ve kullanımına değindiğimiz NumPy kütüphanesini de bu yazıda aktif olarak kullanıyor olacağız.
NumPy hakkında bilginiz yok ise NumPy Nedir ? NumPy Kullanımı adlı yazıma göz atabilirsiniz.

Pandas Kurulum

Pandas kütüphanesini kurmak için Python paket yöneticisi olan pip bilgisayarınızda yüklü olmalı. Yüklü değilse ilk olarak pip ardından da Pandas kütüphanemizi kuralım. 

Ben tüm işlemleri Linux üzerinde gerçekleştirdiğimden kurulumu da Linux üzerinde yapacağım.

Python pip yüklemek için ;

sudo apt install python3-pip

Ve ardından Pandas kütüphanemizi yüklemek için ;

pip install pandas

Ve artık hazırız !
Öncelikle kütüphanelerimizi kullanmak için onu işlemlerimize dahil etmeliyiz.

import numpy as np
import pandas as pd


Pandas ile Temel İşlemler

İlk olarak bir Pandas serisi oluşturalım.

pd.Series([3,5,7,9])

Sonuç:

0    3
1    5
2    7
3    9
dtype: int64

Aşağıdaki dtype: int64 çıktısına dikkat çekmek istiyorum. Burada Pandas serilerinin bir veri tipi olduğunu söyleyebiliriz. Şimdi yukarıdaki serimize benzer başka bir seri oluşturalım ve bir değişkene atayalım.

ilkseri = pd.Series([1,2,3,4,5])
type(ilkseri)

Sonucunda bunun bir Pandas serisi olduğunu görebiliyoruz.

pandas.core.series.Series

Şimdi de ilkseri adlı Pandas serimizin çeşitli özelliklerine bir bakalım.

ilkseri.axes

Bunun sonucunda çıktının isminden de anlaşılacağı üzere Indexlerimizin değerini bize veriyor. Serimizde 0,1,2,3,4 Indexlerimiz olduğundan böyle bir sonuç aldık.

[RangeIndex(start=0, stop=5, step=1)]

Bu serimizin veri tipini sorgulamak istersek onu da aşağıdaki şekilde bastırabiliriz.

ilkseri.dtype

Sonuç:

dtype('int64')

Burada NumPy yazımda da bahsettiğim bazı özellikleri de göstermek isterim. İlk olarak serimizin boyutuna bir bakalım.

ilkseri.ndim

Sonuç: 1
Yine aynı şekilde size değerini de kontrol edebiiriz. Ek olarak serimizin içerdiği değerleri görmek istediğimizde ise aşağıdaki value özelliğini kullanabiliriz.

array([1, 2, 3, 4, 5])

Örneğimizde çalıştığımız seri yalnızca 5 değerden oluşuyor. Daha büyük boyuttaki bir seri ile çalıştığımızda yalnızca ilk 10 yada ilk 5 değeri görmek isteyebiliriz. Bunun için head özelliğini kullanıyoruz. Örneğimizde sadece 5 değerimiz olduğundan ilk 2 değeri görüntülemek isteyelim.

ilkseri.head(2)

Benzer şekilde yalnızca istediğimiz indexteki değerleri görmek için de Python ile oldukça sık kullandığımız slice işlemini kullanabiliriz.

ilkseri[1:3]

Sonuç: 

1    2
2    3
dtype: int64

Son olarak index özelliğine bir bakalım. Bu özelliği kullanarak belirlediğimiz değerleri istediğimiz indexlere atayabiliyoruz. Örnek olarak aşağıdaki şekilde bir seri oluşturalım.

pd.Series([10,20,30,40], index = [1,3,5,7])

Bu işlemin sonucunda da aşağıda gördüğümüz gibi yalnızca belirlediğimiz indexlere istediğimiz değerleri atamış olduk.
Not: Belirlediğimiz index değerleri String ifadeler de alabilmekte dilerseniz çeşitli harf ya da sözcük biçiminde bir index yapısı oluşturabilirsiniz.

1    10
3    20
5    30
7    40
dtype: int64

Şimdi de daha önce değindiğimiz NumPy arrayleri ile bir Pandas serisi oluşturalım.



NumPy Array ile Pandas Serisi Oluşturma

İlk olarak bir NumPy array oluşturalım ve bunu bir değişkene atayalım.

x = np.array([1,2,3,4,5])

Bunu ekrana basmak istediğimizde ndarray nesnemizi başarılı bir şekilde oluşturduğumuzu görüyoruz.
Sonuç:

array([1, 2, 3, 4, 5])

Şimdi de oluşturduğumuz NumPy arrayini Pandas serisine dönüştürelim.

num_to_pan = pd.Series(x)

Değişkenimizi ekrana bastığımızda karşımıza çıkan sonucun bir Pandas serisi olduğunu görüyoruz.

0    1
1    2
2    3
3    4
4    5
dtype: int64

Yazımı burada sonlandırıyorum. Bu yazımda başlı başına Pandas nedir, Pandas nasıl kullanılır, Pandas kurulumu, NumPy Array ile Pandas Serisi Oluşturma, Pandas temel işlemleri ve bunların pratikte nasıl kullanılacağına değinmiş oldum. Yazımda eksik ya da yetersiz gördüğünüz kısımları yorum olarak belirtebilirsiniz. Sağlıkla Kalın.

Heyy ! Blog'a abone olup yazılarımdan ilk sen haberdar olmak ister misin ?

ABONE OL!

Yorumlar

Yorum Ekle

Yorumunuz onaylandıktan sonra yayınlanacaktır.