Cemre Acar
Pandas ile Harici Dosyadan Veri Okumak

Pandas ile Harici Dosyadan Veri Okumak

Bu yazımda Pandas CSV Dosya Okuma, Pandas Excel Dosya Okuma ve Pandas TXT Dosya Okuma kavramlarına değineceğim. NumPy ve Pandas Frameworkleri ile ilgili daha önce çeşitli giriş yazıları ve temel özellikleri belirttiğim bazı yazılar yayımlamıştım. Yayınladığım o yazılara da NumPy ve Pandas buradan ulaşabilirsiniz. Yukarıda da bahsettiğim gibi bu yazıda Pandas ile .CSV, Excel(.xlsx) ve .TXT gibi son derece sık karşılaştığımız dosya tiplerindeki veriyi okumaya çalışacağız.

İlk olarak bir .txt dosyası okuma ile başlayalım. Aslına bakarsak tüm dosyaları neredeyse aynı şekilde okuyabiliyoruz. Yalnızca değişen birkaç şey oluyor.

Pandas ile .TXT Dosyası Okuma

Harici bir dosyayı Pandas ile okumamız için Pandas içerisinde yer alan read_csv fonksiyonunu kullanıyoruz. Aşağıda daha detaylı inceleyelim.

import pandas as pd
pd.read_csv("/dosya_yolu/dosya_ismi.txt")

Yukarıdaki kod bloğumuzda dosya_ismi.txt adlı dosyamızdaki verileri okumuş olduk. Burada değinmemiz gereken bir sep parametresi var. Öyle ki dosyada tutulan verilerin düzgün bir şekilde çıkarılması için bize kolaylık sağlıyor. Python'da print() fonksiyonunun da içinde bulunan bu parametre ile verinin hangi şartlar altında birbirinden ayrılacağını belirtiyoruz. 
Yukarıda bir sep parametresi belirtmedik ve default olarak "," değeriyle geldi. Belirtmek isteseydik aşağıdaki şekilde bir gösterim yapardık. 

import pandas as pd
pd.read_csv("/dosya_yolu/dosya_ismi.txt", sep=";")

Bu sayede okumak istediğimiz dosya_ismi.txt dosyamızdaki veriler ";" ile ayrılmışsa sorunsuz bir şekilde verilerimiz önümüze gelecektir. 

Pandas ile .CSV Dosyası Okuma

Veri setleri ile ilgilendiğimizde .CSV dosyaları en çok karşılaştığımız dosyaların başında geliyor diyebiliriz. Kaggle gibi bir platformda çeşitli veri setlerine ve kaydediliş şekillerine baktığımızda da bunu kolaylıkla görebiliyoruz. Yukarıda .TXT dosyalarını okumak için kullandığımız her şey aynı şekilde burada da geçerli. 

import pandas as pd
pd.read_csv("/dosya_yolu/dosya_ismi.csv", sep="/")

Yukarıda, "/" işareti ile ayrılmış bir veri setini düzgün bir şekilde görüntüleyebileceğimiz bir kod bloğu yazdık.



Pandas ile Excel(.xlsx) Dosyası Okuma

Son olarak üzerinde belirli kayıtlar tutulmuş bir Excel dosyasındaki verileri Pandas ile okuma yöntemine bakıyoruz. Yukarıda da bahsettiğim gibi tüm işleyiş aynı olmakla birlikte burada farklı bir fonksiyon kullanacağız. 

import pandas as pd
pd.read_excel("/dosya_yolu/dosya_ismi.xlsx")

Bu şekilde de bir excel dosyasındaki verilerimizi başarıyla okumuş olduk.

Yukarıdaki 3 başlıkta da fonksiyonların yalnızca sep parametresine değinmiş olduk, buna ek olarak bir çok parametre bulunmakta. Tüm bu parametreleri görmek ve kullandığınız fonksiyon hakkında daha fazla bilgi edinmek için kullanacağınız fonksiyonun başına "?" işareti getirmeniz yeterli olacaktır. 

import pandas as pd
?pd.read_csv

Bu kod bloğunu çalıştırdığınızda oldukça uzun ve detaylı bir yardımcı kaynak sizi bekliyor olacak. Pandas ile Harici Dosyadan Veri Okumak adlı yazımı burada sonlandırıyorum. Umarım bilgiler faydalı olmuştur. Sağlıkla Kalın.

Heyy ! Blog'a abone olup yazılarımdan ilk sen haberdar olmak ister misin ?

ABONE OL!

Yorumlar

Yorum Ekle

Yorumunuz onaylandıktan sonra yayınlanacaktır.