Bu repository, veri bilimi ve makine öğrenmesi alanında geliştirilmiş çeşitli projeleri içermektedir. Her bir proje, farklı veri analizi ve makine öğrenmesi tekniklerini kullanarak gerçek dünya problemlerine çözümler sunmaktadır.
Dosya: mental-healts.ipynb
Bu proje, mental sağlık verilerinin analizini ve görselleştirilmesini içermektedir. Proje kapsamında:
- Veri temizleme ve ön işleme
- İstatistiksel analizler
- Veri görselleştirme
- Korelasyon analizleri
- Trend analizleri
Dosya: Clustering_ML_Jobs_in_the_US_withTF_IDF_and_KMeans.ipynb
Bu proje, ABD'deki makine öğrenmesi iş ilanlarının analizini ve kümeleme işlemlerini içermektedir. Kullanılan teknikler:
- TF-IDF (Term Frequency-Inverse Document Frequency)
- K-Means Kümeleme
- Metin madenciliği
- İş ilanlarının kategorize edilmesi
- Görselleştirme ve analiz
Dosya: Practice Session.ipynb
Bu proje, Pima Indians Diabetes veri seti üzerinde temel veri analizi, görselleştirme ve korelasyon incelemeleri içermektedir.
- Veriyi tanımak
- Eksik ve anlamlı olmayan sütunları tespit etmek
- Görsel analizlerle dağılımları ve ilişkileri incelemek
pandasnumpymatplotlibseaborn
- Veri Yükleme:
pima-indians-diabetes-database.csv - Dağılım Grafikleri: Her sütunun dağılımını incelemek için
plotPerColumnDistribution() - Korelasyon Matrisi: Değişkenler arası ilişkiyi görmek için
plotCorrelationMatrix() - Scatter Matrix: Sayısal değişkenler arası dağılım grafikleri
plotPerColumnDistribution(df, n, perRow)plotCorrelationMatrix(df, width)plotScatterMatrix(df, size, textSize)
- Eksik değerler otomatik olarak tespit edilip analiz dışında bırakılır.
- Sadece sayısal veriler görselleştirmeye dahil edilir.
Veri seti: Kaggle - Pima Indians Diabetes Database
Bu proje temel veri analizi ve görselleştirme uygulamaları içeren bir başlangıç çalışmasıdır.
Bu dosya, çeşitli veri bilimi ve makine öğrenmesi kavramlarının uygulamalı olarak gösterildiği bir çalışma oturumunu içermektedir.
- Python
- Jupyter Notebook
- Pandas
- NumPy
- Scikit-learn
- Matplotlib
- Seaborn
- NLTK (Doğal Dil İşleme için)
Projeleri çalıştırmak için aşağıdaki Python kütüphanelerinin yüklü olması gerekmektedir:
pip install pandas numpy scikit-learn matplotlib seaborn nltk jupyter- Repository'yi klonlayın:
git clone [repository-url]- Gerekli kütüphaneleri yükleyin
- Jupyter Notebook'ları açın ve çalıştırın
.
├── mental-healts.ipynb
├── Clustering_ML_Jobs_in_the_US_withTF_IDF_and_KMeans.ipynb
└── Practice Session.ipynb
Pima Indians Diabetes Analizi