Açıklama
Genel Tanım
Data Science Uzmanlığı Eğitim Programı, veri analizi, modelleme ve makine öğrenmesi alanında derinlemesine bilgi edinmek isteyen katılımcılara, Python programlama temelleri, veri toplama, temizleme, analiz ve görselleştirme yöntemlerinin yanı sıra, ileri düzey makine öğrenmesi, derin öğrenme, doğal dil işleme ve proje geliştirme süreçlerini kapsamlı bir şekilde öğreten çok disiplinli bir programdır. Bu eğitim, hem teorik bilgileri hem de gerçek dünya uygulamalarını içeren vaka çalışmaları, atölye çalışmaları ve grup projeleriyle desteklenerek, katılımcıların kurumsal ve endüstriyel veri bilimi çözümleri geliştirmesine olanak tanır.
Nedir?
Bu eğitim, veri biliminin temel prensiplerinden başlayarak, Python programlama dilinin kullanımıyla veri setlerinin toplanması, temizlenmesi, analizi ve görselleştirilmesini; makine öğrenmesi algoritmalarının uygulanması, model değerlendirme metriklerinin anlaşılmasını; derin öğrenme ve doğal dil işleme gibi ileri tekniklerin somut projeler üzerinden uygulanmasını içermektedir. Ayrıca, veri görselleştirme ve raporlama, proje geliştirme, etik ve veri güvenliği konularını da kapsayan modüller sayesinde, katılımcılar iş süreçlerinde stratejik kararlar alabilecek ve dijital dönüşüme öncülük edebilecek bilgi ve beceriye sahip olurlar.
Kimler içindir?
- Veri bilimine yeni başlayanlar, veri analistleri ve veri mühendisleri
- Makine öğrenmesi ve derin öğrenme konularında kendini geliştirmek isteyen yazılım geliştiriciler
- Akademisyenler, araştırmacılar ve dijital dönüşüm projelerinde yer alan profesyoneller
- İş analistleri, strateji belirleyiciler ve ürün yöneticileri
- Veri odaklı karar alma süreçlerini iyileştirmek isteyen kurum içi uzmanlar
Neden Data Science Uzmanlığı Eğitimi ?
- Kapsamlı Temel ve İleri Bilgi: Veri biliminin temel prensiplerinden ileri makine öğrenmesi ve derin öğrenme tekniklerine kadar geniş bir konu yelpazesi sunar.
- Pratik Uygulama: Canlı demo seansları, interaktif atölyeler, grup projeleri ve vaka çalışmaları ile teorik bilgilerin uygulamaya dönüştürülmesi sağlanır.
- Python Giriş ve Araçları: Veri bilimi çalışmalarının vazgeçilmezi Python dilini, uygulamalı örnekler ve projelerle detaylı olarak öğretir.
- Güncel Trendler ve Etik Yaklaşım: Veri güvenliği, etik ilkeler, veri gizliliği ve geleceğe yönelik teknolojik trendler konularını da kapsayarak, rekabet avantajı sağlayacak stratejik bilgiler sunar.
- Kariyer ve İleri Eğitim Fırsatları: Sağlanan kapsamlı içerik, güçlü bir portföy ve sertifikalandırma ile kariyer gelişimine katkıda bulunur.
Modül 1: Python Giriş ve Programlama Temelleri
1.1 Python’a Giriş
- Python’un Tarihçesi ve Evrimi:
- Python’un oluşturulma amacı ve gelişim süreci
- Python’un açık kaynak felsefesi ve topluluk desteği
- Veri bilimi alanında Python’un popülerliğinin nedenleri (basit sözdizimi, geniş kütüphane desteği)
- Python’un Avantajları ve Kullanım Alanları:
- Hızlı prototipleme, esneklik, okunabilir kod yazma
- Veri analizi, makine öğrenmesi, web geliştirme, otomasyon ve daha pek çok alanda kullanım örnekleri
- Temel Yapı, Sözdizimi ve Yorumlayıcı Kavramı:
- Python yorumlayıcısının çalışma mantığı, REPL (Read–Eval–Print Loop)
- Temel sözdizimi: İfadeler, değişken atamaları, veri yapıları ve temel kontrol akışları
- Kod yazım standartları (PEP8), yorum satırları ve dokümantasyon
- Çalışma Ortamı Kurulumu:
- Python kurulumu (Python 3.x) ve sanal ortamların (virtualenv, conda) önemi
- IDE’ler ve kod editörleri: Jupyter Notebook, VSCode, PyCharm – her birinin avantajları, temel konfigürasyon ayarları
- Çalışma ortamı örnekleri: Basit bir Jupyter Notebook dosyası oluşturma ve çalıştırma
1.2 Temel Veri Tipleri ve Operatörler
- Temel Veri Tipleri:
- Sayılar: Tam sayılar, ondalık sayılar, matematiksel işlemler
- Metinler (String): Karakter dizileri, string metodları, formatlama
- Listeler: Liste oluşturma, eleman ekleme/çıkarma, dilimleme, liste metodları
- Sözlükler (Dictionary): Anahtar-değer çiftleri, sözlük metodları, iterasyon
- Setler: Benzersiz elemanlar, küme işlemleri, fark, kesişim metodları
- Demetler (Tuples): Değiştirilemez veri yapıları, avantajları ve kullanımları
- Operatörler ve İfadeler:
- Aritmetik operatörler: Toplama, çıkarma, çarpma, bölme, mod, üstel işlemler
- Karşılaştırma operatörleri: Eşitlik, büyüklük, küçüklük, eşitsizlik
- Mantıksal operatörler: and, or, not kullanımları
- Bit düzeyi operatörler ve diğer ileri operatör örnekleri
- Uygulamalı Örnekler:
- Temel veri tipleri kullanılarak basit hesaplamalar, string işlemleri, liste ve sözlük manipülasyonları
- Mini projeler: Basit bir hesap makinesi uygulaması, metin tabanlı veri işleme örnekleri
1.3 Kontrol Yapıları ve Fonksiyonlar
- Kontrol Yapıları:
- Koşul ifadeleri (if, elif, else): Karar yapılarının oluşturulması, iç içe koşullar
- Döngüler: For ve while döngülerinin kullanımı, döngü kontrol ifadeleri (break, continue)
- Örnek senaryolar: Belirli bir listede arama, tekrarlanan işlemlerle veri toplama
- Fonksiyonlar:
- Fonksiyon tanımlama, parametre geçişi, varsayılan değerler
- Geri dönüş değerleri, lambda fonksiyonları ve anonim fonksiyonlar
- Fonksiyonların modüler programlamadaki rolü, kodun yeniden kullanılabilirliği
- Örnek uygulama: Matematiksel hesaplama fonksiyonları, veri dönüştürme işlemleri
- Uygulamalı Çalışmalar:
- Kendi fonksiyonlarınızı yazma ve test etme, basit algoritmaların fonksiyonlara bölünmesi
- Kod örnekleri üzerinden hata ayıklama pratiği
1.4 Python’da Hata Ayıklama ve Kod İyileştirme
- Hata Türleri ve Hata Yönetimi:
- Söz dizimi hataları, çalışma zamanı hataları, mantıksal hatalar
- Try-except bloklarının kullanımı, hata mesajlarının analizi
- Finally ve else blokları, özel hata türleri (Exception sınıfları)
- Debugging Teknikleri:
- Print tabanlı hata ayıklama, Python debugger (pdb) kullanımı
- IDE’lerin hata ayıklama özellikleri (breakpoints, adım adım çalıştırma)
- Kodun parça parça test edilmesi, unit test yazımı (unittest, pytest)
- Kod İyileştirme ve Optimizasyon:
- Kodun okunabilirliğinin artırılması, yeniden yapılandırma (refactoring) yöntemleri
- Performans iyileştirme teknikleri, gereksiz tekrarların azaltılması
- İyi kod yazım pratikleri, dokümantasyonun önemi
- Uygulamalı Projeler:
- Gerçek hayat senaryoları üzerinden hata ayıklama seansları
- Mini projelerle kod optimizasyonu ve performans analizi
Modül 2: Veri Toplama, Temizleme ve Keşifsel Veri Analizi (EDA)
2.1 Veri Toplama ve Entegrasyonu
- Veri Kaynakları ve Formatları:
- CSV, Excel, JSON, XML dosyaları ve web API’lerinden veri çekme
- Web scraping teknikleri ve BeautifulSoup, Scrapy gibi araçların tanıtımı
- Pandas ile Veri Okuma ve Yazma:
- pd.read_csv(), pd.read_excel(), pd.DataFrame kullanımı
- Veri setlerinin yazdırılması, kaydedilmesi ve farklı formatlara dönüştürülmesi
- Veri Setlerinin Birleştirilmesi:
- Merge, join, concat fonksiyonlarının kullanımı
- Farklı kaynaklardan gelen verilerin entegrasyonu, veri seti temizleme stratejileri
- Uygulamalı Atölye:
- Gerçek veri setleri üzerinden veri okuma, birleştirme ve temel düzenlemeler
2.2 Veri Temizleme Teknikleri
- Eksik Veriler ve Aykırı Değerler:
- Eksik veri analizi, dropna() ve fillna() fonksiyonları
- Aykırı değer tespiti, IQR, Z-skoru, imputation yöntemleri
- Veri Dönüşümleri ve Normalizasyon:
- Veri tiplerinin dönüştürülmesi, string işlemleri, tarih formatlarının standartlaştırılması
- Normalizasyon, standardizasyon, log dönüşümü örnekleri
- Veri Temizleme Otomasyonu:
- Pandas ve NumPy ile veri temizleme akışları oluşturma
- Fonksiyonel programlama yaklaşımları ile tekrarlanan işlemlerin otomasyonu
- Uygulamalı Çalışmalar:
- Otomatik veri temizleme örnekleri, veri kalitesini artırmaya yönelik mini projeler
2.3 Keşifsel Veri Analizi (EDA)
- Temel İstatistiksel Analizler:
- Ortalama, medyan, varyans, standart sapma hesaplamaları
- Dağılım analizi, çeyrek değerler, boxplot yorumlama
- Veri Görselleştirme:
- Matplotlib ile temel grafik çizimi: Çizgi grafikleri, histogramlar, scatter plot’lar
- Seaborn kullanarak daha gelişmiş görselleştirme: Heatmap, pairplot, violin plot
- Korelasyon ve Pivot Tablolar:
- Korelasyon matrisleri, pivot tablolar oluşturma, veri özetleme teknikleri
- İstatistiksel ilişkilerin keşfi, hipotez testleri için ön analizler
- Uygulamalı Atölye:
- Gerçek veri setleri üzerinden EDA çalışmaları, interaktif raporlama
Modül 3: İstatistik ve Veri Bilimi Temelleri
3.1 Temel İstatistik Kavramları
- Olasılık ve Dağılımlar:
- Temel olasılık kuralları, dağılım türleri (normal, binom, poisson)
- Örneklem, populasyon ve örnekleme teknikleri
- Hipotez Testleri ve İstatistiksel Çıkarım:
- Null hipotez, alternatif hipotez, p-değeri, anlamlılık testleri
- T-test, chi-square testi gibi temel istatistiksel testler
- Regresyon ve Korelasyon Analizi:
- Basit lineer regresyon, çoklu regresyon; korelasyon katsayıları
- R², MSE, RMSE gibi model değerlendirme metrikleri
- Uygulamalı Örnekler:
- Gerçek veri setleri üzerinde istatistiksel analiz uygulamaları, vaka çalışmaları
3.2 İleri İstatistiksel Analizler
- Çok Değişkenli İstatistik:
- ANOVA, MANOVA, faktör analizi, kümeleme yöntemleri
- Çok değişkenli regresyon, principal component analysis (PCA)
- Zaman Serisi Analizi:
- Trend, mevsimsellik, otokorelasyon analizi, ARIMA modelleri
- Zaman serisi öngörüleri ve model validasyonu
- Veri Modelleme ve Öngörü Teknikleri:
- Çıkarım yöntemleri, istatistiksel modelleme ve öngörü (forecasting)
- Gerçek dünya örnekleriyle ileri analitik projeler
- Vaka Çalışmaları ve Uygulamalar:
- İleri istatistiksel tekniklerin veri bilimi projelerinde kullanılması
3.3 İstatistiksel Yazılım ve Araçlar
- Python İstatistik Kütüphaneleri:
- SciPy, statsmodels, scikit-learn’in temel fonksiyonları ve uygulamaları
- İstatistiksel model kurma, testler ve öngörü modelleri oluşturma
- Raporlama ve Yorumlama:
- Verilerin analizi sonucunda rapor yazma teknikleri
- Görsel sunumlar, interaktif raporlama araçları ve dashboard’lar
- Uygulamalı Proje Örnekleri:
- İstatistiksel analiz projeleri, gerçek veri setleri ile vaka çalışmaları
Modül 4: Makine Öğrenmesi Temelleri
4.1 Makine Öğrenmesi Algoritmalarına Giriş
- Öğrenme Türleri:
- Denetimli öğrenme: Sınıflandırma ve regresyon algoritmaları
- Denetimsiz öğrenme: Kümeleme, boyut indirgeme yöntemleri
- Pekiştirmeli öğrenme: Temel kavramlar, ödül ve ceza mekanizmaları
- Temel Algoritmalar:
- Lineer regresyon, lojistik regresyon, karar ağaçları, k-en yakın komşu
- K-means, hiyerarşik kümeleme, basit sinir ağı modelleri
- Model Eğitimi ve Değerlendirme:
- Eğitim-veri-test ayrımı, model doğrulama, çapraz doğrulama
- Hiperparametre optimizasyonu ve model seçimi kriterleri
- Uygulamalı Örnek Projeler:
- Basit sınıflandırma ve regresyon projeleri, veri seti üzerinden uygulama
4.2 Uygulamalı Makine Öğrenmesi Projeleri
- Scikit-learn ile Proje Geliştirme:
- Model kurma, eğitme, test etme ve sonuç değerlendirme
- Örnek veri setleri, model optimizasyonu ve performans ölçümleri
- Ensemble Yöntemleri:
- Random forest, gradient boosting gibi ileri yöntemlerin kullanımı
- Model birleştirme, tahmin doğruluğu artışı
- Vaka Çalışmaları:
- Gerçek dünya uygulamaları, sektör örnekleri üzerinden detaylı proje analizleri
4.3 İleri Makine Öğrenmesi Teknikleri
- Model Değerlendirme Metrikleri:
- R², MSE, MAE, F1 Score, ROC-AUC gibi metriklerin hesaplanması
- Karşılaştırmalı model analizi, performans benchmark’ları
- Özelleştirilmiş Algoritmalar:
- Modelin özelleştirilmesi, kullanıcıya göre uyarlanması ve ileri düzey parametre ayarları
- Gerçek dünya verileriyle iteratif iyileştirme teknikleri
- Uygulamalı Proje ve Demo:
- İleri düzey makine öğrenmesi projeleri, interaktif demo seansları
Modül 5: Derin Öğrenme ve Yapay Sinir Ağları
5.1 Sinir Ağlarının Temelleri
- Yapay Nöron ve Aktivasyon Fonksiyonları:
- Temel yapılar, ağırlıklar, bias ve aktivasyon fonksiyonlarının (Sigmoid, ReLU vb.) matematiksel temelleri
- Tek katmanlı (perceptron) modelin kurulumu ve örnek uygulamalar
- Çok Katmanlı Sinir Ağları:
- Derin sinir ağlarının yapısı, ileri beslemeli ağlar, katmanlar arası bağlantı
- Model eğitim süreci, loss fonksiyonu ve geri yayılım algoritması
5.2 Derin Öğrenme Modelleri
- Önde Gelen Mimari Yaklaşımlar:
- Konvolüsyonel Sinir Ağları (CNN): Görüntü işleme, filtreler, pooling
- Tekrarlayan Sinir Ağları (RNN) ve LSTM: Zaman serisi verileri, sıralı veri işleme
- Transformer ve dikkat mekanizması: Modern dil modelleri, self-attention
- Model Eğitimi ve Optimizasyon:
- Overfitting/underfitting kavramları, regularization, dropout, batch normalization
- Optimizasyon algoritmaları (Adam, RMSprop) ve hiperparametre ayarlamaları
5.3 Uygulamalı Derin Öğrenme Projeleri
- Veri Setleri ve Proje Örnekleri:
- Görüntü, ses, metin verileri üzerinde derin öğrenme uygulamaları
- Model performansının ölçülmesi, iyileştirme stratejileri
- Interaktif Demo Seansları:
- Canlı model eğitimi, model çıktılarının analizi ve değerlendirme
- Grup tartışmaları, vaka çalışmaları ve iteratif iyileştirme
Modül 6: Veri Görselleştirme ve Raporlama
6.1 Gelişmiş Veri Görselleştirme Teknikleri
- Grafik ve Tablo Tasarımı:
- Matplotlib, Seaborn ve Plotly ile çeşitli grafiklerin (çizgi, çubuk, pasta, scatter, heatmap) oluşturulması
- Etkileşimli görselleştirme: Dashboard tasarımı, web tabanlı görselleştirme araçları
- Dashboard Oluşturma:
- Gerçek zamanlı veri görselleştirme, interaktif raporlar
- Örnek projeler, kullanıcı arayüzü entegrasyonları
6.2 Veri Hikayeleştirme ve Sunum Teknikleri
- Veri Hikayesi Oluşturma:
- Veriden öykü çıkarma, anlamlı raporlar yazma
- Storytelling metotları, verilerin stratejik kullanımına yönelik sunum teknikleri
- Sunum Araçları ve Teknikleri:
- Power BI, Tableau gibi araçlarla raporlama, interaktif dashboard sunumları
- Gerçek proje örnekleri üzerinden vaka sunumları, performans analizi
Bu eğitim programı, ARC Enstitü ve Beykoz Üniversitesi Yaşam Boyu Öğrenim Merkezi iş birliğiyle sunulmaktadır.