Makine Öğrenmesi Nedir? (Machine Learning)

Makine öğrenmesi (Machine learning) terimi Arthur Samuel tarafından 1959 yılı itibari ile popülerliğini kazanmaya başlamıştır. Makine öğrenmesi, girdi değerlerinin alınması ve analiz edilmesi ile bu verilerden çıkarımlar yapılması olarak özetlenebilir.

Bir diğer tabir ile makine öğrenmesi detaylı bir programlama kullanılarak çıktı vermek yerine, makine öğrenmesi algoritmalarının verilerle beslenmesi sonucunda modellemelerin oluşturulması (verilen girdi verilerinden öğrenmesi) ile sonuç vermektedir.

Çoğu zaman yapay zeka terimi ile karıştırılmaktadır lakin makine öğrenmesi yapay zekanın bir alt alanı/kümesidir. Diğer bir tabir ile tüm makine öğrenmesi çözümlerini yapay zeka olarak adlandırabilirken, tüm yapay zeka çözümlerini makine öğrenmesi olarak tanımlamamız doğru değildir. Veri bilimine giriş niteliğinde yazmış olduğum bir önceki yazımdan, aralarındaki ilişkiyi açıklayan şemaya ulaşabilirsiniz.  

Makine öğrenmesi genel olarak denetimli ve denetimsiz öğrenme (supervised and unsupervised learning) olarak iki ana başlık altında incelenmektedir. Serinin devamında daha detaylı olarak anlatacağım lakin genel olarak denetimli öğrenme etiketli verilerden öğrenme sürecidir lakin denetimsiz öğrenmede veriler etiketli değillerdir. Bu yaklaşımlar arasından hangisinin sizin durumunuza daha uygun olduğuna karar vermek, yaklaşımların içerisindeki algoritmalardan seçim yapmak birçok faktöre bağlı olarak değişebilmektedir.

Makine Öğrenmesi Süreci Nasıl İlerler?

Makine öğrenmesi sürecinde temel olarak 5 adım baz olarak alınabilir:

  1. Verilerin toplanması: makinenin çıkarım yapabilmesi eldeki verilere bağlıdır. Dolayısı ile öncelikle çıkarım yapılması istenen durum için doğru verilerin temin edilmesi gerekmektedir.
  2. Verilerin temizlenmesi: elimizdeki verileri direk kullanmak ya da hepsini kullanmak her zaman (hatta çoğu zaman) mümkün olmamaktadır. Veri içerisinde gerçeği yansıtmayan dirty ya da noisy veriler olabilir. Bu verilerin tespit edilmesi gerekmektedir.
  3. Verileri ayırma: makine öğrenmesi sürecinde veriler eğitim ve test verisi olmak üzere ikiye ayrılmaktadırlar. İsteğe göre belirli bir sayı ya da yüzdeliğe bağlı olarak verileri ikiye ayrılması gerekmektedir.
  4. Makinenin eğitilmesi: Eğitim verileri kullanılarak makine eğitilir ve bir model oluşturulur. Seçilmiş olan algoritmaya bağlı olarak veriler farklı metotlarda eğitilebilirler.
  5. Test edilmesi: Makinenin eğitilmesi ile oluşturulan makine öğrenmesi modeli kullanarak, ikinci grup olarak ayrılan test verileri üzerinden çıkarım yapması istenir. Sonuçlar gerçekleri ile kıyaslanarak analiz edilir.

Makine Öğrenmesi Kullanım Alanları

Günümüzde kullanım alanları gittikçe yaygınlaşmakta olan makine öğrenmesinin başlıca kullanım alanlarını aşağıdaki gibi sıralamak mümkündür:

  • Müşteri yaşam boyu değeri (bu konu hakkında daha önce Eda Eşmekaya ile yazmış olduğumuz bir makalemiz bulunmakta, incelemek isterseniz buradan ulaşabilirsiniz.)
  • Görüntü sınıflandırma
  • İş zekası
  • Öneri motorları
  • Sanal kişisel asistanlar
  • Fraud etkileşimi/kontrolü

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.