Veri analizi sürecinde, karmaşık veri kümelerini anlamak ve iç görüler elde etmek için farklı görselleştirme teknikleri kullanırız. Bu tekniklerden biri de, verileri gruplara ayırmamıza olanak tanıyan kümeleme (clustering) analizidir. Power BI ,dağılım grafikleri (scatter charts) sayesinde bu analizi görsel olarak destekleyerek, verilerdeki kalıpları daha kolay bir şekilde gözlemlemeye yardımcı olur.
Dağılım Grafiği ile Kümeleme Nedir?
Dağılım grafiği, iki sayısal değişken arasındaki ilişkiyi gösteren bir grafik türüdür. Kümeleme analizinde ise, bu grafik üzerindeki veri noktalarını benzer özelliklere sahip gruplara (kümelere) ayırırız. Böylece, veri kümesindeki segmentleri belirleyebilir ve her bir kümenin karakteristik özelliklerini analiz edebiliriz.
Örnek: Ürün Ortalama Birim Fiyatı ve Ürün Satış Adedi Arasındaki İlişki
Örnekte, ürün bazında, satış adedi ile ortalama birim fiyatı hesaplayan ölçülerimiz var. Bu iki sayısal değişken arasındaki ilişkiyi gözlemleyebileceğimiz bir dağılım grafiği oluşturalım. Açıklama kısmını boş bırakalım.

Görseldeki fiyat ve adet verilerini dikkatlice incelediğimizde, diğer ürünlerden farklılaşan belirgin gruplar ortaya çıkıyor. Bu bulgu, daha derinlemesine bir araştırma için önemli bir başlangıç noktası olsa da, analizimizi bir adım ileriye taşımak istiyoruz. Dağılım grafiğindeki yoğun bölgeleri yakınlaştırarak incelediğimizde, verilerin burada da belirli kümeler halinde toplandığını görüyoruz.

Dağılım grafiği üzerinde, benzer fiyat ve satış adetine sahip ürünler birbirine yakın konumlanır. Bu sayede, ürünleri farklı fiyat ve satış hacmi gruplarına ayırabiliriz. Örneğin:
Yüksek fiyatlı, düşük satışlı ürünler: Lüks veya özel ürünler olabilir.
Düşük fiyatlı, yüksek satışlı ürünler: Popüler ve temel ihtiyaç ürünleri olabilir.
Yüksek fiyatlı, yüksek satışlı ürünler: Premium ürünler veya belirli bir dönemde promosyon yapılan ürünler olabilir.
Yüksek ve düşük eşik değerlerin hangi kurala göre belirleneceği konusu her zaman kolay olmayabilir. Bu tür senaryolarda Power BI’dan kümeleme işlemini gerçekleştirmesi için yardım isteyebiliriz.
Power BI Kümeleri Otomatik Olarak Bul
Dağılım grafiğindeki 3 noktaya tıklayarak açılan menüde kümeleri otomatik olarak bul seçeneğini tıklayalım.

Power BI Dağılım grafiğinde, kümeleri (cluster) otomatik olarak bul seçeneği çıkmıyorsa, temel nedeni ilk aşamada belirttiğimiz açıklama alanına bilgi girilmesidir. Kümeler oluştuğunda otomatik olarak bu alana taşınacağı için boş kalması gerektiğini unutmayalım.
Açılan menüde düzenlemeleri yaptıktan sonra, küme sayısı belirlenir ya da küme sayısını Power BI’ın otomatik olarak oluşturması istenebilir.

- Örneğimizde
Power BI verileri 7 kümeye ayırdı. - Product tablosunun içine hesaplanmış sütun olarak ekledi.
- Hemen ardından da, kümeleri dağılım grafiğinin açıklama kısmına yerleştirdi.



Power BI ile Kümeleme Analizi Yapmanın Faydaları
- Daha Anlaşılır Veri: Karmaşık veri kümelerini daha basit ve anlaşılır hale getirir.
Segmentasyon: Müşteri segmentasyonu, ürün segmentasyonu gibi farklı analizlerde kullanılabilir.
Anormallik Tespiti: Genelden önemli ölçüde ayrışan değerler (outliers) kolayca tespit edilebilir. - Önceliklendirme: Öncelikli olarak odaklanılması gereken konuların görünürlüğünü arttırabilir.
Geniş Kullanım Alanı: Ürün stratejileri, pazarlama kampanya etki analizleri, üretim verimlilik analizleri ve daha birçok konuda hızlı bakış sağlar.
Power BI ve K-Ortalamaları
Power BI, otomatik kümeleme özelliği sayesinde, kullanıcıların teknik detaylarla uğraşmadan kümeleme analizleri yapmasına olanak tanıması üzerinde durduk. Ancak bunu yaparken hangi kümeleme algoritmasını kullandığına dair resmi bir belge bulunmamakla birlikte, veri madenciliği ve makine öğrenimi alanında sıklıkla kullanılan, K-means algoritmasının bu süreçte önemli bir rol oynadığı düşünülüyor.
Sonuç
Power BI’da dağılım grafikleri ile yapılan kümeleme analizi, karmaşık veri kümelerini saniyeler içinde daha anlamlı ve görsel olarak zengin bir hale getirmeye yardımcı olur. Bu yöntem, özellikle müşteri segmentasyonu, ürün gruplandırma ve pazarlama stratejileri gibi alanlarda büyük fayda sağlar. Ancak, kümeleme analizinin sonuçları, kullanılan verilerin kalitesi ve analiz sürecindeki seçimlerden etkilenir. Bu nedenle, elde edilen sonuçları dikkatlice yorumlamanın ve iş bağlamında değerlendirmenin oldukça önemli olduğunu da hatırlatalım.