Phân tích cụm

Phân tích cụm giúp nhận diện các phân khúc hay nhóm tiêu dùng với các đặc tính tương tự nhau. Phân tích cụm được ứng dụng trong rất nhiều lĩnh vực khác nhau như: nghiên cứu hành vi xã hội, tâm lý, địa lý, kinh doanh... Trong marketing và tiếp thị, phân tích cụm được ứng dụng để phân khúc thị trường, tìm hiểu hành vi khách hàng, nhận dạng các cơ hội cho sản phẩm mới hay lựa chọn thị trường để thử nghiệm các chiến lược khác nhau…

Khảo sát nhanhỨng dụng

Phân tích cụm thường được ứng dụng trong marketing chủ yếu cho các mục đích sau:

1. Phân khúc thị trường

Trong phân tích cụm, các đối tượng được nhận diện và phân chia thành các nhóm (người, thị trường, tổ chức) có cùng các đặc điểm nhất định như thái độ, hành vi tiêu dùng, thói quen xem các phương tiện truyền thông…, giúp nhà sản xuất / tổ chức hiểu rõ các phân khúc thị trường đang tồn tại.

Ví dụ:

Khảo sát nhanh

2. Thấu hiểu hành vi người tiêu dùng

Phân tích cụm giúp nhận dạng các nhóm tiêu dùng tương đồng nhau và sau đó, các nhà sản xuất / tổ chức có thể tập trung nghiên cứu hành vi mua hàng của từng nhóm riêng biệt, giúp nắm bắt và hiểu rõ hơn hành vi của người tiêu dùng.

3. Nhận diện các cơ hội cho sản phẩm mới

Bằng cách phân nhóm các nhãn hiệu / sản phẩm, chúng ta có thể xác định được các tập cạnh tranh trong thị trường. Các nhãn hiệu trong cùng một nhóm có mức độ cạnh tranh mạnh mẽ hơn so với các nhãn hiệu giữa các tập khác nhau. Việc kiểm tra các tập cạnh tranh giúp các nhà sản xuất / tổ chức nhận diện các cơ hội sản phẩm còn tiềm năng trên thị trường.

4. Lựa chọn thị trường thử nghiệm

Phân tích cụm cũng đồng thời được ứng dụng trong việc lựa chọn thị trường để thử nghiệm các chiến lược khác nhau. Ứng dụng này liên quan đến việc nhận diện các tập thị trường tương đồng, có thể thay thế cho nhau khi thực hiện các nghiên cứu thử nghiệm; giúp giảm bớt số lượng thị trường thử nghiệm yêu cầu.

5. Giảm lượng dữ liệu

Được sử dụng như công cụ giảm lượng dữ liệu, phân tích cụm giúp phát triển các nhóm hay cụm dữ liệu phụ, dễ quản lý hơn các dữ liệu quan sát cá nhân riêng lẻ. Cụ thể, để mô tả sự khác nhau trong hành vi sử dụng sản phẩm, đầu tiên, khách hàng sẽ được phân thành các nhóm và sự khác biệt giữa các nhóm có thể được kiểm tra thông qua phương pháp phân tích biệt số (MDA).

Khảo sát đơn giảnPhương pháp phân tích

Phương thức phân cụm bao gồm phương thức phân cụm thứ bậc (Hierarchical clustering), phân cụm không thứ bậc (nonhierarchical clustering) và các phương thức khác.

1. Phân cụm thứ bậc (Hierarchical clustering)

Đặc trưng của phân cụm thứ bậc là được xây dựng dưới cấu trúc phân cấp hay sơ đồ hình cây. Phương thức phân cụm thứ bậc có thể tiến hành theo cách kết tụ hay phân chia.

Kết tụ (Agglomerative)

Cách tiếp cận "từ dưới lên": Mỗi quan sát được thực hiện bắt đầu từ trong cụm riêng. Sau đó, các cụm được kết hợp, di chuyển dần lân trên hệ thống phân cấp thành một cụm duy nhất.

Phân chia (Divisive)

Cách tiếp cận "từ trên xuống": Tất cả các quan sát bắt đầu trong một cụm và được phân dần thành các cụm nhỏ, cho đến khi mỗi đối tượng thành một cụm riêng biệt.

Ưu điểm của phân tích cụm thứ bậc là ta không cần phải xác định trước số cụm, mà có thể quan sát sơ đồ cây và quyết định số cụm. Đối với phân cụm thứ bậc - phương pháp kết tụ, có 3 phương pháp để ước định khoảng cách các cụm là:

  • Khoảng cách liên kết (Linkage methods): bao gồm Liên kết đơn, Liên kết hoàn toàn và Liên kết trung bình
  • Tổng độ lệch bình phương / phương sai (Variance Methods): thường dùng nhất là "Phương pháp Ward".
  • Khoảng cách trung tâm (Linkage methods)

Trong số các phương pháp phân cụm thì phương pháp khoảng cách trung tâm và phương pháp Ward đã được chứng minh là có kết quả tốt hơn các phương pháp kia.

2. Phân cụm không thứ bậc (Non-hierarchical clustering)

Phân cụm không thứ bậc (k-means) là phương thức xác định trước số cụm trung tâm, và sau đó nhóm các đối tượng trong một ngưỡng giá trị định sẵn vào các cụm trung tâm. Một số phương pháp phân bổ cụm:

  • Phương pháp bắt đầu tuần tự (Sequential threshold)
  • Phương pháp bắt đầu song song (Parallel threshold)
  • Phương pháp phân chia tối ưu (Optimizing partitioning)

Do khối lượng tính toán ít hơn và thời gian thực hiện nhanh hơn nên phương thức này thường được sử dụng khi số lượng mẫu lớn. Tuy nhiên, vì nhược điểm phải xác định trước số cụm, và số cụm trung tâm được chọn khá tuỳ ý, nên cả hai phương pháp phân cụm thứ bậc và không thứ bậc đều thường được sử dụng. Đầu tiên là sử dụng phân cụm thứ bậc để tìm ra kết quả, sau đó số cụm và các trung tâm cụm được sử dụng làm thông tin ban đầu để áp dụng phương pháp phân chia tối ưu.