Phân cụm dữ liệu bằng thuật toán K-means-Clustering | Khoa Điện - Điện Tử - Đại học Duy Tân

Nghiên cứu Khoa học

Phân cụm dữ liệu bằng thuật toán K-means-Clustering

04/03/2019
Nghiên cứu Khoa học

Thuật toán K-means clustering (phân cụm K-means) thuộc lớp phương pháp Học không giám sát (Unsupervised Learning) trong học máy (Machine Learning). Có rất nhiều định nghĩa khác nhau về kỹ thuật này, nhưng về bản chất ta có thể hiểu phân cụm là các qui trình tìm cách nhóm các đối tượng đã cho vào các cụm (clusters), sao cho các đối tượng trong cùng 1 cụm tương tự (similar) nhau và các đối tượng khác cụm thì không tương tự (Dissimilar) nhau.

Mục đích của phân cụm là tìm ra bản chất bên trong các nhóm của dữ liệu. Các thuật toán phân cụm (Clustering Algorithms) đều sinh ra các cụm (clusters). Tuy nhiên, không có tiêu chí nào là được xem là tốt nhất để đánh giá hiệu quả của của phân tích phân cụm, điều này phụ thuộc vào mục đích của phân cụm như: data reduction, “natural clusters”, “useful” clusters, outlier detection...

Xem tiếp trong file đính kèm.

File đính kèm:

thuat-toan-kmeans.docx

Các tin khác

Hôm nay ngày 22/03/2026
Tuần hiện tại 33

Sinh viên tiêu biểu

Đoàn Thị Thu Hà (trái) - K21EVT - Giải "Women in Business" toàn cầu của cuộc thi Giải pháp xanh cho thành phố 2018 (Go Green in the City 2018)

Video nổi bật

Liên kết website