Dab tsi yog k-txhais tau hais tias Clustering?

Cov ntaub ntawv tsuas nrog k-txhais tau tias algorithm

Lub k- txhais tau tias kev sib haum ntawm cov txheej txheem yog cov ntaub ntawv mining thiab kev siv lub tshuab cov cuab yeej siv los ua pawg saib xyuas ua pawg hauv cov kev soj ntsuam uas tsis tas muaj kev paub txog cov kev sib raug zoo no. Thaum sampling, lub algorithm attempts qhia nyob rau hauv qeb, los yog pawg, cov ntaub ntawv zwm rau, nrog cov pawg ua tau txhais los ntawm tus nqi k.

Lub k- txhais tau tias algorithm yog ib qho ntawm cov kev qhia yooj yim tshaj plaws thiab nws feem ntau siv hauv kev kuaj mob, biometrics, thiab lwm yam. Qhov zoo ntawm k- txhais tau hais tias clustering yog tias nws qhia txog koj cov ntaub ntawv (siv nws cov ntawv tsis muaj neeg saib xyuas) es tsis yog koj yuav tsum qhia cov algorithm hais txog cov ntaub ntawv thaum pib (siv cov ntaub ntawv tus saib xyuas ntawm algorithm).

Nws yog qee zaum hu ua Lloyd's Algorithm, tshwj xeeb tshaj yog nyob rau hauv lub vev xaib kev kawm vim hais tias tus qauv algorithm tau xub npaj siab los ntawm Stuart Lloyd nyob rau xyoo 1957. Lo lus "k-txhais tau" yog txheej thaum xyoo 1967 los ntawm James McQueen.

Yuav ua li cas k-txhais tau Algorithm Functions

Lub k- txhais tau tias algorithm yog ib qho evolutionary algorithm uas tau txais nws lub npe los ntawm nws txoj kev ua haujlwm. Cov pawg ua ke ntawm cov tswv yim qhia ua k pawg, qhov twg k yog muab ua ib qho kev tawm tswv yim. Nws mam li muab txhua qhov kev soj ntsuam rau cov pawg ua ke raws li qhov kev soj ntsuam qhov sib thooj rau qhov nruab nrab ntawm pawg. Lub npe ntawm lub koomhaum yog tom qab ntawd thiab cov txheej txheem pib dua. Ntawm no yog li cas qhov algorithm ua haujlwm:

  1. Lub algorithm arbitrarily xaiv k points ua ntej cov chaw khoob (txhais tau tias).
  2. Txhua tus taw tes hauv cov dataset tau muab tso rau cov chaw kaw, raws li Euclidean nrug nruab nrab ntawm txhua tus taw tes thiab txhua qhov chaw khaus.
  3. Ib qho chaw twg yog qhov nruab nrab ntawm cov ntsiab lus nyob hauv pawg.
  4. Cov kauj ruam 2 thiab 3 rov hais dua txog thaum cov kab ua ke. Convergence yuav tsum txawv raws li qhov kev siv, tab sis nws feem ntau txhais tau tias tsis pom kev hloov pawg thaum cov kauj ruam 2 thiab 3 rov qab dua, los yog qhov kev hloov tsis ua ib qho txawv ntawm qhov txhais ntawm cov pawg.

Xaiv Tus Ntaus Npe

Ib qho kev tsis zoo ntawm k- txhais tau hais tias clustering yog qhov tseeb hais tias koj yuav tsum qhia kom meej cov naj npawb ntawm cov pawg ua ib qho tswv yim rau algorithm. Raws li tsim, lub algorithm tsis muaj peev xwm txiav txim tau qhov tsim nyog tus naj npawb ntawm pawg thiab nyob raws li tus neeg siv los txheeb xyuas qhov no ua ntej.

Piv txwv li, yog tias koj muaj ib pab pawg neeg uas yuav tsum tau muab cais ua raws li cov tub ntxhais uas yog txiv neej lossis poj niam, yog tus txiv neej los yog poj niam, hu ua k- txhais tau tias kev siv k = 3 yuav yuam kom cov neeg ua peb pawg ua ke tsuas yog ob los yog tawm tswv yim ntawm k = 2, yuav muab ib lub ntuj tsim ntxiv.

Ib yam li ntawd, yog tias ib pab pawg neeg tau yooj yim clustered raws li lub xeev lub xeev thiab koj hu ua k- txhais tau tias algorithm nrog cov tswv yim k = 20, cov ntsiab lus yuav dhau mus dav dav kom zoo.

Vim li no, nws yog ib lub tswv yim zoo rau kev sim ua ke nrog qhov sib txawv ntawm k los txheeb xyuas qhov nqi uas zoo tshaj plaws rau koj cov ntaub ntawv. Koj kuj tuaj yeem xav tshawb txog kev siv lwm cov ntaub ntawv mining algorithms hauv koj qhov kev siv rau kev paub siv tshuab.