{"id":2574,"date":"2022-10-26T00:00:00","date_gmt":"2022-10-26T00:00:00","guid":{"rendered":"https:\/\/techlib.net\/techedu\/k-means-clustering\/"},"modified":"2022-10-26T00:00:00","modified_gmt":"2022-10-26T00:00:00","slug":"k-means-clustering","status":"publish","type":"post","link":"https:\/\/techlib.net\/techedu\/k-means-clustering\/","title":{"rendered":"K-Means Clustering"},"content":{"rendered":"<p> El clustering de K-Means es un m\u00e9todo de cuantificaci\u00f3n vectorial, originario del procesamiento de se\u00f1ales, que es popular para el an\u00e1lisis de clusters en la miner\u00eda de datos. Dado un conjunto de observaciones (x1, x2, ..., xn), donde cada observaci\u00f3n es un vector real d-dimensional, k-means clustering tiene como objetivo la partici\u00f3n de las n observaciones en k (\u2264 n) conjuntos S = {S1, S2, ..., Sk} para minimizar la suma de cuadrados dentro del cluster (WCSS) (es decir, la varianza). <br \/>\n El problema es dif\u00edcil desde el punto de vista computacional (NP-hard); sin embargo, existen algoritmos heur\u00edsticos eficientes que se emplean habitualmente y que convergen r\u00e1pidamente a un \u00f3ptimo local. El algoritmo est\u00e1ndar emplea una t\u00e9cnica de refinamiento iterativo. Debido a su omnipresencia, a menudo se denomina algoritmo k-means; tambi\u00e9n se conoce como algoritmo de Lloyd, especialmente en la comunidad inform\u00e1tica. <br \/>\n Dado un conjunto inicial de k-means, el algoritmo procede alternando entre dos pasos: <br \/>\n Paso de asignaci\u00f3n: Asignar cada observaci\u00f3n al cluster cuya media produce la menor suma de cuadrados dentro del cluster (WCSS). Dado que la suma de cuadrados se minimiza, \u00e9ste es tambi\u00e9n el cluster con la media m\u00e1s cercana. <br \/>\n Paso de construcci\u00f3n: Dado el conjunto de k-means del paso de asignaci\u00f3n, calcular las nuevas medias para que sean los centroides del cluster. <br \/>\n El algoritmo ha convergido cuando las asignaciones ya no cambian. Nunca converger\u00e1 a un \u00f3ptimo global, sino que lo har\u00e1 a un \u00f3ptimo local. <\/p>\n<h5> \u00bfPor qu\u00e9 se utiliza el algoritmo K-means?<\/h5>\n<p> El algoritmo de K-means se utiliza para la agrupaci\u00f3n, que es una t\u00e9cnica para agrupar los puntos de datos de manera que los puntos similares est\u00e1n en el mismo grupo y los puntos dis\u00edmiles est\u00e1n en grupos diferentes. El clustering se utiliza en muchos campos diferentes, como el marketing, la miner\u00eda de datos o el reconocimiento de im\u00e1genes, entre otros. El algoritmo K-means es uno de los algoritmos m\u00e1s populares para el clustering. Funciona dividiendo los puntos de datos en un n\u00famero determinado de grupos (llamados clusters) y luego encontrando el centro de cada cluster. Los puntos de datos se asignan entonces al cl\u00faster al que m\u00e1s se acercan. <br \/>\n Hay muchas variantes diferentes del algoritmo k-means, pero la idea b\u00e1sica es siempre la misma: agrupar los puntos de datos de manera que los puntos similares est\u00e9n en el mismo grupo y los dis\u00edmiles en grupos diferentes. <\/p>\n<p> \u00bfC\u00f3mo se clasifica k-means?  Hay algunas maneras de clasificar k-means. Una forma es notar que k-means es un algoritmo de clustering, lo que significa que puede ser usado para agrupar puntos de datos en clusters. Otra forma de clasificar a k-means es observar que es un algoritmo de aprendizaje no supervisado, lo que significa que se puede utilizar para aprender de los datos sin etiquetas.   \u00bfPor qu\u00e9 se llama clustering de k-means?  El algoritmo de clustering k-means se llama as\u00ed porque consiste en dividir un conjunto de datos en k clusters. La \"k\" de k-means se refiere al n\u00famero de conglomerados que crear\u00e1 el algoritmo. <\/p>\n<p> \u00bfC\u00f3mo se analiza K-means?  Hay varias maneras de analizar K-means. Una forma es calcular la suma de cuadrados dentro del cl\u00faster (WCSS), que es una medida de lo bien separados que est\u00e1n los cl\u00fasteres. Otra forma es mirar el coeficiente de silueta, que es una medida de lo bien que se asigna cada punto de datos a su cl\u00faster. <\/p>\n<h5> \u00bfC\u00f3mo se clasifica k-means?<\/h5>\n<p> Hay varias maneras de clasificar k-means. Otra forma de clasificar k-means ser\u00eda notar que k es un algoritmo de clustering. Esto significa que puede utilizarse para agrupar puntos de datos en clusters. Tambi\u00e9n se puede clasificar a k-means observando que es un algoritmo de aprendizaje no supervisado. Esto significa que puede aprender de datos que no tienen etiquetas.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>El clustering de K-Means es un m\u00e9todo de cuantificaci\u00f3n vectorial, originario del procesamiento de se\u00f1ales, que es popular para el an\u00e1lisis de clusters en la miner\u00eda de datos. Dado un conjunto de observaciones (x1, x2, &#8230;, xn), donde cada observaci\u00f3n es un vector real d-dimensional, k-means clustering tiene como objetivo la partici\u00f3n de las n &#8230; <a title=\"K-Means Clustering\" class=\"read-more\" href=\"https:\/\/techlib.net\/techedu\/k-means-clustering\/\" aria-label=\"Leer m\u00e1s sobre K-Means Clustering\">Leer m\u00e1s<\/a><\/p>\n","protected":false},"author":1898,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4],"tags":[],"class_list":["post-2574","post","type-post","status-publish","format-standard","hentry","category-gestion-de-datos"],"_links":{"self":[{"href":"https:\/\/techlib.net\/techedu\/wp-json\/wp\/v2\/posts\/2574","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/techlib.net\/techedu\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/techlib.net\/techedu\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/techlib.net\/techedu\/wp-json\/wp\/v2\/users\/1898"}],"replies":[{"embeddable":true,"href":"https:\/\/techlib.net\/techedu\/wp-json\/wp\/v2\/comments?post=2574"}],"version-history":[{"count":0,"href":"https:\/\/techlib.net\/techedu\/wp-json\/wp\/v2\/posts\/2574\/revisions"}],"wp:attachment":[{"href":"https:\/\/techlib.net\/techedu\/wp-json\/wp\/v2\/media?parent=2574"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/techlib.net\/techedu\/wp-json\/wp\/v2\/categories?post=2574"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/techlib.net\/techedu\/wp-json\/wp\/v2\/tags?post=2574"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}