5.4 Agrupamiento

El agrupamiento es una técnica de Machine Learning que consiste, en pocas palabras, en dividir una población en grupos con la consecuencia de que los datos en un grupo son más similares entre ellos que entre los otros grupos.

Imagina que eres el dueño de una startup que hace ecommerce y quieres tener estrategias de venta para tus clientes. Es casi imposible diseñar una estrategia por cada individuo, pero se puede utilizar el agrupamiento para dividir a los clientes en grupos que tengan similitudes relevantes y así reducir el problema a unas cuantas estrategias.

Existen dos tipos de agrupamiento:

Un punto muy importante que debes considerar cuando ejecutas técnicas de agrupamiento es que debes definir muy claro a qué te refieres cuando hablas de similitud entre puntos, porque esto puede ayudarte a definir el algoritmo correcto para tus necesidades particulares.

A grandes rasgos existen cuatro aproximaciones para definir similitud:

Acuérdate que no tienes que casarte con un modelo específico. Muchos de los mejores Ingenieros de Machine Learning y Científicos de Datos utilizan varios modelos con el mismo conjunto de datos para analizar el rendimiento de los diversos algoritmos que tienen a su disposición. Así que experimenta y siempre compara tus resultados antes de tomar una decisión.

Introduccion al agrupamiento

Clustering

Algoritmos


Agrupamiento jerarquico

Agrupamiento por K-Means

Es un algoritmo que agrupa utilizando centroides. El algoritmo funciona asignando puntos al azar (K define el número inicial de clusters) y después:

BLOG Donde queda mas claro el proceso: https://www.jacobsoft.com.mx/es_mx/k-means-clustering-con-python/
ARTICULO Donde ayuda a entenderlo mejor: http://www.it.uc3m.es/~jvillena/irc/practicas/08-09/06.pdf




Backlinks: Inteligencia Artificial:5. Introduccion al pensamiento probabilistico