创建客户细分

项目背景

近日，一家批发经销商尝试着针对一些客户改变其发货方式，从原来的每周五次每次早上发货，改为了更为便宜的每周三次每次晚上发货。起初，发货方式的改变并没有带来任何显著的负面结果，于是该批发商将这一更为便宜的变动推广到了所有客户。几乎同一时刻，该批发商开始收到客户对发货服务变动的投诉，也有的客户开始取消提货。该批发商受到的损失比节省下来的钱还要多。

客户目标与要求

该批发经销商希望确定他们的客户特征和信息，以帮助他们在未来做出更加明智的商业决策。

解决方案及结果

利用非监督学习技术，看看客户之间存在哪些相似之处，并以最佳的方式将客户细分为不同类别。

使用的语言和库

Python

Numpy

pandas

matplotlib

Sklearn

分析样本数据

样本总数: 440

特征数: 6 观察统计数据（mean, std, min, 25%, 50%, 75%, max）观察几个样本的实际数据情况

处理原始数据并构建合适的模型

观察发现数据存在很大的偏度，通过对数函数进行特征缩放。随后剔除极端的样本点。然后进行PCA（主成分分析）并进行降维。构建 K Means聚类模型，分别聚为2，3，4，5类。

结果

利用Sklearn库中的silhouette_score工具选择最佳的聚类数为 2 类。

luxu1220/Udacity-MLND-CustomerSegments