分类的话:

用户画像算法

用户画像算法、聚类算法

分类算法:

gbtd、随机森林 识别完了看哪个变量更重要。要有可解释性。

价格相关数据:体现在什么方面?一定要跟收入密切相关的。要对数据和业务的理解很重要。

分类项目:部分已知,有一部分训练集,用未知的和已知的做一个比较。打标签。寻找标签里最重要的因素。

gbtd(底层是很多决策树)。svm。dnn。可能解释性那么强。
决策树。xgbox。

输出是:分类的概率。

聚类项目:完全未知,从数据本身来发现特征。k-means。层次聚类。

输出是:不同类别的特征。

要理解商业逻辑。