机器学习 August 19, 2018

2-6 k近邻算法总结

Words count 202 Reading time 1 mins. Read count 0

最大的缺点:效率低下

如果训练集有m个样本,n个特征,则预测每一个新的数据,需要O(m*n)

优化,使用树结构:KD-Tree,Ball-Tree

缺点2:高度数据相关

缺点3:预测结果不具有可解释性

缺点4:维数灾难

随着维护的增加,“看似相近”的两个点之间的距离越来越大

解决方法:降维

0%