最大的缺点:效率低下
如果训练集有m个样本,n个特征,则预测每一个新的数据,需要O(m*n)
优化,使用树结构:KD-Tree,Ball-Tree
缺点2:高度数据相关
缺点3:预测结果不具有可解释性
缺点4:维数灾难
随着维护的增加,“看似相近”的两个点之间的距离越来越大
解决方法:降维
最大的缺点:效率低下
如果训练集有m个样本,n个特征,则预测每一个新的数据,需要O(m*n)
优化,使用树结构:KD-Tree,Ball-Tree
缺点2:高度数据相关
缺点3:预测结果不具有可解释性
缺点4:维数灾难
随着维护的增加,“看似相近”的两个点之间的距离越来越大
解决方法:降维