【竞赛6】kNN轻松达到0.99以上

  板凳区 Sofa竞赛6    浏览次数:3880        分享
0

按照标杆的格式重新写了下

之前上传的结果达到0.99

供大家讨论


# -*- coding: utf-8 -*-
from sklearn.neighbors import KNeighborsClassifier
import pandas as pd
import numpy as np

train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')

train.drop('id', axis=1, inplace=True)
test.drop('id', axis=1, inplace=True)

train_labels = train.pop('y')

clf = KNeighborsClassifier()
clf.fit(train, train_labels)

submit = pd.read_csv('sample_submit.csv')
submit['y'] = clf.predict(test)
submit.to_csv('knn', index=False)


 

MangoCoke   2018-04-04 14:14



   2个回答 
0

k近邻的效果怎么这么好?选择默认的k=5都这么好啊?

SofaSofa数据科学社区DS面试题库 DS面经

dzzxjl   2018-04-04 20:43

是的,即使使用默认参数,效果也非常好。 - npwong   2018-04-04 23:56
0

Random Forest 比 KNN 还要强!SVC (rbf核)也跟 KNN 差不多。

我想出题者也没有想过,这条题目原来那么简单。现在游戏已经变成:你能否全对。


SofaSofa数据科学社区DS面试题库 DS面经

npwong   2018-04-05 00:06



  相关讨论

形状识别:是方还是圆?这个比赛求思路?

有没有点击上传数据浏览器就崩溃的?

作为一个ML的博士应该怎么去怎么找文献?

使用深度学习进行图像分类

有没有赚外快的方法啊

有偿!!如何写一个restful api

求教一下:怎么进阶

有人关注机器学习在量化交易中的应用吗?

大家跑模型都用的什么牌子的笔记本

如何评价大数据的未来?

  随便看看

sklearn r2_score返回负数

人工神经网络有哪些常用的激活函数?

为什么神经网络模型不用交叉验证?

95%置信区间的正确理解

怎么给plt.subplot加一个主标题?