北大青鸟:Python机器学习介绍 - 图文 下载本文

哇哦!准确率高达 83%。就第一次尝试而言,这个结果已经很好了。 交叉验证分数的意思是 K 折验证方法。如果 K=10,就是说要把数据分成 10 个变量,计算所有分数的均值,并将它们作为最终分数。 微调

现在你已经完成了用 Python 实现机器学习的步骤。但再加一个步骤可以让你得到更好的结果——微调。微调的意思是为机器学习算法找到最佳参数。以上面的随机森林代码为例:

model = RandomForestClassifier(criterion='gini', n_estimators=700, min_samples_split=10,min_samples_leaf=1, max_features='auto',oob_score=True,

random_state=1,n_jobs=-1)

你需要设置许多参数。顺便说一下,上面的都是默认值。你可以根据需要改变参数。但当然了,这需要花费很多时间。

别担心——有一种叫做网格搜索(Grid Search)的工具,它可以自动找出最佳参数。听起来还不错,对吧?

# Random Forest Classifier Parameters tunning model = RandomForestClassifier() n_estim=range(100,1000,100)

## Search grid for optimal parameters param_grid = {\

model_rf = GridSearchCV(model,param_grid = param_grid, cv=5, scoring=\model_rf.fit(train_X,train_Y) # Best score

print(model_rf.best_score_) #best estimator

model_rf.best_estimator_

好了,你可以自己尝试一下,并从中享受机器学习的乐趣。 总结

怎么样?机器学习看起来似乎并不难吧?用 Python 实现机器学习很简单。一切都已经为你准备好了。你可以做一些神奇的事,并给人们带来快乐。