先介绍一下本人背景。|数据挖掘快速入门几大招( 五 )


三、实践经验
一旦完成了以上的两步 , 就可以开始在现实世界数据上应用这些概念啦 。 一个没有经验的数据科学家可能会训练一个模型 , 一旦准确率达到某个高百分比 , 就把它运送到生产中去 , 而无视在这样做的时候所做的不正确的假设 。 所以 , 知道什么时候模型是过拟合的 , 什么时候有虚假的相关性 , 需要有扎实的理论理解和经验 。 针对这一部分 , 我个人的建议是尽早开始练习 , 但要从小项目做起 。 实施简单的算法 , 如线性回归、梯度下降、k-means聚类、k-nearestneighbors和na?veBayes , 然后再进行更高级的操作 。 在使用库之前 , 试着对每个算法都做一次 。 只有这样 , 才能完全理解它们真正的工作方式 。 在这里也推荐一个叫Kaggle的平台 , 这里面的数据集都是真实的 , 会让你感觉到数据科学是如何在现实世界中使用的 。 Kaggle上还会有各种竞赛 , 根据其奖励分为不同类型 。 知识、工作、这些比赛很适合初学者 , 你也可以在其中找到很多如何获得好成绩的文章和样本解决方案 。
总结
先介绍一下本人背景。|数据挖掘快速入门几大招】总的来说 , 数据挖掘的学习只要遵循上面提及的步骤 , 先拥有一定的基础和背景知识 , 再从理论到实际操作慢慢过渡 , 就能熟练掌握这一技能啦 。 在这个过程中 , 找到适合自己的教材也是很重要的 。 希望大家能根据我上面的分享找到适合自己的学习方式及课程 , 早日实现自己的职业理想!