先介绍一下本人背景。|数据挖掘快速入门几大招( 五 )
三、实践经验
一旦完成了以上的两步 , 就可以开始在现实世界数据上应用这些概念啦 。 一个没有经验的数据科学家可能会训练一个模型 , 一旦准确率达到某个高百分比 , 就把它运送到生产中去 , 而无视在这样做的时候所做的不正确的假设 。 所以 , 知道什么时候模型是过拟合的 , 什么时候有虚假的相关性 , 需要有扎实的理论理解和经验 。 针对这一部分 , 我个人的建议是尽早开始练习 , 但要从小项目做起 。 实施简单的算法 , 如线性回归、梯度下降、k-means聚类、k-nearestneighbors和na?veBayes , 然后再进行更高级的操作 。 在使用库之前 , 试着对每个算法都做一次 。 只有这样 , 才能完全理解它们真正的工作方式 。 在这里也推荐一个叫Kaggle的平台 , 这里面的数据集都是真实的 , 会让你感觉到数据科学是如何在现实世界中使用的 。 Kaggle上还会有各种竞赛 , 根据其奖励分为不同类型 。 知识、工作、这些比赛很适合初学者 , 你也可以在其中找到很多如何获得好成绩的文章和样本解决方案 。
总结
【先介绍一下本人背景。|数据挖掘快速入门几大招】总的来说 , 数据挖掘的学习只要遵循上面提及的步骤 , 先拥有一定的基础和背景知识 , 再从理论到实际操作慢慢过渡 , 就能熟练掌握这一技能啦 。 在这个过程中 , 找到适合自己的教材也是很重要的 。 希望大家能根据我上面的分享找到适合自己的学习方式及课程 , 早日实现自己的职业理想!
- 5G|关于5G,华为赢了
- 物联网|?内容创作者:要明白文章首先是写给推荐系统看的!
- 上海图书馆东馆东方网记者包永婷1月16日报道:1月15日下午|上海图书馆东馆内部啥样?跟着读者公测先睹为快
- 核桃|核桃编程荣膺“2021中国网·科技企业先锋榜”年度品牌影响力企业
- meta|阿里云到底有多强大?一起来盘点一下它骄人的战绩
- 锐龙|为什么AMD只推出一款锐龙7 5800X3D?因为资源都优先给Milan-X了
- 盲盒|网友:刘强东:是史玉柱先动的手,提啥女留学生?
- Linux|为什么国企要把电脑全部换成Linux环境?能不能从专业的角度分析一下?
- 裁员潮|内容推荐系统:你的文章至少要先让它明白
- 宏碁|Redmi K50或优先推出电竞版,标准版随后推出,可能定位更高