先介绍一下本人背景。|数据挖掘快速入门几大招( 四 )


总的来说 , 这三个月的学习很有趣 , 但在这过程中 , 我也发现了自己基础的不足 。 作为一个统计专业并且有一些编程基础的学生 , 我本以为自己对于数据的处理和建模应该是能信手拈来的 。 可这套课程的难度远超出我的想象 。 因为之前的学习比较基于理论 , 接触实例不多 , 所以在接触像这类对实例进行深入分析并利用一系列连续和离散数学工具的练习的项目就会有些应付不过来 。 这套课程为理解、预测和决策提供了一个定量框架 , 几乎涉及生活的方方面面 , 从交通信号灯的计时 , 到疾病传播的控制 , 从资源管理 , 到体育领域等等 。 可以肯定的是 , 上完这套课 , 你也会跟我一样 , 有一种柳暗花明后充实的感觉 , 并且技能也会得到很大程度的提升 。
除了这些课程 , 哈佛还提供了相应线上的证书项目 , 一共四节课 , 总时长约为2年 。 这个项目旨在教授学生如何通过应用先进的统计学、建模和编程技能 , 得出预测性的见解 , 获得数据挖掘和计算技术的深入知识 , 并为从产品设计到金融等一系列行业发掘出重要的问题和情报 。
先介绍一下本人背景。|数据挖掘快速入门几大招
文章图片
虽然与AndrewNg的课程相比 , 这个项目对数据挖掘强调内容较少 , 但你会得到更多关于从数据收集到分析的整个数据科学工作流程的练习 。 像我之前提及的 , 对于数据挖掘极其相关领域要尽可能多的掌握、了解 。 所以相对于系统性地学习 , 这套课程能帮助你拥有一个整体的框架概念 , 并拓展很多数据科学领域的知识 。 不足的是 , 这套教材目前只有英文资源 , 且难度较高 。
3.吴恩达AI课程(Andrewng)
先介绍一下本人背景。|数据挖掘快速入门几大招
文章图片
这套教材也是很多人推荐的 , 它是2017年推出的 , 内容较新 , 可以免费使用 , Coursera上线之后我也慕名有去体验过 。 我个人在学习时使用的是斯坦福大学的版本 , 不是Coursera的 。 这两个版本相比较之下 , Coursera的课程内容比斯坦福的CS229更简单 , 对于数学基础的要求也更低 。 Coursera版本的课程几乎没有涉及很多概率分布、线性优化、平滑处理等机器学习相关的数学知识;反之 , 吴恩达通过各种举例代入的讲解 , 让人工智能变得更加通俗易懂 , 虽然梯度、矩阵等的内容显得十分复杂 , 但是后期用python都可以代入得出结果 , 这样简单实用的设置 , 也受到了很多入门者的喜爱 。 不过这也是这套课程受争议的地方 , 很多人认为对于数学知识讲解过于浅显 , 不足以打好机器学习的基础 。
吴恩达本人是斯坦福大学计算机科学系和电气工程系的客座教授 , 他也是在线教育平台Coursera的创始人之一 。 这套教材在网易有中文版资源 , 课程的形式也是像PPT一样并且附上吴恩达本人的笔记 。 整体来说内容浅显易懂 , 处于初级-中级难度 。 比较适合入门学习 。 这套还配有课后作业和测试 , 保证了一定的练习量 , 但只限于Cousera课程 , 且编程作业需要在Jupyter上完成 。 其次 , 由于是较新的教材 , 了解并真正使用过的人不一定很多 , 所以在学习过程中遇到问题时 , 需要自己查阅资料解决 。
这套教材还有一个特点就是其内容设置的是自下而上的偏理论式讲解 。 这些课程的一个很强的优点是每一个编程练习都有Jupyter中的Python代码模板 。 在几乎所有的课程中 , 吴恩达都带来了一些在该领域取得巨大声誉的人 , 如GeoffHinton,YoshuaBengio,IanGoodfellow,AndrejKarpathy等 。 他们的讲座对于机器学习非常具有启发性 , 大家感兴趣的可以去听一听 。