文章图片
数据分析的时代已经到来 , 从国家、政府、企业到个人 , 大数据和数据分析已经成为大家耳熟能详的名词 。 但是你可能没有学过数据分析或编程的专业知识 , 或者你虽然学了很多数据分析的理论 , 但你还不知道怎样运用到实践上 。 在这里 , 我将对数据分析师最受欢迎的四种工具(Excel、R、Python和BI)进行比较 , 作为开始学习数据分析的基础 。
1.Excel
1.1 使用场景
? 一般办公室里简单的数据处理工作 。
? 中小型企业的数据管理和存储 。
? 学生或老师用来进行简单的统计分析(如方差分析、回归分析等) 。
? 结合 Word和PowerPoint来创建数据分析报告 。
? 数据分析师的辅助工具 。
? 为一些商业杂志和报纸制作图表(数据可视化) 。
1.2 优势
? 入门使用Excel很容易 。
? 学习资源非常丰富 。
? 你可以用Excel做很多事情:建模、可视化、数据报告、动态图表等 。
? 它可以帮助您在进一步学习其他工具(如Python和R)之前了解许多操作的含义 。
1.3 缺点
? 要完全掌握Excel , 需要学习VBA , 所以难度还是很高的 。
? 当数据量很大时 , 就会出现卡顿的情况 。
? 不借助其他工具的话 , Excel数据文件本身只能容纳108万行 , 不适合处理大规模数据集 。
? 内置的统计分析过于简单 , 做高级分析比较吃力 。
? 与Python、R和其他开源软件不同 , 正版Excel需要收费 。
2.R
2.1 使用场景
R的功能几乎涵盖数据分析的所有领域 , 就我们一般的数据分析工作而言 , R能做的事情主要有以下几个方面 。
? 数据清洗 。
? 网络爬取 。
? 数据可视化 。
? 统计假设检验(t检验、方差分析、卡方检验等) 。
? 数据建模(线性回归、逻辑回归、树模型、神经网络等) 。
? 数据分析报告输出(R markdown) 。
2.2 R容易学吗?
在我看来 , 学习使用R是比较简单的 , 如果经过10天的集中学习 , 足以掌握其基本使用、基本数据结构、数据导入导出、简单的数据可视化等内容 。 有了这些基础 , 当你遇到实际问题时 , 就可以找到你需要使用的R包 , 通过阅读帮助文件或者网络上的资料 , 可以快速地解决具体的问题 。
3. Python
3.1 使用场景
? 数据爬取 。
? 数据清洗 。
? 数据建模 。
? 根据业务场景和实际问题构建数据分析算法 。
? 数据可视化 。
? 数据挖掘和分析的高级领域 , 例如机器学习和文本挖掘 。
3.2 R与Python
R和Python都是可以编程的数据分析工具 , 不同的是 , R专门用于数据分析领域 , 而数据分析只是Python 的一个应用分支 , Python还可以用来开发网页、开发游戏或者开发系统后端 , 做一些运维的工作 。
当前的一个趋势是 , 在数据分析的领域里 , Python正在追赶着R , 在某些方面 , 它已经超越了R , 例如机器学习和文本挖掘 , 但是R在统计领域仍然保持着优势 。 Python在数据分析方面的发展 , 在很多地方都模仿了R的一些特性 , 所以 , 如果你还是新手 , 还没有开始学习 , 我建议你从Python开始 。
- 京东方|网络工程师常用的软件工具整理,最新软件安装包分享
- 尽管最初只是一个针对青少年的聊天工具|huggingface获20亿美元融资
- Python|小米自研的极夜拍照功能“夜枭算法”拿下两项世界冠军,你喜欢吗
- 智能手机|我花2000块钱 买到了手机店最赚钱的工具
- Python|中科院花38小时整理出来的Python教程,整整632集,从入门到精通拿走不谢!
- Python|特斯拉CEO马斯克:我要和普京单挑
- 任天堂|翻盖设计双屏显示,这款老旧任天堂ndsi,当年专属玩游戏工具
- 前段时间|微信新增性能检测工具,网友:不如来点有用的功能!
- 自媒体|自媒体素材、工具大全分享,每天稳定收益300+
- Python|叠加版麒麟处理器的手机要来了?