希捷|一次性总结:64个数据分析常用术语( 四 )


52、机器学习(Machine learning)
人工智能的一部分 , 指的是机器能够从它们所完成的任务中进行自我学习 , 通过长期的累积实现自我改进 。
53、网络分析(Network analysis)
分析网络或图论中节点间的关系 , 即分析网络中节点间的连接和强度关系 。
54、异常值检测(Outlier detection)
异常值是指严重偏离一个数据集或一个数据组合总平均值的对象 , 该对象与数据集中的其他它相去甚远 , 因此 , 异常值的出现意味着系统发生问题 , 需要对此另加分析 。
55、模式识别(Pattern Recognition)
通过算法来识别数据中的模式 , 并对同一数据源中的新数据作出预测
56、预测分析(Predictive analysis)
大数据分析方法中最有价值的一种分析方法 , 这种方法有助于预测个人未来(近期)的行为 , 例如某人很可能会买某些商品 , 可能会访问某些网站 , 做某些事情或者产生某种行为 。 通过使用各种不同的数据集 , 例如历史数据 , 事务数据 , 社交数据 , 或者客户的个人信息数据 , 来识别风险和机遇 。
57、回归分析(Regression analysis)
确定两个变量间的依赖关系 。 这种方法假设两个变量之间存在单向的因果关系(译者注:自变量 , 因变量 , 二者不可互换) 。
58、路径分析(Routing analysis)
针对某种运输方法通过使用多种不同的变量分析从而找到一条最优路径 , 以达到降低燃料费用 , 提高效率的目的 。
59、情感分析(Sentiment Analysis)
通过算法分析出人们是如何看待某些话题 。
60、SQL
在关系型数据库中 , 用于检索数据的一种编程语言 。
61、时序分析(Time series analysis)
分析在重复测量时间里获得的定义良好的数据 。 分析的数据必须是良好定义的 , 并且要取自相同时间间隔的连续时间点 。
62、文本挖掘(Text Mining)
对包含自然语言的数据的分析 。 对源数据中词语和短语进行统计计算 , 以便用数学术语表达文本结构 , 之后用传统数据挖掘技术分析文本结构 。
63、可视化(Visualization)
只有正确的可视化 , 原始数据才可被投入使用 。 这里的“可视化”并非普通的图型或饼图 , 可视化指是的复杂的图表 , 图表中包含大量的数据信息 , 但可以被很容易地理解和阅读 。
64、仪表板(Dashboard)
使用算法分析数据 , 并将结果用图表方式显示于仪表板中 。
以上 。
"