机器学习|统计学和机器学习到底存在哪些联系和区别?

机器学习|统计学和机器学习到底存在哪些联系和区别?

文章图片

机器学习|统计学和机器学习到底存在哪些联系和区别?

文章图片

机器学习|统计学和机器学习到底存在哪些联系和区别?

文章图片

机器学习|统计学和机器学习到底存在哪些联系和区别?

统计学和机器学习之间的界定一直很模糊 。
无论是业界还是学界一直认为机器学习只是统计学批了一层光鲜的外衣 。
而机器学习支撑的人工智能也被称为“统计学的外延”
例如 , 诺奖得主托马斯·萨金特曾经说过人工智能其实就是统计学 , 只不过用了一个很华丽的辞藻 。

萨金特在世界科技创新论坛上表示 , 人工智能其实就是统计学
当然也有一些不同的声音 。 但是这一观点的正反双方在争吵中充斥着一堆看似高深实则含糊的论述 , 着实让人摸不着头脑 。
一位名叫Matthew Stewart的哈佛大学博士生从统计与机器学习的不同;统计模型与机器学习的不同 , 这两个角度论证了机器学习和统计学并不是互为代名词 。
机器学习和统计的主要区别在于它们的目的

与大部分人所想的正相反 , 机器学习其实已经存在几十年了 。 当初只是因为那时的计算能力无法满足它对大量计算的需求 , 而渐渐被人遗弃 。 然而 , 近年来 , 由于信息爆炸所带来的数据和算力优势 , 机器学习正快速复苏 。
言归正传 , 如果说机器学习和统计学是互为代名词 , 那为什么我们没有看到每所大学的统计学系都关门大吉而转投'机器学习'系呢?因为它们是不一样的!
我经常听到一些关于这个话题的含糊论述 , 最常见的是这样的说法:
\"机器学习和统计的主要区别在于它们的目的 。 机器学习模型旨在使最准确的预测成为可能 。 统计模型是为推断变量之间的关系而设计的 。
虽然技术上来说这是正确的 , 但这样的论述并没有给出特别清晰和令人满意的答案 。 机器学习和统计之间的一个主要区别确实是它们的目的 。
然而 , 说机器学习是关于准确的预测 , 而统计模型是为推理而设计 , 几乎是毫无意义的说法 , 除非你真的精通这些概念 。

首先 , 我们必须明白 , 统计和统计建模是不一样的 。 统计是对数据的数学研究 。 除非有数据 , 否则无法进行统计 。 统计模型是数据的模型 , 主要用于推断数据中不同内容的关系 , 或创建能够预测未来值的模型 。 通常情况下 , 这两者是相辅相成的 。
因此 , 实际上我们需要从两方面来论述:第一 , 统计与机器学习有何不同;第二 , 统计模型与机器学习有何不同?
说的更直白些就是 , 有很多统计模型可以做出预测 , 但预测效果比较差强人意 。
而机器学习通常会牺牲可解释性以获得强大的预测能力 。 例如 , 从线性回归到神经网络 , 尽管解释性变差 , 但是预测能力却大幅提高 。
从宏观角度来看 , 这是一个很好的答案 。 至少对大多数人来说已经足够好 。 然而 , 在有些情况下 , 这种说法容易让我们对机器学习和统计建模之间的差异产生误解 。 让我们看一下线性回归的例子 。
统计模型与机器学习在线性回归上的差异

或许是因为统计建模和机器学习中使用方法的相似性 , 使人们认为它们是同一个东西 。 对这我可以理解 , 但事实上不是这样 。
最明显的例子是线性回归 , 这可能是造成这种误解的主要原因 。 线性回归是一种统计方法 , 通过这种方法我们既可以训练一个线性回归器 , 又可以通过最小二乘法拟合一个统计回归模型 。