如果我们用一个不同的损失函数 , 结果可能并不收敛 。 例如 , 如果我们用了铰链损失(使用标准梯度下降时不太好区分 , 因此需要使用类似近梯度下降等其它方法) , 那么结果就不会相同了 。
最后可以对模型偏差进行区分 。 你可以用机器学习算法来测试线性模型以及多项式模型 , 指数模型等 , 来检验这些假设是否相对我们的先验损失函数对数据集给出更好的拟合度 。 在传统统计学概念中 , 我们选择一个模型 , 评估其准确性 , 但无法自动从100个不同的模型中摘出最优的那个 。 显然 , 由于最开始选择的算法不同 , 找出的模型总会存在一些偏误 。 选择算法是非常必要的 , 因为为数据集找出最优的方程是一个NP-hard问题 。
那么哪个方法更优呢?
这个问题其实很蠢 。 没有统计学 , 机器学习根本没法存在 , 但由于当代信息爆炸人类能接触到的大量数据 , 机器学习是非常有用的 。
对比机器学习和统计模型还要更难一些 , 你需要视乎你的目标而定究竟选择哪种 。 如果你只是想要创建一个高度准确的预测房价的算法 , 或者从数据中找出哪类人更容易得某种疾病 , 机器学习可能是更好的选择 。 如果你希望找出变量之间的关系或从数据中得出推论 , 选择统计模型会更好 。
如果你统计学基础不够扎实 , 你依然可以学习机器学习并使用它——机器学习程序库里的抽象概念能够让你以业余者的身份来轻松使用它们 , 但你还是得对统计概念有所了解 , 从而避免模型过度拟合或得出些貌似合理的推论 。
图中文字:这是你的机器学习系统?对的 , 你从这头把数据都倒进这一大堆或者线性代数里 , 然后从那头里拿答案就好了 。 答案错了咋整?那就搅搅 , 搅到看起来对了为止 。
- 机器人|2023,智能移动机器人加速落地
- 专利局|新报告:氢技术创新转向低排放 欧盟和日本专利领先
- 超越谷歌和苹果?小米进军电动汽车行业
- 埃隆马斯克说手机和可穿戴设备是过时的技术,脑机接口才是未来
- 小米科技|便宜了600块!一加11的产品力能和小米13相比吗?
- 一加科技|没有一加11Pro手机,但一加Ace2已入网,将搭载骁龙8+和100W快充
- 红米手机|红米K60和iQOO Neo7竞速版分别上手:选择,不会特别纠结!
- 比尔盖茨在谈论电动汽车时不提特斯拉,难道和埃隆马斯克有过节?
- 惠普|惠普戴尔退出中国?关注飞腾、鲲鹏和龙芯产业链
- 华为|怒砸400亿!华为和中芯国际成“邻居”,外媒:华为“野心”暴露