机器学习|5 分钟了解机器学习的特征工程( 二 )


我们的模型理解数字但不理解字符串 , 这就是我们需要将字符串转换为数字的原因 。但是 , 我们不能为我们的字符串分配随机数 , 因为我们的模型可能比小数字更重视大数字 。这就是为什么我们要使用 one-hot 编码的原因 。
以下是有关房屋销售的示例:

One-hot 编码对于用机器学习模型能够理解的简单数字数据替换分类数据很有用 。
总结特征工程将帮助您:
借助适当的特征 , 解决适当的业务案例问题 。
提高机器学习算法的性能 。
作者:Florian Bouron