文章图片
AutoML 可以为预测建模问题自动找到数据准备、模型和模型超参数的最佳组合 , 本文整理了5个最常见且被熟知的开源AutoML 框架 。
AutoML框架执行的任务可以被总结成以下几点:
- 预处理和清理数据 。
- 选择并构建适当的特征 。
- 选择合适的模型 。
- 优化模型超参数 。
- 设计神经网络的拓扑结构(如果使用深度学习) 。
- 机器学习模型后处理 。
- 结果的可视化和展示 。
- Auto-Sklearn
- TPOT
- Hyperopt Sklearn
- Auto-Keras
- H2O AutoML
安装:
#pip
pip install auto-sklearn
#conda
conda install -c conda-forge auto-sklearn
因为进行了大量的封装 , 所以使用的方法sklearn基本一样 , 以下是样例代码:
import sklearn.datasets
import sklearn.metrics
import autosklearn.regression
import matplotlib.pyplot as plt
X y = sklearn.datasets.load_diabetes(return_X_y=True)
X_train X_test y_train y_test = sklearn.model_selection.train_test_split(X y random_state=1)
automl = autosklearn.regression.AutoSklearnRegressor(
time_left_for_this_task=120
per_run_time_limit=30
tmp_folder='/tmp/autosklearn_regression_example_tmp'
)
automl.fit(X_train y_train dataset_name='diabetes')
2、TPOTTPOT(Tree-based Pipeline Optimization Tool)是一个 Python 自动化机器学习工具 , 它使用遗传算法优化对机器学习的流程进行优化 。 它也是基于 Scikit-Learn 提供的方法进行数据转换和机器学习模型的构建 , 但是它使用遗传算法编程进行随机和全局搜索 。 以下是TPOT 搜索流程:
安装:
#pip
pip insall tpot
#conda
conda install -c conda-forge tpot
样例代码:
from tpot import TPOTClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
import numpy as np
iris = load_iris()
X_train X_test y_train y_test = train_test_split(iris.data.astype(np.float64)
iris.target.astype(np.float64) train_size=0.75 test_size=0.25 random_state=42)
tpot = TPOTClassifier(generations=5 population_size=50 verbosity=2 random_state=42)
tpot.fit(X_train y_train)
print(tpot.score(X_test y_test))
tpot.export('tpot_iris_pipeline.py')
3、HyperOpt-Sklearn:HyperOpt-Sklearn 是 HyperOpt 的包装器 , 可以将 AutoML 和 HyperOpt 与 Scikit-Learn 进行整合 , 这个库包含了数据预处理的转换和分类、回归算法模型 。 文档中介绍说:它专为具有数百个参数的模型进行大规模优化而设计 并允许跨多核和多台机器扩展优化过程 。
安装:
pip install hyperopt
样例代码:
from pandas import read_csv
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error
from hpsklearn import HyperoptEstimator
from hpsklearn import any_regressor
- 美味|中国机器人“服务”比利时餐馆
- 机器人|日本企业的可穿戴设备不行 为何女性机器人却很火?
- 学习|女生频遭他人恶意修改考研志愿 账号被人登录:专家称个人信息遭泄露
- 苹果|毫不逊色于苹果系列,国产5G旗舰机器,这两款性价比极高
- 华硕|华硕推三套居家办公学习解决方案,护眼、全能、双屏各具特色
- 机器人|刘强东:从没想过有一天会让一万多兄弟离开,心里这道坎很难过去
- 机器人|特斯拉最早明年开始生产人形机器人 网友:《西部世界》要成真
- 老婆机器人上市一小时售罄,除了不能生育,其他全会做?别被骗了
- 机器|NE板链式斗提机的常见故障与解决方法?
- 一、前言:石头G10S如何解决扫地机器人2大痛点今天之前|石头g10s如何解决扫地机器人2大痛点