如何攻克计算机科学圣杯?自动机器学习让AI模型在几秒内给出结果

机器学习的研究人员在设计新模型时做出了许多决定 , 比如他们会决定在神经网络中包含多少层 , 以及输入值在每个节点上的权重 。
德国弗莱堡大学的机器学习实验室负责人弗兰克·哈特(FrankHutter)表示 , 所有这些人类决策的结果是 , 复杂的模型最终是“由直觉设计的” , 而不是系统设计的 。
如今 , 一个被称为自动机器学习(AutoML)的领域正在快速发展 , 旨在消除直觉的主导作用 。 其核心思想是让算法做出模型的设计决策 , 而不是研究人员 。
这种技术最终可以使机器学习变得更容易获得 。 尽管自动机器学习已经存在了近十年 , 但研究人员仍在努力改进它 。
最近 , 一个新会议在美国巴尔的摩举行 , 组织者称其为“第一次关于这个主题的国际会议” , 会上展示了为提高AutoML准确性和优化其性能所做的努力 。
人们对AutoML简化机器学习的潜力非常感兴趣 。 亚马逊和谷歌等公司已经提供了使用AutoML技术的低代码机器学习工具 。 如果这些技术变得更有效 , 它就可以加速研究 , 并允许更多的人使用机器学习 。
核心思想是为了让人们能够选择一个他们想问的问题 , 指派一个AutoML工具 , 最终收到他们想要的结果 。
会议组织者之一、美国怀俄明大学的助理教授拉尔斯·科托夫(LarsKotthoff)表示 , 这个愿景是“计算机科学的圣杯” , “由你来指定问题 , 计算机确定如何解决它——你只需要做这些 。 ”但首先 , 研究人员必须弄清楚如何使这些技术更节省时间和能源 。
如何攻克计算机科学圣杯?自动机器学习让AI模型在几秒内给出结果
文章图片
如何攻克计算机科学圣杯?自动机器学习让AI模型在几秒内给出结果】(来源:MSTECH)
如何攻克计算机科学圣杯?自动机器学习让AI模型在几秒内给出结果
文章图片
什么是AutoML?
乍一看 , AutoML的概念似乎是多余的——毕竟 , 机器学习已经在自动化从数据中获取见解的过程了 。
但是 , 由于AutoML算法在底层机器学习模型之上的抽象层上运行 , 只利用这些模型的输出作为指导 , 因此它们可以节省时间和计算 。 研究人员可以将AutoML技术应用于预训练模型 , 以获得新的见解 , 而无需在重复现有研究方面浪费算力 。
例如 , 美国富士通研究中心的研究科学家迈赫迪·巴拉米(MehdiBahrami)和他的合作者展示了最近的工作 , 即如何使用具有不同预训练模型的BERT-sort算法 , 以适应新的目的 。
BERT-sort是一种算法 , 在数据集上训练时 , 它可以计算出所谓的“语义顺序” 。 例如 , 给定一套电影评论数据 , 它可以知道“杰出(great)”电影的排名高于“好(good)”和“坏(bad)”电影 。
用AutoML技术 , 算法学习到的语义顺序也可以用在癌症诊断分析 , 甚至是韩文文本分类等任务上 , 减少时间和计算 。 巴拉米说:“BERT需要几个月的计算 , 而且非常昂贵 , 模型的生成和重复就要花上100万美元 。
所以 , 如果每个人都想做同样的事情 , 它又是很昂贵、浪费的 , 那其实对世界并不友好 。 ”尽管该领域展示出了希望 , 但研究人员仍在寻找使AutoML技术提高计算效率的方法 。
例如 , 像神经架构搜索这样的方法 , 目前正在构建和测试许多不同的模型 , 以找到最佳拟合 , 而完成所有这些迭代所需的能源是不可小觑的 。 AutoML技术也可以应用于不涉及神经网络的机器学习算法 , 比如创建随机决策森林或支持向量机来对数据进行分类 。
这些领域的研究更加深入 , 许多编码库已经适用于那些想要将AutoML技术整合到项目中的人 。 会议组织者弗兰克·哈特(FrankHutter)表示 , 下一步是使用AutoML来量化不确定性 , 并解决算法中的可信度和公平性问题 。