看懂这25个核心概念,就没有啃不动的机器学习论文( 二 )


看懂这25个核心概念,就没有啃不动的机器学习论文
文章图片
第三个是数据增强 。 这部分介绍了论文作者使用了数据增强技术来在微调步骤中对特定任务的数据集进行扩展 。
看懂这25个核心概念,就没有啃不动的机器学习论文
文章图片
之后文章精简地呈现了原始论文中TInyBERT的关键数据 , 如该模型的性能在基准测试中达到了BERT基础教师模型的96% , 同时体积缩小了7.5倍 , 速度提高了9.4倍 。
看懂这25个核心概念,就没有啃不动的机器学习论文
文章图片
针对原始论文的三个核心贡献 , 文章还给出了一些有价值的思考 , 如特定任务的蒸馏(微调)比通用蒸馏(预训练)更重要等等 。
看懂这25个核心概念,就没有啃不动的机器学习论文
文章图片
SwinTransformer解读
再比如当年屠榜各大视觉任务的SwinTransformer , 由微软亚洲研究院郭百宁团队提出 , 是视觉领域的研究者必读的一篇论文 , 这项工作也在这个论文解读项目有精彩的分享:
看懂这25个核心概念,就没有啃不动的机器学习论文
文章图片
文章首先以原始论文中的关键图表 , 简要介绍了SwinTransformer的基本方法及其核心设计元素 。
看懂这25个核心概念,就没有啃不动的机器学习论文
文章图片
然后逻辑清晰地详解了SwinTransformer的架构细节 , 包括4个stage和SwinTransformerBlock
看懂这25个核心概念,就没有啃不动的机器学习论文
文章图片
接着列出了SwinTransformer的几项实验:
看懂这25个核心概念,就没有啃不动的机器学习论文
文章图片
有兴趣的读者可以自行前往该项目探索一番 , 如果想分享自己的论文解读 , 也可以向该项目提交PR 。 据项目作者透露 , 后续还将推出notebook和讲座 , 帮助大家更好地跟进研究进展 。
更多内容 , 点击下方关注:
mp-common-profile看懂这25个核心概念,就没有啃不动的机器学习论文
文章图片
未经「AI科技评论」授权 , 严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权 , 转载时需标注来源并插入本公众号名片 。
雷峰网