业务数据全用上也喂不饱AI?试试这个小样本学习工具包( 三 )


Siamese(SiameseNetworks)是一种早期的小样本学习方法 。 该方法设计了一种孪生结构 , 很自然地学习如何更好地度量输入内容的相似度 , 从而使用极少的标签样本来获得预测新样本的能力[14] 。
我们在paddlefsl.model_zoo中实现了上述五种算法的完整的训练和测试逻辑 。 以MAML为例 , 用户仅需传入待测数据集和相关的算法超参和训练配置 , 即可直接开始训练或测试 , 并自动保存训练得到的模型参数:
业务数据全用上也喂不饱AI?试试这个小样本学习工具包
文章图片
此外 , 我们还在样例(examples)中提供了PET[16]、P-Tuning[17]和EFL[18]在FewCLUE任务上的实现 。 FewCLUE的任务将额外地依赖paddlenlp包 , 其实现过程中使用了百度的中文NLP预训练模型ERNIE1.0 , 并汇报了三种算法的效果 。
我们利用本项目实现的经典算法高层次接口测试了所有数据集上的效果 , 并与原论文或其他论文复现的效果做了比对 。 结果显示 , 我们的实现均达到了原论文方法使用其他机器学习框架汇报的结果 , 在多数任务上提升了原有的效果 。 具体的结果数据在样例(examples)中给出(https://github.com/tata1661/FSL-Mate/tree/master/PaddleFSL/examples)
低层次常用工具函数