当前位置:网站首页>小样本学习-入门
小样本学习-入门
2022-07-19 03:09:00 【坠金】
术语
Support Set / Query Set 和 N-way k-shot
传统图像分类
小样本学习
小样本学习想要达到的效果:
- 给模型一个查询样本(query set),该样本属于一个新的,以前未见过的类,
- 还给它一个支持集S(support set),模型必须使用来自支持集的信息才能学会对query set进行分类。支持集由n个来自k个不同看不见类的样本组成,这就是N-way k-shot
注意N 和 k 是由 Testing data决定的,与 Training data 无关;
如何从原始的 training dataset 和 testing dataset 中得到这几个 Support set 和 Query set 呢?
右侧方框的testing data也可以表示这样:
training过程中将提供大量的样本,使模型learn to learn。training过程的类叫做base class。
testing过程只有少量样本,测试模型few shot learning的能力。testing中包含的都是training时没见过的新类(novel class)
episode
在Matching networks论文中对训练周期的定义上提出了episodes的概念,为了区别大数据训练的epochs,在episodes周期里,都是为了服务于few-shot任务的子类别样本训练,这个子类别就是区别于epochs中全类别子样本训练,。很多meta-learning中的任务也喜欢用episodes这个词汇,而对应神经网络中的mini-batch是比较合适的。
举例:20-way 5-shot问题:
- 每个episodes提取出来20个类别,而不是所有的类别(传统softmax分类训练要加载所有类别);
- 每个类别是有5个examples可供训练,因为训练中还要分support-sets+query-sets,5-shots场景至少需要5+1个样例,至少一个query example去何support-sets的样例做距离(分类)判断。
- 测试集可以变换成5-way 1-shot等等方式来评估模型的泛化能力。
- 最后每个epoch还要设定由多少个episodes来组成,好像大家都喜欢用1000来作为典型值。
domain gap / catagory gap
用来描述数据集差异
domain gap:如下图,可能种类是同一种,但是清晰程度,光照不一样
category gap:种类不同
参考资料
边栏推荐
- 三、品达通用权限系统__pd-tools-swagger2
- PAT乙级-B1007 素数对猜想(20)
- NAOMI: Non-Autoregressive MultiresolutionSequence Imputation(非自回归多分辨率序列填补)论文详解
- How to carry out engineering implementation of DDD Domain Driven Design
- The latest announcement in 2022: the best time to post on social media
- 通过网上的客户经理办理股票开户安全吗?佣金高不高啊?
- Mysql_Note2
- Metaverse:元宇宙中DeFi的可能性和局限性
- 19 和为K的子数组
- SoC第一个工程hello_world
猜你喜欢
随机推荐
LeetCode 0749. 隔离病毒 - 大模拟
01. Valid parentheses
NAOMI: Non-Autoregressive MultiresolutionSequence Imputation(非自回归多分辨率序列填补)论文详解
MySQL之数据库和表的创建与管理
《数据库系统内 幕》B树的变体
Numpy学习
向量化执行引擎框架 Gluten 正式开源!
【微信小程序】课程表案例--0基础版
实验1:电影分析
shell总结(1)
通过网上的客户经理办理股票开户安全吗?佣金高不高啊?
LeetCode 0120. 三角形最小路径和
一次翻好多倍的SQL优化过程
Oracle嵌套多层,找不到表的别名问题
GCDQueue封装
Eight considerations of servant leadership
Pat b-b1007 prime pair conjecture (20)
MySQL主从复制、读写分离
栈题目:基本计算器
Memory forensics WP of 2022 network security national game