行家说行话｜关于少样本学习的二三事

400-661-9188
028-83319389

首页
核心技术
空间智能多模态世界模型：悠然无界大模型

多模态产业通用大模型：悠然大模型

AI工具链：OSMAGIC码极客
产品
- 空间智能本体—MAGX系列
  智能体硬件产品：
  MAGX Unloader 智能卸货机
- 多模态交互智能体-UU系列
  智能体软件产品：
  UU Holo 实时空间多模态交互智能体
  UU Video Agent一站式视频分析与应用智能体
- 行业应用智能体-URAN系列
  行业智能体产品：
  悠然智擎城市治理空间智能体
  悠然智擎烟草工业空间智能体
  悠然智擎应急防灾协同空间智能体
  行业智能体平台：
  悠然远智空间智能体平台
  边缘智能产品：
  悠然AI-Lite智能一体机
- 智能检测智能体 —KL系列
  KL系列：
  Mini LED AOI 系列产品
  屏显检测产品
  半导体检测产品
  大幅面检测产品
解决方案
AI通用解决方案
- AI+工业检测
- AI+安全生产
AI行业解决方案
应用案例
半导体

高端屏显

大幅面

烟草

化工

燃气

交通

城市治理

生态环保

园区

文旅
关于我们
公司简介

招贤纳士

新闻动态
伙伴生态

 首页 /关于我们 /新闻动态

技术创新 | 行家说行话｜关于少样本学习的二三事

发布时间：2021-05-18

“现有的AI系统在有充足数据的单一任务中表现出超过人类智能的能力，但是当要求它处理一些简单但却有一定差异的不同任务时，则仍然存在很多困难。”

01. 何为“少样本学习”
以视觉AI系统中应用非常广泛的目标检测算法为例，不同任务中需要检测的目标可能存在很大差异，以目前的监督式学习范式处理，对大量有标签数据的需求在切入新场景和新任务时，存在成本和效率的双重压力。我们将这样的情况称作“碎片化”的任务场景。

在这样的背景下，“少样本学习（Few-shot Learning）”方法应运而生，有时又被称为“元学习（Meta Learning）”或者“学会学习（Learn to Learn）”。

它强调利用既有的知识经验来促进新任务的学习，使计算机具备获取多样性知识的能力。此类方法在视觉AI系统中已有极为成功的案例，例如考拉悠然多模态识别技术，在训练过程里让模型习得提取每个人独特“特征”的能力，从而当遇到未见过的人员（新的任务）时，仅需注册一张或几张照片，即可达成对其身份识别的超高准确率。

002

（人脸识别面部特征提取）

02. 少样本学习优势所在
我们认为这样的方法在更多的“碎片化”任务场景中都可以被推广应用，从而带来极大的体验提升——

一方面，针对新任务可以通过极少量样本的特征提取与注册方式迅速达成上线，显著提高系统开发与应用的效率。以智慧城市场景中的行为识别为例，在监督式学习范式下，对于每一种需要被系统甄别出的行为，都需要经过对较大量视频数据的采集、分段、标注、训练等繁复的过程，从一个行为识别任务从需求明确到实际的部署上线可能花费数周到数月时间；但通过“少样本学习”的方式，则仅需要将少数几个典型行为样本注册到系统中即可达成一定程度的识别，这一过程可能只需要几天的时间就能完成。

另一方面，在使用过程中的漏报与误报现象，也可以通过注册方式实时在线解决，对于现有AI系统依赖于离线训练与部署的笨重迭代方式也是很好的补充。比如目标检测算法在智能制造领域的具体应用中，漏检和误检的现象对这类系统造成长期的困扰，人工智能方法虽然显著提高了目标检测算法的准确率，但也仍然无法完全杜绝漏检和误检的产生；在传统监督式学习下，针对漏检和误检的现象，需要收集一定量的错误样本，然后增量进行训练，不仅费时费力、响应延迟，且新的训练是否能够关注到这些错误样本，从而实际达成效果提升并不能得到保障，这些错误样本的数据分布很可能被极大量的原始训练数据的分布所淹没；而在“少样本学习”范式之下，针对漏检和误检的问题，则只需要将错例及时注册到系统中，告知系统这是“增补”或“例外”的目标，通过这一简便快捷的操作，错漏补丁即可实时生效，并且也不会存在分布淹没的不利现象。

基于此，快速、高效和灵活将是少样本学习区别于传统监督式学习的优势所在。

03. 提升少样本条件下的应用效果的注意事项
利用“少样本学习”范式来改造AI算法以适应“碎片化”任务场景，基于度量的方法是一种相对简便的实施路径，这一路径与“表征学习（Representation Learning）”也有较大的相似性。通过考拉悠然的不断实践，提升此类方法在少样本条件下的应用效果需要注意以下三点：

（1）特征的独特性与稳定性
基于度量的方法希望对于每一个样本能够提取到其独一无二的“特征”，并且这种特征应该是稳定的，即不受常见的如光照、角度、模糊等条件而变化，这可以通过简单的数据增强手段在一定程度上模拟；

（2）无监督与有监督相结合
这种学习方法本身可以是无监督的，因此可以利用海量的廉价无标签数据进行学习以提高泛化性能；在有一些宝贵有标签数据的条件下，也可以利用标签数据，来进一步促进特征的稳定性；同时结合这两种学习方法比单一地采取其中一种更好；

（3）约束特征的独立性
机器学习方法在学习高维特征的过程中会倾向于“抄捷径”，因此在特征之间有时会存在较强的相关性，这不利于充分发掘模型的表达能力以提炼多样性知识；通过约束特征之间的独立性，有助于提高模型在新任务上的冷启动效果。

04. “少样本学习”的实践之路
考拉悠然一直在行为分析和视觉检测领域不断探索“少样本学习”的“用武之地”，力求以最高效率和灵活度完成行为和物品的检测。

003

相关文章

公司动态 | 考拉悠然亮相央视！新技术催生新场景，开启空间智能新时代

2025-02-17
公司动态 | 5G+AI，考拉悠然用科技赋能校园智慧管理

2022-04-06
公司动态 | 焕新升级！考拉悠然官网全新上线

2024-11-19

Hi，我是考拉悠悠

AI定义新美好

探索无限可能从这里开始