微大智能科技(苏州)有限公司

    机器视觉训练必知的20个经典图像数据集

    分享到:
    点击次数:1438 更新时间:2020年12月24日10:35:05 打印此页 关闭

    机器视觉的任务包括图像采集、图像处理和图像分析,下面为大家分享用于机器视觉训练的20个经典图像数据集。

     

    Labelme:麻省理工学院计算机科学与人工智能实验室(CSAIL)创建的大型数据集,包含187,240张图像、62,197条带注释的图像和658,992张带标签的对象。

     

    乐高积木:通过文件夹和使用Blender渲染的计算机对大约16700种乐高积木进行分类的大约12,700张图像。

     

    ImageNet:用于新算法的实际图像数据集。根据WordNet层次结构进行组织,其中层次结构的每个节点都以成千上万的图像进行描绘。

     

    LSUN:具有许多辅助任务的场景理解(房间布局估计、显着性预测等)

     

    MS COCOCOCO是包含200,000多个标记图像的大规模对象检测、分割和字幕数据集。它可以用于对象分割,上下文识别以及许多其他用例。

     

    哥伦比亚大学图像库:COIL100是一个数据集,其中包含360个旋转角度中每个角度成像的100个不同对象。

     

    视觉基因组:视觉基因组是一个数据集和知识库,旨在将结构化图像概念与语言联系起来。该数据库具有详细的视觉知识库,并带有108,077张图像的字幕。

     

    Google的开放图像:“Creative Commons”900万个URL的图像集合,这些URL已用6000多个类别的标签进行了注释。

     

     

     

    来自“打开图像”数据集的带注释的图像。

     

    左:Kevin Krejci的《鬼拱门》。右:J B制造的银制厨房用具。两个图像均在CC BY 2.0许可下使用。

     

    Youtube-8M:带有标签的大规模数据集,由数百万个YouTube视频ID组成,带有超过3,800多个视觉实体的注释。

     

    带标签的野外面孔:13,000个带标签的人脸图像,用于开发涉及面部识别的应用程序。

     

    斯坦福犬类数据集:包含20,580张图像和120种不同的犬种类别,每个类别约有150张图像。

     

    地点:以场景为中心的数据库,其中包含205个场景类别和250万个带有类别标签的图像。

     

    CelebFaces:具有超过200,000张名人图像的人脸数据集,每个图像带有40个属性注释。

     

     

    来自CelebFaces数据集的样本图像。

     

    花卉:在英国常见的花朵图像数据集,包含102个不同类别。每个花类由40258张图像组成,这些图像具有不同的姿势和光线变化。

     

    植物图像分析:涵盖超过一百万张植物图像的数据集。可以从11种植物中选择。

     

    家庭对象:一个数据集,其中包含来自家庭的随机对象,大部分来自厨房、浴室和客厅,这些对象分为训练和测试数据集。

     

    CIFAR-10:包含60,00032×32彩色图像的大型图像数据集,分为10类。数据集分为五个训练批次和一个测试批次,每个批次包含10,000张图像。

     

    CompCars:包含163种车型,包含1,716种车型,每种车型都标有五个属性,包括最大速度、排量、门数、座位数和汽车类型。

     

    室内场景识别:非常具体的数据集,非常有用,因为大多数场景识别模型在“外部”效果更好。包含67个室内类别,共15620张图像。

     

    VisualQAVQA是一个数据集,包含有关265,016张图像的开放式问题。这些问题需要对视觉和语言的理解。对于每个图像,至少有3个问题,每个问题10个答案。

      上一条:如何提高机器视觉系统中工业相机的帧率 下一条:工业相机如何获取彩色图像