PASCAL VOC 2007數(shù)據(jù)集介紹
PASCAL VOC 2007(Visual Object Classes)數(shù)據(jù)集最初是由歐洲計(jì)算機(jī)視覺會(huì)議(European Conference on Computer Vision,ECCV)發(fā)起的一個(gè)項(xiàng)目,主要用于目標(biāo)檢測、圖像分類和語義分割任務(wù)。
PASCAL VOC 2007數(shù)據(jù)集一共有9963張圖片,其中訓(xùn)練集和驗(yàn)證集5011張,測試集4952張,包含了20個(gè)類別。
20個(gè)類別如下圖:

訓(xùn)練集和驗(yàn)證集5011張圖片:

測試集4952張圖片:

PASCAL VOC 2007數(shù)據(jù)集共包含五個(gè)文件夾,文件目錄如下:

Annotations:存放目標(biāo)檢測任務(wù)的標(biāo)簽文件(xml格式),與JPEGImages文件夾中的圖片一一對應(yīng),如下圖;

ImageSets:包括Layout,Main和Segmentation三個(gè)文件夾。其中,Layout用于person layout任務(wù),存放的是具有人體部位的數(shù)據(jù)(如:頭、手和腳等);Main用于分類和檢測任務(wù),存放的是分類和檢測的數(shù)據(jù)集劃分?jǐn)?shù)據(jù);Segmentation下存放用于分割任務(wù)的數(shù)據(jù);

JPEGImages:存放jpg格式的圖片文件,與Annotations文件夾中的標(biāo)簽一一對應(yīng),如下圖;

SegmentationClass:存放Semantic Segmentation(語義分割)的標(biāo)簽,不同類別用不同顏色標(biāo)注,即對每個(gè)像素點(diǎn)分類,如下圖;

SegmentationObject:存放Instance Segmentation(實(shí)例分割)的標(biāo)簽,不同個(gè)體用不同顏色標(biāo)注,即目標(biāo)檢測+語義分割,如下圖;

注意一:
關(guān)于Annotations中的xml標(biāo)簽文件:
filename:文件名;
source:圖片來源;
owner:擁有者;
segmented:是否分割;
size屬性:
width表示圖片的寬度;
height表示圖片的高度;
depth表示圖片的深度;
object屬性:
name表示bbox的類別;
pose:拍攝角度(front,rear,left,right和unspecified);
truncated:目標(biāo)是否被截?cái)?如延伸到圖片外),是否被遮擋(超過15%);
difficult表示bbox識(shí)別難度,0—可識(shí)別,1—不可識(shí)別;
bndbox表示bbox,(xmin,ymin)—左上角坐標(biāo),(xmax,ymax)—右下角坐標(biāo);
注意二:
關(guān)于Main中的文件
用于檢測任務(wù)(只記錄圖片名稱)


用于分類任務(wù)(記錄圖片名稱和正負(fù)樣本)


其中,+1為正樣本,表示圖片是person;-1為負(fù)樣本,表示圖片不是person;
例如,"000012"為負(fù)樣本,表示圖片中沒有person;"000017"為正樣本,表示圖片中有person,如下圖:

PASCAL VOC 2007訓(xùn)練集和驗(yàn)證集下載:
http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
PASCAL VOC 2007測試集下載:
http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar