labelImgの出力
<annotation>
<folder>template</folder>
<filename>car.jpg</filename>
<path>C:\car.jpg</path>
<source>
<database>Unknown</database>
</source>
<size>
<width>1280</width>
<height>720</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>lamp</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>1036</xmin>
<ymin>647</ymin>
<xmax>1259</xmax>
<ymax>702</ymax>
</bndbox>
</object>
</annotation>
VOTの出力は、bndboxの座標が小数点以下も含めて出力されるようです。
<annotation verified="yes">
<folder>Annotation</folder>
<filename>car</filename>
<path>C:\car.jpg</path>
<source>
<database>Unknown</database>
</source>
<size>
<width>1280</width>
<height>720</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>lamp</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>179.76060935799782</xmin>
<ymin>252.1001088139282</ymin>
<xmax>404.0043525571273</xmax>
<ymax>437.3449401523395</ymax>
</bndbox>
</object>
</annotation>
bndboxの座標が左上原点なのか、左下原点なのかはっきりしなくて(出力結果から判断すると、左上原点)PASCAL VOCのxmlの仕様を確認しようとしたのですが、これといった情報が見つかりません。
どうもThe PASCAL Visual Object Classes Challenge 2012 (VOC2012) Development Kitというのが仕様らしいのですが、細かな情報はないようです。「xml見ればわかるでしょ?」と言われれば、確かにそうなのですが。