PASCAL VOCのxmlの仕様が見つからない

2020年2月8日土曜日

labelImg VOTT

t f B! P L
labelImgVOTTでアノテーションを行って、PASCAL VOC形式で結果を出力すると、次のようなxmlファイルが生成されます。
labelImgの出力

<annotation>
  <folder>template</folder>
  <filename>car.jpg</filename>
  <path>C:\car.jpg</path>
  <source>
    <database>Unknown</database>
  </source>
  <size>
    <width>1280</width>
    <height>720</height>
    <depth>3</depth>
  </size>
  <segmented>0</segmented>
  <object>
    <name>lamp</name>
    <pose>Unspecified</pose>
    <truncated>0</truncated>
    <difficult>0</difficult>
    <bndbox>
      <xmin>1036</xmin>
      <ymin>647</ymin>
      <xmax>1259</xmax>
      <ymax>702</ymax>
    </bndbox>
  </object>
</annotation>
VOTの出力は、bndboxの座標が小数点以下も含めて出力されるようです。

<annotation verified="yes">
 <folder>Annotation</folder>
 <filename>car</filename>
  <path>C:\car.jpg</path>
  <source>
    <database>Unknown</database>
  </source>
  <size>
    <width>1280</width>
    <height>720</height>
    <depth>3</depth>
  </size>
  <segmented>0</segmented>
  <object>
    <name>lamp</name>
    <pose>Unspecified</pose>
    <truncated>0</truncated>
    <difficult>0</difficult>
    <bndbox>
      <xmin>179.76060935799782</xmin>
      <ymin>252.1001088139282</ymin>
      <xmax>404.0043525571273</xmax>
      <ymax>437.3449401523395</ymax>
    </bndbox>
  </object>
</annotation> 
bndboxの座標が左上原点なのか、左下原点なのかはっきりしなくて(出力結果から判断すると、左上原点)PASCAL VOCのxmlの仕様を確認しようとしたのですが、これといった情報が見つかりません。 どうもThe PASCAL Visual Object Classes Challenge 2012 (VOC2012) Development Kitというのが仕様らしいのですが、細かな情報はないようです。「xml見ればわかるでしょ?」と言われれば、確かにそうなのですが。

このブログを検索

ブログアーカイブ

QooQ