VOT 数据集

VOT数据集简介

vot这个数据集来自于一个目标跟踪比赛visual object tracking

https://www.votchallenge.net/

官方网站上只有样本展示,并没有给下载链接,说是要用VOT toolkit去下载。

然后之前的vot toolkit是matlab版本的,2020年又出了一个python版本的。

项目在github上:

https://github.com/votchallenge/vot-toolkit-python

这个工具的使用方法的官方教程在他官网也可以找到:

https://www.votchallenge.net/howto/tutorial_python.html

因为国内"网速不太好",所以vot toolkit这个工具并不能行得通,建议直接百度下载吧,或者代码里边有下载链接。

vot toolkit代码中的链接在vot/dataset/vot.py 中有写具体的url。你也可以用这个下载。

数据集

vot2013 包含16个短视频,但是已经不在vot toolkit中维护了

vot2014 由25个短序列,八个序列从去年的VOT2013挑战(螺栓,自行车,大卫、跳水、体操、手,遮阳伞,女人)。

vot2015 数据集包含60短序列,从其他数据集中选出来的

vot2016 数据和vot2015相同,但是gt标的更精确了

vot2017 同vot2016相同

vot2018 .。没有相关描述

vot2019 .。没有相关描述

vot2020 .。没有相关描述

常见的处理

由于是4个点的坐标,8个值,有的时候并不好用,例如在siamrpn算法中就将4边形转换为一个矩形,不规则四边形转化为合适大小的竖直的包围框bbox,转换方式如下:

第一选出4个点中xy的最大最小值,x_min、x_max、y_min和y_max。以(x_min,y_min),(x_max,y_max)这两个点组成了完全包围原来多边形的最小竖直包围框,如果直接这样转化引入的误差相对较大,还需要按照面积大小对这个最小竖直包围框进行放缩,首先求出原来多边形包围框的两个相邻边的边长,以这两个相邻边边长求出原来多边形包围框近似的面积。假设这两个相邻边边长为polygon_b1、polygon_b2。算出最小竖直包围框面积向该多边形近似的面积转化时应该使用的放缩因子s。计算公式为:

$$ s = \sqrt\frac{polygon\_b1 * polygon\_b2}{(x\_max-x\_min)*(y\_max-y\_min)} $$

按照比例因子s对最小竖直包围框进行放缩,得到新的更加合适的竖直包围框。计算公式如下:

$$ \begin{cases} cx = \frac{x\_min+x\_max}{2}\\ cy = \frac{y\_min+y\_max}{2}\\ w = ( x\_max-x\_min) * s \\ h = ( y \_max-y\_min)*s \end{cases} $$

转化效果如图:

红色为原始多边形,蓝色为最小竖直包围框,绿色为调整过后的最小包围框。

文章目录