-
Notifications
You must be signed in to change notification settings - Fork 93
Open
Description
首先感谢你的注释,中文的看起来舒服多了。另外是这样的,我现在在做疾病分类,但是有的病灶只占了图像很小一部分,所以我现在需要用目标检测来提高图像分类准确率。我目前的想法是比如说一张图片预测出了很多box,那么我就按照置信度选择前10个box来得出最终这张图片的类别,比如看10个box觉得多数预测称了A类,那么就预测这张图片属于A类。
我现在用的是faster_rcnn_x101_64x4d这个模型,然后问题是我不太清楚模型输出是个什么东西。比如我在tools/test.py里
def single_gpu_test(model, data_loader, show=False):
model.eval()
results = []
dataset = data_loader.dataset
prog_bar = mmcv.ProgressBar(len(dataset))
for i, data in enumerate(data_loader):
with torch.no_grad():
result = model(return_loss=False, rescale=not show, **data)
results.append(result)
if show:
model.module.show_result(data, result, dataset.img_norm_cfg)
batch_size = data['img'][0].size(0)
for _ in range(batch_size):
prog_bar.update()
return results那个result我调试发现输出是个list,好像每次长度都为10,每个元素是一个tensor,维度是 n*5, 这个n不固定,可能是0,1,也可能是8。就想请问一下这里输出的是什么?或者有什么简单的办法可以计算最终的分类准确率?谢谢
Metadata
Metadata
Assignees
Labels
No labels