基于医学图像分类算法研究(四)——基于kvasir—dataset-v2+kvasir-capsule+hyper kvasir数据集整理后进行训练测试

张开发
2026/4/4 19:44:22 15 分钟阅读
基于医学图像分类算法研究(四)——基于kvasir—dataset-v2+kvasir-capsule+hyper kvasir数据集整理后进行训练测试
前言老师说我们的数据集不够展示的效果可能一般没办法只能多方面的去搜刮数据集但是像这种肠胃病的公开数据集并不多我能找到的也只有这几个能测试的当然有些是视频但是视频不太符合我们的要求况且也不太会用。所以就找了这几个公开的数据集并统一整理了下当然我也不确定整理的对不对就是名字相同的归一类可能会有些差异但是就这样先用着到时候具体的问题去到医院再深入研究咯。一、数据集链接1.Kvasir-Dataset-V2Simula Datasets - Kvasirhttps://datasets.simula.no/kvasir/2.kvasir-capsuleSimula Datasets - Kvasir Capsulehttps://datasets.simula.no/kvasir-capsule/3.hyper kvasirSimula Datasets - HyperKvasirhttps://datasets.simula.no/hyper-kvasir/根据上述的3个公开数据集进行整理按照同名称放入同一类来扩充数据集数据集较少的选择舍弃最好规整下来有6万多张数据集具体效果如下图所示。本份数据集标有英文和中文以及对应每个类别的数量。二、图片展示三、训练测试我的效果图依然按照之前的那样展示中间上方的是超参数的设置左边是网络训练的过程右边是网络测试生成的热力值图右下方显示的是accF1,recall。分别是准确率F1分数召回率。左上方显示的是训练后模型权重文件的大小。下面将展示各模型的训练测试效果有小模型到较大的模型依次展示。1.efficentnet_b02.efficientnet_b13.efficientnet_b24.vit_tiny_r_s16_p8_2245.volo_d1_2246.vit_base_patch16_2247.vit_base_patch16_clip_2248.deit_base_patch16_2249.swin_base_patch4_window7_22410.swin_large_patch4_window7_22411.swinv2_cr_large_224三、结果汇总四、总结模型分析在轻量模型中EfficientNet_B2表现最佳具有最高的准确率。在中量模型中ViT_Base_Patch16_Clip_224在F1分数和召回率上表现最好。在重量模型中Swin_Large_Patch4_Window7_224表现最佳具有最高的准确率和F1分数。综合评估所有模型中ViT_Base_Patch16_Clip_224在中量模型类别中表现最为优秀具有最高的F1分数和召回率准确率也非常高是综合表现最好的模型。Swin_Large_Patch4_Window7_224重量模型虽然在准确率和F1分数上表现良好但文件大小较大可能不适合对存储空间有限制的应用场景。轻量模型中EfficientNet_B2准确率最高适合对计算资源有限制的环境。建议如果对模型大小有严格要求建议选择EfficientNet_B2。如果对模型性能有较高要求且计算资源充足建议选择ViT_Base_Patch16_Clip_224。对于需要在模型性能和大小之间取得平衡的情况可以考虑Volo_v1_224或DeiT_Base_Patch16_224。

更多文章