乳腺超声图像分类和乳腺特征识别具有广泛的应用场景,主要包括以下几个方面:可用于乳腺肿瘤的早期诊断和鉴别;可以进行乳腺疾病的筛查和预防工作;基于乳腺超声图像分类和特征识别的分析结果, 可以为患者制定个性化的治疗方案。同时,通过定期跟踪乳腺病变的变化, 可以评估治疗效果, 指导后续治疗方案的调整;也可以为临床医生提供辅助决策支持。
然而,对乳腺癌的超声图像进行分类面临着诸多挑战性问题。
(1) 图像质量和解剖结构复杂性:超声图像的质量受到多种因素的影响, 如声波穿透深度、乳腺密度、声束散射等。 乳腺组织的解剖结构复杂, 包括脂肪、腺体、纤维等, 这种复杂性可能导致图像中出现阴影、伪影以及结构不清晰等问题, 使得肿瘤的检测和定位变得困难。
(2) 肿瘤的大小和形态多样性:乳腺肿瘤的大小和形态各异, 有的肿瘤可能非常小且形状不规则, 有的可能与周围组织密集相似, 这增加了在超声图像中准确检测和定位肿瘤的难度。
(3) 良恶性肿瘤的特征相似性:有时候良性和恶性乳腺肿瘤在超声图像上的形态特征相似, 如边界清晰、内部回声均匀等,这增加了区分良恶性肿瘤的挑战。
(4) 噪声和伪影:超声图像可能受到多种因素的于扰,如仪器噪声、伪影和运动伪影等,这可能导致误检或涓检。
而对超声乳腺影像BIRADS分类及对乳腺特征进行有效识别,可以提升乳腺肿瘤分类的准确性,减少误诊和漏诊。同时采用人工智能(AI)算法,实现自动化和标准化的BIRADS分类,可以减少人为误差,提高诊断一致性。通过高效的AI算法,可以更好地分配医疗资源,尤其在医疗资源有限的地区,显著提升乳腺癌筛查和诊断能力。
本赛题聚焦于利用Ai算法提高超声乳腺影像中BIRADS分类和特征识别的准确性。BIRADS(乳腺影像报告和数据系统)分类是一种评估乳腺健康状况的重要手段,通过对超声影像的特征进行详细识别和分析,医生能够判断乳腺病变的性质并进行相应的治疗建议。
参赛选手需设计一个AI算法,该算法能够高效处理超声乳腺影像,通过图像识别技术识别乳腺影像中的关键特征,并根据这些特征自动分类BIRADS等级以及相关特征识别。
输入:经预处理的乳腺超声影像数据集,包含图片及其ID号和图片对应的标签。
输出:对于每幅影像,输出其ID对应的BIRADS分类结果,以及影像中关键特征的识别结果。
本次赛题关注超声乳腺影像的BIRADS分类及特征识别。
乳腺分类数据集依照2013版BI-RADS分类标准,总计7类:
0类:资料不全,结合其他检查再评估;[本数据集不做要求]
1类:未见异常。常规体检(1年1次);[本数据集不做要求]
2类:良性病变;
单纯囊肿、乳房内淋巴结、术后积液、乳腺植入物、随访无变化纤维腺瘤/复杂囊肿
3类:良性可能性大(>0%但<=2%) ;
形态规则:椭圆形、大分叶,边缘光整,水平位
4类:可疑恶性,考虑穿刺活检明确诊断(>2%但<95%) ;
4a级:属于低度可疑恶性,>2%但<=10%,可抇及的边缘清楚实性肿块,纤维腺瘤、复杂囊肿、可疑脓肿
4b级:有中度可能恶性的病灶,>10%但<=50%,边界部分浸润的肿块或脂肪坏死
4c级:恶性可能较大,>50%但<95%,形态不规则,边缘浸润的实性肿块
简单而言,四类可疑恶性征象描述词:形态不规则,垂直生长,边缘不光整,微钙化。
满足一项为4a,同时满足两项为4b,同时满足三项为4c。
5类:高度可疑恶性(>=95%的恶性可能)做临床处理;
简单而言具有三4个以上恶性征像。
6类:病理证实为恶性病变,但尚未接受外科切除、放化疗或全乳切除术等。[本数据集不做要求]
乳腺特征数据集包含乳腺的4类特征:方位,边缘,钙化,形状,其中标签使用0和1来表示,0表示良性特征,1表示恶性特征。
方位:包含平行和不平行,标签0为平行,1为不平行。
平行:即水平位。肿块长轴与皮肤平行;
不平行:即垂直位,前后径大于横径。
一般以肿块最长轴的断面来判断生长方位。
边缘:指肿块的边界,包含光整和不光整,标签0为光整,1为不光整。
光整:指边缘有明确的界定,病灶和周围组织有突变。
不光整:模糊(包括高回声晕)、成角、微小分叶、毛剌状。
钙化:包含有钙化和无钙化,标签0为有钙化,1为无钙化。
钙化:在超声图像上就可以看到局部是很白的亮点。
无钙化:即超声局部图像上无明显的很白的亮点。
形状:分为规则和不规则,标签0为规则,标签1为不规则。
规则:圆形或椭圆形、大分叶。
不规则:既非回形,也非椭圆形。
对获取的超声乳腺影像数据进行预处理,包括图像去噪、对比度增强、尺寸标准化等操作,以提高后续特征提取和模型训练的效果。
构造一个包含方位、边缘、钙化和形状等特征的乳腺肿瘤识别模型。
使用卷积神经网络(CNN)来处理图像数据,提取关键特征。可以使用多尺度卷积,以提取不同尺度的区域特征,并融合所得到的特征图,使其包含更丰富的全局和局部特征信息。
可以考虑加入注意力机制,通过学习获取每个特征通道的重要程度,然后按照重要程度保留有用特征的权重,减弱无用特征的权重。
利用迁移学习提高模型效率,尤其在数据较少的情况下。图像分割技术如U-Net用于精确的边缘和形状识别。
使用交叉验证等方法对训练好的模型进行评估,调整模型参数并优化模型结构,以提高模型的泛化能力和准确率。
详细记录和分析每次实验的输出结果,计算均值,确保结果的可靠性和准确性。
根据参赛队伍提供的预测结果文件,计算准确率、特征预测准确率、灵敏度、特异性和F1分数的平均得分,综合算法速度计算综合评分。