首届船海数据智能应用创新大赛晋级名单出炉前三名的分享来了!

  经过激烈的角逐,由深海技术科学太湖实验室联合无锡市委人才工作领导小组办公室、无锡市科学技术局、华为技术有限公司共同主办的首届“船海数据智能应用创新大赛”初赛晋级名单日前正式出炉。“水面/水下典型目标识别”和“非结构化数据压缩与处理”两个赛题方向分别选出了30组队伍晋级决赛。

  据大赛组委会介绍,自 4 月 12 日开赛以来,大赛受到了社会各界广泛关注,两个赛道参赛总人数超过了 1300 人。其中,“水面/水下典型目标识别”赛道竞争尤为激烈,351 支队伍参赛,只有不到1成的队伍成功晋级决赛。这和该赛道的出题内容契合当下人工智能的热门应用紧密相关。

  面向日益增长的智能化水上交通、海洋环境探测、水下探测等场景需求,提高水面/水下针对船只、渔网、浮标、漂浮物、礁石、水生物等典型目标的检测识别能力成为船舶领域人工智能应用亟需解决的难题。来自华中科技大学人工智能与自动化学院张钧杰的团队、南京理工大学博士沈飞团队、浙江大学软件学院人工智能专业许可团队采用不同的技术手段,各显其能,分别获得该组初赛的前三名。初赛阶段有努力、有收获,面对决赛有期许、有奋进……三位选手敞开心扉,分享了他们的赛事所得。

  张钧杰是华中科技大学人工智能与自动化学院的研一学生。之前他曾参加过几个和目标检测相关的赛事,如城市红绿灯视觉检测与识别比赛、雨雪雾行驶场景下交通参与者视觉检测与识别以及阿里天池的小样本商标检测挑战赛。

  张钧杰对此次参赛感受比较深刻的有两点:一是排行榜实时刷新,比赛更透明,也让选手更有冲劲;二是“这次比赛因为有对速度的要求,所以对于显卡的要求不是很高,用的baseline也是我比较熟悉的yolov5,这个比赛也非常具有实际意义,所以非常适合我们参加。”

  对于初赛提交的方案,张钧杰用中规中矩来形容。训练阶段用的都是一些常见的数据增强手段,然后对学习率、优化器等参数进行精细调整。谈到比赛过程中的难点,他表示:“赛题中对于FPS的要求是一个比较难的点,这要求我们在精度与速度之间进行平衡。如何保证速度达标的情况下仍然能够展现出良好的性能是这个比赛的关键所在。”

  在参加这次比赛的过程中张钧杰看了很多相关的论文博客,从中学到了很多东西。比赛还创造了自己和其他参赛选手交流的机会。边打比赛边学习,自己能力得到了很大的提升,这种感觉很棒!他透露,进入复赛后,打算尝试更多的数据增强手段,希望队伍能取得好成绩。

  南京理工大学智能媒体分析实验室(IMAG)博士一年级学生沈飞的团队是此次初赛的第二名。沈飞坦言,自己打比赛有两三年了,像此次目标检测类的比赛也打过很多次,所以对赛事很了解,并且也拿到过一些国际、国内大赛的好名次。此次来打比赛,首要是因为赛事主办方是太湖实验室。比赛很透明,公平性好,而且影响力大。此外,这个比赛最特殊、也是吸引沈飞的地方就是“科研立项”——太湖实验室给出了按照国家自然科学基金重大项目立项标准,为获奖团队在赛题方向提供不少于100万元科研立项支持!

  沈飞主攻人工智能目标检测类方向。在比赛过程中,他们遇到了两个比较大的挑战:首先是来自的数据挑战,如:背景复杂导致的目标物体虚化、光照和角度变化、样本稀少不均衡、样本标注误差较大等问题。针对数据问题,团队使用了丰富的数据增强技术,包括传统的图像翻转、对比度、饱和度调整扩充;使用了中值滤波进行噪声抑制;使用了mixup混合图像增加抗拟合性。此外在FPN阶段还使用了之前科研的成果,即图卷积来增强局部特征提取能力。

  第二个挑战是来自比赛限时30FPS,让他们面临速度和精度的平衡挑战。对此,他表示,初赛的模型暂时能满足要求,后续会考虑使用知识蒸馏,进行教师-学生网络的学习;模型剪枝量化、TensorRT等技术进行模型加速。同时,他们在复赛时可能会考虑采用对抗生成网络进行样本扩充。通过截取训练样本中数目少的类别目标图像,利用生成对抗网络生成大量异构的目标图像并融合到背景图像中作为训练样本,丰富目标信息。

  浙江大学软件学院人工智能专业研一学生许可和他的三名同学组成的团队获得了初赛的第三名。许可曾参加过诸如图像分析类竞赛,但是目标检测类的还是首次。作为人工智能专业研究生,许可平时学的主要是传统视觉优化。此次参赛,团队不仅冲着大赛诱人的奖金,也是想借着比赛实现从传统方法到深度学习的跨越。

  在初赛中,许可介绍说,团队主要用的都是很成熟的技术,其中有4点提分比较高点。首先是多尺度训练和测试时增强(tta),这个比较常见,多尺度训练能让模型适应不同尺寸的目标,而tta对于一张测试图像,将不同尺度下所得到的bbox放在一起做nms,能够有效提高mAP。然后是multi-lable,因为他们观察到很多船只十分的模糊,人眼都无法分辩。还有就是merge-nms,对于置信度比较低的bbox,不直接删除,而是通过iou对最终的bbox坐标进行加权,这是针对数据集中bbox的标注不够精确,并且计算量也不大。最后是Swa(模型参数平均), 能让模型更具泛化性,有着ensemble的效果但不增加计算量。

  许可坦言,初赛由于有比较多的代码可以参考,所以任务实现起来问题并不是太大。进入复赛后,他们将从模型和数据增强两方面做些提升。模型方面,可以通过加上attention模块,或者把分类头解耦,回归和分类不再共享参数;对于数据增强,初赛时并没有找到比较好的数据增强方法。此外,复赛任务是视频目标检测,这一方面他们还需要多做些了解。

  经过短暂的休整,2022年7月16日,船海数据智能应用创新大赛决赛将正式启动。在接下来的两个月时间里,最终将从两组各30个晋级队中选出10个决赛入围团队。2022年9月底,决赛队伍将经过现场路演答辩,经专家组评选出最终获奖名单。届时,还将邀请行业大咖面对面讲座,与参赛选手进行学术交流。“初赛仅仅是决赛的一个门槛,名次和决赛结果并不能挂钩!”面对决赛,不少选手已经在准备放大招。在这场高手云集的顶级赛事里,头脑风暴带来的变数是常态,让我们期待选手们带来更多惊喜的表现。

  作为本次大赛的评委。华为机器视觉算法专家窦昊博士讲到,航海创新大赛的赛题贴近真实船海场景的应用需求,对关键船海目标进行识别和检测,有助于无人船等船海技术的应用和推广。选手在初赛中各显其能,产生出不少有亮点的解决方案,从理解数据、应用数据、优化模型、优化效率等角度做出了很多创新。在即将开展的决赛中,选手将面对真实采集的视频场景,挑战雨雾、风浪、距离对成像的干扰,希望选手持续创新,克服真实场景难题,达成优异的成绩。