2024年10月30日,我校智能医学澳门皇家金堡SIRB智能医学团队老师在国际计算机科学领域著名期刊《Information Fusion》(中科院一区,TOP期刊)在线发表题为“Information fusion for large-scale multi-source data based on the Dempster-Shafer evidence theory”的研究性论文,我校张鹏飞特聘副研究员为论文唯一通信作者。
据最新研究显示,真实世界的数据海洋中蕴藏着海量的多源数据,涵盖了生物信息、医疗记录和军事情报等重要领域。然而,这些数据源所固有的复杂性和不确定性,为信息融合的过程带来了前所未有的挑战。在这一背景下,Dempster-Shafer(简称D-S)证据理论凭借其卓越的不确定性表示能力,在信息融合领域得到了广泛应用。尽管如此,当D-S证据理论应用于多源数据信息融合时,仍需克服三大难题:首要问题是如何将样本信息有效转化为证据,并构建出基本概率分配(BPA)函数;其次,如何解决冲突证据之间的融合问题;最后,如何缓解计算过程中可能出现的指数爆炸现象,以提高融合效率。
针对上述挑战,该论文深入研究了基于D-S证据理论的大规模多源数据的信息融合策略,设计了一种将复杂的数据矩阵转化为便于操作的支持矩阵的新方法,从而简化了基本概率分配函数的确定过程。论文针对冲突证据的难题提出了一种新的解决方案,该方案通过生成包含平均值的新数据集,并将其无缝整合至现有数据中,以增强数据的兼容性和可靠性。此外,该文还开创性地开发了一种分层证据融合规则,该规则在处理大规模数据集时展现出显著优势,能够有效减轻证据理论计算中常见的指数爆炸问题。尤为重要的是,该论文建立了该规则与经典的D-S证据融合规则之间的等价关系,从理论层面坚实地验证了所提出方法的正确性与有效性。与当前先进的信息融合方法相比,该论文提出的方法在分类准确率上平均提升了4.66%,同时在处理时间上平均缩短了66.35%。这一研究成果不仅彰显了该方法的高效性和有效性,更在信息融合领域展现出了出色的性能。因此,该论文提出的方法对于未来处理大规模复杂医学数据具有重要的指导意义和应用价值。
该研究得到国家自然科学基金(62406044),资助博士后研究人员计划B档(GZB20230092),中国博士后面上项目(2023M740383),四川省自然科学基金面上项目(2024NSFSC0721)和澳门皇家金堡科研启动经费的支持。
全文链接:https://doi.org/10.1016/j.inffus.2024.102754
(供稿:智能医学澳门皇家金堡)