多个巨大女孩?
我也有同样的疑问,之前就看过一个关于这个问题的论文。 摘要: 本文提出了基于图神经网络的结构型数据聚合方法(GCN)来解决该问题。所提方法的核心在于将多源异构的数据聚合过程形式化,并利用图神经网络的结构信息和学习能力来准确高效地计算各特征值在整体问题求解过程的重要性并加以加权求和。 在本文的实验中,我们首先验证了所提的GCN模型在消除数据噪声、提升特征值有效性方面的有效性;然后我们将其应用于基于深度学习的目标检测任务之中,并在KITTI [1]上进行了大量的实验对比。 结果表明:相较于传统的方法,我们的算法在F1-score提升6.5%的同时,能够大大降低计算成本。我们在计算机视觉、自然语言处理等诸多领域都展示了GCN的应用潜力。 引言 近年来,深度学习取得了巨大的成功。然而,深度学习之所以能取得如此成功,很大程度上得益于庞大而丰富的数据。但是,获取高质量标注的数据却是一个困难的问题。以目标检测为例,一个正确的人类标注需要花费相当的时间和人力。不同人的标注可能存在显著的风格差异。如何提高标注的有效性成为一个亟待解决的问题。
有监督的学习通常需要的标注为每一幅图像或者视频帧给出类别标记。在无监督学习或弱监督学习中,需要找到图像之间的关联结构或者语义分类,这些任务往往要求更高分辨率的特征表示。
无论是无监督还是弱监督学习,其核心都是通过优化算法从数据中学习表示以完成后续的分类或者聚类任务[2][3]。有效的特征提取对于后续的任务至关重要。如果给定的特征不能充分描述数据对象,则必须补充新的特征或者对已有特征进行重新挖掘才能得到有效改善。
目前有很多特征设计的方法[4][5],这些方法大多通过手工设计得到特征向量,然后输入到分类器中进行学习。这类方法难以适应新的场景,而且很难灵活应用。最近,深度学习成为了一个新的研究热点。它通过自动学习获得数据本身的表示,避免了人工设计特征的局限,得到了广泛的应用。在CV领域,deep learning解决了人脸检测和图像分割等以往难以解决的问题。
但是在深度学习中,特征的提取仍然是一个值得深入研究的课题。 本文提出一种基于图神经网络的构造性数据聚合方法(graph convolutional network, GCN)。根据图的邻接关系和对数线性代数的基本原理,我们从局部和全局两个角度来定义特征向量的含义。我们可以通过训练模型来学习具有特定意义的特征向量。
更重要的是,这些特征向量能够被用来聚合多源异构的数据。在多源异构的数据集合里,不同数据来源可能会产生冗余的特征,也有可能因为数据来源的不同导致特征缺失。利用我们提出的GCN模型,可以有效地融合不同来源的数据并生成高度相关的特征子空间。
在本文的实验部分,我们验证了所提的GCN在消除数据噪声、提高特征有效性和数据聚合效率上的有效性。然后将GCN用于基于深度学习的目标检测任务中,并在KITTI 上进行了大量的实验比较。我们证明了所提的GCN能够有效降低检测器的训练时间,同时不牺牲检测的精度。
我们也展示了所提的GCN在CT图像分析、文本分类和生物信息学分析等其他领域的潜在应用,展现了它在结构化数据分析方面的重要潜力。