章节片段
对比学习
自监督对比学习将表示学习转化为实例区分任务,其中同一样本的增强视图形成正对,不同样本的视图形成负对(例如,SimCLR [16]、MoCo [17])。然而,将所有不同样本视为负例可能导致类别崩溃 [18],使同一类别的样本相互分离。为了解决上述问题,基于原型的对比学习方法转换了
方法
subsection初步 给定一个包含 N 个样本的数据集 来自 K 个聚类。一般的对比聚类方法旨在学习一个编码器 、一个实例级别的头节点 ϕproj( · ) 和一个聚类级别的头节点 ϕcluster( · ) 以实现表示学习和良好的聚类性能。对于样本 xi,编码器用于提取特征 ,然后投影头节点 ϕproj( · ) 被用来将嵌入映射为标准化嵌入,即 。进一步学习
实验
1) 数据集和评估指标。我们在几个知名数据集上评估了我们方法的性能:CIFAR-10/100 [29]、STL-10、ImageNet-10 和 ImageNet-Dogs。我们使用了三个广泛认可的指标来评估我们方法的聚类性能:标准化互信息(NMI)[30]、调整后的Rand指数(ARI)[31] 和准确率(ACC)[32]。这三个指标的值范围从0到1,其中较高的值表示更好的聚类性能。
2) 实现细节。
结论和未来工作
在本文中,我们介绍了一种对比聚类方法,该方法为每个聚类维护一个多原型表示的队列。虽然这种设计表现出了良好的性能,但我们认识到它依赖于初始聚类的质量,因为初始化不当可能导致次优的原型。为了减轻这一点,我们采用了对比预训练和基于置信度的原型初始化来确保鲁棒性。经过细化的原型随后增强了伪标签和
CRediT作者贡献声明
赵云晓:撰写——原始草稿、可视化、验证、方法论、概念化。郭叶成:可视化、验证、方法论。岳琴:撰写——审阅与编辑、撰写——原始草稿。白亮:监督、调查、资金获取。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。
致谢
本工作得到了中国国家自然科学基金(编号62432006, 62276159)和山西省基础研究计划(编号202303021223004)的支持。