本文共 347 字,大约阅读时间需要 1 分钟。
题目:Do computer vision foundation models learn the low-level characteristics of the human visual system?
计算机视觉基础模型学习到人类视觉系统的低级特征了吗?
作者:Yancheng Cai, Fei Yin, Dounia Hammou, Rafal Mantiuk
本研究通过设计全面的测试方案,对多种基础模型和生成模型的图像编码器进行了深入评估。我们测试了45种具有代表性的模型,包括DINO、DINOv2、OpenCLIP等流行视觉基础模型。此外,我们还探讨了多种测试类型,涵盖对比度检测、对比度掩蔽和对比度恒常性等关键视觉特性,以确保评估结果的全面性和准确性。
转载地址:http://kxrfk.baihongyu.com/