2.1 知识蒸馏的概念和目标
知识蒸馏是一种用于提高深度神经网络性能的技术,它通过从一个预先训练好的“教师网络”中传输知识到一个“学生网络”中来实现。教师网络通常具有更大的规模和更高的性能,而学生网络则是一个较小的网络,旨在在拥有较少计算资源或参数约束的情况下实现良好的性能。
知识蒸馏的目标是将教师网络的知识转移到学生网络中,以改善学生网络的性能。这种知识的传递可以通过不同的方式实现,如参数复制、特征映射、激活值等。通过这种方法,学生网络可以受益于教师网络的经验和知识,从而更好地泛化和准确地预测。