Приоритетные области применения искусственного интеллекта в педагогическом образовании

Русский

ВЛИЯНИЕ НОРМАЛИЗАЦИИ И АУГМЕНТАЦИИ НА ТОЧНОСТЬ РАСПОЗНАВАНИЯ ЛИЦ И ВЫРАЖЕНИЙ ЛИЦА

Дата публикации
25.04.2026
Журнал
Приоритетные области применения искусственного интеллекта в педагогическом образовании
Выпуск
Приоритетные области применения искусственного интеллекта в педагогическом образовании
Страницы
70-75
DOI
10.5281/zenodo.19828305

Авторы

Аннотация

В данной статье рассматривается влияние методов нормализации и аугментации на точность распознавания лиц и выражений лица. Показано, что качество работы алгоритмов компьютерного зрения определяется не только архитектурой модели, но и корректной предварительной обработкой входных изображений. В качестве основных факторов, влияющих на точность классификации, выступают различия в освещении, масштабе, ракурсе, положении головы, качестве изображения и структуре обучающей выборки. Представлен анализ основных методов нормализации, включая выравнивание лиц, масштабирование изображений, нормализацию яркости и контраста, а также методов аугментации, таких как повороты, зеркальное отражение, изменение яркости, добавление шума и случайные геометрические преобразования. Рассматривается их роль в повышении устойчивости алгоритмов к вариативности входных данных и снижении эффекта переобучения. Проведённый анализ показывает, что совместное применение нормализации и аугментации позволяет улучшить качество распознавания как личности человека, так и выражения его лица. Полученные выводы подтверждают целесообразность использования указанных методов в составе современных систем классификации на основе изображений лица.

Ключевые слова

распознавание лиц распознавание выражений лица нормализация аугментация данных компьютерное зрение глубокое обучение классификация

Версии на других языках

English
This article examines the influence of normalization and augmentation methods on the accuracy of face recognition and facial expression recognition. It is shown that the performance of computer vision algorithms depends not only on the model architecture, but also on the quality of image preprocessing. The main factors affecting classification accuracy include variations in illumination, scale, pose, head orientation, image quality and training data structure. The paper analyzes the main normalization methods, including face alignment, image resizing, brightness and contrast normalization, as well as augmentation techniques such as rotations, horizontal flipping, brightness variation, noise injection and random geometric transformations. Their role in improving model robustness to input variability and reducing overfitting is discussed. The analysis shows that the combined use of normalization and augmentation improves the quality of both identity recognition and facial expression classification. The obtained conclusions confirm the effectiveness of these methods as an essential component of modern face-based classification systems.
face recognition facial expression recognition normalization data augmentation computer vision deep learning classification

Список литературы

1. Li S., Deng W. Deep Facial Expression Recognition: A Survey.
2. Schroff F., Kalenichenko D., Philbin J. FaceNet: A Unified Embedding for Face Recognition and Clustering.
3. Deng J., Guo J., Xue N., Zafeiriou S. ArcFace: Additive Angular Margin Loss for Deep Face Recognition.
4. Mollahosseini A., Hasani B., Mahoor M.H. AffectNet: A Database for Facial Expression, Valence, and Arousal in the Wild.
5. Lucey P., Cohn J.F., Kanade T. et al. The Extended Cohn–Kanade Dataset (CK+).