Мобильное распознавание номиналов российских банкнот для слепых людей
Авторы: Суворов Д.А., Жуков Р.А., Тетерюков Д.О., Мозговой М.В., Волков А.В. | Опубликовано: 09.02.2018 |
Опубликовано в выпуске: #1(118)/2018 | |
DOI: 10.18698/0236-3933-2018-1-94-104 | |
Раздел: Информатика, вычислительная техника и управление | Рубрика: Системный анализ, управление и обработка информации | |
Ключевые слова: распознавание, банкнота, глубокое обучение, передача знаний, машинное обучение, распознавание образов |
Представлена система классификации российских банкнот для слепых людей по фото на основе методов глубокого обучения с использованием техники knowledge transfer. Проведен сравнительный анализ производительности и точности подходов с использованием архитектур ResNet-50, VGG-19 и Inception-v3 для первичного извлечения признаков с фото купюр. Описан процесс создания базы для обучения системы. Проведено тестирование системы на настольном и мобильном процессорах. Наилучшую точность распознавания показала система, построенная на базе архитектуры для извлечения признаков ResNet-50. По производительности система на базе ResNet-50 оказалась на втором месте, незначительно уступив системе на базе Inception-v3, которая при этом показала очень низкую точность классификации (78 %). Точность классификации решения на базе ResNet-50 составила 99,5 %, что является приемлемым для ее использования в реальных условиях
Литература
[1] Pascolini D., Mariotti S.P. New estimates of visual impairment and blindness: 2010 // British Journal of Ophthalmology. 2011. Vol. 96. No. 5. URL: http://www.who.int/blindness/estimates2011.pdf (дата обращения: 15.07.2017).
[2] Bruna A., Farinella G.M., Guarnera G.C., Battiato S. Forgery detection and value identification of euro banknotes // Sensors. 2013. Vol. 13. Iss. 2. P. 2515–2529. DOI: 10.3390/s130202515
[3] A high-performance banknote recognition system based on a one-dimensional visible light line sensor / Y.H. Park, S.Y. Kwon, T.D. Pham, K.R. Park, et al. // Sensors. 2015. Vol. 15. Iss. 6. P. 14093–14115. DOI: 10.3390/s150614093
[4] Semary N.A., Fadl S.M., Essa M.S., Gad A.F. Currency recognition system for visually impaired: Egyptian banknote as a study case // Proc. Int. Conf. on Information and Communication Technology and Accessibility. DOI: 10.1109/ICTA.2015.7426896
[5] Hasanuzzaman F.M., Yang X., Tian Y. Robust and effective component-based banknote recognition by SURF features // WOCC. 2011. DOI: 10.1109/WOCC.2011.5872294
[6] Singh S., Choudhury S., Vishal K., Jawahar C.V. Currency recognition on mobile phones // Proc. 22nd Int. Conf. on Pattern Recognition. 2014. P. 2661–2666. URL: http://web2py.iiit.ac.in/research_centres/publications/download/inproceedings.pdf.9797adb46eb9d9a7.5375726979613230313443757272656e63792e706466.pdf (дата обращения: 15.07.2017).
[7] Parlouar R., Dramas F., Macé M.J-M, Jouffrais Ch. Assistive device for the blind based on object recognition: An application to identify currency bills // Proc. 11th Int. ACM SIGACCESS Conf. on Computers and Accessibility. 2009. P. 227–228. URL: https://www.irit.fr/~Marc.Mace/pdfs/parlouar_r_09_227.pdf (дата обращения: 15.07.2017).
[8] Bhurke C., Sirdeshmukh M., Kanitkar M.S. Currency recognition using image processing // Int. J. of Innovative Research in Computer and Communication Engineering. 2015. Vol. 3. No. 5. P. 4418–4422.
[9] Gutstein S., Fuentes O., Freudenthal E. Knowledge transfer in deep convolutional neural nets // Proc. of Twentieth Int. Florida Artificial Intelligence Research Society Conf. 2007. P. 104–109. URL: http://www.cs.utep.edu/ofuentes/FLAIRS07GutsteinS.pdf (дата обращения: 15.07.2017).
[10] He K., Zhang X., Ren S., Sun J. Deep residual learning for image recognition // Proc. IEEE Conf. on Computer Vision and Pattern Recognition. 2016. DOI: 10.1109/CVPR.2016.90
[11] Simonyan K., Zisserman A. Very deep convolutional networks for large-scale image recognition // Proc. 3rd Int. Conf. on Learning Representations. 2015. URL: https://arxiv.org/pdf/1409.1556.pdf (дата обращения: 15.07.2017).
[12] Rethinking the inception architecture for computer vision / C. Szegedy, V. Vanhoucke, S. Ioffe, J. Shlens, Z. Wojna // Proc. IEEE Conf. on Computer Vision and Pattern Recognition. 2016. P. 2818–2826. DOI: 10.1109/CVPR.2016.308
[13] ImageNet large scale visual recognition challenge / O. Russakovsky, J. Deng, H. Su, J. Krause, et al. // Int. J. of Computer Vision. 2015. Vol. 115. Iss. 3. P. 211–252. DOI: 10.1007/s11263-015-0816-y
[14] Kingma D.P., Ba J. Adam: A method for stochastic optimization // Proc. Int. Conf. on Learning Representations ICLR. 2015. URL: https://arxiv.org/pdf/1412.6980.pdf (дата обращения: 15.07.2017).
[15] Maaten L., Hinton G. Visualizing data using t-SNE // Journal of Machine Learning Research. 2008. No. 9. P. 2579–2605. URL: http://www.jmlr.org/papers/volume9/vandermaaten08a/vandermaaten08a.pdf