Программа под название Watch, Attend and Spell (WAS), основана на работе распознавания образов и машинного обучения. Система искусственного интеллекта просмотрела более 5 тыс. часов телепередач, и за это время ведущие произнесли порядка 118 тыс. предложений.
После обучения программы, эксперты провели сравнение её работы, с работой профессиональных переводчиков. Проанализировав полученные данные учёные установили, что человек способен распознать 12% слов, а созданная ими программа – 50%.
Читать по губам — это чрезвычайно сложный в освоении навык, и программа WAS значительно облегчит переводчикам работу, к примеру предлагая им варианты на утверждение. Исследователи предложили и иные варианты использования программы: озвучивание немых фильмов, распознавание речи нескольких людей одновременно, и давать указания смартфону в шумной атмосфере. Новая разработка станет отличным помощником в различных отраслях.