Дослідники Microsoft досягли рівня людських можливостей при комп'ютерному розпізнаванні мови.
Корпорація Microsoft повідомила про останнє важливе досягнення своїх дослідників в області розпізнавання мовлення – розроблена ними технологія дозволяє розпізнавати слова мови настільки ж добре, як це робить людина. Про це повідомляється в блозі компанії.
У звіті, опублікованому в середині жовтня, група дослідників та інженерів з підрозділу Microsoft Artificial Intelligence and Research повідомила про систему розпізнавання мовлення, яка здійснює рівну або меншу кількість помилок порівняно з професійними фахівцями з розпізнавання мовлення. За даними дослідників, частота помилкових слів (word error rate, WER) склала 5,9% порівняно з 6,3 %, зазначеними у звіті групи всього місяць тому.
Показник у 5,9 % помилок приблизно дорівнює кількості помилок, що здійснюються людьми при транскрибуванні того ж фрагмента мови. Це мінімальний, за весь час досліджень, рівень помилок за результатами галузевого стандартного тесту Switchboard по розпізнаванню мови.
"Ми досягли рівних можливостей з людиною, — сказав Сюедунь Хуань, головний науковий співробітник Microsoft за мовними технологіями. — Це історична подія".
Ця подія означає, що вперше комп'ютер став здатним розпізнавати слова в мові так само ефективно, як це робить людина. Таким чином, команда дослідників досягла мети, поставленої менше року тому, і істотно перевершила загальні очікування.
"Це досягнення стало кульмінацією понад двадцять років досліджень", — говорить Джеффрі Цвейг керівник дослідницької групи з усного та діалогічного мовлення компанії Speech & Dialog.