Програма для вирішення кросвордів навчить машини краще розуміти мову

Навчання 08 лютого 2024

Хоча вчені розробляли систему не для того, щоб вирішувати кросворди, виявилося, що вона справляється з ними краще, ніж програми, створені спеціально для цієї мети.

Дослідники створили веб-платформу, яка використовує нейронні мережі і відповідає на питання кросвордів краще, ніж комерційні продукти, розроблені спеціально для цієї мети. Ця система допоможе машинам краще розуміти природну мову.

У процесі тестування програма, розроблена вченими з Кембриджського, Монреальського та Нью-Йоркського університетів, відповідала на питання, що містять слово, словосполучення або пропозицію краще, ніж комерційне ПЗ для вирішення кросвордів. Ця система може працювати і як «зворотний словник», в якому користувач називає поняття, і система повертає слова, що описують це поняття.

Дослідники навчили програму розуміти слова, фрази і речення за допомогою понятійної бази шести словників і Вікіпедії. Вони використовували свою модель як спосіб подолати розбіжність між машинами, які розуміють значення окремих слів і машинами, які розуміють значення фраз. Результати роботи, опубліковані в журналі Transactions of the Association for Computational Linguistics припускають, що подібний підхід може призвести до поліпшення результатів більш універсальних систем розуміння природної мови, діалогових систем, а також інформаційно-пошукових систем в цілому. Весь вихідний код програми і дані були викладені у вільний доступ для майбутніх досліджень.

"Незважаючи на недавній прогрес в області штучного інтелекту, проблеми, пов'язані з розумінням мови, особливо важкі, і наша робота передбачає багато можливих способів застосування глибинних нейронних мереж в мовних технологіях, - говорить Фелікс Хілл (Felix Hill), один з авторів дослідження. - Одна з найбільших труднощів у навчанні комп'ютерів розуміння мови - відтворення безлічі багатих і різноманітних джерел інформації, доступних людям, коли вони вчаться говорити і читати ".

Принцип роботи комерційного ПО для розгадування кросвордів нагадує пошук Гугла, і одна система може звертатися до більш ніж тисячі словників. Хоча цей підхід зручний, якщо потрібно знайти буквальне визначення, він гірше працює з питаннями, з якими модель не стикалася при навчанні. Крім того, він вимагає дуже великого обсягу пам'яті.

Вчені стверджують, що результати дослідження демонструють ефективність навчання за допомогою словників для розробки моделей, які розуміють словосполучення і пропозиції. Зараз вони шукають способи вдосконалити свою систему, зокрема, шляхом об'єднання з іншими моделями навчання мови та лінгвістичної взаємодії.

Пограти з програмою можна тут: http://45.55.181.170/defgen/