Google Deepmind утверждает, что новая система искусственного интеллекта совершила серьезный прорыв в одном из самых сложных тестов для ИИ.
Компания утверждает, что создала новую систему искусственного интеллекта, способную решать задачи по геометрии на уровне лучших учеников средней школы.
Геометрия – одна из старейших ветвей математики, но для систем искусственного интеллекта она оказалась особенно сложной. Их сложно обучить из-за недостатка данных, а для достижения успеха необходимо создать систему, способную решать сложные логические задачи.
Как правило, инженеры обучают такие системы с помощью машинного обучения, которое предполагает предоставление им данных о том, как успешно выполнить ту или иную задачу, и их обучение. Но для доказательства теорем, особенно в геометрии, мало таких человеческих демонстраций.
По словам исследователей, для создания новой системы, известной как AlphaGeometry, они использовали другой подход. Вместо этого они использовали языковую модель, которая смогла обучиться, синтезировав миллионы теорем и их доказательств, а затем объединили ее с системой, способной искать точки разветвления в сложных задачах.
В совокупности эта система способна обучаться и решать сложные геометрические задачи без участия человека, утверждают создатели.
Ее испытали на 30 задачах из Международной математической олимпиады – соревнования, в котором учащимся старших классов предлагается доказать математические теоремы. AlphaGeometr смог решить 25 из них.
Это намного лучше, чем у предыдущего лучшего метода, который смог решить только 10 задач. Это приближает его к среднему золотому медалисту, который решил 25,9 теоремы.
По словам исследователей, система также смогла представить доказательство в понятном для человека виде и даже нашла новую версию одной теоремы.
На данный момент система может быть использована только для определенных видов геометрии. Но со временем ее можно будет использовать в различных отраслях математики, говорят исследователи.
В то время как в последнее время основное внимание уделялось большим языковым моделям, таким как ChatGPT, Deepmind сосредоточилась на более практическом использовании искусственного интеллекта. К ним относятся, например, недавние прорывы в прогнозировании погоды и других разделах математики.
Работа описана в новой статье “Решение олимпиадной геометрии без демонстрации человека”, опубликованной в журнале Nature.