07.12.2023 | В DeepMind создали ИИ-модель, которая учится новому как человек |
Команда Google DeepMind представила новаторскую модель ИИ, которая способна обучаться через социальное взаимодействие. Результаты своей работы ученые опубликовали в журнале Nature Communications . Сейчас большинство систем ИИ, таких как ChatGPT , получают знания через анализ крупных массивов данных из интернета и других источников. Однако эксперты отмечают, что эффективность такого подхода не так уж и высока с точки зрения скорости и качества обучения. Поиски альтернативных методов для тренировки алгоритмов ведутся уже давно. Главная цель разработчиков — «научить» ИИ осваивать новое подобно людям. В отличие от машин, человек способен перенимать навыки, наблюдая лишь за небольшим количеством примеров и без необходимости обрабатывать терабайты данных. Ученые из DeepMind решили воссоздать этот паттерн в рамках своего эксперимента. Они разработали виртуальный мир GoalCycle3D, включающий неровную местность с разнообразными препятствиями и цветными сферами. В этот мир были помещены программные агенты ИИ, которые должны были преодолевать препятствия и проходить сквозь сферы к целевой точке. Первоначально агенты не получали никаких знаний о правилах виртуальной вселенной и должны были обучаться методом подкрепления — за успешные действия им начислялись вознаграждения. Также они могли многократно повторять задачи в разных, но схожих условиях. Таким образом, к концу каждого испытания агенты успевали выработать оптимальную стратегию. Затем ученые усложнили задачу. В симуляцию были добавлены так называемые экспертные агенты, уже знающие кратчайший путь к цели. Эксперимент показал, что обычные агенты гораздо быстрее обучались, подражая действиям «экспертов», и впоследствии могли применять полученные навыки даже без их участия. По мнению DeepMind, социальное обучение – это важнейшая характеристика человеческого интеллекта, и сам механизм намного эффективнее традиционных подходов машинного обучения. Ученые полагают, что их разработка открывает перспективы для создания более «дружественных» ИИ, способных к продуктивному взаимодействию с людьми и окружающей средой. |
Проверить безопасность сайта