Алгоритм Dreamer освоїв Minecraft за 9 днів — і навчився самовдосконалюватися

Дослідники з Google DeepMind разом із Університетом Торонто навчили алгоритм штучного інтелекту Dreamer самонавчанню — через гру Minecraft.

Усього за дев’ять днів без попередньої підготовки ШІ досяг експертного рівня.

Візіком, maps API, карта,

Джерело: techxplore.com

Команда створила систему винагород у грі, зокрема за пошук діамантів. Замість навчання правилам, Dreamer отримав лише загальні параметри та можливість моделювати уявне майбутнє. Цей підхід дозволив йому самостійно знаходити найкращі дії для досягнення мети.

Щоб ускладнити завдання, гру перезапускали кожні 30 хвилин у новому віртуальному середовищі. Попри це, алгоритм швидко пристосовувався й ефективно повторював успішні дії в кожному новому світі.

Дослідники вважають, що здатність уявляти результат допомагає Dreamer зосереджуватися лише на корисних діях. У майбутньому така модель може бути застосована до роботів, які самостійно навчатимуться виконувати завдання в реальному середовищі.

2025-04-07 10:37:08