Как GPT-5 проскочила Pokemon Red: скоростной прорыв в обучении ИИ

Опубликовано: 14.09.2025 Просмотров: ...

GPT-5 в Pokemon Red

Если вы сомневаетесь в темпах развития ИИ, просто посмотрите на скриншот выше. На нём результат прохождения старенькой игры Pokémon Red моделью GPT-5 от Nintendo — почти в три раза быстрее, чем это делала её предшественница, GPT-3. Заметили разницу? Сейчас разберёмся, почему это не просто рекорд скорости, а важный этап в эволюции искусственного интеллекта.

Следующий рубеж для ИИ — так называемые «модели мира», то есть виртуальные среды, где агент учится действовать так, как в реальности. Видеоигры — идеальный тренировочный полигон: в них есть чёткие правила старта, возрастающая сложность и масса непредсказуемых ситуаций. Это даёт агентам ценный опыт адаптации и приобретения новых навыков.

Для покорения Pokémon Red (и его «близнеца» Pokémon Blue) ИИ использует метод scaffolding — набор внешних инструментов для анализа карты, прокладки оптимального маршрута и планирования долгосрочных задач. Без такого «наборщика» модели всё ещё путаются в лабиринтах мира, за что их часто критикуют. Но разве мы не пользуемся GPS, календарями и заметками, когда впервые попадаем в незнакомый город? Инструменты — не слабость, а часть арсенала умного агента, и важно лишь научиться вовремя ими пользоваться.

Тот факт, что GPT-5 потратила на прохождение почти в три раза меньше игровых шагов, чем GPT-3, говорит не только о повышении скорости, но и об улучшении навыков планирования. Новая модель меньше бродит «выживай за счёт случайностей», не ввязывается в бесполезные битвы и фокусируется на ключевых заданиях для продвижения вперёд.

Планирование — краеугольный камень для ИИ в любой сфере. Принципы «не теряйся, не отвлекайся, действуй целенаправленно» легко переносятся на офисных помощников: от навигации в интерфейсах и заполнения форм до покупки билетов. А в будущем эти навыки понадобятся роботам, работающим в физическом мире.

Демис Хассабис, глава Google DeepMind, в интервью Логану Килпатрику подчеркнул, что видеоигры — одни из важнейших будущих бенчмарков для ИИ. Он начинал как разработчик игр и даже получил Нобелевскую премию, так что его мнение заслуживает внимания. Хассабис отмечает, что традиционные тесты для моделей почти исчерпали себя — многие из них «пройдены» на 100%, и создать новые стало непросто.

Здесь на помощь приходят тысячи игр разных жанров — от шахмат до шутеров — каждая со своими правилами и требованиями к навыкам. Позиция DeepMind проста: пилотируя ИИ в этом океане виртуальных миров, можно учить его новым стратегиям годами.

Особый интерес у Хассабиса вызывают состязания между моделями — когда ИИ играет сам с собой, сложность растёт вместе с развитием новых версий. В этом ключе Google запустила Kaggle Game Arena: первой дисциплиной стали шахматы, где в финале GPT-3 обыграла Grok 4 (а Gemini 2.5 Pro от Google дошла до полуфинала). В дальнейшем платформа расширится, и в будущем ИИ смогут не только соревноваться, но и создавать игры друг для друга на лету.

Краткий пересказ:

GPT-5 прошла старую игру Pokémon Red втрое быстрее GPT-3, демонстрируя рост навыков планирования и эффективности использования вспомогательных инструментов.
Видеоигры служат «моделями мира» для тренировки ИИ: они предоставляют управляемую, но непростую среду с чёткими правилами и случайными событиями.
Метод scaffolding помогает ИИ анализировать карту, прокладывать оптимальные маршруты и устанавливать приоритеты, что важно и за пределами игр — в офисных задачах и робототехнике.
Google DeepMind рассматривает игры как ключевые бенчмарки, а проект Kaggle Game Arena даёт возможность моделям соревноваться и эволюционировать внутри игровой среды.

Теги:

GPT-5, Pokémon Red, искусственный интеллект, нейросети, видеоигры, модель мира, планирование, Google DeepMind, Kaggle Game Arena, бенчмарки