Модель орієнтується у просторі без використання карти або GPS-датчика

Компанії Meta вдалося створити модель, яка точно орієнтується у просторі без використання GPS, карт, інших систем позиціонування та додаткового навчання з підкріпленням.

Нова технологія стане в пригоді в проєктуванні роботів, метаверсів і доповненої реальності.

Візіком,  maps API, карта, GPS,

Про це повідомляють Новини картографії від Візіком з посиланням на tech.24tv.ua.

У своєму дослідженні компанія зосередилася на "точково-цільовій навігаційній моделі" – системі, яка може переміщатися новими середовищами без будь-якої карти або GPS-датчика. Ця технологія застосовує алгоритми, що імітують розумові процеси людини у спрощеному форматі.

У масштабі пари фізичних об'єктів різниця між таким алгоритмом і тим, що використовує GPS, несуттєва. Однак, якщо мовиться про оцифрування будівель або навіть міст, новий алгоритм Meta зможе легко обійти конкурентів завдяки меншому обсягу даних, що обробляються.

Як це працює

AR-окуляри, які показують нам, де ми залишили свої ключі, наприклад, вимагають фундаментально нових технологій, які допомагають ШІ розуміти розташування та розміри незнайомого, постійно мінливого середовища без ресурсомістких обчислень та попередньо завантажених карток. Як людям, нам не потрібно знати точне розташування або довжину нашого журнального столика, щоб мати можливість ходити навколо нього, не натикаючись на його кути, – пояснили інженери.

Той самий принцип використовується і в новій моделі. Ця система використовує техніку, відому як візуальна адометрія. Вона дозволяє ШІ визначати своє місце розташування на основі візуальних даних – наприклад, якщо робот з підтримкою цієї системи підійде до стіни, а потім розгорнеться на 90 градусів, то він запам'ятає, що рухатися назад більше не має сенсу і враховуватиме це, прокладаючи новий маршрут. У компанії стверджують, що ця методика може використовуватись для створення ефективних нейронних моделей без анотацій від людини.

Щоб ще більше підвищити ефективність ШІ, Meta створила колекцію навчальних даних Habitat-Web. У цій бібліотеці представлено понад 100 тисяч різних методів об'єктно-цільової навігації. Технологія пов'язує симулятор Habitat, що працює через звичайний веб-браузер, із сервісом Mechanical Turk і дозволяє дистанційно керувати віртуальними роботами у будь-якому масштабі.

За заявами розробника, агенти ШІ, навчені на цих даних, можуть досягати "найсучасніших результатів" – наприклад, вони вчаться шукати об'єкти, заглядаючи в кімнати та перевіряють приховані кути.

Новий модульний підхід

На додаток команда Meta створила модульний підхід "підключи та працюй". Це рішення допомагає роботам узагальнювати різноманітні набори семантичних навігаційних завдань за допомогою системи навчання з нульовим досвідом. Ідея полягає в тому, щоб допомогти агентам ШІ адаптуватися на льоту без ресурсомістких карт та навчання. Модель один раз "захоплює" основні дані візуальної навігації, а потім застосовує їх до різних завдань у тривимірному середовищі без повторного навчання.

У результатах дослідження інженери розповіли, що нові моделі вимагають у 12,5 раза менше навчальних даних та показують успішні результати на 14% частіше за конкурентів. У перспективі розробники хочуть впровадити такі моделі у метавсесвіт компанії, а також у майбутні AR/VR-гарнітури.

Читайте також: