Компания Niantic использует данные, полученные от игроков Pokémon Go и пользователей приложения Scaniverse, для создания навигационной системы с использованием искусственного интеллекта.
12 ноября компания Niantic сообщила о планах создания модели искусственного интеллекта для навигации в пространстве. Для обучения модели, которая по аналогии с Large Language Model (LLM, большой языковой моделью) была названа Large Geospatial Model (LGM, большая геопространственная модель) — Niantic использует данные визуального сканирования окружающего пространства, полученные от пользователей её мобильных приложений: игры Pokémon Go и инструмента для 3D-сканирования Scaniverse. Традиционно компании берут данные для обучения на веб-ресурсах, видеохостингах, из книг, аудиозаписей, и Niantic — первая компания, которая объявила об обучении на данных, полученных из мобильных приложений.
Аренда виртуального сервера с GPU — это доступное по цене решение, которое позволяет получить в распоряжение мощное оборудование с помощью средств виртуализации. Этот вариант отлично подходит небольшим проектам, этапам разработки или тестированию моделей.
Хотите заниматься нейросетями? Тогда вам нужен мощный сервер. Решение — аренда виртуальных серверов с GPU для выполнения самых требовательных задач: от машинного обучения и анализа данных до рендеринга и виртуализации от AdminVPS.
В течение последних пяти лет компания занималась разработкой Системы визуального позиционирования и обучила более 50 миллионов нейронных сетей со 150 триллионами параметров. Каждая нейросеть связана с определённым местом или углом обзора и представляет собой цифровой образ физического пространства. Обладая такими данными Система визуального позиционирования уже позволяет работать в более чем миллионе мест. Следующим этапом в разработке в компании видят объединение локальных нейронных сетей в глобальную модель, обладающую «пространственным интеллектом» и способную распознавать местоположение с незнакомых углов или достраивать недостающую пространственную информацию.
Niantic рассматривает LGM как технологию, способную научить компьютеры не только воспринимать и понимать физические пространства, но и взаимодействовать с ними по-новому. Это, по их мнению, станет ключевым элементом не только для очков дополненной реальности, но и для смежных сфер — от робототехники до создания контента и автономных систем. С их точки зрения, пространственный интеллект со временем превратится в операционную систему реального мира, особенно по мере перехода от смартфонов к носимым устройствам.
На данный момент модель уже оперирует информацией о 10 миллионах отсканированных мест по всему миру. Niantic получает от пользователей по 1 миллиону новых сканов каждую неделю, причём каждый из сканов содержит сотни отдельных изображений. Важно также, что эти сканы сделаны с точки зрения пешехода и захватывают области, недоступные для автомобилей и уличных камер.
Читайте в блоге:
- Суверенная нейросеть от «Яндекса» обновилась
- Преодолено главное препятствие для разработки квантовых компьютеров
- Разработан метод оценки производительности нейросетей при обработке больших объёмов данных