На сегодняшний день бум искусственного интеллекта разворачивается главным образом в цифровой сфере. Генеративные модели, которые могут разговаривать на любую тему, создавать качественные видео по запросу или писать сложный код, представляют собой важные достижения в области ИИ. Однако эти достижения касаются только мира программного обеспечения.
Существует ещё одна область, которая ждет трансформации благодаря современным технологиям ИИ: физический мир, мир атомов. Роботехника появилась десятилетия назад, и уже сегодня миллионы роботов по всему миру автоматизируют различные виды физической активности. Однако современные роботы обладают узкими возможностями и ограниченным интеллектом. Они обычно создаются для выполнения конкретной задачи — например, перемещения коробок в складе, выполнения определённого шага в процессе производства или уборки пола пылесосом. Они не обладают такой гибкостью и обобщённым пониманием, как большие языковые модели, такие как ChatGPT.
Это изменится в ближайшие годы. Генеративный ИИ завоюет мир атомов, и всё, что произошло до сих пор в ИИ, покажется скромным в сравнении с этим. С начала эры цифровых вычислений стремлением технологий было сделать аппаратные платформы максимально универсальными и сохранить как можно больше гибкости для программного обеспечения. Эти идеи отстаивал Алан Тьюринг, интеллектуальный предшественник компьютеров и искусственного интеллекта, который изложил их в своей концепции «машины Тьюринга» — устройства, способного выполнять любой возможный алгоритм.
Раннее развитие цифровых компьютеров подтвердило основополагающее понимание Тьюринга. В 1940-х годах разные физические компьютеры создавались для разных задач: один для расчёта траекторий ракет, другой для дешифровки сообщений противника. Но к 1950-м годам появились универсальные, полностью программируемые компьютеры как доминирующая архитектура вычислений. Их универсальность и адаптируемость в различных случаях использования оказались решающим преимуществом: их можно было постоянно обновлять и использовать для любого нового приложения просто написанием нового программного обеспечения.
В более современной истории можно вспомнить, как множество различных физических устройств было объединено в один продукт — iPhone, благодаря гению Стива Джобса и других разработчиков: телефон, камера, видеорегистратор, диктофон, MP3 плеер, GPS навигатор, устройство для чтения электронных книг, игровое устройство, фонарик, компас.
Аналогичный узор можно отметить и в недавнем развитии моделей ИИ, хотя в этом примере всё связано с программным обеспечением. Узкие, субъективные модели — одна для перевода языка, другая для анализа тональности и так далее — за последние несколько лет уступили место универсальным «фундаментальным моделям», способным выполнять полный спектр задач.
Мы увидим этот же переход в робототехнике в ближайшие годы: от специализированных машин с ограниченными применениям к более универсальной, гибкой, адаптируемой платформе. Как будет выглядеть такая универсальная аппаратная платформа? Какой форм-фактор ей нужен, чтобы гибко функционировать в различных физических условиях?
Ответ очевиден: она должна быть похожа на человека. Вся наша цивилизация была спроектирована и построена людьми для людей. Наша физическая инфраструктура, инструменты, продукты, размеры зданий, помещений, дверей: всё оптимизировано для человеческого тела. Если мы хотим создать универсального робота, способного работать на фабриках, складах, в больницах, магазинах, школах, отелях и домах, то этот робот должен иметь форму человека. Ни один другой форм-фактор не будет работать так же хорошо.
Это причина, по которой возможности для гуманоидных роботов столь обширны. Применение передового ИИ в реальном мире — это следующая великая граница для искусственного интеллекта. Большие языковые модели автоматизируют значительные объёмы когнитивной работы в ближайшие годы. Параллельно гуманоидные роботы автоматизируют значительную часть физической работы.
И эти роботы уже не являются отдалённой мечтой из научной фантастики. Хотя большинству людей это ещё не очевидно, гуманоиды находятся на грани внедрения в реальный мир.
Tesla активно инвестирует в создание гуманоидного робота под названием Optimus. Компания планирует начать поставки роботов клиентам в 2025 году. Генеральный директор Tesla выразил уверенность в важности этой технологии для компании и всего мира: «Я удивлён, что люди не осознают масштаб программы роботов Optimus. Важность Optimus станет очевидной в ближайшие годы. Те, кто внимательно смотрит и слушает, поймут, что Optimus окажется более ценным, чем автомобильный бизнес Tesla, более ценным, чем [полностью автономное вождение].»
Несколько молодых стартапов также делают быстрые шаги в этой области. Недавно компания Figure из Бей-Эрии объявила о привлечении $675 миллионов от инвесторов, включая Nvidia, Microsoft, OpenAI и Джеффа Безоса. Пара месяцев назад компания выпустила впечатляющее видео, где её гуманоидный робот делает чашку кофе.
Ещё одна ведущая компания в области гуманоидов, 1X Technologies, объявила о финансировании $100 миллионов в январе. 1X уже предлагает одну версию своего гуманоидного робота (с колёсами) для продажи и планирует скоро выпустить новое поколение (с двумя ногами).
В ближайшие годы эти компании перейдут от небольших пилотных проектов с клиентами к массовому производству. К концу десятилетия можно ожидать увидеть сотни тысяч (если не миллионы) гуманоидных роботов, работающих в реальном мире.