Пионер ИИ, главный научный советник Института Vector и лауреат премии Тьюринга Джеффри Хинтон на прошлой неделе опубликовал статью о том, как можно объединить последние достижения в области глубокого обучения для создания системы ИИ, которая лучше отражает принцип работы человеческого зрения.
Система Хинтона называется «GLOM», и в этом эксклюзивном интервью с партнером Radical Аароном Бриндлом Джеффри объясняет, как она работает, ее значение для всего, от беспилотных автомобилей до обработки естественного языка, и почему он выбрал этот термин (или аббревиатуру?) GLOM.
Аарон Бриндл: В чем самая большая разница в том, как человеческий мозг обрабатывает изображение по сравнению с существующими нейронными сетями?
Джефф Хинтон: Во-первых, есть огромные различия в аппаратном обеспечении. Мозг обрабатывает изображения, используя огромное количество соединений с низким энергопотреблением. Компьютеры имеют меньше подключений, но потребляют больше энергии. Исторически сложилось так, что модели компьютерного зрения рассматривали отдельные изображения, на которых статическое изображение представлено с одинаковым разрешением. Традиционные системы технического зрения искусственного интеллекта пытаются обработать это единообразное изображение целиком.