Как компании развивающие языковые модели AI стали обучать свои системы, нанимая людей для творчества. train AI.

Мы уже писали о стартапе из Канады, который недавно получил инвестиции в 25 миллионов долларов на то чтобы создавать поток данных для обучения нейросетей. Но видимо процесс пошел дальше...

Компании платят людям за создание контента исключительно для обучения ИИ. Это включает в себя найм людей с писательским опытом и ученой степенью для работы по написанию эссе на неполный рабочий день или предложение Adobe около 3 долларов в минуту за видео людей, выполняющих повседневные задачи.

Компании, занимающиеся искусственным интеллектом, готовы платить за обучающие данные, которые сделают их модели умнее, чем у конкурентов. Крупные игроки, такие как OpenAI, Google и Apple, заключили сделки по лицензированию контента таких сайтов, как Reddit, Tumblr, Shutterstock и новостных агентств. Лицензирование данных с платформ является законным, но это не значит, что пользователи будут этому рады — знаете ли вы, что Photobucket проверяет ваши загрузки 15-летней давности?

Использование контента, созданного с нуля, — это противоположность тому, как обучалось большинство моделей искусственного интеллекта — автоматическое получение данных из Интернета. Плата людям за создание оригинального контента не только дает платформе данные, которых нет у других, но и позволяет избежать проблем с авторскими правами, за которые ИИ критиковали.

Это также может быть формой контроля качества, поскольку модели ИИ не всегда собирают данные из лучших источников и часто просто копируют контент, созданный другим ИИ.

Соблюдение авторских прав — это шанс выделиться в глазах самых востребованных платежеспособных клиентов ИИ.

Источник.