HELM – IQ тест для языковых моделей Искусственного интеллекта. AI.

Если для оценки человеческих способностей используется IQ тест (хотя конечно он устарел), то для оцнки ИИ создан специальный тест Holistic Evaluation of Language Models (HELM).

«Мир должен установить правила дорожного движения, чтобы любые недостатки ИИ намного перевешивались его преимуществами». - Билл Гейтс

Тест целостной оценки языковых моделей (HELM) недавно обновил свои результаты для оценки производительности крупномасштабных языковых моделей (LLM) в различных задачах. В отличие от традиционных эталонных тестов, которые часто фокусируются на точности и точности, HELM обеспечивает всестороннюю оценку модели, включая ее влияние на общество. В нем представлены модели из разных организаций, продвигающих область исследований LLM, включая Google, Meta, OpenAI.

Источник.