vesti-ua.net
»
Новини
»
Технології
»
Експерти визначили найточніший ШІ: хто найменше схильний до "галюцинацій"

Експерти визначили найточніший ШІ: хто найменше схильний до "галюцинацій"

Низький рівень "галюцинацій" критично важливий для корпоративного використання

26-12-2025, 10:24 / Автор: Артем Шах

2.4т

Чат-бот Grok, розроблений компанією Ілона Маска xAI, несподівано посів лідируючу позицію в дослідженні надійності ШІ-моделей, проведеному в грудні 2025-го року. Водночас ChatGPT і Gemini опинилися внизу рейтингу.

Аналіз підготувала аналітична компанія Relum, яка оцінила десять провідних чат-ботів із погляду їхньої придатності для використання в задачах бізнесу. Потім їм присвоювали бал ризику надійності від 0 до 99, причому вищі бали вказували на серйозніші проблеми.

Згідно з результатами, Grok найменше галюцинував (тобто видавав неправдиві відповіді і вигадував факти) – лише на рівні 8%. Для порівняння, у ChatGPT від OpenAi цей показник склав 35%, а в Google Gemini ще вищий – майже 40%. Також високий рівень помилок у 27% демонструє Microsoft Copilot.

Впритул до лідера наблизилася китайська нейромережа DeepSeek, у якої зафіксували 14% галюцинацій. Непогані показники у Claude – 17% і Perplexety – 13%.

Автори дослідження зазначили, що низький рівень галюцинацій критично важливий для корпоративного використання. Статистика показує: щонайменше 65% американських компаній уже застосовують ШІ чат-боти в повсякденній роботі.

Залежність від інструментів ШІ, ймовірно, збільшиться ще більше, тому корпораціям доведеться обирати нейромережеві моделі, зважаючи на те, наскільки вони надійні та підходять для конкретних бізнес-потреб, ідеться у звіті Relum.

Експерти визначили найточніший ШІ: хто найменше схильний до "галюцинацій"

Останні новини