Чат-бот Grok, розроблений компанією Ілона Маска xAI, несподівано посів лідируючу позицію в дослідженні надійності ШІ-моделей, проведеному в грудні 2025-го року. Водночас ChatGPT і Gemini опинилися внизу рейтингу.
Аналіз підготувала аналітична компанія Relum, яка оцінила десять провідних чат-ботів із погляду їхньої придатності для використання в задачах бізнесу. Потім їм присвоювали бал ризику надійності від 0 до 99, причому вищі бали вказували на серйозніші проблеми.
Згідно з результатами, Grok найменше галюцинував (тобто видавав неправдиві відповіді і вигадував факти) – лише на рівні 8%. Для порівняння, у ChatGPT від OpenAi цей показник склав 35%, а в Google Gemini ще вищий – майже 40%. Також високий рівень помилок у 27% демонструє Microsoft Copilot.
Впритул до лідера наблизилася китайська нейромережа DeepSeek, у якої зафіксували 14% галюцинацій. Непогані показники у Claude – 17% і Perplexety – 13%.
Автори дослідження зазначили, що низький рівень галюцинацій критично важливий для корпоративного використання. Статистика показує: щонайменше 65% американських компаній уже застосовують ШІ чат-боти в повсякденній роботі.
Залежність від інструментів ШІ, ймовірно, збільшиться ще більше, тому корпораціям доведеться обирати нейромережеві моделі, зважаючи на те, наскільки вони надійні та підходять для конкретних бізнес-потреб, ідеться у звіті Relum.
Нагадаємо, Атака на Одеську область: під обстрілом опинилися об'єкти портової та промислової інфраструктури.
Раніше Вєсті-ua.net писали, Чат-бот Ілона Маска створив фейкову новину про Сонце.
Також Вєсті-ua.net повідомляли, Імітація процесу: чому нинішні переговори не можуть привести до миру.
Чому ви можете довіряти vesti-ua.net →