Головна новина
Статті у фокусі

Експерти визначили найточніший ШІ: хто найменше схильний до "галюцинацій"

Низький рівень "галюцинацій" критично важливий для корпоративного використання
26-12-2025, 10:24
Редактор: Артем Шах Артем Шах

Експерти визначили найточніший ШІ: хто найменше схильний до
3.2т

Чат-бот Grok, розроблений компанією Ілона Маска xAI, несподівано посів лідируючу позицію в дослідженні надійності ШІ-моделей, проведеному в грудні 2025-го року. Водночас ChatGPT і Gemini опинилися внизу рейтингу.

Аналіз підготувала аналітична компанія Relum, яка оцінила десять провідних чат-ботів із погляду їхньої придатності для використання в задачах бізнесу. Потім їм присвоювали бал ризику надійності від 0 до 99, причому вищі бали вказували на серйозніші проблеми.

Згідно з результатами, Grok найменше галюцинував (тобто видавав неправдиві відповіді і вигадував факти) – лише на рівні 8%. Для порівняння, у ChatGPT від OpenAi цей показник склав 35%, а в Google Gemini ще вищий – майже 40%. Також високий рівень помилок у 27% демонструє Microsoft Copilot.

Впритул до лідера наблизилася китайська нейромережа DeepSeek, у якої зафіксували 14% галюцинацій. Непогані показники у Claude – 17% і Perplexety – 13%.

Автори дослідження зазначили, що низький рівень галюцинацій критично важливий для корпоративного використання. Статистика показує: щонайменше 65% американських компаній уже застосовують ШІ чат-боти в повсякденній роботі.

Залежність від інструментів ШІ, ймовірно, збільшиться ще більше, тому корпораціям доведеться обирати нейромережеві моделі, зважаючи на те, наскільки вони надійні та підходять для конкретних бізнес-потреб, ідеться у звіті Relum.

ии

Реклама

Читають зараз: Україна незабаром перейде на автономні дрони-перехоплювачі, здатні запускатися роями, - Forbes.

Чому ви можете довіряти vesti-ua.net →

Google News
Ми в Google News
Підписуйтесь, щоб не пропускати важливі новини
Підписатися
Коли закінчиться війна?
Реклама
Останні новини
Більше новин
Реклама