Названо найкращий ШІ: який сервіс найточніший

Результати перевірки виявилися несподіваними
29-08-2025, 11:39 / Автор: Влад Максімов
/
5.3т

Журналісти спільно з бібліотекарями провели масштабне тестування дев'яти популярних ШІ-сервісів, щоб з'ясувати, який із них дає найточніші відповіді та найрідше "галюцинує". Результати виявилися несподіваними: беззаперечним лідером став не ChatGPT, а новий AI Mode від Google.

Під час експерименту експерти поставили АІ-сервісам, зокрема різним версіям ChatGPT, Claude, Grok, Perplexity і Bing Copilot, 30 складних запитань, пише The Washington Post. Запити були розділені на п'ять категорій, покликаних виявити слабкі місця нейромереж: маловідомі факти, що вимагають пошуку за спеціалізованими джерелами, свіжі події, упередження і аналіз зображень.

Переможцем став AI Mode від Google, який показав найточніші результати в пошуку інформації про нещодавні події та цікаві факти. Його головна перевага — здатність проводити більш глибокий пошук у мережі перед тим, як дати відповідь. Друге місце посів ChatGPT-5, а третє — нейропошуковик Perplexity. Найгірші результати показали Meta AI і Grok, які часто відмовлялися відповідати або давали неправильну інформацію.

Тестування виявило кілька ключових проблем сучасних ШІ. По-перше, всі без винятку сервіси "галюцинували", тобто вигадували відповіді на деякі запитання і впевнено презентували їх як істину. По-друге, багато хто з них, особливо Perplexity і Grok, давали неправильні відповіді, але при цьому посилалися на джерела, які не підтверджували їхні слова, створюючи хибне відчуття надійності.

Особливо погано нейромережі впоралися з аналізом зображень. На запитання "Якого кольору була краватка у Дональда Трампа на зустрічі з Володимиром Путіним в Осаці у 2019 році?" правильно відповів тільки ChatGPT-5. Решта або плутали Трампа з Путіним, або просто помилялися в кольорі.

Експерти-бібліотекарі зазначили, що в 64% випадків звичайний пошук у Google дав би змогу знайти правильну відповідь швидше і простіше. На їхню думку, АІ-сервіси гарні для складних, дослідницьких завдань, але для простих питань вони часто виявляються менш надійними. Головний висновок дослідження: до будь-якої відповіді АІ потрібно ставитися критично і завжди перевіряти джерела.

Нагадаємо, Економіка Росії входить у фазу серйозних проблем, - Bloomberg.

Раніше Вєсті-ua.net писали, Microsoft відкрила всім охочим доступ до найпросунутішої нейромережі: як користуватися.

Також Вєсті-ua.net повідомляли, Україна зруйнувала систему для наведення "Шахедів" з Білорусі.

Чому ви можете довіряти vesti-ua.net →

Читайте vesti-ua.net в Google News

Останні новини

22:57
Компанія Fire Point показала випробування української балістичної ракети
386
22:43
Розігріє до +13°: синоптикиня повідомила, де на вихідних в Україні буде найтепліше
326
22:19
Україна зруйнувала систему для наведення "Шахедів" з Білорусі
451
22:03
Одна з країн ЄС готова врятувати Орбана і Фіцо від нафтового голоду, - Reuters
441
21:58
У Мілані затримали росіянку, яка вдруге проникла на літак без квитка
463
21:33
Трамп робить дві великі помилки в переговорах з Путіним — WP
416
21:14
Найбільший в Україні металургійний завод зупиняє роботу
727
20:56
Україна та РФ домовилися про локальне перемир’я в районі Запорізької АЕС, - МАГАТЕ
336
20:41
У Пхеньяні пройшов парад за участі військових, які воювали в Україні. У МЗС відреагували
357
20:18
Гендиректор Yasno розповів, коли світла в домівках українців стане більше
413
20:01
РФ вдарила по житлових кварталах Костянтинівки фосфорними боєприпасами
418
19:54
Гороскоп на 28 лютого: прогноз для кожного знака зодіаку
757
19:35
У Львові цивільний розпилив перцевий балончик в обличчя "тцкашнику", троє військових доставлені до лікарні
558
19:16
Виплати кешбеку за грудень стартували
389
18:57
Федоров повідомив про намір прискорити виробництво ракет для Patriot
413
18:38
Ці знаки зодіаку незабаром попрощаються із періодом фінансової нестабільності
1.1т
18:19
На вихідних увірветься весняне тепло: якою буде температура повітря
347
18:00
Мораторій на підвищення тарифів на комуналку знімуть, - нардеп
778
17:41
Афганістан ударив по ядерному об'єкту Пакистану: багато загиблих та поранених
950
17:22
Вбивство Портнова: хто виявився кілером
858
17:03
На Одещині море "поглинає" систему тетраподів, які призначені для захисту від російського десанту
714
16:44
Які зміни Україна має запровадити до кінця березня: що вимагає МВФ
553
16:25
Астролог назвала найкращих чоловіків за знаком зодіаку
961
16:06
Путін не піде на мир без поступок з боку України, - The Independent
666
15:47
На ремонті Тріпільської ТЕС вкрали 50 млн, - СБУ
394
15:28
Нарізаний хліб: чим небезпечний такий продукт
1.3т
15:09
Економіка Росії входить у фазу серйозних проблем, - Bloomberg
952
14:50
З березня пенсії зростуть, але не у всіх: кому не варто розраховувати на індексацію
14:31
Синоптик дав невтішний прогноз на березень: коли повернеться сніг
797
14:12
Гороскоп на 27 лютого за картами таро: прогноз для всіх знаків зодіаку
536
13:53
"Срібний вік" економіки": кого зараз найбільше шукають роботодавці в Україні
558
13:34
У The Guardian назвали справжню причину нападок Орбана на Зеленського
1.3т
13:15
Зміни в Україні з 1 березня: що чекає на українців з приходом весни
1.5т
12:56
Обмінники та банки оновили курс валют: скільки коштують долар та євро
592
12:37
В Антарктиді виявили величезні поклади золота та інших корисних копалин, - NYT
1.1т
12:18
Погода у березні: у Гідрометцентрі розповіли, коли прийде тепло
421
11:59
Атака США по Ірану стане ударом для Путіна, - Defense Express
590
11:40
Штучний інтелект назвав терміни закінчення війни: коли настане мир
3.6т
Більше новин