Найрозумніші нейромережі не можуть пройти тест для дітей: вчені розкрили парадокс

Штучний інтелект усе ще не може ефективно розв'язувати завдання, які вимагають аналітичного підходу
26-03-2025, 21:58 / Автор: Лілія Тунська
Найрозумніші нейромережі не можуть пройти тест для дітей: вчені розкрили парадокс
5.2т

Хоча штучний інтелект уже давно обганяє людей у швидкості обробки даних і точності обчислень, його логічне мислення, як і раніше, залишає бажати кращого, пише УНІАН.

Новий тест ARC-AG2 наочно демонструє, що навіть найпотужніші моделі ШІ не здатні вирішувати завдання, які для людини здаються елементарними.

ARC-AG2 (Abstraction and Reasoning Corpus) - це серія логічних завдань, де ШІ необхідно визначити закономірність у послідовності різнокольорових квадратів і вибрати правильну відповідь. Такі головоломки неможливо розв'язати методом запам'ятовування, вони вимагають гнучкості мислення, здатності до узагальнення і перенесення знань на нові завдання.

Результати тесту показують, що ШІ поки що не володіє цими навичками:

  • Deepseek R1 набрав лише 1,3% правильних відповідей
  • Google Gemini і Claude 3.7 Sonnet показали близько 1%,
  • GPT-4.5 від OpenAI впорався ще гірше - 0,8%.

Розробники ARC-AG2 навмисно зробили завдання складними для штучного інтелекту, але простими для людини. На відміну від традиційних тестів, де ШІ може спиратися на величезні бази даних, тут йому доводиться адаптуватися до нової інформації на ходу - і це його слабке місце.

Попередню версію тесту, ARC-AG1, було створено у 2019 році, і вона залишалася нерозв'язною для ШІ протягом чотирьох років. Якщо нова версія виявиться настільки ж складною, це може значно уповільнити прогрес у розробці штучного загального інтелекту (AGI).


Чому ви можете довіряти vesti-ua.net →

Google News
Ми в Google News
Підписуйтесь, щоб не пропускати важливі новини
Підписатися
Головне
Статті / Інтерв'ю у фокусі
Думки
ТОП-НОВИНИ
Коли закінчиться війна?
Останні новини
20:18
Путін вже готувався підписати мир з Україною, коли Трамп все перекреслив, - журналіст
152
20:01
"Ми дуже чекали, що ти одужаєш": помер відомий український актор
232
19:55
Ремонт доріг: Україна отримає кошти, - міністр розвитку громад та територій
189
19:36
Паливо почало дешевшати: які АЗС вже знизили ціни
312
19:17
У США відкрили завод із виробництва комплектуючих для атомних підводних човнів
263
18:58
Рада ухвалила закон, який дозволяє не платити за комунальні послуги у пошкодженому чи зруйнованому житлі
433
18:39
Скандал із monobank: голову НБУ викликали до Ради
347
18:20
Європі загрожує дефіцит палива, - гендиректор Shell
242
18:01
В Одесі під час "оповіщення" автомобіль ТЦК збив жінку у дворі житлового будинку: людей задували балончиками
462
17:42
Рютте розлютив Європу підтримкою війни в Ірані, - Financial Times
375
17:23
В Україні більше не буде проби Манту, впроваджуються нові методи діагностики туберкульозу
323
17:04
Угорщина припиняє постачання газу до України, - Орбан
381
16:45
Росіяни керованими авіабомбами знищили греблю на Сіверському Донці
447
16:26
Американцям заборонили користуватися новими іноземними роутерами
308
16:07
Міський голова Луцька пішов у відставку
335
15:48
Названо найпопулярніші автомобілі в Європі за типами силових установок
323
15:29
Трамп напередодні виборів в Угорщині відкрито підтримав Орбана: "Я з ним до кінця!"
409
15:10
У НБУ попередили про прискорення інфляції
388
14:51
Не вибухають після удару: ракети Tomahawk опинилися під критикою через серію збоїв, - Forbes
929
14:32
Ціни на нафту: котирування відреагували на дипломатичні зусилля США щодо припинення війни в Ірані
401
14:13
Ракетний есмінець ВМС Великобританії плив у Східне Середземномор'я понад три тижні
774
13:54
Росія залишила без світла місто-супутник ЧАЕС та частину Чернігова
382
13:35
Рейтинг Трампа в США впав до найнижчого рівня, – Reuters
498
13:16
У Києві зафіксували шкідливе забруднення повітря
409
12:57
США готують перекидання елітних десантників на Близький Схід, - CNN
373
12:38
Унікальна місія: NASA відправить на Марс космічний корабель із ядерним двигуном
650
12:19
В Естонії дрон атакував електростанцію
422
12:04
Що означають показники білірубіну для печінки та здоров'я
1.3т
12:00
Трамп поспішає завершити війну, план було передано Ірану через Пакистан, - Bloomberg
413
11:41
Війна в Ірані зміцнила вісь Росія-Китай, – аналітик
403
11:22
Іран почав стягувати плату за прохід суден через Ормузьку протоку, - Bloomberg
405
11:03
Великодній кошик подорожчав у 2026 році: скільки тепер коштують продукти
396
10:44
Іран відмовився від зустрічі з Уїткоффом, – CNN
594
Більше новин