ChatGPT не зміг успішно пройти тестування на наукові гіпотези.

Незважаючи на вражаючі результати на перший погляд, штучний інтелект часто лише здогадує відповіді і має труднощі з виявленням неправдивих висловлювань.

Американські вчені провели масштабний експеримент, щоб з'ясувати, наскільки точно сучасні системи штучного інтелекту здатні оцінювати наукові твердження. Для цього вони запропонували ChatGPT проаналізувати понад 700 гіпотез із реальних наукових досліджень і визначити, чи є вони правдивими, чи хибними, повідомляє znaj.org.

На перший погляд результати виглядали досить оптимістично. У 2024 році точність відповідей становила 76,5%, а вже у 2025-му зросла до 80%. Однак після врахування фактору випадкового вгадування реальна ефективність системи значно знизилася - приблизно до 60%.

Особливо вразливою виявилася здатність штучного інтелекту виявляти неправдиві заяви. У цьому випадку правильність відповідей становила лише 16,4%, що, на думку дослідників, вказує на суттєві недоліки в логічному аналізі.

Окрім того, дослідники виявили ще одну проблему - непостійність відповідей. Навіть якщо повторювати одне й те ж питання кілька разів підряд, ChatGPT може надавати різні відповіді. Це викликає сумніви щодо його надійності в ситуаціях, де необхідні стабільність і точність.

Вчені підкреслюють, що сучасні системи штучного інтелекту не сприймають інформацію так, як це роблять люди. Вони функціонують, спираючись на статистичні закономірності та величезні обсяги даних, а не на справжнє розуміння. Тому відповіді, які надає ШІ, можуть виглядати переконливими, хоча насправді бути невірними.

Автори цієї роботи вважають, що розробка штучного інтелекту, здатного до справжнього логічного мислення, може виявитися значно тривалішою за терміни, ніж передбачалося раніше.

У підсумку вчені радять користувачам ставитися до відповідей ШІ критично та обов'язково перевіряти інформацію, особливо коли йдеться про науку, медицину чи інші важливі сфери.

Нагадаємо, ШІ "повернув" на екрани відомого актора Вела Кілмера, який помер у 2025 році.

З'явилася інформація про кількість українців, які використовують штучний інтелект.