Команда вчених із Бельгії, можливо, вирішила одну з найбільших проблем у галузі ШІ, використовуючи метод децентралізованого навчання на основі блокчейну. Хоча дослідження все ще знаходиться на ранніх стадіях, його потенційні наслідки можуть змінюватись від революції у дослідженні космосу до подання екзистенційної загрози для людства.
У змодельованому середовищі дослідники розробили спосіб координації навчання між окремими автономними ШІ-агентами. Команда використовувала технології блокчейна для спрощення та забезпечення безпеки комунікацій агентів, створюючи таким чином децентралізований рій навчальних моделей.
Індивідуальні результати навчання кожного агента в рої потім використовувалися для розробки більшої моделі ШІ. Оскільки дані оброблялися через блокчейн, ця велика система отримала зиск від колективного інтелекту рою, не отримуючи доступу до даних окремих агентів.
Рої ШІ
Машинне навчання, концепція, що тісно пов'язана зі штучним інтелектом, має безліч форм. Типовий чат-бот, наприклад ChatGPT від OpenAI або Claude від Anthropic, розробляється з використанням декількох технік. Він попередньо навчається з використанням парадигми, яка називається «навчання без вчителя», а потім уточнюється за допомогою іншої, відомої як «навчання з підкріпленням на основі людського зворотного зв'язку».
Однією з основних проблем із цим підходом є те, що він зазвичай вимагає зберігання даних для навчання в централізованій базі даних. Це робить його непрактичним для додатків, які потребують безперервного автономного навчання або де конфіденційність є важливою.
Команда дослідників проводила свої дослідження блокчейна, використовуючи парадигму навчання, яка називається «децентралізоване федеративне навчання». У результаті вони виявили, що вони можуть успішно координувати моделі, зберігаючи децентралізацію даних.
Безпека рою
Більшість досліджень команди зосередилися на вивченні стійкості рою до різних методів атак. Оскільки технологія блокчейна є загальнодоступним реєстром, а мережа навчання, яка використовується в експерименті, була децентралізована, команда змогла продемонструвати стійкість до традиційних атак хакерів.
Однак вони знайшли певний поріг для кількості недобросовісних роботів, яку може витримати рій. Дослідники розробили сценарії, що включають роботи, навмисно спроектовані для заподіяння шкоди мережі. Ці сценарії включали агентів із злими намірами, агентів із застарілою інформацією та роботів, закодованих із простими інструкціями щодо порушення роботи.
Хоча прості та застарілі агенти були відносно легко захищаються, команда виявила, що розумні агенти зі злими намірами могли б зрештою порушити інтелект рою, якби достатня кількість їх змогла впровадитися.
Це дослідження залишається експериментальним та проводилося лише в рамках симуляцій. Але незабаром може настати час, коли рої роботів можуть бути скоординовані децентралізованим чином. Це може одного разу дозволити командам ШІ-агентів з різних компаній або країн працювати разом для навчання більшого агента, не жертвуючи конфіденційністю даних.