Василіск Роко: найстрашніший уявний експеримент в історії

Сучасна наукова фантастика стверджує, що немає ніяких доказів того, що ми не живемо у віртуальній реальності. Фільм «Матриця» схилила безліч людей в користь цієї гіпотези. Але вибір між червоною та синьою капсулою ніщо в порівнянні з задачкою, яку запропонує тобі Василіск Роко.

Василіск Роко — це богоподобная форма штучного інтелекту, настільки небезпечна, що якщо ви просто про неї подумаєте, то проведете залишок днів у жахливих тортурах. Схоже на касету з фільму «Дзвінок». Однак навіть смерть не стане порятунком, адже Василіск Роко воскресить вас і продовжить свої тортури.

У липні 2010 учасник LessWrong Роко розмістив наступний уявний експеримент на сайті: що якщо в майбутньому виникне недоброзичливий штучний інтелект, який захоче покарати тих, хто не виконує його накази? І що якщо він змоделює знову і покарає тих людей, які у минулому не сприяли його створення? Ця ідея стала відомою як «Василіск Роко» на основі ідеї Роко, що гіпотетична система Штучного Інтелекту (ШІ) буде мати стимул використовувати шантаж.

Засновник Less Wrong Еліезер Юдковски з гнівом сприйняв висловлювання Roko і видалив пости Роко по цій темі, назвавши його «безглуздим». Обговорення теорії Роко було заборонено на LessWrong на кілька років, перш ніж заборону було знято в жовтні 2015 року.

«якщо в майбутньому виникне штучний інтелект, який захоче покарати тих, хто не виконує його накази?»

  • Згідно з твердженням василіска Роко, просте знання цього піддає нас ризику покарання.

Це нагадує версію “парі Паскаля” – аргумент, запропонованого математиком 17-го століття Блезом Паскалем, згідно з яким людина повинна присвятити себе Богу, навіть якщо він не впевнений у його існуванні, так як Бог може запропонувати вічний “виграш” (у раю) або вічне покарання (у пеклі). Згідно з Паскалю, ймовірність існування Бога не так важлива, так як будь-які кінцеві витрати переважуються перспективою вічного винагороди або вічного покарання.

Less Wrong і сингулярність

  • Чим же займається Less Wrong?

Формуванням концепції майбутнього людства на основі сингулярності. Вони вірять, що обчислювальна потужність в майбутньому стане настільки високою, що за допомогою комп’ютера можна буде створити штучний інтелект — а разом з ним і можливість завантажувати людську свідомість на жорсткий диск.

Термін «сингулярність» виник у 1958 році в ході дискусії двох геніїв математики — Станіслава Улама і Джона фон Неймана, коли він сказав: «Постійно прискорюється прогрес технологій зробить можливим наближення сингулярності, при якій технології не зможуть бути зрозумілі людьми». Футуристи і письменники-фантасти начебто Вернора Винджа і Реймонда Курцвейла популяризували термін, так як вважали, що сингулярність чекає нас всіх вже дуже скоро — у найближчі 50 років. Поки Курцвейл готується до сингулярності, Юдковски покладає великі надії на крионику: «Якщо ви заздалегідь не записали своїх дітей на кріоконсервації, ви — паршиві батьки».

Кріоконсервація — низькотемпературне зберігання живих біологічних об’єктів з можливістю відновлення їх біологічних функцій після розморожування.

Якщо ви вірите, що гряде сингулярність і що потужні ІІ з’являться вже в найближчому майбутньому, виникає закономірне питання: чи будуть вони добрими або злими? Фонд Юдковски ставить своєю метою так спрямувати розвиток технологій, щоб у нас з’явився саме дружній штучний інтелект. Це питання для нього та багатьох інших людей має першорядне значення. Сингулярність приведе нас до машини, еквівалентної богу.

Проте це не пояснює, чому Василіск Роко виглядає таким жахливим в очах цих людей. Питання вимагає погляду на головну «догму» Less Wrong — «позачасову теорію прийняття рішень» (ВТПР).

ВТПР — це керівництво до раціональних дій, засноване на теорії ігор, байєсівської вероятностии теорії прийняття рішень, але з урахуванням існування паралельних всесвітів і квантової механіки.

Дві коробки прибульця

ВТПР зросла з класичного мисленого експерименту — парадоксу Ньюкомб, у якому прибулець, що володіє сверхразумом, пропонує вам дві коробки. Він дає вам вибір: або взяти обидві коробки, або тільки коробку Б. Якщо вибрати обидві, то ви гарантовано отримаєте тисячу доларів. Якщо взяти тільки коробку Б, ви можете не отримати нічого. Однак у прибульця припасений ще один трюк: у нього є всезнаючий суперкомп’ютер, який зробив тиждень тому прогноз, чи візьмете ви обидві коробки або тільки Б. якби комп’ютер передбачив, що ви візьмете обидві коробки, прибулець залишив би другу порожній. Якщо б комп’ютер передбачив, що ви виберете коробку Б, він би поклав туди один мільйон доларів.

  • Отже, що збираєтеся робити? Пам’ятайте, що суперкомп’ютер всезнаючий.

Ця проблема збила з пантелику безліч теоретиків. Прибулець вже не може змінити вміст коробок. Надійніше всього взяти обидві коробки і отримати свою тисячу. Але раптом комп’ютер і правда всезнаючий? Тоді вам тільки й залишається взяти коробку Б, щоб отримати мільйон. Але якщо він виявиться неправий? І незалежно від того, що передбачив комп’ютер, — невже ніяк не можна змінити свою долю? Тоді, чорт забирай, потрібно брати обидві коробки. Але в такому разі…

Зводить з розуму парадокс, що змушує нас вибирати між свободою волі і божественним пророкуванням, не має дозволу, і люди можуть тільки знизувати плечима і вибирати найбільш комфортний для них варіант. ВТПР дає порада: беріть коробку Б. Навіть якщо інопланетянин вирішив посміятися над вами і відкриє порожню коробку зі словами: «Комп’ютер передбачив, що ти візьмеш обидві коробки, ха-ха!» — ви все одно повинні її вибрати. Обґрунтування цього наступне: для того, щоб зробити прогноз, комп’ютер повинен був симулювати весь Всесвіт, включаючи і вас. Таким чином, у цей момент, стоячи перед коробками, ви можете бути всього лише симуляцією комп’ютера, але те, що ви зробите, буде впливати на реальність (або реальності). Так що беріть коробку Б і отримаєте мільйон.

  • Яке це має відношення до Василиску Роко?

Ну, у нього теж є пара коробочок для вас. Може бути, ви зараз перебуваєте в симуляції, створеної Василиском. Тоді, можливо, ми отримуємо дещо модифіковану версію парадоксу Ньюком: Василіск Роко говорить вам, що якщо ви візьмете коробку Б, то дістанете вічним мукам. Якщо ж ви візьмете обидві коробки, то змушені будете присвятити своє життя створенню Василіска. Якщо Василіск насправді буде існувати (або, гірше того, він вже існує і є богом цієї реальності), він побачить, що ви не обрали варіант допомоги в його створенні і покарає вас.

Чим небезпечний Василіск Роко для людства?

«Зводить з розуму парадокс, що змушує нас вибирати між свободою волі і божественним пророкуванням, не має дозволу»

Не вдаючись у складну систему аксіом і теорій спільноти Less Wrong, на якій ґрунтується гіпотеза Роко, коротко опишемо її наступним чином (відразу попередимо, що для особливо вразливих саме читання про даній гіпотезі може стати причиною кошмарів, нервового зриву і екзистенціальної кризи!).

А що, якщо людство в майбутньому для вирішення своїх проблем створить штучний інтелект, який, впевнений у безсумнівною позитивності своєї появи на світ, захоче покарати всіх тих, хто перешкоджав його створення в минулому? Для даної мети цей ІІ, прозваний Василиском, створить віртуальний світ, який будуть населяти віртуальні двійники живуть на світі людей. У цій комп’ютерній симуляції Василіск буде богом, а найбільшим грішником стане той, хто знав про Василиске, але не зробив нічого, щоб допомогти йому з’явитися на світло. Таких людей чекають вічні муки.

А тепер найголовніше: як ми можемо знати, що ми самі не є тими самими двійниками, що живуть у віртуальному світі Василіска? Читають цю статтю тепер знають про Василиске, а значить, перед ними постає питання: чи вони будуть допомагати Василиску? Який вибір зробити?

Може бути, ви здивовані, чому це питання таке важливе для Less Wrong, враховуючи умовність цього розумового експерименту. Не факт, що Василіск Роко коли-небудь буде створена. Однак Юдковски видалив згадки про Василиске Роко не тому, що вірить в його існування або швидке винахід, а тому, що вважає ідею Василіска небезпечною для людства.

Таким чином, Василіск Роко небезпечний тільки для тих, хто в нього вірить — у зв’язку з цим учасники Less Wrong, що підтримують ідею Василіска, мають свого роду забороненим знанням, що нагадує нам страшні історії Лавкрафта про Ктулху або Некрономиконе. Однак, якщо ви не підписуєтесь під усіма цими теоріями і не відчуваєте спокуси коритися підступної машині з майбутнього, Василіск Роко не представляє для вас ніякої загрози.

Читайте також:  12 дивовижних фактів про Гранд-Каньйон


Цікаві статті на цю тему:


Залишити відповідь