Щоразу, заходячи в інтернет, ви стикаєтеся зі штучним інтелектом. Він живе у пошукових системах, у мобільних мережах, у більшості додатків на вашому смартфоні. Добре вивчивши ваші смаки, ІІ пропонуватиме музику, фільми та книги, які сподобаються саме вам. Якби можливо було одним натисканням кнопки відключити всі алгоритми, «зламався» сам інтернет, оскільки розподілом навантаження на вузли мереж вже давно займається ІІ. Ендрю Ин, співзасновник і колишній керівник Google Brain, якось порівняв ІІ з електрикою. Він сказав, що незабаром не залишиться такої сфери, на яку не вплинув би штучний інтелект. Але чи готові алгоритми займатися творчістю?
Вважають, що це існуючі алгоритми ставляться до категорії про «слабких» ІІ. Вони орієнтовані рішення або якоїсь однієї завдання, або пула завдань, які стосуються однієї області. Що таке «сильний» ІІ, ми поки що не знаємо. Можна сказати, що це алгоритм, що має самосвідомість і розум, нехай навіть і не схожий на людський. Швидше за все, «сильний» ІІ буде здатний на творчість. Але як справи з сучасними алгоритмами? Вивченням та розвитком методів створення ІІ займається машинне навчання (ML, Machine Learning).
Фахівці в цій галузі не дають машині покрокову інструкцію, як досягти певного результату, а вчать її самостійно приходити до цього результату за мінімального втручання людини. Щоб звичайна програма знаходила на фотографіях котиків, програмісту потрібно було б розкласти поняття «котик» на тисячі характеристик. Хорошому ML-алгоритму достатньо показати тисячу фотографій, на яких фігура котика обведена та підписана.
З одного боку, такий спосіб навчання дуже спрощує життя. З іншого боку, для навчання ІІ потрібно знайти цю тисячу фотографій та розмітити на ній потрібні об’єкти. В інтернеті вже є кілька великих баз з даними, на яких можна тренувати алгоритми, є безліч дрібних, специфічніших. Причому не лише із зображеннями, а й із текстами, анімацією, аудіозаписами. І тут важливо пам’ятати, що дані для навчання ІІ збирає і розмічує той самий чоловік. Від людини залежить, наскільки вони різноманітні та точні. В англійській мові це ілюструє ідіома GIGO – garbage in, garbage out (перекладається як “сміття на вході – сміття на виході”). Грубо кажучи, не варто чекати на шедевральний роман від алгоритму, який навчався на бульварному чтиві.
Зображення, яке згенерувала нейромережа після тренування на картинах у стилі модернізму
Широко відомий той факт, що розпізнавання осіб у алгоритмах комп’ютерного зору (тих, що аналізують зображення) для представників неєвропеоїдних рас працює значно гірше, ніж для білих людей. Це пов’язано саме з нерівною репрезентацією всіх рас у тренувальних даних. У 2015 році навіть стався скандал: алгоритм, що розпізнає в Google Photos, не впізнав у двох афроамериканцях людей і помітив їх як горил. Для таких помилок є назва, AI bias — упередженість штучного інтелекту, що веде до спотворень у результатах. Ми можемо, самі того не помічаючи, навчити алгоритми расизму, сексизму та інших поганих речей. Це може відбито у сфері мистецтва.
Ще одна проблема з ІІ полягає в тому, що ми поки що погано розуміємо, яким чином він приходить до того чи іншого результату. Вона теж має назву — проблема інтерпретованості, і зараз вчені потроху просуваються до її вирішення. Ситуація ускладнюється тим, що параметрів, якими оперує алгоритм, дуже багато, а робота деяких моделей — з тих, що вже виконують важливі завдання, — взагалі не пояснюється, оскільки їх архітектура спочатку не враховувала необхідність інтерпретації результатів. Що вже говорити про нефахівців — простих людей, які не можуть залізти нейромережі «в мізки» і подивитися, на якому шарі, через які параметри вона дає збій. По суті, зараз штучний інтелект — це чорна скринька, і в ній відбувається загадкова магія. Якщо він намалює абстракцію або напише мелодію, то не зможе пояснити, чому зробив її саме такою і якою за нею ховається сенс.
Загалом не варто поспішати і наділяти штучний інтелект тими якостями, які йому не притаманні. Однак це не заважає використовувати його як хороший інструмент — тим більше, що інтерес до результатів спільної з ІІ творчості потроху підвищується.
У 2018 році в Нью-Делі відбулася виставка, повністю присвячена предметам мистецтва, створеним за допомогою штучного інтелекту. У жовтні того ж року картина, що згенерувала нейромережею, була продана на аукціоні Christie’s майже за півмільйона доларів — рекордна сума для такого типу зображень. Влітку 2019 року міжнародну художню виставку «Штучний інтелект та діалог культур» організував Ермітаж. Чи здатні сучасні алгоритми на творчість чи ні, але вони вже впливають на мистецтво. Наскільки сильно залежить від конкретної області.
«Портрет Едмонда Беламі» пішов з молотка за 432,5 тисячі доларів, що в 45 разів більше за його стартову ціну. Картину згенерувала нейромережа, яку команда Obvious з Парижа натренувала на 15 тисяч портретів, написаних у період з XIV по XX століття. Автори проекту використовували вже існуючу нейромережу з відкритим вихідним кодом – звичайна справа в IT-середовищі. Це була GAN (Generative Adversarial Network, генеративно-змагальна нейромережа) — втілення проривної концепції, яка з’явилася лише шість років тому.
Портрет Едмонда Беламі
У червні 2014 року дослідник із Google Brain (нині працює в Apple) Ян Гудфеллоу з колегами опублікував статтю Generative Adversarial Networks, в якій описав відносно простий, але геніальний принцип машинного навчання. Фахівці запропонували стравити один з одним дві моделі: генеративну та дискримінативну. Перша намагатиметься обдурити другу, а друга розпізнати обман.
Наприклад, генератору показують багато-багато реалістичних пейзажів – така база даних називається тренувальним набором – і доручають створити щось схоже. Він генерує фото, яке надсилається дискримінатору. Дискримінатор намагається визначити, звідки воно прийшло: із тренувального набору чи від генератора. Якщо зображення прийшло від генератора, а дискримінатор подумав, що з набору, то генератор молодець надурив суперника. Дискримінатор бере це на замітку і наступного разу намагатиметься таке зображення не пропустити. Якщо ж дискримінатор правильно розпізнав згенероване зображення, генератор наступного разу намагатиметься зробити таку фотографію, яка більше схожа на реальну.
Роботу цих двох моделей часто порівнюють із протистоянням між фальшивомонетниками та банками. Перші удосконалюються у копіюванні банкнот, а другі – у виявленні підробок. До речі, команда Obvious має цілу серію згенерованих портретів сімейства Беламі. Це прізвище відсилає до прізвища автора концепції GAN: bel ami (фр.), як і good fellow (англ.) означає «хороший друг».
Галерея нейромережевого мистецтва, розділ «Природа»
Нещодавно, у березні 2020 року, «Яндекс» створив Галерею нейромережевого мистецтва. Це сайт із віртуальною виставкою картин, згенерованих StyleGAN2 та розподілених за різними секціями власним алгоритмом компанії. Усього там чотири секції: «Люди», «Природа», «Місто» та «Настрій». Особливість виставки в тому, що кількість картин в ній обмежена (хоча ІІ здатна створювати їх тисячами), і кожен відвідувач з моменту відкриття міг забрати одну з них собі, завантаживши оригінал зображення. Картини закінчилися за кілька годин – попит був величезний.
Щось неіснуюче
У лютому 2019 року компанія Nvidia випустила нейромережу StyleGAN, а разом із нею відкрила сайт ThisPersonDoesNotExist.com. На цьому сайті нейромережа в реальному часі створює фотографії облич неіснуючих людей, причому такого рівня реалістичності, що відрізнити їх від фото справжніх людей дуже складно.
У багатьох пабликах і каналах почали з’являтися випробування із закликом вгадати, на якому зображенні справжня людина, а яке згенерувала нейромережа. Згодом люди навчилися їх розрізняти. Фокус у тому, що на фотографіях нейромережі фон завжди замилений, а на периферії – у волоссі, на плечах чи на грудях – можна помітити артефакти. Незабаром після відкриття сайту почали з’являтися ресурси-клони, на яких StyleGAN створювала неіснуючих кішок та коней, а також неіснуючі хімічні сполуки, вази та сумочки.
Цієї людини не існує, її обличчя створив StyleGAN2 – друга версія алгоритму Nvidia.
З текстами справа набагато гірша, ніж із зображеннями. Якщо в художній абстракції ми здатні вловити красу і якийсь сенс, то нескладний текст збиває людину з пантелику. А зв’язковий алгоритми генерувати поки що не вміють — навіть найкращі губляться після кількох пропозицій. Втім, деяких успіхів фахівці досягли в галузі поезії. Чітка ритміка і приємне звучання фраз не повністю компенсують відсутність сенсу, але можуть принести деяке задоволення.
У грудні 2017 року творча команда з Botnik Studios неабияк повеселила інтернет, а особливо шанувальників серії про Гаррі Поттера, головою з нової книги про Хлопчика, який вижив. Цей розділ написав штучний інтелект, і називається вона “Красавчик”, а сама книга – “Гаррі Поттер і портрет того, що виглядало як велика купа попелу”. Сенсу в ній не те щоб багато: фрази алгоритм видавав зв’язкові, проте вони погано стикувалися один з одним. Це принципом роботи подібних моделей.
Вони подивилися на двері, кричачи про те, наскільки вони були зачинені, і прохаючи її перетворитися на невелику кулю.
— Пароль був «ЯВ’ЯЧІ ЖІНКИ», — заволала Герміона.
Уривок із неіснуючої книги про Гаррі Поттера від Botnik Studios
Алгоритми обробки природної мови (NLP, Natural Language Processing) більш-менш добре уявляють структуру мови і навіть навчилися утворювати морфологічно правильні словосполучення — це видно по тому, як просунулися за останні роки автоматичні перекладачі. Ще один великий крок у бік письменницької кар’єри алгоритми зробили, коли навчилися пророкувати з урахуванням контексту продовження фрази, але в основі продовження — наступний шматок тексту. Приблизно по тому принципу працює автодоповнення в сучасних цифрових клавіатурах. Але ІІ добре себе показує на коротких дистанціях. Під час марафонів — коли потрібно написати оповідний абзац — він плутається і несе нісенітницю.
У лютому 2019 року компанія OpenAI заявила, що створила універсальну модель генерації осмислених текстів, але відмовилася відразу публікувати повну версію, побоюючись, що її використовуватимуть у поганих цілях, наприклад, для штампування фейкових новин. Модель GPT-2 справді виявилася гарною, хоча не особливо відрізнялася від попередників і працювала за принципом того ж автодоповнення. Її виділяло кількість параметрів – грубо кажучи, налаштувань у вузлах нейромережі – і обсяг тренувальних даних. У повній версії моделі 1,5 мільярда параметрів, тоді як в інших алгоритмах використовується 100-300 мільйонів. А навчали її на сорока гігабайтах текстових даних. Натренована GPT-2 здатна видавати короткий зміст кількох абзаців, відповідати на запитання, а головне самостійно генерувати великі обсяги тексту.
Два Кільця були повернуті до Рівенделла. Фродо та Сем прокинулися одні в кімнаті, і Фродо виявив на своїй подушці записку. Він відкрив її і прочитав: «Хай буде з вами назавжди сила Кільця і нехай не згасне його світло».
Текст згенерований GPT-2
Ентузіасти, так би мовити, русифікували цю модель – навчили на масиві текстів із російської літератури. Так з’явився розважальний сервіс “Порфирович” (ймовірно, названий на честь головного героя Пелевінського “iPhuck 10” – Порфирія Петровича), а ще чат-бот в “Телеграмі” – NeuroPoetBot.
Печера. Димний чад смолоскипів. Крилаті тіні, що кидаються під стелею. Косматий, набрякаючий кайданами натовп… У мене досі серце завмирає при одному погляді на це. А тут ще повний місяць у небі… Відчуття таке, що потрапив до авангарду, коли писала цю статтю про привидів. Тут усі такі примітивні.
Марія Семенова («Волкодав») + нейромережа «Порфирович» (GPT-2)
У російськомовному просторі був ще один творчий проект, до якого залучили штучний інтелект (відомого письменника). Влітку 2018 року, перед виходом третьої частини серіалу «Гоголь», телеканал ТВ-3, «Яндекс» та Сергій Лук’яненко представили розповідь, написану ІІ у стилі Миколи Васильовича Гоголя. Оповідання називалося «Дурний договір».
«Яка доля!» — подумав про себе Харитон і, прийшовши до себе в кімнату одягнутися і ліг у ліжко. Довго боровся він із безсонням, нарешті, пересилив її. Знову якийсь сон, якийсь вульгарний, бридкий сон. Боже, змилуйся: хоч на хвилину, хоч на одну хвилину покажи її! Мою милу дружину, яку я ще недавно тримав у своїх обіймах».
(Уривок з «Дурного договору»)
За штучний інтелект відповідав “Яндекс” – підібрав модель, натренував на 30 тисячах творів російської прози і потім “донавчив” на творчості класика. Сергій Лук’яненко вигадав персонажів та підготував основу для сюжету, яку ІІ сам заповнив псевдогоголівським текстом. Вийшло не те щоб добре, але, за словами самого Лук’яненка, імітувати стиль алгоритми вже виходить: «Погана новина — у нас часом виходять книги, написані гірше, ніж історія, придумана нейромережею „Яндекса“».
Генерація музики нейромережам дається, з одного боку, простіше: у ній немає такого жорсткого смислового рівня, як у тексті, тому можна просто концентруватися на милозвучності. З іншого боку, їм доводиться працювати з дуже важкими файлами. Однак на ринку вже є програми, в яких ІІ створює нескінченний музичний потік під різні настрої та в різних стилях.
Найбільш вражаючих результатів досягла та сама команда OpenAI. На початку травня 2020-го вона опублікувала алгоритм, який здатний генерувати музику в різних жанрах, від блюзу до важкого металу, і навіть із вокальними партіями — такого ще не було ні в кого. Але тут не все гладко. Створювати закінчені композиції — з куплетами, приспівами і основним мотивом, що повторюється, — нейромережа все ж не вміє, до того ж робота алгоритму вимагає величезних обчислювальних ресурсів: на генерацію треку завдовжки за хвилину йде дев’ять годин. Крім того, при синтезі вокалу вона використовує зразки голосів реальних виконавців, що порушує питання захисту авторських прав.
Альбом блек-металу, створеного ІІ DADABOTS
Деяким експериментаторам традиційних видів творчості не вистачає, і вони схрещують між собою різні форми мистецтва, наприклад, живопис і музику. Компанія Awara IT вирішила перевірити, чи зможе нейромережа виявити зв’язок між роботами Василя Кандинського та композиціями, якими вони були натхненні. Розробники натренували свій алгоритм на зв’язках творів: наприклад, картина “Москва I” зіставлялася з оперою Ріхарда Вагнера “Лоенгрін”, “Імпресія III (концерт)” – з композиціями Арнольда Шенберга, – а потім запропонували нейромережі згенерувати картину, що відповідає пісні. »групи «Альянс». Вийшов своєрідний перфоманс — автору пісні, Олегу Парастаєву, він навіть сподобався, але до талантів штучного інтелекту музикант ставиться скептично: «Сам собою штучний інтелект не здатний творити повною мірою — без участі людини мистецтвом це не назвеш».
У кіно (і в принципі під час роботи з відео) нейромережа поки що залишається на других ролях, проте свої обов’язки виконує досить добре. Зараз алгоритми вміють маніпулювати фігурами на відео, міняти обличчя людей, причому чудово справляються навіть із дрібною мімікою. Є такий ІІ, який змінює рухи губ у ролику, і здається, що людина говорить іншою мовою. Все це може якось призвести до того, що глядач сам вибиратиме актора, якого хоче бачити у певній ролі.
Втім є одна короткометражка, яку повністю зрежисував штучний інтелект. Його звуть Бенджамін, а фільм має назву Zone Out. Головну роль у ньому відіграв Томас Міддлдітч — зірка «Кремнієвої долини». Бенджамін створив сценарій, вибрав зі старих фільмів відповідні кадри, склеїв їх у сцени, підставив обличчя акторів у потрібні місця, озвучив їх голосами і написав саундтрек. Все це він зробив сам за 48 годин. Вийшла чорно-біла нуарна фантастика про вченого, який намагається зупинити поширення вірусу, що змінює обличчя людей.
У деяких кадрах створеного ІІ фільму обличчя акторів все ж таки «підтікають»
До повноцінної творчості штучному інтелекту поки що далеко, але питання з правами на його твори постає вже зараз. Цілком його не вирішили ще ніде, влада багатьох країн поки що за нього навіть серйозно не бралася, тому що впровадження ІІ в правову сферу потребує ґрунтовного підходу, довгої та кропіткої спільної роботи законотворців із фахівцями у галузі машинного навчання. Однак де-не-де норми про охорону результатів творчості нейромереж вже з’явилися — наприклад, у Великій Британії. Там авторські права належать тій людині, що створила умови для появи твору. У різних ситуаціях це може бути як розробник нейромережі, і простий користувач.
У Росії, як і США, інтелектуальні права на предмети мистецтва, створені ІІ, не охороняються. Цьому заважає і структура закону про авторське право, і в принципі те, як працюють алгоритми. Зображення, музика та інші твори, що згенеровані нейромережами, підпадають під визначення об’єкта права, який за законом слід захищати. Найчастіше вони нові, оригінальні та унікальні. Однак назвати нейромережу автором не можна, оскільки мета авторського права — показати, хто має пріоритет у використанні результатів творчості, а штучний інтелект на свою творчість видів не має. У деяких країнах юристи обговорюють варіант наділити ІІ, а також роботів та інші «розумні» машини окремими правами та обов’язками визначити їх у законах як «технічна особа». Але це поки що концепція, невідомо, чи її розвиватимуть.
Можна не морочитися з правами і оголосити, що все згенероване нейромережами перетворюється на суспільне надбання і ним може скористатися будь-яка людина без обмежень. Однак створення алгоритму та його навчання забирає у людей багато сил, часу і навіть грошей — особливо «масивні» алгоритми потребують потужних обчислювальних ресурсів і витрачають під час роботи величезну кількість електроенергії. Відмовити творцям нейромережі у захисті їхніх інтересів буде несправедливо.
Твоє обличчя, коли не можеш написати симфонію
У законодавстві Росії є поняття суміжних прав — такі виникають у видавців, які випускають твори, які вже стали суспільним надбанням, артисти-виконавці, розробники баз даних. Деякі юристи вважають, що охороняти творчість ІІ слід саме у таких поняттях. Інші ж вказують на те, що суміжні права вторинні по відношенню до авторських і треба спочатку визначити, кого вважати автором, а вже потім дозволяти чи не дозволяти комусь сторонньому користуватися результатами його роботи.
Авторами цілком можна було б назвати тих, хто сприяв появі твору. Однак тут є кілька незрозумілих моментів. По-перше, чиї права пріоритетніші — розробника чи користувача? Одні розробники викладають вже повністю натреновані моделі, які не вимагають від користувача ніяких зусиль. Інші публікують лише каркас, а навчати та натягувати алгоритм для виконання того чи іншого завдання має сам користувач. Можна було б надати пріоритетне право тому, на чиїй машині з’явився твір, проте цей варіант не передбачає використання хмарних технологій.
Готового комплексного рішення поки що немає ні в кого, і невідомо, чи з’явиться воно найближчими роками.
Автор – голограма?
Медична голограма зорельоту «Вояджер» (актор Роберт Пікардо)
У серіалі «Зоряний шлях: Вояджер» був такий персонаж, «Доктор», — екстрена медична голограма і, по суті, «сильний» ІІ, який виконував обов’язки головного медичного офіцера. Протягом усього польоту “Вояджера” він вивчав свої творчі можливості і до двадцятого епізоду сьомого сезону дозрів до публікації власного голографічного роману. На жаль, його досвід роботи з видавничою сферою двадцять четвертого сторіччя виявився негативним. Видавець відмовився на вимогу Лікаря відкликати роман для доопрацювання, апелюючи до того, що у голограми немає прав розпоряджатися власним твором. За законами Федерації авторські права можуть належати лише людині.
Пройшов судовий розгляд. Захисники Лікаря вимагали визнати його рівною людині, проте суддя з цим не погодився. Він не був упевнений у тому, що голограма здатна приймати власні рішення, у тому числі творчі, а не просто діє відповідно до програми, закладеної людьми. Але він розширив для Лікаря юридичне поняття автора у тій частині, що стосується прав на власні твори.
Здавалося б, фантастика двадцятирічної давності, але подібні питання скоро доведеться вирішувати і нам.
* * *
Творчі здібності штучного інтелекту лише починають формуватися. Його перші кроки можуть комусь здатися незручними, смішними чи незначними, проте не варто забувати, що кожна людина теж багато тренується, щоб досягти хоча б мінімального успіху у своїй галузі мистецтва. Він працює над собою, шліфує навички, пробує різні техніки. Тому, перш ніж глумливо пропонувати бездушній машині написати шедевр, тільки уявіть, скільки довелося б вчитися вам, щоб зробити те саме.
Цікаві статті на цю тему:
- Вірші, сюжети, код, контекст та віртуальний світ: що вміє нейромережа ChatGPT
- Як встановити контакт із інопланетянами
- Підводні міста майбутнього. Як і навіщо нам заселяти океан
- Промені смерті: шалені проекти та улюблена зброя шахраїв
- Суть чорних дірок: сингулярність, горизонт подій, спагеттифікація