Правовые вопросы использования AI при создании графики. Разбор от i-Legal

Несмотря на стремительный рост популярности AI-сервисов, генерирующих визуальный контент по запросу пользователей, с правовой точки зрения их работа (а также использование созданной ими графики) вызывает множество вопросов. На самые актуальные из них в специальном материале для App2Top ответили юристы фирмы i-Legal.

Выборка изображений по поиску «midjourney» в «Яндексе»

Авторы: Наталья Юркова, управляющий партнер компании i-Legal, Алексей Кононов, ведущий юрист i-Legal, и Мария Ордовская-Танаевская, советник корпоративного отдела i-Legal.

Наталья Юркова, Алексей Кононов и Мария Ордовская-Танаевская

Тварь ли я дрожащая или право на копирайт имею

В 2022 году, кажется, каждый успел посмотреть на аниме-версию домашнего любимца в китайской нейросети QQ или благодаря Midjourney перенестись в мир Гарри Поттера с уклоном в киберпанк.

Картинки, порождаемые нейросетями, быстро «завирусились», фактически сделав нас частью обучающего механизма генеративного искусственного интеллекта (generative artificial intelligence; англ. generative – «порождающий»), который может не только анализировать данные, но и создавать их.

“What’s in the box?”

Когда сегодня говорят о генеративном AI, который преобразует текст в контент (text-to-content generation), а именно – в изображения, чаще всего имеют в виду DALL-E 2 (разработка OpenAI; генерирует фотореалистичные изображения), Midjourney (разработка независимой одноименной лаборатории; доступна через бот в Discord; имеет собственный, узнаваемый стиль и позволяет подражать стилю художников; есть пробная версия, по умолчанию является платной) или Stable Diffusion (опенсорс-модель стартапа Stability AI; доступна через платный сервис Dream Studio, через приложения третьих лиц или в виде бесплатной версии на устройстве пользователя).

Press “/imagine” to start

Чтобы сгенерировать контент с помощью нейросети, пользователи вводят текст (так называемый промпт; от англ. prompt – «подсказка»), а AI преобразует его в изображение.
В промптах можно указывать достаточно базовые вещи: предмет, цвет, художественный стиль. А можно накручивать параметры, которые требуют более узконаправленных знаний, задавая фокусное расстояние, внося хроматические аберрации или делая референс к конкретному «движку», например, Unreal Engine.

Пример промпта и изображения, сгенерированного по нему:

«a man in a long dusty black coat and a flat hat riding a walking black horse on a street amidst the ruins of a post-apocalyptic city riding towards the sunset on the horizon, bleak scenery, grim atmosphere, hyperreality, landscape photography, ultra-wide angle, depth of field, hyper-detailed, beautifully coloured, insane details, beautiful color graded, Shutter speed 1/1000, F/22, white balance, 4K, 8K, RTX rendered, super-resolution, lonely, fully colored, soft lighting, Chromatic Aberration — Variations by @9664989620 (fast)»

Изображение и промпт взяты из бота Midjourney в Discord. Variations by @9664989620

Промпт используется для наиболее эффективного инструктирования AI. По своей конструкции промпты могут быть достаточно сложны, при этом они представляют собой набор отдельных слов, пусть и составленный по определенному принципу. Поэтому, в отличие от «твиттов», сложно представить, что один промпт будет самостоятельным объектом авторского права. Однако совокупности таких промптов, которую можно сравнить с базой данных, при определенных условиях могла бы быть предоставлена правовая охрана.

Что касается использования имени художника или персонажа в составе промпта в качестве референса, то сам факт упоминания в тексте промпта, например, художника Леонида Афремова (чей стиль достаточно узнаваем), не должен представлять собой нарушения, однако полученный таким образом конечный результат работы AI – может. Почему? Попробуем разобраться.

«Из ста кроликов никогда не составится лошадь, из ста подозрений никогда не составится доказательства»

Генеративный AI обучается распознаванию закономерностей в предоставленных данных и их воспроизведению. Для обучения AI, преобразующего текст в изображение, требуется визуальный материал, который представляет собой результат интеллектуальной деятельности, как правило, охраняемый. Иначе говоря, использовать картинки с просторов Интернета без разрешения правообладателя – не всегда допустимая практика.

На данный момент возможность «обучения» AI на охраняемых авторским правом изображениях обосновывается доктриной добросовестного использования (от англ. fair use), распространенной в США и в Великобритании, которая при определенных обстоятельствах допускает использование произведений, в частности, изображений, защищенных авторским правом, без согласия автора.

При оценке того, имело ли место добросовестное использование, судами рассматриваются следующие параметры (на примере Закона об авторском праве США 1976 г.):

1. Цель и характер использования (как используется оригинальная работа и является ли использование коммерческим)

Чтобы использование данных считалось некоммерческим, необходимо, чтобы данные для обучения и модель были созданы исследователями и некоммерческими организациями. Компании стремятся соответствовать данному критерию: Stable Diffusion по лицензии использует базу данных LAION (немецкая некоммерческая организация), при этом сама компания не собирала данные и не проводила обучение модели (благодаря этому, Stable.AI имеет возможность продавать премиум-доступ к модели); DALL-E 2 также разработана некоммерческой организацией OpenAI (ключевым партнером и инвестором является Microsoft).

Но описанные выше ситуации, которые окрестили «отмыванием данных AI», уже вызывают вопросы с точки зрения формального соответствия критерию для сохранения возможности применения доктрины fair use. Поэтому однозначно определить, посчитают ли суды использование действительно некоммерческим, достаточно затруднительно.

2. Характер произведения, защищенного авторским правом (насколько само произведение относится к цели авторского права, заключающейся в поощрении творчества, носит ли оно творческий или в большей фактографический характер)

Исследование данных более чем 12 миллионов изображений в LAION-5B (используется для обучения Stable Diffusion) показало, что 47% изображений происходит всего со 100 доменов, таких, как Pinterest или DeviantArt. Однако сам факт происхождения изображения с сайта, предоставляющего лицензию, не означает, что такой домен является первоисточником изображения или что его использование разрешено. Так, например, с помощью инструмента, позволяющего проверить, нет ли работ тех или иных художников в составе данных, на которых происходит обучение, были обнаружены изображения, ранее удаленные из стора RedBubble.

Кроме того, по косвенным признакам можно судить о том, что AI изучал работы определенного художника. Например, «отклик» Midjourney на промпт со словами «Леонид Афремов», демонстрирует, что сеть с ним знакома:

Выборка изображений по поиску «Леонид Афремов» в «Яндексе»

Сгенерированные Midjourney изображения по промпту с упоминанием стиля Леонида Афремова

Таким образом, высока вероятность, что по данному критерию факт использования AI изображений, охраняемых авторским правом, будет свидетельствовать в пользу авторов оригинальных произведений.

3. Объем использования защищенного авторским правом произведения и его значительность для итогового результата в целом

Генерируемые AI изображения кажутся оригинальными и созданными под конкретный промпт. Однако недавно проведенное на примере Stable Diffusion исследование показало, что возможно технически установить не только тот факт, что полученный контент представляет собой «воспроизведение» в той или иной части, порой, значительной, изображений (англ. replication), на которых происходит обучение и которые AI использует для «тренировки» своих алгоритмов, но и определить сами оригинальные изображения.

Соответствие данному критерию в каждом случае оценивается индивидуально. Будет ли оценка носить технический характер и опираться, как это было сделано в указанном выше исследовании, на количественные критерии, или более «субъективный», на усмотрение человека (как им воспринимается то или иное изображение), предсказать сложно.

4. Влияние, которое оказывает такое использование на ценность оригинальной работы (наносится ли и в какой степени вред потенциальному рынку распространения оригинальной работы, например, создается ли ей замена)

Данный критерий является одним из самых сложных и важных для оценки добросовестного использования. Однако провести аналогию с существующей практикой достаточно затруднительно хотя бы потому, что не до конца ясно, чьи именно действия суды на практике могут расценить как способные привести к тому, чего больше всего опасаются художники, – к обесцениванию их творчества и всех тех лет, которые ушли на получение навыков и формирование собственного стиля.

Винить ли компании, как создателей этого оружия массового «интеллектуально-творческого» поражения, или «простых пользователей», которые могут обратить во вред художникам это оружие, воздвигнутое на их же собственных творениях? К сожалению, на текущий момент ответ на данный вопрос будет в большей степени лежать в области морали, чем права.

«Вопросы. Вопросы требуют ответов»

Если вероятность того, что факт обучения AI на изображениях, которые защищены авторским правом, может быть признан нарушением доктрины fair use, достаточно мала (поскольку он вписывается в указанные выше критерии), то непосредственно процесс создания и дальнейшего использования контента вызывает большое количество вопросов и требует введения более узконаправленного регулирования, которое давало бы ответ, кто и как имеет право использовать получаемые изображения.

Пока регулирование в данной области на публичном уровне ограничено ~~технологиями своего времени~~, компании предпринимают попытки самоограничения (или снятия с себя возможной ответственности), наделяя пользователя теми или иными правами в своих лицензионных соглашениях.

Так, согласно Условиям использования сервиса Midjourney пользователь, который не приобретает платную подписку, получает международную лицензию Commons Noncommercial 4.0 Attribution. По ней он может использовать изображения путем распространения, публичной демонстрации и т.п., но не может использовать их в коммерческих целях. Кроме того, пользователь не может запретить кому-либо еще использовать созданные по его промптам произведения. Фактически, Midjourney работает как совместное рабочее пространство, и другие люди могут использовать чужие промпты или сгенерированные изображения.

Если пользователь выбирает платный тариф, то он становится полноценным владельцем изображений и иных, сгенерированных с помощью сети активов. Однако любые изображения, сгенерированные в открытом источнике, например, в чате в Discord, доступны для просмотра третьим лицам.

Пользователь может приобрести дополнительную опцию конфиденциальности (privacy add-on) к своей подписке, и Midjourney берет на себя обязательство прилагать все усилия, чтобы не публиковать созданные пользователем произведения, то есть пользователь может создать нечто вроде частного канала для генерации собственных произведений и использовать их коммерческим путем.

Создатели Midjourney также сделали оговорку со ссылкой на DMCA (Закон США об авторском праве в цифровую эпоху), что для генерации результатов модель использует систему AI, обученную на общедоступных данных. Полученные на выходе данные могут быть непреднамеренно схожи с защищенными авторским правом материалами или товарными знаками, и компания готова рассматривать запросы, связанные с потенциальными нарушениями.

В свою очередь, Stable Diffusion распространяется под лицензией Creative ML OpenRAI-M, которая позволяет пользователям:

воспроизводить, проводить публичный показ, публичное исполнение, сублицензирование и распространение модели и любых ее дополнительных материалов, например, исходного кода и любых производных модели;
использование модели и любого дополнительного материала коммерческим путем;
сохранять права на выходные данные, созданные пользователями с использованием модели.

Также Stable Diffusion заявила, что у художников будет возможность выбрать, какие работы они хотят исключить из данных, используемых при обучении модели Stable Diffusion 3. В свою очередь, художники считают, что со стороны авторов должно быть продемонстрировано явно выраженное согласие, а не «отсутствие возражений».

Так, на ArtStation (сайт для профессиональных художников) началась забастовка против использования контента, сгенерированного с помощью AI. Теперь проектам, помеченным NoAI (никакого AI), будет автоматически присваиваться HTML-метатег NoAI, запрещающий использование такого контента системами AI.

В соответствии с Условиями предоставления услуг ArtStation все работы, которые размещаются на сайте, принадлежат художникам, и ArtStation не будет продавать или лицензировать работы другим компаниям. Кроме того, условия запрещают «собирать, агрегировать, добывать, удалять или иным образом использовать любой контент, загруженный на Сайт, в целях тестирования, ввода или интеграции такого контента с искусственным интеллектом или другими алгоритмическими методами, когда такой контент был помечен или размечен как NoAI поставщиком контента».

Некоторые авторы выражают свое несогласие более явным способом: так, в федеральный суд Калифорнии был подан иск (на настоящий момент не рассмотрен) против компаний Microsoft, GitHub и OpenAI. Иск касается работы алгоритма GitHub Copilot, который совместно разработан OpenAI и GitHub (принадлежит Microsoft) и используется по лицензии компанией Microsoft.

В процессе написания кода алгоритм предлагает закончить строку, и уже была анонсирована функция, которая позволит добавлять к коду новые, готовые блоки. Как утверждает истец, Copilot не указывает авторство, когда воспроизводит опенсорс код, условия лицензии которого прямо требуют такого указания. Кроме того, в иске указано, что имело место нарушение DMCA, запрещающего удаление информации об авторских правах.

«И выходит. И входит. Замечательно выходит!»

Самым важным вопросом и для пользователей, и для самих сетей (с точки зрения доктрины добросовестного использования, в частности) будет «порождающая» стадия работы алгоритма, когда из промпта пользователя… вжух! – и сгенерировано изображение.

Начать стоит с того, что здесь нас ждет еще один вопрос: к какой юрисдикции можно было бы привязаться с точки зрения регулирования и совершения потенциального нарушения с учетом «распределенной» сети AI и того, что «нарушитель» до конца не установлен? Поскольку по этому аспекту понятно не больше, чем по остальным, к сожалению, остается опираться только на общедоступные источники информации, в которых на данный момент больше всего отсылок к законодательству США и Великобритании, в том числе, как к странам, где располагаются компании, с которыми такие сети ассоциируются.

В США произведения, созданные исключительно машиной, не охраняются авторским правом. Правовая охрана может возникнуть в случае, если будет доказано, что человеком был внесен собственный существенный вклад. По мнению Бюро авторского права США (USCO), исходя из Закона США об авторском праве 1976 года, автором произведения может выступать только человек, а AI не соответствует этому требованию. Так, доктор Стивен Талер (Stephen Thaler), подавший заявку на регистрацию произведения искусства, созданного AI, где указал себя в качестве правообладателя, а AI Creativity Machine – в качестве автора, получил от USCO отказ, который на настоящий момент пытается оспорить (Stephen Thaler v. Perlmutter and The United States Copyright Office).

Поэтому особо привлекает внимание история, когда созданное AI изображение принесло победу своему автору, который представил работу “Théâtre D’opéra Spatial” на конкурсе после того, как потратил 80 часов на создание 900 итераций и на доработку в Adobe Photoshop изображений, сгенерированных AI.

Также в США зарегистрировано право как на произведение изобразительного искусства на книгу комиксов, которая создана с помощью Midjourney. Художница Крис Каштанова (Kris Kashtanova) разместила на обложке прямое указание на то, как именно были получены изображения.

Великобритания является одной из немногих стран, предоставляющих защиту авторского права на произведения, созданные исключительно с помощью компьютера. Автором в Великобритании считается «лицо, которым принимаются меры, необходимые для создания произведения». Видится, что эту трактовку можно интерпретировать различным образом (будет ли это «лицо» разработчиком модели или, например, просто ее оператором?).

В качестве одного из способов коммерциализации генерируемые AI изображения могут размещаться на стоковых площадках. Однако среди крупных игроков в данной сфере нет единой позиции насчет допустимости таких изображений:

Getty Images запретило изображения, полученные с помощью AI, указав, что продажа художественных работ AI потенциально может подвергнуть пользователей юридическому риску;
Shutterstock заключил сделку с OpenAI об интеграции DALL-E; при этом художники, чьи работы использовались для обучения моделей, будут получать возмещение;
DeviantArt объявил, что будет использовать контент пользователей для обучения AI, однако после последовавшего возмущения с их стороны отменил свое решение;
Adobe Stock признает контент, созданный с помощью AI, но с соблюдением определенных правил, например, название изображения должно включать пометку «Генеративный AI».

В Политиках Adobe ответственность за контент возлагается на пользователя:

«… вы гарантируете нам, что у вас есть все права для Adobe Stock на использование контента…, что контент не нарушает никаких прав третьих лиц»;
«Никогда не отправляйте контент, который нарушает права третьих лиц, включая имитацию или тиражирование контента или стиля»;
«Не используйте изображение, на которое у вас нет прав, в качестве параметра для ваших генеративных подсказок для AI».

«Аннушка уже купила подсолнечное масло, и не только купила, но даже разлила»

Процесс обучения генеративного AI невозможно обернуть вспять, заставив сеть забыть картины Леонида Афремова как по вспышке нейрализатора людей в черном. Можно либо уничтожить модель (что уже представляется маловероятным с учетом распространения Stable Diffusion как опенсорс-проекта), либо принять соответствующее регулирование.

К сожалению, скорость внедрения такого регулирования не соответствует темпам развития AI, а самые сложные вопросы лежат не в сфере авторского права, а в гораздо более тонких для применения материях: этике и морали.

При желании создать, разместить или использовать материалы, полученные с использованием AI, в условиях текущего регулирования, а точнее, его отсутствия, можно лишь рекомендовать внимательно изучать действующие условия сервисов, консультироваться с юристами и быть морально готовыми к неожиданным «сюжетным» поворотам в этой набирающей космическую скорость развития области.

03.02.2023 13:07
Александр Семенов

Правовые вопросы использования AI при создании графики. Разбор от i-Legal

Опубликовано:
Александр Семенов

Теги:

Тварь ли я дрожащая или право на копирайт имею

“What’s in the box?”

Press “/imagine” to start

«Из ста кроликов никогда не составится лошадь, из ста подозрений никогда не составится доказательства»

«Вопросы. Вопросы требуют ответов»

«И выходит. И входит. Замечательно выходит!»

«Аннушка уже купила подсолнечное масло, и не только купила, но даже разлила»

Теги:

03.02.2023 13:07 Александр Семенов

Правовые вопросы использования AI при создании графики. Разбор от i-Legal

Опубликовано: Александр Семенов

Теги:

Тварь ли я дрожащая или право на копирайт имею

“What’s in the box?”

Press “/imagine” to start

«Из ста кроликов никогда не составится лошадь, из ста подозрений никогда не составится доказательства»

«Вопросы. Вопросы требуют ответов»

«И выходит. И входит. Замечательно выходит!»

«Аннушка уже купила подсолнечное масло, и не только купила, но даже разлила»

Теги:

03.02.2023 13:07
Александр Семенов

Опубликовано:
Александр Семенов