Потенциал нейросетей в генерации фотореалистичного контента для медиа
Потенциал нейросетей в генерации фотореалистичного контента для медиа
Авторы статьи выдвигают предположение о способности ресурсов искусственного интеллекта (ИИ) «стать субститутом фотографических изображений», заменив собой работу фотожурналистов. Для верификации этой гипотезы в работе экспериментально рассматриваются возможности четырех зарубежных и отечественных профильных нейросетей с последующей экспертной оценкой полученных с их помощью результатов.
Во введении авторы констатируют: цифровизация и развитие ИИ радикально меняют медиакоммуникации и журналистику, влияя на методы работы, форматы медиатекстов и конкуренцию с блогерами и инфлюенсерами. Современные нейросети уже способны создавать текстовый, визуальный и видеоконтент высокого качества, что открывает большие возможности, но и вызывает этические и юридические вопросы, связанные с достоверностью информации и ее авторством. Визуальный контент особенно важен для цифрового поколения, поэтому СМИ активно используют ИИ для создания иллюстраций и работы в смежных сферах (PR, маркетинг). В то же время в общественно-политических изданиях применение генерированного контента требует осторожности из-за рисков фейков. В нишевых изданиях и деятельности фрилансеров ИИ помогает экономить время и расширять возможности создания иллюстраций, что становится востребованным при возрастании роли удаленной внештатной журналистики.
Методика исследования включала опрос 293 студентов-журналистов УрФУ, которым авторы работы демонстрировали 60 изображений — по 10 иллюстраций, сгенерированных пятью нейросетями (Kandinsky, Leonardo, Midjourney, Stable Diffusion, «Шедеврум»), и 10 реальных фотографий, тщательно отобранных для исключения подделок. Иллюстрации охватывали десять тематик: натюрморты, животные, интерьеры, здания, люди в действии, портреты, руки с предметами, природа, статуэтки и техника. Участникам давали 10 минут (примерно 10 секунд на изображение) на быстрый и интуитивный выбор — считают ли они изображение сгенерированным или реальным, с обязательной аргументацией признаков ИИ-контента в последующем обсуждении. Иллюстрации генерировались исследователями самостоятельно или были взяты из официальных источников нейросетей, а для Midjourney использовались только авторизованные каналы. Итоги опроса основаны на закрытых анкетах в гугл-формах, а устные дискуссии служили дополнительным качественным анализом.
Переходя к результатам, авторы отмечают: в ходе опроса выяснилось, что ни одна сгенерированная иллюстрация не была единодушно признана искусственной, как и ни одна реальная фотография не была однозначно определена респондентами как подлинная, что в целом указывает на субъективность восприятия. Большинство участников (около 80%) правильно распознавали реальные фото, подтверждая объективную адекватность оценок. По качеству фотореалистичности лидировала нейросеть Leonardo, успешно сгенерировавшая изображения по запросам практически на все темы, кроме портрета человека. Альтернативная отечественная разработка Kandinsky напротив — по всем заданиям продемонстрировала слабые результаты за исключением «снимков» интерьеров и статуэток. Midjourney, хотя и заняла второе место по количеству ошибочно принятых за фотографии сгенерированных изображений, признана респондентами сильной в генерации животных, интерьеров, портретов и статуэток, а также удовлетворительно справившейся с натюрмортами и изображениями рук. Итоговый общий рейтинг учитывал не только количество успешно отработанных тем, но и уникальность сильных сторон протестированных нейросетей.
Формулируя выводы, авторы утверждают — нейросети всех направлений стремительно развиваются: в начале 2023 г. даже ведущие модели не могли генерировать изображения, воспринимаемые как реальные фотографии, а уже через два года ИИ демонстрирует способность полностью заменять фотоснимки. Несмотря на различие «сильных» и «слабых» систем, такие модели, как Leonardo и Midjourney, сейчас способны функционировать в качестве практической альтернативы традиционной фотографии.
Представленные авторами статьи цифры, по их мнению, фиксируют в текущем моменте радикальный сдвиг парадигмы. В предыдущем исследовании (Мухина, Олешко, 2024) было обнаружено, что 8 % медиа‑фрилансеров и 3 % штатных журналистов уже отказались от фотобанков в пользу генерации иллюстраций в нейросетях, в результате чего посещаемость самого популярного банка Pixabay начала падать. Хотя эти показатели кажутся небольшими, их динамика ясно указывает на то, что ИИ скоро станет серьезным конкурентом фотографов и иллюстраторов.
Мнения исследователей о замене человека ИИ разнятся, но развитие нейросетей за последние два года позволяет прогнозировать дальнейший экспоненциальный рост их возможностей. Сам творческий посыл в создаваемых компьютерами изображениях исходит от пользователя, однако, подчеркивают авторы, ИИ быстро обучается и уже сегодня способен создавать качественные фотореалистичные иллюстрации, способные удовлетворить запросы как СМИ, так и их аудитории.
кандидат филологических наук, доцент кафедры периодической печати и сетевых изданий, департамент «Факультет журналистики», Уральский федеральный университет, г. Екатеринбург, Россия
доктор философских наук, профессор, заведующий кафедрой периодической печати и сетевых изданий, департамент «Факультет журналистики», Уральский федеральный университет, г. Екатеринбург, Россия
связь