Наконец, теперь можно создавать безумно реалистичные лица, которых не существует.

Используйте модель машинного обучения для создания реалистичных изображений на iOS

Знакомы ли вы с веб-страницей «Такого человека не существует»?
Когда вы посещаете эту страницу, вы увидите портреты высокого качества.

Этого человека не существует
Этого человека не существуетthispersondoesnotexist.com

При перезагрузке вы увидите другого человека. Этих людей не существует.
Это изображение создано с помощью технологии машинного обучения под названием StyleGAN.

Эта статья покажет вам, как использовать StyleGAN на iOS для простого создания реалистичных портретных изображений.

Сверхмощная генерация изображений, но можно ли ее использовать на iOS? .. ..

StyleGAN может генерировать не только человеческие лица, но и картины, аниме-изображения и многое другое.
Если мы справимся с этим на iOS, похоже, мы сможем сделать забавное приложение.

Однако, хотя StyleGAN — это технология, анонсированная в конце 2010-х годов, я не видел много случаев, когда ее можно было бы использовать на iOS (насколько мне известно).
Есть способ запустить ее на веб-сервере. , но если его можно запустить на устройстве, он не требует подключения к сети и работает быстро. Я предполагаю, что узким местом было….
・StyleGAN модель была слишком большой и

・ Структура казалась сложной

Появился MobileStyleGAN

В 2021 году был представлен MobileStyle GAN, более легкий для мобильных устройств.

GitHub — bes-dev/MobileStyleGAN.pytorch: официальная реализация MobileStyleGAN в PyTorch
официальная реализация PyTorch Сопутствующие видеоролики можно найти на YouTube. Подробнее см. на…github.com

Эту модель можно легко преобразовать в формат CoreML и использовать на iOS.
Легкий размер 38 МБ (до квантования), для генерации требуется всего около 1 секунды.
Если это так, я думаю, что это может использоваться на iPhone.

Конкретный метод

1. Получить модель

План A:

Модель CoreML можно получить, запустив скрипт экспорта CoreML в репозитории MobileStyleGAN.
На выходе получается многомерный массив (1024 * 1024 ML MultiArray).

План Б:

Преобразованную модель MobileStyle GAN CoreML можно загрузить с сайта CoreML-Models (Model Zoo).
Результатом является изображение (1024 * 1024 CVPixelBuffer).

GitHub — john-rocky/CoreML-Models: Преобразованные модели CoreML
Преобразованный зоопарк моделей CoreML. Вы можете преобразовать модель в формат CoreML по ссылке на диске Google. См.…github.com

2. Генерация изображения

Запустите модель в Swift

MobileStyleGAN состоит из двух сетей: сети сопоставления и сети синтеза.
Создайте случайное начальное число [1, 512] и передайте его в сеть сопоставления.
Передайте выходные данные сети сопоставления в сеть синтеза.

Создайте изображение с помощью примера проекта Xcode

Вы также можете попробовать пример проекта для использования MobileStyleGAN на iOS.

GitHub — john-rocky/CoreML-StyleGAN: пример проекта по использованию MobileStyleGAN в iOS.
Пример проекта по использованию модели CoreML для MobileStyleGAN в проекте Xcode. Вы можете создавать изображения людей и…github.com

Вот простой пример, чтобы выбрать изображение из библиотеки фотографий и запустить модель.
Вы можете клонировать и из Github и строить. Нажмите кнопку, чтобы создать изображение лица. Он будет сгенерирован примерно за 1 секунду на изображение.

Интересные приложения могут быть созданы вами

Поскольку изображение генерируется из 512 случайных начальных чисел, я думаю, что вы можете создать изображение с шаблоном примерно 3 * 10 в 1000-й степени (правильно ли это?).

🐣

Я инженер-фрилансер.
Консультация по работе
Пожалуйста, не стесняйтесь обращаться к нам с кратким описанием разработки.
[email protected]

Я делаю приложение, использующее Core ML и ARKit.
Мы отправляем информацию, связанную с машинным обучением и дополненной реальностью.

Гитхаб

Твиттер
Средний

Спасибо.

материалы по теме:

Новые материалы

Итак, что такое MLOps?

Согласно Представляя MLOps: «MLOPs — это стандартизация и оптимизация управления жизненным циклом машинного обучения». Это особенно интересное определение, потому что его разделение..

Прогрессивная транспиляция

В последние годы программисты JavaScript (он же EcmaScript) часто используют компиляторы исходного кода , также известные как транспиляторы , для преобразования более усовершенствованной или..

Алиса в стране машинного обучения — инициатива «100 дней кода машинного обучения»

Covnets, регрессия, классификация, ReLU, предвзятость… — все это интригующие жаргоны, которые я слышал от своих сверстников, выбравших курс машинного обучения, по касательной во время обычного..

Иногда учитель, всегда ученик

Учение Йоды в применении к развитию разработчиков «Делай или не делай. Нет никакой попытки.” Обучение программированию превратилось в современное «создание группы» или «написание книги»...

Как создать файл конфигурации сборки в Xcode | Серия настроек проекта Xcode

Эта статья шаг за шагом расскажет вам, как создать новый файл конфигурации сборки в вашем проекте Xcode. Что такое файл конфигурации сборки? Файл конфигурации сборки — это обычный..

Venv против Virtualenv в Python — что использовать?

Когда дело доходит до создания виртуальных сред в Python, есть два популярных варианта: venv и virtualenv. Оба инструмента служат одной цели — созданию изолированных сред для ваших проектов..

Реализация персептрона на Python (для абсолютных новичков)

Введение За последние пару десятилетий было довольно много шумихи вокруг искусственного интеллекта и его приложений. В этой статье мы обсудим, что такое искусственный интеллект и его основное..

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Javascript Development Javascript Tips Cybersecurity Tech Data Development Learning Angular Algorithms ChatGPT Productivity NLP CSS Neural Networks Developer Startup Golang Reactjs Vuejs Reinforcement Learning Computer Vision