Технологии машинного обучения и прокачки искусственного интеллекта продолжают продвигаться семимильными шагами.
Разработчики из OpenAI создали нейросеть DALL·E (одновременно напоминает «ВАЛЛ-И» и Дали – в этом есть логика), которая создает изображения по текстовому описанию.
DALL·E учитывает 12 млрд параметров (цвет, высота, названия предметов, их расположение) – поэтому может создавать как нереалистичных животных, так и фотографичные изображения.
На этом возможности нейросети не заканчиваются: она может понимать сложные абстрактные комбинации, изменять стиль и графику изображений, писать текст. Вроде авокадо-кресла.
Или вывеска магазина с надписью OpenAI.
И улитка в виде арфы.
Несмотря на колоссальные успехи, DALL·E пока не идеальна и не готова обрабатывать слишком сложные запросы.
«По мере ознакомления с большим числом объектов DALL·E начинает путаться в том, какой цвет присущ тому или иному предмету, и результативность резко снижается», – объясняют авторы.
Правда, есть и недовольные. Профессор Технологического института Джорджии Марк Ридл отмечает: если ввести в Google запрос «буррито животные», то поиск выдаст похожие картинки. Нейросеть создавала целую галерею буррито пингвинов.
It turns out that there are a lot of images on Google Image Search of “burrito animals”, including penguins.
Also, google “cartoon daikon”
— Mark O. Riedl (@mark_riedl) January 5, 2021
Тем не менее, Марк все равно отмечает невероятную работу авторов – и пусть нейросеть выдает похожие работы, что и Google. Но никто не отменяет дальнейшего прогресса:
«Способность использовать общие понятия по-новому – это важная составляющая креативности и интеллектуальных способностей в целом».
Подробнее о DALL·E можно прочитать на сайте разработчиков.
Читайте также:
Microsoft выпустила бесплатное приложение, создающее модели ИИ без умения кодить
Нейросеть от Nvidia создает модель лица, которая повторяет слова за вами
Это фитнес-приложение меняет повествование в аудиокниге в зависимости от вашего окружения