Плохо рисующая, но стандартная нейросеть AttnGAN

Аналитика >> 20.08.2018, 14:00

Автор блога Автор блога AI Weirdness Джанель Шейн обнаружила странную генеративно-состязательную нейросеть AttnGAN. Она умеет рисовать картинки по текстовому описанию. Ее проблема кроется в том, что она нуждается в слишком точно заданных параметрах изображения и часто не может правильно определить границы заданного объекта.

Джанель отметила, что, пока нейросеть была обучена на узком наборе данных о птицах, она была способна создавать вполне сносные изображения. Но после того, как создатели обучили ее на наборе данных, включающем множество изображений от разных животных до торговых центров, она не смогла создать осмысленную картинку по такому-же описанию. Автор нейросети считает, что ошибка может скрываться в чрезмерно большом наборе исходных данных, в котором она не может подобрать подходящие примеры. К тому же, нейросеть не умеет определять правильное количество отверстий на лице человека. Разработчики добавили в контрольный набор данных лица знаменитостей для того, чтобы нейросеть умела создавать фотореалистичные портреты, но это решение не помогло. Ошибки есть и отображениях животных и текстур их шерсти из-за того, что алгоритм не умеет правильно определять границу и формы объекта.