IBM открыла доступ к базе для обучения алгоритмов

Технологии >> 30.01.2019, 16:11

В базе IBM содержится в разы больше фото с аннотациями, чем у конкурентов. Главной целью компании является избавление искусственного интеллекта (ИИ) от предвзятости, а также обучение алгоритмов в равной степени распознавать европеодидов и меньшинства.

На сегодня распознавание лиц входит в число наиболее бурно развивающихся приложений ИИ. Эксперты прогнозируют, что уже в ближайшей перспективе решения нейросетей отразятся на жизнях миллионов людей, поскольку главным потребителем выступают госструктуры.

Скептиков в связи с этим волнует предвзятость алгоритмов. Именно поэтому IBM взялась за усовершенствование ИИ при помощи огромного массива данных с фото. Базы данных – ключевой источник, на основании которого алгоритмы делают выводы.

CNBC сообщает, что искажение информации в случаях с лицами происходит регулярно. В 2018-м даже нейресети IBM в 35% выдавали ошибку при распознавании женщин со смуглой кожей, тогда как белых мужчин идентифицировали надежно. После этого IT-гигант решил исправить ситуацию и в итоге опубликовал репрезентативную базу фото, размеченную специально для обучения.

Фотоколлекция Fikr насчитывает 100 млн. изображений, но разработчики IBM миллион и создали попутно отдельный тестовый датасет из 36 тыс. лиц, равномерно распределив их по возрастам и этносам. Но главный исследователь компании Дж.Смит считает, что и миллиона фото недостаточно для отражения разнообразия мира, технологию следует пополнять разнообразными обучающими данными.