IBM уже давно перестала считаться компанией, которая связана только с компьютерами. Новое подразделение активно занимается созданием и обучением нейросетей. Недавно IBM использовала почти миллион фотографий с Flickr, чтобы научить свои программы распознаванию лиц. Более того, компания делилась фото с внешними исследователями.
Как сообщает NBC, владельцы снимков не давали своё согласие на обработку. Вряд ли они бы согласились. Всё же эти системы могут в конечном итоге использоваться для наблюдения и распознавания. Вероятно, некоторые фотографы получили разрешение фотографировать этих людей. Однако сами люди не подозревали о назначении фото.
К слову, IBM не собирала фотографии – они являются частью коллекции YFCC100M. 99 миллионов фотографий собрал Yahoo – бывший владелец Flickr – для проведения исследований. Все фотографии были переданы по лицензии Creative Commons: их можно свободно использовать с некоторыми ограничениями.
Однако даже самые разрешающие лицензии Creative Commons не допускают использования фотографий для обучения систем распознавания лиц по этническому признаку. И это не первый пример. IBM ранее сделала продукт для видеоаналитики, который использовал телекамеры для определения рас людей.
The Verge сообщает, что IBM опубликовал заявление: «Мы очень серьезно относимся к конфиденциальности отдельных лиц и уделяем большое внимание соблюдению принципов конфиденциальности». В заявлении отмечалось, что к набору данных могут обращаться только проверенные исследователи. Кроме этого, в коллекции лишь изображения, которые были общедоступными. Представитель компании добавил: «Отдельные лица могут отказаться от присутствия в этой подборке».
Самое смешное, что сделать это непросто. Обычный человек не может узнать, есть ли он в этой базе данных. IBM хранит набор данных в тайне от всех, кто не проводит научных или корпоративных исследований. Тем не менее, NBC удалось добыть данные – в статье можно ввести свой логин Flickr и узнать, попали ли в список.
IBM – одна из нескольких компаний, исследующих область распознавания лиц. И она не одинока в использовании фотографий людей без их согласия. Например, в Facebook хранятся фотографии 800 000 лиц, открытые для скачивания другими исследователями.