К содержанию



10 years challenge — простая забава или целенаправленный сбор данных?

Опубликовано:19 Янв 2019

Если вы читаете этот пост, то скорее всего вы заметили ставший популярным в сети флешмоб под названием 10 years challenge. Возможно, вы даже приняли в нем участие, разместив в соцсетях свою свежую фотографию и фото десятилетней давности для сравнения. На первый взгляд этот флешмоб выглядит простой безобидной забавой, которыми изобилуют социальные сети. Но так ли это на самом деле?

10 years challenge

Популярная писательница Кейт О’Нил высказала предположение, что флешмоб #10yearschallenge мог быть запущен с целью сбора большого датасета для обучения алгоритмов по распознаванию лиц.

Мне эта идея кажется достаточно правдоподобной. Очевидно, что хорошая технология распознавания лиц должна “уметь” распознать лицо человека даже по прошествии определенного периода времени, за который внешность человека могла измениться. Но как научить алгоритм делать это? Где взять такой датасет, в котором хранились бы фотографии одного и того же человека в разное время, в упорядоченном виде и в хронологическом порядке? Даже если где-то и хранится такая информация (паспортные столы, медицинские учреждения, банки….), вряд ли ее можно просто так заполучить.

А вот соцсети — идеальное место. Пользователи по своей собственной инициативе да еще и с огромным удовольствием формируют такой датасет. Действительно, в результате распространения этого флешмоба в свободном доступе оказались миллионы изображений человеческих лиц по состоянию на сегодня и 10 лет назад, да еще и с множеством мета-данных в виде комментариев где, что и когда. Разумеется, что есть и определенный процент “шума”, но этот процент присутствует в любом датасете.

Кстати, по поводу “шума”. Скептики утверждают, что Facebook, к примеру, и так имел базу фотографий пользователей, в виде аватарок, которые изменялись с течением времени. Но тут есть нюанс в том, что люди не всегда постят аватарки строго в хронологическом порядке, к тому же дата публикации фото в фейсбук далеко не всегда соответствует дате, когда это фото было действительно сделано. Более того, очень часто люди используют вместо фотографий какие-то картинки, карикатуры и прочее. То есть, если бы Facebook или какая-то другая заинтересованная сторона просто выгрузили аватарки людей в хронологическом порядке, такая база данных была бы гораздо менее релевантной и на ее обработку потребовалось бы намного больше времени. А вот правила 10 years challenge четко предусматривают размещение двух фотографий — свежей и 10-летней давности.

Кстати, Facebook отрицает свою причастность к этому флешмобу, утверждая, что это активность придуманная пользователями. Но не нужно быть фейсбуком для того, чтобы придумать эту затею. Это могла быть любая компания, которая заинтересована в использовании распознавания лиц в своем бизнесе. Впрочем, даже если этот флешмоб был придуман кем-то совсем без задней мысли, просто по-приколу, все равно теперь многие могут воспользоваться существующим датасетом, ведь все фотографии теперь находятся в открытом доступе в сети, нужно просто отфильтровать по хештегу.

Стоит ли вам переживать, если вы приняли участие в 10 years challenge и разместили свои фотографии? Что ж, если вы оптимист — можете считать, что вы сделали услугу обществу, внеся свою лепту в усовершенствование технологии распознавания лиц. Если же вы пессимист-”параноик”, как я, у вас точно возникнут идеи на счет того, какие риски несет в себе #10yearschallenge. Кстати, поделитесь своими переживаниями по этому поводу в комментариях.

Поделитесь с друзьями

Понравилась статья? Подписывайтесь на обновления блога

Введите Ваш email: