Искусственный интеллект кажется всемогущим, но за его точностью стоят миллионы дешёвых рук. В Бангладеш, Индии и на Филиппинах тысячи людей размечают фото и видео, не зная, для кого и зачем. Цена — десять центов за лицо.
Невидимая фабрика ИИ
Образ «всемогущего ИИ», способного к самообучению и принятию решений без участия людей, опирается на одну недосказанность. Перед тем как «машина поймёт», человек должен объяснить, что именно ему необходимо. Платформы вроде Amazon Mechanical Turk, Appen, Scale AI и Яндекс.Толока выдают сотням тысяч «гиг-работников» задания: обвести лицо, отметить эмоцию, расшифровать фразу, распознать объект на фото. Это называется «разметкой данных» — основа любого алгоритма машинного обучения.
На практике каждый ИИ, который «видит» лицо или «распознаёт» номер машины, прошёл обучение на размеченных вручную массивах изображений. «Автоматизация» построена на дешёвом человеческом труде. И этот труд зачастую анонимен и неучтённый.
География цифрового пролетариата
Большинство разметчиков находятся в странах глобального юга — Индия, Бангладеш, Кения, Филиппины. Их объединяет одно: отсутствие социальных гарантий, оплата в диапазоне от 1 до 10 центов за задание, изнурительная конкуренция за копеечные задачи. Каждая такая платформа — рынок труда без правил: субподряд на субподряде, отсутствие понятных условий и невидимость исполнителей.
В расследовании Le Monde показано, как толокеры из Азии и Африки размечали фото для подрядчиков, не подозревая, что участвуют в «обучении» SORM — системы слежки. Если верить этому изданию, их нанимали через подрядные цепочки, без объяснений и прозрачности. Многие были уверены, что работают на нейтральные задачи для обучения ИИ.
Улыбайтесь
Типичные задания включают маркировку лиц, эмоций, жестов, голоса, походки. Иначе говоря — всё, что необходимо для систем распознавания и поведенческого анализа. В открытых описаниях задач на платформах — обтекаемые формулировки: «улучшение качества ИИ», «повышение точности распознавания».
Но итоговое применение может быть куда конкретнее. Известно, что размеченные кадры используются для «умных» городских камер, автоматических турникетов, оценки лояльности клиентов и даже распознавания подозрительной активности. Толокеры обводят — алгоритмы запоминают. Как отметил один из участников опроса для Mozilla Foundation:
Ты не знаешь, кому отдаёшь свои глаза»
.
Этично, но дёшево?
На бумаге всё гладко: любой человек может зарегистрироваться на платформе и выполнять задания. Но на деле это рынок, где отсутствует коллективный договор, невозможна защита прав и недоступен контроль за дальнейшим использованием результатов. Большинство платформ декларируют «этичные принципы», но не несут ответственности за конечных заказчиков.
Цены — отдельная история. Как показано в исследовании Oxford Internet Institute, средняя ставка за задачу по разметке составляет $0.02–0.10, при этом выполнение одного задания может занимать до 5 минут. Учитывая конкуренцию, автоматическое списание средств за ошибки и нестабильность задач, доходы остаются на уровне нескольких долларов в день.
Расплата за ИИ
Такой рынок не просто дешёв — он неравный. Богатые страны строят ИИ-системы, используя труд бедных — так же, как некогда строили колонии. Исследователи цифровой этики всё чаще говорят о «цифровом колониализме»: когда ресурсы — это не нефть или золото, а данные и внимание человека. США, Китай, ЕС, частично Россия — все они эксплуатируют глобальный рынок «гиг-разметки». При этом доступ к ИИ и его выгодам остаётся у одних, а риски и труд — у других. Эта модель воспроизводит старые схемы зависимости, скрывая их за современными терминами.
Самый острый вопрос — кто несёт ответственность за использование размеченных данных. Сегодня это зона серой этики: пользователь подписывает соглашение, но не может отозвать данные, не знает, где и как они применяются, а заказчик остаётся в тени. Можно ли ввести запрет на дешёвую ручную разметку? Вряд ли. Но можно ввести регулирование, требующее раскрытия заказчиков, установления минимальных ставок и прав исполнителя на данные. Пока же толокеры работают вслепую, и их труд используется для целей, о которых они могут даже не подозревать.
Получается, революция в области искусственного интеллекта опирается не на машины, а на миллионы глаз, рук и мышек. Они делают работу, от которой потом зависит, кого пустят в метро, а кого остановит камера. И пока за это платят по десять центов — ответ на вопрос, чьё будущее строит ИИ, остаётся открытым.