Безопасный информационный мир. Часть 2. Big Data

Александр Ягольник
Безопасный информационный мир. Часть 2. Big Data

Стихийное развитие средств распространения информации породило геометрический рост количества сведений, которые получает и передаёт каждый человек. Для того, чтобы не утонуть в этом море информации, а получить из него пользу, разрабатываются специальные программы, которые автоматизируют сбор, сортировку и анализ данных.

Один из таких современных механизмов с большим потенциалом – это Big Data (Большие данные, БД).  Созданный первоначально для совершенствования торговых операций в мировой сети, БД собирает множество запросов отдельных людей, формируя статистически достоверную картину их потребностей. Если вы делаете поисковый запрос «коляска», то скорее всего следующими будут «памперс» и «детская одежда». Первоначально такие связи придумывали люди. Сейчас многое рассчитывается автоматически. После поиска коляски 90% начинали искать памперсы и детскую одежду. Построение таких статистически достоверных связей позволяет прогнозировать действия большинства пользователей сетей и рекламировать им то, что скорее всего они сами хотели бы купить, но ещё даже не успели об этом подумать. БД следит за каждым из нас при каждом заходе в мировую сеть. Это аналог Большого Брата, возникший спонтанно не из политических, а из коммерческих соображений. Любое обращение к любому сайту уже пополняет статистику ваших действий в БД, а специальные программы формируют ваш информационный портрет.
 
Можно ли использовать БД для преднамеренного вреда конкретному человеку? БД – это реально громадный объём информации. При этом, информация формируется хаотически. Движения отдельных участников информационного пространства подобны движениям броуновских частиц. Для того, чтобы рассчитать движение каждой частицы, не хватит мощностей имеющихся компьютеров. Также и запросы отдельного человека проблематично собрать, проанализировать и использовать «в ручном режиме» для нанесения ему вреда.
 
Показательна история системы безопасности ГДР «Штази». Технической возможности этой организации хватило для записи всех телефонных разговоров граждан Восточной Германии. Но некому было расшифровывать, систематизировать, анализировать эти данные. Не зная конкретного человека, не слушая именно его телефон, невозможно было выявить злоумышленника или инакомыслящего, даже имея записи всех его разговоров. Big Data  - это те же «километры плёнки с записями», которые некому читать. Это автоматический собеседник для каждого из нас, который на основе наших же вопросов предлагает нам ответы, не дожидаясь следующего вопроса, а угадывая его. Выходит, БД безопасна? Не совсем.

На основе БД можно сделать следующее:
1) Определить «температуру» информационного пространства, а также среднее направление движения «информационных частиц». Например, можно прогнозировать глобальные потребности в обществе. Если слишком многие спрашивают о колясках, значит, жди всплеска рождаемости. Если слишком многие спрашивают, как сделать коктейль Молотова, значит, жди бунты и революции.
2) Отследить через фильтр определённых запросов специфическую группу участников информационного пространства. Например, отслеживать упоминания в запросах коктейля Молотова и формировать отдельную базу адресов, с которых такие запросы поступали.
3) Формировать «рекламные вбросы».  Спросил человек в сети о памперсах, а ему рекламируют определённого производителя колясок. Или поинтересовался датой выборов, а ему дают рекламу определённой партии и кандидата.

Как видите, начавшись исключительно как маркетинговый инструмент, сегодня БД решает следующий круг вопросов:
• Накопление данных
• Сортировка и анализ данных
• Прогнозирование индивидуальных потребностей на основе массовой статистики
• Накопление персональной информации и формирование потребительского, информационного портрета, прогнозирование потребностей на основе индивидуальной статистики
• Сбор специфических запросов, представляющих опасность для общества
• Прогнозирование потребностей общества, включая не только потребности покупателей, но и социальные, политические потребности
• Влияние на потребителей путём предоставления отобранной, рекламной информации

Сегодня нет прямых свидетельств, что БД используется государствами и спецслужбами в своих целях. Это во многом «вещь в себе». Например, если вы интересуетесь политикой коммунистов, вам предоставят сведения о коммунистических лидерах, если националистов, то националистических вождях. БД будет следовать вашим желаниям, предоставляя попутную проплаченную рекламу. Это, своего рода, течение в информационном океане, которое тем сильнее, чем больше информации в него поступает. Но что мешало в реальном океане использовать энергию течений для путешествий, торговли, войны, грабежа? Только незнание течения и неумение плавать по нему. Несомненно, чем мощнее будет БД, тем больше желающих воспользоваться этой силой в своих целях. Государства будут пытаться взять БД под контроль в меру свой юрисдикции, чтобы понимать, что происходит в обществе, стимулировать выпуск колясок или совершенствовать полицейские броневики. Спецслужбы и злоумышленники попытаются получить максимум информации об отдельных лицах и группах людей, прогнозировать их действия, используя алгоритмы БД. Если сегодня нет программ, позволяющих найти человека по его информационному портрету в БД, то завтра они обязательно появятся. Влияние на пользователей за счёт избирательной рекламы возрастёт многократно. Если сегодня эта реклама слишком инерционна, навязчива и неточна, то завтра вы удивитесь, как она будет попадать в ваше настроение и соответствовать вашим планам. Научившись доверять ей, вы разучитесь самостоятельно искать и анализировать информацию. И тогда вами будет управлять тот, у кого будет больше денег на рекламу коммерческую или политическую.

Как защитить себя от БД? Главный источник информации о вас – это ваши запросы в сети, привязанные к вашему адресу. Уже сегодня есть спрос на анонимность в сети. Конечно, эта анонимность весьма условная и примитивная. Отказываясь от персонализации в БД вы теряете все плюсы от её применения. С другой стороны, многие ваши запросы сами по себе выдают ваше местоположение. Вряд ли австралиец с австралийского адреса будет интересоваться заказом пиццы в Санкт-Петербурге в России. И всё же есть запросы, которые вы бы не хотели привязывать к себе лично, когда вам не нужны дальнейшие советы и столь интимная детализация вашего информационного портрета. Пока вам приходится надеяться на анонимайзеры, как в виде дополнений к браузерам, так и встроенные в них. Но что будет дальше?
Человечество привыкло учится на жертвах. Когда при помощи БД сделают несколько государственных переворотов, совершат громкие ограбления, осудят инакомыслящих и разорят конкурентов, люди потребуют на уровне национальных и международных законов ограничить сбор данных БД, сделать их прозрачными по составу собираемых данных и ввести уголовную ответственность за анонимный сбор данных и принуждение к предоставлению данных, которые не обязательны для оказания информационной услуги. В идеале человек может сам решать, какие данные предоставлять автоматическим сборщикам типа БД, а какие не будут собираться ни при каких обстоятельствах. Во всех браузерах это должно быть реализовано на уровне простых и понятных настроек. По умолчанию, любой сбор данных о человеке через браузер должен быть отключён.
 
Но информационная опасность подстерегает нас не только извне, но и изнутри. Мы сами можем превратить свою жизнь в персональный ад благодаря информации. Что такое «информационная клетка» я расскажу в следующей статье.