Про свободу, которой у нас больше нет
Люди медленно и плохо считают, зато замечательно распознают образы. А что делают компьютеры? Компьютеры считают быстро и без ошибок, но образы распознают не очень хорошо. Значит, что мы стремимся сделать? Мы стараемся создать нейронные сети, которые бы распознавали образы и определяли корреляции так же хорошо, как это делаем мы.
При этом мы сами не очень понимаем, как наш мозг работает.Если нейронные сети будут обладать такой же структурой, как наша голова, тогда компьютеры будут делать все то же, что делаем мы. При этом заметьте, что человеческая голова – это звучит красиво – работает на 3 или 4% от того, как могла бы работать.
Получается, что на меньшем количестве нейронных сетей нам удастся добиться того, что сейчас получается, когда доходит до нашего мышления. Преподаватели русского языка поставили бы мне двойку за такие выражения, но все так и есть.
Когда нейронные сети стали более развитыми, в Google придумали платформу, которая называется Tensor Flow. Она позволяет строить нейронные сети и обучать их с целью распознавания образов. И, что самое важное, здесь можно проследить корреляции. Есть еще Spark neural networks, сейчас все это активно развивается.
Непонятно, будем ли мы, как человечество, довольны этим, потому что мы абсолютно потеряли нашу прайваси. Прайваси – это не безопасность, это свобода. Именно ее мы и потеряли. Мы ее потеряли безвозвратно и навсегда. Я докажу вам это на нескольких примерах.
Пример 1. Дьявольское устройство
Каждый из нас носит дьявольское устройство в кармане. Когда вы покупаете это устройство, вы как бы заключаете договор с государством.
Договор такой: нам разрешают звонить, обмениваться сообщениями и так далее, но за это мы разрешаем государству знать, где мы находимся. Даже когда ваш телефон выключен, это не имеет абсолютно никакого значения. Государство знает, где вы находитесь 24 часа в сутки.
Есть еще такая штука, называется GPS, она есть и в машинах, и в телефонах. Государство знает, где мы находимся, с точностью до метра 24 часа в сутки. Но это еще не все.
Пример 2. С Google вы всегда откровенны
Сейчас я вам расскажу, как мы теряем прайваси. У нас по закону не имеют права прослушивать телефонные разговоры. Я думаю, что этот закон не нарушается, потому что это ведет к большим проблемам. Телефоны не прослушиваются. Если простой американец звонит за границу, то все разговоры записываются, машина анализирует их, но это другой разговор. Что важно – это meta data: кто звонил, куда звонил, откуда и длина разговора.
Если у вас имеется огромное количество meta data, то вам даже не нужно знать содержание разговора, чтобы понять, о чем разговор.
У вас есть огромное количество data basis, и это все meta data. В математическом смысле слова большое количество meta data и все корреляции, которые там прослеживаются, асимптотически приближены к тому, что вы бы услышали в разговоре.
Разбираем кейс... Итак, вы немножко заболели. Что вы делаете?
- При условии, что у вас есть компьютер. Вы идете в Google. Вбиваете туда все симптомы. При этом, если кому-нибудь вы могли бы и соврать, то с Google вы всегда откровенны.
- Вы написали все симптомы. Это одна data, которую Google запомнит навсегда. Что вы делаете дальше?
- Вы звоните врачу с целью прийти и полечиться. Позвонили врачу, очень хорошо, известно, когда вы звонили, известно, как долго вы разговаривали.
- После этого вы пришли к врачу. Врач вам выписал лекарства. Вы пошли в аптеку и заплатили вашей кредитной картой. Абсолютно вся эта информация сохраняется.
- Потом ваш врач отправил вас еще к какому-нибудь специалисту. И к нему вы тоже записались и тоже прогуглили все, что касается того, что вам сказал врач. Вся эта информация соединяется и коррелируется.
Где мы здесь потеряли прайваси? Не там, где появляются конкретные данные о каждом факте, а там, где это все коррелируется.
Еще кейс
Представьте себе ситуацию, что вы работаете в каких-нибудь специальных службах государства. И вы получили информацию, что человека, который вам нужен, видели в ресторане две недели назад, потом на каком-то вокзале и еще где-то в кинотеатре.
Вывод: вы мгновенно понимаете, кто этот человек.
Делается это так:
- Вам известно, что человек в такой-то день был в ресторане. Берутся записи абсолютно всех трансляционных вышек, а у вас там 120 000 телефонных номеров.
- Через две недели нужного человека видели на каком-то вокзале – вы берете вышку рядом с вокзалом, там есть еще 80 000 номеров.
- И, наконец, кино. Вероятность того, что еще один человек побывал во всех трех местах равна нулю. Поэтому вам выскакивает уже один номер телефона.
Теперь о нашем будущем...
Наше будущее очень светлое. Оно заключается в следующем: вы идете по улице, навстречу вам идет человек. Вы хотите познакомиться с этим человеком, расстояние 50 метров. Вы смотрите на ваш телефон. Там вся информация об этом человеке: имя, фамилия, отчество, где живет, женат – не женат. Болел: да – нет. Если да, то чем. Это все будет максимум через 10 лет.
Дальше вы хотите пойти в магазин, открываете дверь, входите, на вас внимательно смотрит продавец. У него в телефоне полная информация о вас. А главное – какой у вас доход. Потому что в зависимости от дохода вам будут предлагать разные товары.
Например, вчера я гулял по Малой Бронной и видел такое количество Майбахов, какое за 30 лет жизни в Америке не видел. Так вот, если вы заходите в магазин дилера, то продавец вместо Toyota сразу предложит вам Майбах. По-английски это называется pointed advertisement – когда вы совершенно точно знаете, кто ваш клиент и чего он хочет, еще до того, как он появился. Я считаю, что это полная потеря прайваси.
Про security, которая скоро исчезнет
На самом деле, с точки зрения философии, общество должно определять направление развития технологии. Но у нас развитие технологий диктует развитие общества. Это я говорю про Америку. Теперь поговорим о security. Вообще, моя область – это криптография. И я был математиком. Вся компьютерная security основана на hash functions.
Это сейчас называется cryptographically secure hash functions:
1. One way functions. Когда вы знаете, куда отобразилось, но никогда не можете вернуться обратно. Математически это возможно, а с точки зрения вычислений – нет.
2. Паблики infrastructure. Public key и private key, которые определяют и доказывают всем, что вы – это вы. Ваше лицо никто не видит, но в каждой компании имеется свой digital certificate, и вы его предъявляете.
– Как вас зовут?
– Мона.
– А я что-то неуверен, что вас зовут Мона. У вас доказательства есть?
– Паспорт.
– Паспорт, выданный государством? Если паспорт выдан государством, а я государству доверяю, то вы Мона. А если не доверяю, то я не знаю, кто вы.
То же самое происходит тут.
Когда же речь заходит о blockchain и криптовалютах, то там нет никого, кому бы вы доверяли. Поэтому, с моей точки зрения, это дань моде, которая продиктована биткоинами. Люди думают, что он стоил 5 центов, а скоро будет стоить 120 тысяч. Но вся эта структура совсем не дает вам сто процентов уверенности.
Так вот, digital certificates просто доказывают, что ваш компьютер – тот компьютер, с которым вы хотите иметь дело. Еще бывает такая вещь, как none rejudiation – это когда вы написали банку, что ему нужно вам заплатить, он заплатил, а вы говорите: «Нет-нет, я ничего не получил». Так вот чтобы такого не было, существует publicy cryptography.
И вдруг возникает проблема. Это квантовые компьютеры
Для меня это катастрофа, потому что мои два курса по криптографии улетают. Не будет больше той криптографии, которая есть. Люди, которые покупают вещи по интернету, не смогут этого делать. Вся зашифрованная информация будет расшифрована в доли секунды.
Был такой замечательный человек Питер Шор. Он в 1994 году просто доказал, что квантовые компьютеры очень скучные с точки зрения того, из чего они состоят. Они состоят из нулей и единиц, больше там ничего нет. У вас имеется эта единица информации. Это бит. Он либо ноль, либо один. Q-бит – это фотон, который одновременно находится и в состоянии 0, и в состоянии 1. И вы знаете только вероятность, с которой он 0 или 1. И выясняется, что если всего этих Q-битов несколько сотен, то вся security, которая у нас есть летит.
Теория решеток
По-английски есть такое выражение «лететь к черту в ручной корзинке». Так вот, в этой корзинке криптография улетает. И тут выясняется, что у нас еще есть некая схема. Или даже не схема, а теория решеток. Быстро объясню, что такое решетка. Те, кто никогда не имели дела с линейной алгеброй, могут меня не понять.
Представьте себе ваше двухмерное пространство, то есть плоскость. У вас имеется два вектора. Два вектора, оба выходят из нуля. Каждый из них вы будете умножать на целые числа, положительные и отрицательные. У вас получится такая прямая, две прямых и разбитые точечки. Потом все многообразие векторов, которое вы получили, вы начинаете складывать. Результат – решетка.
Выясняется, что если ваш базис, то есть вот эти два вектора, не ортонормированные, то есть не ортогональные, не длиной единица, то найти самый маленький вектор в такой решетке является невероятно сложной математической задачей. При условии, что размерность не два, а пятьсот.
Когда эти квантовые компьютеры, даже с не очень большим количество Q-битов, применили к моделированию сложных систем, то все выводы, которые можно вынести из этих моделей с помощью обычного компьютера, были также получены с помощью квантового компьютера.
Но там квантовый компьютер обнаружил то, что другие компьютеры не обнаруживали. Оказывается, в сложных системах есть такие практически бесконечные колебания. Они маленькие, но почти бесконечные. И это то, чего мы как раз всегда знали.
Простой пример – берем семью
Семья – сложная система, потому что поведение в семье значительно сложнее, чем ее структура. И как это бывает, в этой системе возникают возбуждения. Это ссоры. Они проходят, но некоторые колебания остаются. Это называется «злоба прошла, а осадочек остался». Так вот этот «осадочек» — это те колебания, которые позволили определить использование квантовых компьютеров.
Бояться особо нечего, но придется все перестраивать. Сейчас самые мощные квантовые компьютеры имеют в себе 51 Q-бит. С помощью этого компьютера удалось разложить на множители огромное число – 15. 15 разложили на 5 и 3. Кстати, RSA, на котором, считай, вся security держится, достаточно простой.
Для непосвященных: вы придумываете два громадных простых числа. Простое число – это число, которое простое. Каждое число больше, чем жизнь. Вы их перемножили, и то, что вы получили, называется security parameter, выясняется, что разложить это число назад не удается, при условии, что люди правильно подобрали эти простые числа. Они даже называются strong primes – «сильные простые числа».
Сильное простое число – это когда вы считаете его единицу, она, разумеется, четная. Она начинает уже делиться на что-то. И один из множителей этого числа тоже должен быть громадным. И это все идет, идет, идет… Так вот выясняется, что это все полетит, потому что квантовый компьютер будет раскладывать числа на множители в 1 секунду.
А где будущее Big Data?
Будущее в том, что все нейронные сети будут совершенствоваться, они будут более мощными. Мы будем делать намного более мощные вычисления. Для биологии и медицины это совершенно замечательно, потому что лекарства будут тестироваться вне человеческого организма и тестироваться намного быстрее. Это очень хорошо.
При этом мы абсолютно потеряем нашу прайваси. Ее просто не будет. Слово будет, а смысла, который оно несет, не будет. Я пытался придумать слово, которое есть, но смысла его для меня уже нет. Это слово «граммофон». Эта же судьба ждет и слово «прайваси».
Возвращаясь к Big Data, самое большое значение будет иметь интеграция разных платформ, если не брать в расчет нейронные сети. Big data будет вылавливать закономерности и корреляции. Вопрос в том, а что они будут означать. У вас имеется огромное количество данных, компьютер описал закономерность, а что это означает, с точки зрения здравого смысла? Это отдельная проблема.
Закономерностей в мире множество, но что-то мы просто не понимаем. Например, такая закономерность: поездка в метро от одной станции до другой занимает 11 минут, а мороженое стоит 50 рублей. Имеет ли это какой–то смысл?
Глупый пример, но такая закономерность тоже может быть выявлена. Это то, что нас ждет в будущем.
Благодаря сервису Penxy мы можем поделиться с вами презентацией Анатолия, которую можно не просто посмотреть, но и послушать:
После выступления аудитория задала Анатолию вопросы через специальный сервис WhenSpeak. Мы публикуем «публичное интервью» со спикером.
Вопрос 1. Сейчас много где пишут про алгоритм Шора и как он плохо повлияет на криптографию. А разработаны ли сейчас или разрабатываются какие-то алгоритмы на основе квантовых вычислений, новые технологии шифрования?
– Для человека, математически не предрасположенного, вы можете представить себе месседж, который вам нужно зашифровать, одной звездой. Что вы делаете? Вы добавляете к ней маленький вектор. И звезда плюс вектор – зашифрованное сообщение. Как происходит расшифровка? Вот у вас звезда плюс вектор – зашифрованное сообщение – вы должны из этого сообщения найти вектор, который был бы наиболее близким к нему. Вот это была бы расшифровка. И она сейчас возможна при условии, что ваша public key – базис нормальный, ортонормированный, а ваша private key – базис абсолютно жуткий. И математически доказывается, это тяжелая задача. Это одно направление, с которым я знаком. Про другие направления я практически ничего не знаю, и они мне неинтересны.
Вопрос 2. Что делать? Что надо скрывать уже сейчас, кроме пин-кода от карты?
– Я думаю, что имеет смысл внутренне расслабиться. Вы ничего не сможете скрыть, как бы вы ни старались. Спрятаться невозможно, даже не пытайтесь. Но дружеский совет: постарайтесь не нарушать закон. Если вам удастся, будете all set.
Вопрос 3. Что вы думаете о блокчейне и биткоине?
– Что касается блокчейна, я считаю, что это мода. Это работает так: когда подсоединяется новый блок, его содержание переходит в предыдущие блоки. Его содержание даже не переходит, но от его содержания берется криптографический hash function, поэтому если в предыдущих блоках что-то меняется, это всем будет известно. Кроме того, там все равно идет public key и private key. Я на это смотрю как на маленький кусочек криптографии, я не знаю, что с этим будет.
У меня на работе есть человек, который мировая величина в этом деле. Я ему задал перед отъездом этот же вопрос. И он мне ответил: «На эту глупость я даже времени не хочу тратить».
Тем не менее это distributed trust. В какой степени он надежен, это другой вопрос. Понятно, что hash function абсолютно не позволит изменить что-либо в предыдущих блоках без того, чтобы об этом узнали все люди. Вот люди делают на этом деньги.
Вопрос 4. Вы говорите, что общество должно определять направление развития технологий. С другой стороны, вы говорите, что прайваси исчезнет. Это общество выбрало
– Что значит «люди выбрали»... Это очень маленькое количество людей. Когда делается технический прогресс, люди делают то, что можно сделать сейчас, не зная, куда это приведет. Я думаю, это не изменится. Когда придумали пенициллин, никто его специально не придумывал, результат случайно оказался такой.
Если удастся придумать вакцину от ВИЧ, это тоже будет случайный побочный результат. То же с теоремой Ферма, которую случайно доказали, это был результат теории, которая не имела к этому отношения. Это слепой подход. Мы делаем то, что можем делать сегодня, чтобы завтра делать больше и лучше. Но, что будет послезавтра, мы не знаем. Мы понятия не имеем, куда мы идем, как общество.
Материалы по теме:
О чем говорили «технари» на Big Data Conference 2017
Хорошие и плохие способы использовать машинное обучение в предвыборной кампании
Что большая четверка мобильных операторов делает с нашими данными
Технологии «Зарядья»: кто стоит за «умной навигацией» по парку
Будущее маркетинга – неужели все дело в данных?
Зачем изучать большие данные: рассказывает эксперт в ИТ и криптографии Анатолий Темкин