Сеть будущего
Сеть будущего
Под словом «Интернет» чаще всего понимают World Wide Web или всемирную паутину. Но это не одно и то же. Сеть Интернет заработала 29 октября 1969 года, а всемирная паутина стала общедоступна в Интернете в 1991. Она является одним из многих сервисов, которые предоставляет Интернет, наряду с почтой, мгновенными сообщениями, голосовой и видеосвязью, файлообменом. Но именно всемирная паутина сейчас стала синонимом интернета, а лежащий в её основе протокол HTTP используется сейчас наиболее широко. И используется, честно говоря, не по назначению. HTTP расшифровывается как «протокол передачи гипертекста». Его автор, Тим Бернерс-Ли, создавал паутину как сеть взаимосвязанных документов, пронизанную гиперссылками. Что-то вроде глобальной библиотеки. Но Интернет уже давно перерос этот этап. Сеть сегодняшнего и завтрашнего дня — это не сеть документов, не библиотека, а чрезвычайно сложная модель реального мира, его полноценное отражение, в котором документы играют лишь незначительную роль. Это — сеть людей, вещей, денег, идей, мест, корпораций, государств, их взаимоотношений и сочетаний.
Современные веб-приложения не имеют почти ничего общего с сайтами пятнадцатилетней давности. Концепция пронизанной гиперссылками глобальной библиотеки давно устарела. Facebook — это не библиотека, так же как и Twitter, Google, Amazon. Сегодня множество сервисов, построенных на базе протокола HTTP, не имеют никакого отношения к гипертексту. Требуется новый набор базовых конструкций, гораздо более общий и универсальный, чем документ и гиперссылка.
Социальность, репутация, электронные платежи и торговые системы, криптография, обмен файлами и сообщениями, хранение и синхронизация файлов в облаках, голосовая и видеосвязь, группы и круги по интересам, поиск, фильтрация и рекомендации в той или иной мере используются практически на каждом достаточно развитом сайте. Некоторые из этих функций, например криптография, уже вошли в состав базовых протоколов, большинство же либо реализуется каждый раз заново силами программистов сайта, либо берется в готовом виде у крупных поставщиков — поиск от Google, социальные кнопки от Facebook, платежи от PayPal. Почти все эти функции пока сильно централизованы и зависимы от воли небольших групп лиц. Чем это угрожает, хорошо было видно на примере истории с преследованием Wikileaks. Во время публикации секретной переписки дипломатов США сайт wikileaks.org подвергся мощной DDoS-атаке, под давлением властей США администратор доменной зоны .org EveryDNS заблокировал его домен, руководство Amazon.com отказалось предоставлять услуги хостинга, Bank of America и платёжные системы PayPal и Moneybookers заморозили счета Wikileaks, Visa и Mastercard заблокировали переводы пожертвований. Сайт продолжал работать только благодаря тому, что добровольцы создали и поддерживали больше тысячи его копий («зеркал») по всему миру. Если бы правительство США смогло ещё и подвергнуть цензуре выдачу поисковых систем, доступ к сайту удалось бы практически полностью перекрыть.
Для сети будущего жизненно необходима децентрализация этих функций. Только тогда сеть не будет разделена корпоративными и государственными границами на легко управляемые и уязвимые сегменты. Только тогда информационные технологии смогут стать прочным фундаментом для нового общественного строя.
То, что в основе архитектуры сети должны лежать распределённые технологии, не исключает наличия крупных и очень крупных сайтов или дата-центров, но снижает зависимость от них, что в конечном итоге может служить гарантией их неприкосновенности. Власть будет понимать, что, закрой сегодня Google, Facebook или Twitter, завтра (буквально завтра!) их место займет распределённая структура. Пусть менее эффективная, но зато без какой-либо возможности контролировать её и договариваться с руководством, по причине отсутствия такового. Само наличие распределенных сервисов будет заставлять власть вести себя лояльно по отношению к крупным интернет-корпорациям. Сейчас крупнейшие узлы в интернете напоминают небоскрёбы посреди пустыни. В будущем они никуда не исчезнут, но их будет окружать «малоэтажная застройка», помогающая им, подстраховывающая и дублирующая их. Так же как и в файлообменных сетях или сети Skype большую часть ресурсов предоставляют компьютеры обычных пользователей, но при этом никто не запрещает за дополнительную плату воспользоваться услугами облачных провайдеров или дата-центров.
Вместо документов ключевым объектом такой распределенной сети может быть более абстрактная единица, назовём её просто «ресурс». Ресурсом может быть всё, что угодно — документ, запись в блоге, файл и даже объект реального мира. Для управления этими ресурсами и их описания используются метаданные. Файл с метаданными, или метафайл должен играть роль, которая сегодня разделена между системой доменных имён, поисковыми системами, торрент-трекерами, Википедией, системами учёта репутации и рейтинга. Это «этикетка», на которой написана вся существенная справочная информация о ресурсе. Такими же «этикетками» или, если хотите «паспортами» можно снабдить учетные записи пользователей или других активных участников сети, обобщённо назовём их «агентами».
Метафайлы и ресурсы, принадлежащие, или имеющие любое другое отношение к конкретному пользователю, могут храниться как в дата-центрах, предоставляющих услуги на коммерческой основе, так и в облаке, состоящем из компьютеров самого пользователя и его друзей, коллег или родственников. Уже сейчас подобную схему используют файлообменные и распределённые социальные сети, например Disapora (http://diasporaproject.org/)
Каждое обращение к ресурсу фиксируется в его метафайле, а сам ресурс, вместе с копией метафайла, некоторое время хранится на том компьютере, хозяин которого обратился к ресурсу. Таким образом, любая востребованная информация многократно дублируется.
С помощью датчиков, сканеров, видеокамер и микрофонов в сеть попадают данные о людях и объектах реального мира — идёт отслеживание истории, так же, как и в случае с ресурсами внутри сети. Уже сейчас существуют многокамерные охранные системы, которые отслеживают историю перемещения объектов между разными камерами. Узлы, снабжённые камерами и датчиками, смогут делать это в масштабах целого города или страны. А так как сеть децентрализована, такая информация не сможет быть монополизирована никем.
Информация о том, какими ресурсами интересуется агент, накапливается и служит для облегчения и ускорения поиска похожей информации в фоновом режиме. Кроме того, такой агент сам начинает помогать другим искать информацию, соответствующую его интересам.
Предположим, что пользователь вводит запрос в строке поиска. Поиск ресурсов, соответствующих запросу, происходит в два этапа. На первом этапе находятся узлы, наиболее близкие семантически к запросу пользователя. На втором — эти узлы возвращают список ресурсов, наиболее релевантных запросу.
Другими словами, если кто-то хочет найти информацию о рыбалке, то он сначала находит агентов, принадлежащих заядлым рыбакам, а потом эти агенты снабжают его всей необходимой информацией. Их авторитет и репутация, заработанные в ходе всей предыдущей сетевой жизни, служат гарантией релевантности выдачи. Поисковый спам в такой системе практически невозможен.
Далеко не всегда можно получить исчерпывающий непротиворечивый ответ. Как правило, по любому вопросу есть несколько разных, часто взаимоисключающих мнений. Было бы неправильно с помощью какого-либо алгоритма пытаться вычислить самое лучшее решение, так как это искажает реальную картинку. Информация о том, что единого мнения не существует — весьма существенна для принятия решения. Пользователя нельзя лишать такой информации. Для выявления таких групп с разными мнениями необходимо проводить кластерный анализ[98], позволяя людям с противоположными позициями не конфликтовать, а конструктивно сосуществовать.
Преимущества кластеризации групп со схожими интересами, но противоположными мнениями еще и в защите от спама и накруток. Любой субъект, пытающийся создать армию виртуалов, мягко и ненавязчиво изолируется от остального мира в своём кластере, где он и его боты могут до посинения плюсовать друг друга и забрасывать постами с рекламными ссылками. То же самое относится и к гиперактивным сетевым сумасшедшим.
В состав информации, содержащейся в метафайлах, могут входить оценки («+1») пользователей. Они могут сопровождаться уточняющими ярлыками или ключевыми словами. Таким образом, формируется репутация агентов и оценки ресурсов, гораздо более совершенные, чем сегодняшние «одномерные» цифровые карма или рейтинг. Во-первых, наличие отдельной цифры по каждому ключевому слову поможет избежать ситуации, когда из-за низкого рейтинга по одному показателю, останется незамеченной высокая оценка по другому. Во-вторых, становится возможным отследить, кто ставит плюсы или минусы, и тем самым исключить возможность случайных флуктуаций, вызванных набегом «толпы хомячков», не разбирающихся в вопросе. Более того, репутация может считаться индивидуально для каждого запроса. Например, некто выбирает врача, у которого хочет лечиться. Система сможет построить цепочку доверия между пациентом и врачом, найдя, среди друзей пациента несколько человек с медицинским образованием, а среди «друзей друзей» — человека, который однажды лечился конкретно у этого врача. Их оценки и отзывы будут иметь гораздо больший вес, чем оценки случайных людей.
Кроме того, сами алгоритмы, по которым будут рассчитываться рейтинги и репутация, можно будет выбирать и сравнивать друг с другом, и даже смешивать результаты в определённых пропорциях. Сомневаешься? Переключись на другой алгоритм рекомендаций и проверь. Вообще не доверяешь алгоритмам? Используй рейтинг, составленный вручную каким-нибудь экспертом или профессиональным сообществом. Примерно как в боксе, когда при одинаковых базовых правилах и технике есть множество версий и форматов соревнований — все эти WBA, WBO и WBC. И точно также как в боксе могут проводиться объединительные бои чемпионов разных версий, можно выбирать, какой алгоритм использовать для обработки общедоступных базовых метаданных. Тогда сразу будет видно, кто есть кто. Будет здоровая конкуренция между алгоритмами.
Сейчас поиск релевантной информации в сети осуществляется либо по доменному имени, либо через Google, либо через структурированные каталоги вроде Википедии, либо пассивно — через стену Фейсбука или твиты. Система метафайлов, формирующих «семантическую карту» сети, сочетает сильные стороны всех этих подходов[99].
Так как поиск происходит в два этапа (сначала — агенты, потом — ресурсы), пользователь в придачу к информации получает и новые связи и контакты — активно интересуясь какой-либо темой, человек автоматически становится частью сообщества, которому эта тема интересна, без необходимости регистрироваться на тематических форумах, вступать в группы и т.д.
Сеть должна вести учет всех своих физических ресурсов (мегабайты, мегабиты и т.д.) и их потребления участниками. Общий баланс сети на сколько-нибудь продолжительном отрезке времени всегда должен сходиться. По аналогии с мегабайтами и мегабитами можно подключить любые другие материальные ценности — доллары, евро, товары, услуги. Для обмена ресурсами нужны биржи и платёжные системы. Встроенная в базовые структуры сети система микроплатежей, микрокредитов и биржа ресурсов позволит практически избавиться от неудобств, связанных с оплатой любого контента и значительно снизить цену на него, а значит — решить проблему пиратства. У подавляющего большинства людей удобство пользования легальной и всеобъемлющей базой цифрового контента перевесит желание сэкономить несколько копеек, скачав бесплатно, и испортить себе репутацию. Необходимым условием работы такой схемы является гарантия того, что цена на любой контент должна оставаться нечувствительной для пользователя, чтобы можно было качать, без опасений получить крупный счёт в конце месяца. Примерно так же как мы сейчас оплачиваем электричество. Цена киловатта — величина практически постоянная.
С другой стороны, в отличие от стандартных киловатт, качество того, что мы качаем в сети, может сильно варьироваться. Чтобы учесть это, можно предусмотреть механизм формирования цены контента в зависимости от его оценок и отзывов. Такой механизм можно назвать краудпрайсингом (англ. crowd pricing).
Итак, уже в ближайшие годы станет возможным создание распределённой информационной системы глобального масштаба, которая будет содержать достаточно точную и подробную модель реального мира, чтобы обеспечить всеобщий учёт и отслеживание людей, предметов и товаров как внутри сети, так и вне её, вычисление многомерной (наподобие параметров персонажа в ролевой игре) и контекстно-зависимой репутации людей и организаций, оплату любых товаров и услуг, финансирование любых проектов, обсуждение и коллективное решение любых вопросов в реальном времени без долгосрочного делегирования власти.
Такая система сделает возможным скачок в развитии человечества, сравнимый по значимости с неолитической революцией. Она станет, фактически, нервной системой нашей планеты, объединив всё человечество в структуру, более прочную, чем любое государство прошлого и настоящего, и при этом несравненно более гибкую и свободную.
Подобно тому как машины и механизмы в тысячи и миллионы раз увеличили физическую силу человека, письменность — объем памяти, а компьютеры — скорость вычислений, такая система сможет на много порядков увеличить число Данбара, превратив всю планету в «глобальную деревню», где все друг друга знают и все друг другу доверяют.
Число Данбара — биологическое ограничение на количество постоянных социальных связей, которые человек может поддерживать. Поддержание таких связей предполагает знание отличительных черт индивида, его характера, а также социального положения, что требует значительных интеллектуальных способностей. Лежит в диапазоне от 100 до 230, чаще всего считается равным 150. Величина названа в честь английского антрополога Робина Данбара, который и предложил это число[96].
Источник: Dunbar, R.i.m. Neocortex Size as a Constraint on Group Size in Primates" [96]