StatisticalMechanicsOfComplexNetworks(by Barabasi)

ОБЗОРЫ СОВРЕМЕННОЙ ФИЗИКИ, ТОМ 74, ЯНВАРЬ 2002 Статистическая механика сложных сетей Réka Albert* и Albert-Lászlό Barabási Отдел физики, университет , Notre Dame, Notre Dame, Indiana 46556 (опубликовано 30 января, 2002) Сложные сети описывают большое разнообразие природных и социальных систем. Часто приведенные примеры включают ячейку, сеть химических веществ, связанных химическими реакциями, и интернет, сеть маршрутизатор и компьютеры, соединенные физическими связями. В то время как по традиции эти системы моделировались как случайные графы, широко признано, что топология и эволюция реальных сетей управляются прочными организационными принципами. Эта статья просматривает последние продвижения в области сложных сетей, фокусирующиеся на статистической механике сетевой топологии и динамики. После просмотра эмпирических данных, которые мотивировали недавний интерес к сетям, авторы обсуждают основные модели и аналитические средства, покрывающие случайные графы, сети, без окалины и small-world сети, возникающую теорию развивающихся сетей, и взаимодействие между топологией и устойчивость сетей к сбоям и атакам. Содержание Введение .......................................................................................................................................3 I. Топология реальных сетей: эмпирические результаты ........................................................5 II. Всемирная сеть ...............................................................................................................................5 Интернет ..........................................................................................................................................6 Сеть сотрудничества фильмов и актеров .....................................................................................9 Сеть научных сотрудничеств ........................................................................................................9 Сеть половых контактов человека ................................................................................................9 Клеточные сети .............................................................................................................................10 Сети телефонных звонков ...........................................................................................................10 Сети цитат .....................................................................................................................................11 Лингвистические сети ..................................................................................................................11 Энергетические и нервные системы ...........................................................................................11 Белковое свертывание ..................................................................................................................12 III. Теория случайных графов .....................................................................................................12 Модель Erdős – Rényi ...................................................................................................................13 Подграфы ......................................................................................................................................14 Эволюция графов .........................................................................................................................16 Распределение степеней ..............................................................................................................17 Связность и диаметр ....................................................................................................................18 Коэффициент кластерации ..........................................................................................................19 Спектр графа .................................................................................................................................20 IV. Теория протекания .................................................................................................................22 Интересные величины в теории протекания .............................................................................22 Общие результаты ........................................................................................................................23 Точные решения: протекание в дереве Кэли .............................................................................24 Масштабирование в критических областях ...............................................................................26 Структура кластера ......................................................................................................................26 Бесконечномерное протекание ...................................................................................................27 Параллели между теорией случайных графов и протеканием ................................................27 Обобщенные случайные графы ............................................................................................28 V. Предел в случайных графах, не зависящих от масштаба .........................................................29 Формализм функции генерации..................................................................................................30 Случайные графы с распределением степеней по степенному закону ...................................32 Двудольные графы и коэффициент кластеризации ..................................................................33 VI. Сети малые миры ...................................................................................................................34 Модель Уотса-Строгатса .............................................................................................................35 Свойства small-world сетей .........................................................................................................36 1. Средняя длина пути..............................................................................................................37 2. Коэффициент кластеризации ..............................................................................................39 3. Распределение степеней ......................................................................................................39 4. Спектральные свойства ......................................................................................................40 VII. Безмасштабные (scale-free) сети .............................................................................................41 A. Модель Барабаси-Альберта (Barabási–Albert (BA) model) ................................................41 B. Теоретические подходы ..........................................................................................................42 C. Предельные случаи BA-модели ............................................................................................45 D. Свойства BA-модели ...............................................................................................................46 1.Средняя длина пути...............................................................................................................46 2. Соотношения степеней узлов ..............................................................................................47 3.Коэффициент кластеризации ...............................................................................................48 4.Спектральные свойства ........................................................................................................49 I. Введение Сложные сетевые структуры описывают широкий спектр систем высокотехнологической и интеллектуальной важности. Например, клетка наилучше описывается как сложная сеть химических элементов, связанных химическими реакциями; интернет _ сложная сеть маршрутизаторов и компьютеров, соединенных различными физическими и беспроводными связями; причуды и идеи, распространенные в социальных системах, узлами которых являются люди, а ребра представляют различные социальные связи; всемирная паутина есть огромная сеть веб-страниц, связанных гиперссылками. Эти примеры лишь несколько из того множества, которое подсказало научной общественности исследовать механизмы, которые определяют топологию сложных сетей. Желание понять такие переплетенные системы столкнулось со значительными трудностями. В физике разработан целый арсенал успешных средств для предсказания поведения системы в целом исходя из свойств ее составляющих. Мы теперь понимаем, как магнетизм возникает из коллективного поведения миллионов частиц, или как квантовые частицы приводят к такой выдающейся феномене как конденсация Бозе-Эйнштейна или сверхтекучести. Успех таких попыток моделирования основан на простоте взаимодействий между элементами; нет никаких неясностей о том, какой элемент с каким взаимодействует, а сила взаимодействия одинаково определяется исходя из физического расстояния. Тем не менее, для нас затруднительно описать системы, для которых физическое расстояние неуместно или неясно, взаимодействуют ли два компонента. В то время как для сложных с нетривиальными топологиями сетей такая неясность естественно присутствует, в последние несколько лет мы осознали, что средства статистической механики предлагают идеальный каркас для описания таких переплетенных систем. Такие развития представили новые проблемы для статистической физики и неожиданные связи с главными темами в физике конденсированных сред, от процеживания до конденсации Бозе-Эйнштейна. Традиционно изучение сложных сетей являлось делом теории графов. В то время как теория графов изначально специализировалась на регулярных графах, с 1950-х обширные сети с отсутствием явных принципов построения были описаны как случайные графы, которые предлагались как самая простая и непосредственная реализация сложных сетей. Случайные графы были впервые изучены венгерскими математиками Полом Эрдосом и Алфредом Ренйи. Согласно модели Эрдоса-Ренйи, мы начинаем с N вершин и соединяя каждую пару вершин с вероятностью 𝑝, создавая граф приблизительно с 𝑝𝑁(𝑁 − 1)/2 случайно выбранными ребрами. Со времени своего представления эта модель была путеводительной для нашего представления сложных сетей в течение десятилетий. Однако растущий интерес к сложным сетям подсказал многим ученым пересмотреть эту парадигму моделирования и задать единственный простой вопрос: действительно ли реальные системы за такими разнообразными сложными сетями, как клетка или интернет, являются абсолютно случайными? Наша интуиция подсказывает о том, что сложные системы должны демонстрировать некоторые принципы организации, которые в какой-то степени должны быть зашифрованы в их топологии. Но если топология этих систем на самом деле отклоняется от случайного графа, то нам нужно развить средства и системы мер для фиксирования лежащих в основе организационных принципов в количественных терминах. В последние годы мы засвидетельствовали существенное продвижение в этом направлении, вызванное несколькими параллельными развитиями. Во-первых, компьютеризация процесса приобретения информации во всех сферах привело к появлению больших баз данных о топологии различных реальных сетей. Во-вторых, увеличившиеся вычислительные возможности позволили нам исследовать сети, содержащие миллионы узлов, анализируя вопросы, которые раньше невозможно было затронуть. В-третьих, медленное, но видимое стирание границ между дисциплинами дало ученым доступ к разнообразным базам данных, тем самым давая им возможность раскрыть характерные свойства сложных сетей. И напоследок, есть возрастающая надобность перейти за границы редукционистических подходов и попробовать понять поведение системы как целого. Если придерживаться такой стратегии, понимание топологии взаимодействий между компонентами, т. е. сетями, неизбежно. Исходя из этих стремительных развитий и обстоятельств, многие новые концепции и меры были предложены и тщательно исследованы в последние годы. Как бы то ни было, три концепции занимают важнейшее место в современном представлении сложных систем. Ниже мы определим и вкратце обсудим их, с более подробным обсуждением в последующих разделах. Маленькие миры: Концепция маленьких миров, в простых терминах, описывает тот факт, что, несмотря на частые большие размеры, в большинстве сетей путь от одного узла к другому сравнительно небольшой. Расстояние между узлами определяется как количество ребер в наикратчайшем пути, соединяющем их. Самым распространенным примером маленького мира является концепция “шесть градусов разделения”, обнаруженная социальным психологом Стэнли Милграмом (1967). Последний пришел к выводу, что между любыми двумя людьми, живущими в США (Кочен, 1989) есть путь знакомств с типичной длиной примерно в шесть человек. Многие сложные сети характеризуются свойством маленьких миров: актеры в Голливуде находятся друг от друга в среднем в пределах трех человек, или химические элементы в клетке обычно разделены тремя химическими реакциями. Концепция маленьких миров, будучи очень занимательной, не является индикатором определенного принципа организации. В самом деле, как показали Эрдос и Ренйи, типичная дистанция между любыми двумя вершинами в случайном графе оценивается как логарифм количества вершин. Таким образом, случайные графы также являются маленькими мирами. Кластерация: Клики, представляющие круг друзей или знакомых, в котором каждый член знает любого другого, являются распространенным свойством социальных сетей. Эта неотъемлемая тенденция образовывать группы измеряется коэффициентом кластерации (Уоттс и Строгатс, 1998). Данная концепция исходит из социологии, где имеет название “разрыв транзитивных троек” (“fraction of transitive triples”) (Вассерманн и Фауст, 1994). Рассмотрим фиксированную вершину 𝑖, имеющую 𝑘𝑖 ребер, которые соединяют ее с 𝑘𝑖 вершинами. Если ближайшие соседи этой вершины были бы частью клики, то между ними было бы 𝑘𝑖 (𝑘𝑖 − 1)/2 ребер. Соотношение между количеством ребер 𝐸𝑖 , которые реально существуют между этими 𝑘𝑖 вершинами и общее число 𝑘𝑖 (𝑘𝑖 − 1)/2 дает нам значение коэффициента кластерации вершины 𝑖, 𝐶𝑖 = 2𝐸𝑖 𝑘𝑖(𝑘𝑖−1) (1) Коэффициент группирования всей сети есть среднее всех отдельных 𝐶𝑖 . Альтернативное определение коэффициента кластерации, которое часто используется в литературе, обсуждено в Sec. VI.B.2 (Баррат и Уэйт, 2000; Ньюман, Строгатс и Уоттс, 2000). В случайном графе, т. к. ребра распределены случайным образом, коэффициент кластерации имеет величину 𝐶 = 𝑝 (Sec. III.F). Тем не менее, в большинстве, если не во всех, реальных сетях коэффициент кластерации намного больше чем в соизмеримой случайной сети (т. е. имеющей то же количество вершин и ребер, что и реальная сеть). Распределение степеней: Не все узлы в сети имеют то же самое число ребер (степень узла). Разброс степеней узлов характеризуется функцией распределения 𝑃(𝑘), которая дает вероятность того, что случайно выбранный узел имеет ровно 𝑘 ребер. Т. к. в случайном графе ребра распределяются случайным образом, большинство узлов имеет приблизительно ту же степень, которая близка к средней для всей сети степени ⟨𝑘⟩. Распределение степеней случайного графа является распределением Пуассона с пиком 𝑃(⟨𝑘⟩). Одним из самых интересных развитий нашего понимания сложных сетей является открытие того, что для доминирующей части больших сетей распределение степеней значительно отступает от пуассоновского. В частности, для большого количества сетей, в том числе и всемирной сети (Альберт, Йонг и Барабаси, 1999), интернета (Фалоутсос, 1999), или метаболических сетей (Йонг и другие, 2000) распределение степеней имеет хвост со степенным законом, 𝑃(𝑘) ~ 𝑘 −𝜆 . (2) Такие сети называются свободными от масштаба (Барабаси и Альберт, 1999). В то время как некоторые сети имеют экспоненциальный хвост, функциональная форма 𝑃(𝑘) все же значительно отступает от Пуассоновского распределения, ожидаемого для случайного графа. II. Топология реальных сетей: эмпирические результаты Изучение большинства сложных сетей было вызвано желанием понять различные реальные системы, от коммуникационных сетей до экологических. Таким образом, доступные для исследования базы данных обхватывали несколько дисциплин. В этой части мы кратко обозрим те сети, которые были изучены исследователями с целью раскрыть общие свойства сложных сетей. Помимо описания баз данных, мы также обратим внимание на три сильные меры топологии сети: средняя длина пути, коэффициент кластерации, и распределение степеней. Другие числовые значения, как обсуждено в последующих частях, будут также тестированы на этих базах данных. Свойства исследуемых баз данных, а также применяемых образцов, подытожены в таблицах I и II. Таблица I. Общие характеристики некоторых реальных сетей. Для каждой сети мы отметили количество узлов, среднюю степень ⟨𝑘⟩, среднюю длину пути 𝑙 и коэффициент кластерации 𝐶. Для сравнения мы включили среднюю длину пути 𝑙𝑟𝑎𝑛𝑑 и коэффициент кластерации 𝐶𝑟𝑎𝑛𝑑 случайного графа той же величины и с той же средней степенью. Числа в последнем столбце закреплены с символами на рисунках 8 и 9. Всемирная сеть Всемирная сеть представляет собой самую крупную сеть, для которой информация о топологии в данное время доступна. Узлами сети являются документы (веб-страницы), а ребра _ гиперссылки (URL-ы), которые ведут от одного документа к другому (смотри рис.1). Размер этой сети в конце 1999-го года составлял примерно один миллиард (Лоуренс и Гилс, 1999). Интерес к всемирной сети во многом возрос после того, как было открыто, что распределение степеней вебстраниц подчиняется степенному закону над несколькими порядками величин (Альбер, Йонг и Барабаси, 1999; Кумар и др., 1999). Т. к. ребра во всемирной сети имеют направление, сеть характеризуется двумя распределениями степеней: распределение выходящих ребер, 𝑃𝑜𝑢𝑡(𝑘), обозначает вероятность того, что у документа есть 𝑘 гиперссылок, и распределение входящих ребер, 𝑃𝑖𝑛(𝑘), есть вероятность того, что 𝑘 гиперссылок указывают на конкретный документ. Несколько исследований показали, что и у 𝑃𝑜𝑢𝑡(𝑘), и у 𝑃𝑖𝑛(𝑘) хвосты подчиняются степенному закону: 𝑃𝑜𝑢𝑡(𝑘)~ 𝑘 −𝜆𝑜𝑢𝑡 и 𝑃𝑖𝑛(𝑘)~ 𝑘 −𝜆𝑖𝑛 . (3) Альберт, Йонг и Барабаси (1999) изучили подмножество всемирной сети, содержащее 325 729 узлов, и обнаружили, что 𝜆𝑜𝑢𝑡 = 2,45 и 𝜆𝑖𝑛 = 2,1. Кумар и др. (1999) использовали кроль Алекса Inc., состоящий из 40 миллионов документов, и получили 𝜆𝑜𝑢𝑡 = 2,38 и 𝜆𝑖𝑛 = 2,1 (см. также Клейнберг и др., 1999). Последующее рассмотрение топологии всемирной сети Бродером и др. (2000) использовало два 1999 кролей Алтависта, содержащих в общей мере 200 миллиона документов, и обнаружили, что 𝜆𝑜𝑢𝑡 = 52,72 и 𝜆𝑖𝑛 = 52,1 с масштабом, близким к пяти порякам величин (рис. 2). Адамик и Хьюберман (2000) использовали несколько другое представление всемирной сети, где каждый узел представлял отдельное имя домена и два узла соединялись, если любая страница из одного домена соединялась с любой страницей из другого домена. В то время как данный метод рассматривал страницы из одного домена как целое, представляя нетривиальное скопление узлов, распределение входящих ребер все еще подчинялось степенному закону с 𝜆𝑑𝑜𝑚 = 1.94. 𝑖𝑛 Обратите внимание на то, что 𝜆𝑖𝑛 одно и то же для всех измерений на уровне документов, кроме двухгодичного перерыва между первым и последним сетевым кролем, в течение которого всемирная сеть выросла, по крайней мере, в пять раз. Тем не менее, 𝜆𝑜𝑢𝑡 склонно расти с объемом выборки или со временем (см. таблицу 2). Несмотря на большое число узлов, всемирная сеть обладает свойством маленького мира. Это впервые было отмечено Альбетом, Йонгом и Барабаси (1999). Они открыли, что средняя длина пути в выборке, содержащей 325 729 узлов, есть 11,2 и, используя масштабное преобразование в конечном объеме, предсказали, что для всей всемирной сети из 800 миллиона узлов средняя длина пути будет примерно 19. Дальнейшие измерения Бродера и др. (2000) показали, что средняя длина пути в 50-миллионном образце всемирной сети есть 16, что совпадает с предсказанием для конечного объема для образца такой величины. И наконец, сеть уровня доменов демонстрирует среднюю длину пути 3,1 (Адамик, 1999). Ориентированность всемирной сети не дает нам возможность измерят коэффициент кластерации, используя равенство (1). Для того чтобы избежать этой трудности, можно избавиться от ориентированности, сделав все ребра двунаправленными. Таким способом воспользовался Адамик (1999), кто изучил всемирную сеть на уровне домена, используя кроль Алекса 1997, состоящий из 50 миллионов веб-страниц, распределенных в 259 794 сайтах. Адамик убрал узлы, имеющие лишь один край, и работал с сетью из 153 127 сайтов. В то время как ожидалось, что такие изменения несколько увеличат коэффициент кластерации, она обнаружила значения 𝐶 = 0.1078, порядок величин выше чем 𝐶𝑟𝑎𝑛𝑑 = 0.00023, соответствующий случайному графу такой же величины и средней степени. Интернет Интернет _ сеть физических связей между компьютерами и другими телекоммуникационными устройствами (рис. 1). Топология интернета изучена на двух различных уровнях. На уровне маршрутизаторов, где последние являются вершинами, а ребра _ физические соединения между ними. И на внутридоменном уровне (или уровне автономных систем), где каждый домен, состоящий из сотен маршрутизаторов и компьютеров, представляется единственным узлом. Два домена соединены ребром, если есть хотя бы один путь, соединяющий их. Фалоутсос и др. (1999) изучили интернет на обоих уровнях и пришли к выводу, что в каждом случаи распределение степеней подчиняется степенному закону. В результате исследования топологии интернета в трех различных датах между 1997 и концом 1998 были получены значения между 𝛾𝐼𝑎𝑠 = 2,15 и 𝛾𝐼𝑎𝑠 = 2,22. Исследования топологии интернета 1995-го на уровне маршрутизаторов, содержащем 3888 узлов, привело к значению 𝛾𝐼𝑟 = 2,48 (Фалоутсос и др., 1999). Таблица II. Масштабные степени, характеризующие распределение степеней некоторых свободных от масштаба сетей, для которых 𝑃(𝑘) подчиняется степенному закону (2). Мы отмечаем размер сети, ее среднюю степень ⟨𝑘⟩ и границу к для масштабирования по степенному закону. Для ориентированных сетей мы отдельно отмечаем показатели (𝛾𝑖𝑛 ) для входящих и (𝛾𝑜𝑢𝑡 ) для выходящих, а для неориентированных сетей, отмеченных звездочкой (∗), эти величины совпадают. Столбцы 𝑙𝑟𝑒𝑎𝑙 , 𝑙𝑟𝑎𝑛𝑑 и 𝑙𝑝𝑜𝑤 сравнивают среднюю длину пути реальных сетей с распределением степеней по степенному закону и предсказаниями в теории случайных графов (17) и Ньюмана, Строгатса, и Уоттса (2001) [см. также равенство (63) выше], как это обсуждено в отделе V. Числа в последнем столбце связаны с символами в рисунках 8 и 9. Рисунок 1. Сетевая структура всемирной сети и интернета. Верхняя панель: узлами всемирной сети являются веб-документы, соединенные гиперссылками (URLы). Нижняя панель: в интернете узлами являются маршрутизаторы и компьютеры, а ребра _ провода и кабели, которые их физически соединяют. Рисунок любезно предоставлен Истваном Альбертом. Рисунок 2. Распределение степеней всемирной сети с точки зрения двух различных измерений: , 325 729-узелный образец Альберта и др. (1999); , измерения более чем 200 миллионов страниц Бродером и др. (2000); (a) степенное распределение выходящих ребер; (b) степенное распределение входящих ребер. Информация представлена логарифмически для уменьшения шума. Любезно предоставлено Алтависта и Эндрю Томкинами. Авторы благодарят Луизу Амараль за исправление ошибки в предыдущей версии рисунка (см. Мосса и др., 2001). Рисунок 3. Степенное распределение некоторых реальных систем: (a) интернет на уровне маршрутизаторов. Информация любезно предоставлена Рамешом Говинданом; (b) сеть сотрудничества фильмов и актеров. Барабаси и Альберт (1999). Обратите внимание на то, что если добавить также телевизионные сериалы, что включает большое число актеров, то возникает экспоненциальный останов для больших 𝑘 (Амараль и др., 2000); (c) соавторская сеть физиков высокой энергии. Ньюман (2001a, 2001b); (d) соавторская сеть нейробиологов, Барабаси и др. (2001). Недавно Говиндан и Тангмунарункит (2000) отобразили множество из примерно 150 000 интерфейсов маршрутизаторов и примерно 200 000 смежных маршрутизаторов, подтверждая степенной закон с 𝛾𝐼𝑟 ≃ 2,3 [см. рис. 3(a)]. Интернет как сеть демонстрирует кластерацию и небольшую длину пути. Йук и др. (2001a) и Пастор-Саторрас и др. (2001), изучая интернет на уровне доменов между 1997 и 1999, обнаружили, что коэффициент кластерации менялся между 0,18 и 0,3 в сравнении с 𝐶𝑟𝑎𝑛𝑑 ≃ 0.001 для случайных графов со сходными параметрами. Средняя длина пути для интернета на уровне доменов менялся от 3,70 до 3,77 (Пастор-Саторрас и др., 2001; Йук и др., 2001a), а на уровне маршрутизаторов он был около 9 (Йук и др., 2001a), указывая на свойство маленького мира. Сеть сотрудничества фильмов и актеров Сеть сотрудничества фильмов и актеров немало изучена. Она основана на базе данных о фильмах в интернете, которая содержит все фильмы и их составы актеров с 1890-ых. В этой сети узлы _ актеры, а два узла соединяются ребром, если соответствующие актеры играли вместе в некотором фильме. Эта сеть постоянно увеличивается: в 1998 году было 225 226 узлов (Уоттс и Строгатс, 1998), а к маю 2000 года это число выросло до 449 913 (Ньюман, Строгатс и Уоттс, 2000). Средняя длина пути в сети актеров близка к значению длины для случайного графа той же величины и средней степени _ 3,65 по сравнению с 2,9, но коэффициент кластерации 100 раз превышает значение для случайного графа (Уоттс и Строгатс, 1998). Распределение степеней сети фильмов и актеров имеет хвост со степенным законом для больших значений 𝑘 [см. рис. 3(b)], с 𝑃(𝑘)~ 𝑘 −𝛾𝑎𝑐𝑡𝑜𝑟 , где 𝛾𝑎𝑐𝑡𝑜𝑟 = 2.3 ± 0,1 (Барабаси и Альберт, 1999; Альберт и Барабаси, 2000; Амараль и др., 2000). Сеть научных сотрудничеств Аналогичная к сети актеров и фильмов сеть может быть сконструирована и для ученых, где узлы _ ученые, и два узла соединяются, если соответствующие ученые вместе писало статью. Для раскрытия топологии этого сложного графа Ньюман (2001a, 2001b, 2001c) в течение пяти лет (19951999) изучал четыре базы данных, охватывающие физику, биомедицинские исследования, физику высокой энергии компьютерную науку. Все эти сети демонстрируют маленькую среднюю длину пути, но большой коэффициент кластерации, это показано в таблице I. Степенное распределение сети сотрудничеств физиков высокой энергии демонстрирует почти идеальный степенной закон с показателем 1,2 [рис. 3(c)], во время как другие базы данных имеют степенной закон с более высоким показателем в хвосте. Барабаси и др. (2001) изучили граф сотрудничества математиков и неврологов, публикации между 1991 и 1998. Средняя длина пути в этих сетях составляет примерно 𝑙𝑚𝑎𝑡ℎ = 9.5 и 𝑙𝑛𝑠𝑐𝑖 = 6, коэффициенты кластерации 𝐶𝑚𝑎𝑡ℎ = 0.59 и 𝐶𝑛𝑠𝑐𝑖 = 0,76. Степенные распределения данных сетей сотрудничеств стойкие со степенными законами с показателями 2,1 и 2,5, соответственно [см. рис. 3(d)]. Сеть половых контактов человека Многие болезни, передаваемые половым путем, включая СПИД, распространяются на сеть сексуальных отношений. Лильерос и др. (2001) изучили сеть, составленную из сексуальных отношений 2810 людей и основанную на широком исследовании, проведенной в Швеции в 1996. Т.к. ребра в этой сети существуют относительно недолго, они анализировали распределение партнеров в течение одного года, и выяснили, что и для мужчин, и для женщин распределение имеет степенной закон с показателями 𝛾𝑓 = 3,5 ± 0,2 и 𝛾𝑚 = 3,3 ± 0,2, соответственно. Клеточные сети Йонг и др. (2000) изучали обмен веществ 43 организмов, представляющих все три среды жизни, объединяя их в сеть, где узлы _ субстраты (такие как ATP, ADP, H2O), а ребра представляют преимущественно ориентированные химические реакции, в которых эти субстраты могут участвовать. Оказалось, что для всех организмов распределение входящих и выходящих ребер подчиняется степенному закону с показателями между 2,0 и 2,4. В силу ориентированности сетей коэффициент кластерации не определен. Средняя длина пути приблизительно одна и та же для всех организмов, со значением 3,3. Коэффициент кластерации был изучен Уонгером и Феллем (2000; см. также Фелл и Уонгер, 2000), обращая внимание на энергетический и биосинтетический обмен веществ бактерии Escherichia coli. Они открыли, что , вдобавок к степенному закону распределения степеней, неориентированная версия этого графа обладает маленькой средней длиной пути и большим коэффициентом кластерации (см. таблицу I). Еще одна сеть, характеризующая клетку, описывает взаимодействия между протеинами, где узлы _ протеины, которые соединяются ребром, если экспериментальным путем показано, что они связаны вместе. Изучение этих физических взаимодействий показало, что распределение степеней в карте физических взаимодействий протеинов дрожжах подчиняется степенному закону с показателем в хвосте 𝑃(𝑘)~ (𝑘 + 𝑘0 )−𝛾𝑒− (𝑘+𝑘0 )/𝑘𝑐 , где 𝑘0 = 1, 𝑘𝑐 = 20 и 𝛾 = 2,4 (Йонг, Мейсон и др., 2001). Экологические сети Пищевые сети очень часто используются экологами для численной оценки взаимодействий между различными видами (Пим, 1991). В пищевой сети узлами являются виды, а ребра представляют отношения хищник-добыча. В недавнем исследовании, Уиллиамс и др. (2000) изучили топологию семи наиболее документированных и больших пищевых цепей: Skipwith Pond, Little Rock Lake, Bridge Brook Lake, Chesapeake Bay, Ythan Estuary, Coachella Valley и St. Martin Island. В то время как эти сети широко различаются в количестве видов или средней степени, в каждом из них виды находятся в трех или меньше ребрах друг от друга. Этот результат был подтвержден независимым исследованием Монтоя и Сола (2000) и Камачо и др. (2001a). Они также показали, что пищевые сети обладают высокой кластерацией. Степенное распределение было вначале исследовано Монтоя и Сола (2000). Они сфокусировались на сетях Ythan Estuary, Silwood Park и Little Rock Lake, считая их неориентированными. Несмотря на маленький размер этих сетей (самый большой из них имеет 186 узлов), они разделяют свойства их бо'льших аналогов, присущие неслучайным графам. В частности, Монтоя и Соле (2000) пришли к выводу о том, что распределение степеней стойко со степенным законом с необычно маленьким показателем 𝛾 ≃ 1,1. Тем не менее, маленький размер этих сетей оставляет место для некоторой неопределенности 𝑃(𝑘). Камачо и др. (2001a, 2001b) считают, что для некоторых пищевых цепей exponential fit works очень подходящий. Подтвердившееся существование ключевых видов, которые играют важную роль в топологии пищевой сети, указывает существование узлов (распространенное свойство сетей, не обладающих масштабом), однозначное определение топологи сети может улучшиться благодаря более крупным сетям данных. Сети телефонных звонков Из модели звонков дальней дистанции сконструирован большой ориентированный граф, где узлы _ телефонные номера, а каждый звонок есть ребро, направленное от звонившего к принявшему звонок. Абелло, Пардалос и Ресенд (1999) и Айелло, Чанг и Лу (2000) изучили граф телефонных звонков дальней дистанции, сделанных за один день, и обнаружили, что распределение выходящих и входящих ребер подчиняется степенному закону с показателем 𝛾𝑜𝑢𝑡 = 𝛾𝑖𝑛 = 2,1. Сети цитат Из модели цитат научных публикаций сформирована достаточная сложная сеть, где узлами являются статьи, а ориентированные ребра _ ссылка на ранее опубликованную статью. Рендер (1998), изучая распределение 783 339 газет, каталогизированный Институтом Научной Информации, и 24 296 газет, опубликованных в Физическом Обзоре между 1975 и 1994, обнаружил, что вероятность того, что газета была процитирована 𝑘 раз, подчиняется степенному закону с показателем 𝛾𝑐𝑖𝑡𝑒 = 3, указывая на то, что распределение входящих ребер в сети подчиняется степенному закону. Недавнее исследование Вазкуезом (2001) распространило эти исследования также на распределение степеней выходящих ребер, обнаружив, что оно имеет экспоненциальный хвост. Лингвистические сети Запутанность человеческих языков предлагает несколько возможных способов для определения и изучения сложных сетей. Недавно Феррер и Канчо и Соле (2001) сконструировали такую сеть для английского языка, основанной на Британском Национальном Собрании, где узлы _ это слова; эти узлы соединены, если в предложениях они либо расположены друг за другом, либо между ними есть одно слово. Они обнаружили, что полученная сеть из 440 902 слов имеет маленькую среднюю длину пути 𝑙 = 2,67, высокий коэффициент кластерации 𝐶 = 0,437 и двурежимное распределение степеней со степенным законом. Слова со степенью 𝑘 ≤ 103 разлагаются с показателем степени 𝛾< = 1,5, в то время как слова с 103 < 𝑘 < 105 подчинаются степенному закону с 𝛾> ≃ 2,7. Другое исследование (Йук, Йонг и Барабаси, 2001b) соединяло слова в зависимости от их значений, т. е. два слова соединялись друг с другом, если они являлись синонимами согласно словарю Мерриам-Уебстер. Результат указывает на существование гигантского кластера из 22 311 слов из 23 279, имеющих синонимы, со средней длиной пути 𝑙 = 4,5 и с более высоким коэффициентом кластерации 𝐶 = 0,7 в сравнении с 𝐶𝑟𝑎𝑛𝑑 = 0,0006 для эквивалентной случайной сети. Вдобавок, распределение степеней имело хвост, подчиняющийся степенному закону с 𝛾𝑠𝑦𝑛 = 2,8. Эти результаты показывают, что во многих отношениях язык также образует сложную сеть с принципами организации, которые мало отличаются от примеров, рассмотренных выше (см. также Стейверс и Тененбаум, 2001). Энергетические и нервные системы Энергетическая система западной части Соединенных Штатов описывается сложной сетью, узлы в которой _ это генераторы, трансформаторы и подстанции, а ребра _ высоковольтные линии передачи. Количество узлов в энергетической системе есть 𝑁 = 4941, а ⟨𝑘⟩ = 2,67. В крошечной (𝑁 = 282) нервной сети черви нематода 𝐶. 𝑒𝑙𝑒𝑔𝑎𝑛𝑠 узлами являются нейроны, а ребро соединяет два нейрона, если они связаны либо синапсом, либо щелевым контактом. Уоттс и Строгатс (1998) обнаружили, что в то время как средняя длина пути приблизительно равнялась длине для случайного графа того же размера и средней степени, их коэффициент кластерации был намного выше (таблица I). Распределение степеней энергетической системы сопоставимо с экспоненциальной, а для нервной сети 𝐶. 𝑒𝑙𝑒𝑔𝑎𝑛𝑠 оно имеет пик в промежуточном 𝑘, после чего оно разрушается по экспоненте (Амараль и др., 2000). Белковое свертывание Во время свертывания белок принимает последовательные структуры. Каждый узел представляет отдельное состояние. Две структуры соединяются, если они могут быть получены друг из друга с помощью элементарного изменения. Скала, Амараль и Бартелеми (2001) изучили сеть, сформированную из структур двумерного (2D) сетчатого полимера, и обнаружили, что она обладает свойством маленьких миров. В особенности, средняя длина пути увеличивается логарифмически с увеличением размера полимера (и размера сети, соответственно), что соответствует поведение случайного графа. Тем не менее, коэффициент кластерации намного превосходит 𝐶𝑟𝑎𝑛𝑑 , и эта разница увеличивается вместе с размером сети. Распределение степеней сети структур сопоставимо с Гауссовским (Амараль и др., 2000). Базы данных, обсужденные выше, послужили причиной и источником вдохновения для раскрытия топологических свойств реальных сетей. Мы часто будем обращаться к ним для обоснования различных теоретических предсказаний или для понимания ограничений возможностей моделирования. В остальной части данного обзора мы обсудим различные теоретические средства, разработанные для моделирования этих сложных сетей. Для этого нам нужно начать с родителем всех моделей сетей: теорией случайных графов Эрдоса и Ренйи. III. Теория случайных графов В математических терминах сеть представляется как граф. Граф _ пара множеств 𝐺 = {𝑃, 𝐸}, где 𝑃 _ множество 𝑁 узлов (вершин или точек) 𝑃1 , 𝑃2 , … , 𝑃𝑁 , а 𝐸 _ множество ребер (соединений или линий), которые соединяют два элемента из 𝑃. Рисунок 4. Иллюстрация графа с 𝑁 = 5 вершинами и 𝑛 = 4 ребрами. Множество вершин: 𝑃 = {1, 2, 3, 4, 5}. Множество ребер: 𝐸 = {{1, 2}, {1, 5}, {2, 3}, {2, 5}}. Графы обычно представляются как множество точек, каждая из которых соответствует вершине. Две такие точки соединены линией, если соединены соответствующие вершины (см. рисунок 4). Теория графов возникла в восемнадцатом веке в работе Леонарда Эйлера, чья ранняя работа в основном касалась маленьких графов с высокой степенью регулярности. В двадцатом веке теория графов стала более статистической и алгоритмической. Особенно большим источником идей являлось изучение случайных графов, т. е. графов, в которых ребра распределены случайным образом. Сети со сложной топологией и неизвестными принципами организации часто оказываются случайными; таким образом, теория случайных графов широко используется в изучении сложных сетей. Теория случайных графов была представлена Полом Эрдосом и Альфредом Ренйи (195 1960, 1961) после того, как Эрдос открыл, что вероятностные методы часто оказываются полезными в проблемах со средствами в теории графов. Детальное обсуждение данной области доступно в классической книге Боллобаса (1985), дополненной обозрением Коэна (1988) параллелей между фазовыми переходами и случайными графами, а также путеводителем истории подхода Эрдоса и Ренйи, написанным Каронским и Русинским (1997). Здесь мы кратко описываем важнейшие результаты теории графов, обращая особое внимание на те аспекты, которые имеют прямое отношение к сложным сетям. Модель Erdős – Rényi В своей первой классической статье о случайных графах Erdős – Rényi определяют граф как 𝑁 помеченных узлов, соединенных 𝑛 ребрами, которые выбраны случайным образом из 𝑁(𝑁 − 𝑛 1)/2 возможных ребер (Erdős – Rényi, 1959). В общем существует 𝐶[𝑁(𝑁−1)/2] графов с 𝑁 вершинами и 𝑛 ребрами, которые формируют вероятностное пространство, в котором каждая реализация равновероятна. Альтернативным и эквивалентным определением случайного графа является биномиальная модель. Здесь в начале имеется 𝑁 вершин. Каждая пара вершин соединяется с вероятностью 𝑝 (см. рисунок 5). Следовательно общее количество ребер _ случайная величина с ожидаемым значением 𝐸(𝑛) = 𝑝[𝑁(𝑁 − 1)/2]. Если 𝐺0 _ граф с вершинами 𝑃1 , 𝑃2 , … , 𝑃𝑁 и с 𝑛 ребрами, то вероятность получения этого графа в процессе построения есть 𝑃(𝐺0 ) = 𝑝𝑛 (1 − 𝑝) 𝑁(𝑁−1) −𝑛 2 . Рисунок 5. Иллюстрация процесса изменения графа в модели Erdős – Rényi. В начале имеем 𝑁 = 10 отдельных вершин (верхняя часть рисунка), затем каждая пара вершин соединяется с вероятностью 𝑝. Нижняя часть рисунка показывает два различных этапа формирования графа, соответствующих значениям 𝑝 = 0,1 и 𝑝 = 0,15. Мы можем увидеть появление деревьев (дерево порядка 3, нарисованное длинными пунктирными линиями) и циклов (цикл порядка 3, нарисованный короткими пунктирными линиями), а также соединенный кластер, который объединяет половину вершин в 𝑝 = 0,15 = 1,5/𝑁. Теория случайных графов изучает свойства вероятностного пространства, связанного с графами с 𝑁 вершинами, при 𝑁 → ∞. Многие свойства таких случайных графов могут быть определены с использованием вероятностных доводов. В этом отношении Эрдос и Ренйи использовали определение, что почти каждый граф обладает свойством 𝑄, если вероятность обладания свойством 𝑄 приближается к 1 при 𝑁 → ∞. Среди вопросов, поставленных Эрдосом и Ренйи, есть такие, которые имеют непосредственную значимость в понимании сложных сетей, например: Является ли типичный граф связным? Содержит ли он треугольник соединенных вершин? Каким образом его диаметр зависит от его размера? В математической литературе конструирование случайного графа часто называется эволюцией: вначале имея множество из 𝑁 отдельных вершин, граф развивается с последовательным добавлением случайных ребер. Графы, полученные на разных этапах этого процесса, соответствуют все большим и большим вероятностям соединения 𝑝, и наконец, при 𝑝 → 1, получается полный граф [имеющий максимальное количество ребер 𝑛 = 𝑁(𝑁 − 1)/2]. Основной целью теории случайных графов является выяснение при какой вероятности соединения 𝑝 некоторое фиксированное скорей всего свойство появится. Самым большим открытием Эрдоса и Ренйи было то, что многие важные свойства случайных графов появляются довольно неожиданно. Т. е. при заданной вероятности либо почти все графы обладают некоторым свойством 𝑄 (например, все пары вершин соединены путем из последовательных ребер), либо наоборот почти все графы этим свойством не обладают. Переход между тем, что свойство скорей всего будет или не будет выполняться, обычно происходит очень быстро. Для многих таких свойств есть критическая вероятность 𝑝𝑐 (𝑁). Если 𝑝(𝑁) растет медленней чем 𝑝𝑐 (𝑁) при 𝑁 → ∞, то почти каждый граф с вероятностью соединения 𝑝(𝑁) не будет обладать свойством 𝑄. Если же 𝑝(𝑁) растет слегка быстрее чем 𝑝𝑐 (𝑁), то почти каждый граф будет обладать свойством 𝑄. Таким образом, вероятность того, что граф с 𝑁 вершинами и с вероятностью соединения 𝑝 = 𝑝(𝑁) имеет свойство 𝑄, удовлетворяет следующей системе: 𝑝(𝑁) 0, 𝑖𝑓 𝑝 (𝑁) → 0 𝐶 lim 𝑃𝑁,𝑝 (𝑄) = { (4) 𝑝(𝑁) 𝑁→∞ 1, 𝑖𝑓 𝑝 (𝑁) → ∞. 𝐶 Здесь уместно важное замечание. Физики, специализированные в критических явлениях, примут 𝑝𝐶 (𝑁) как критическую вероятность, знакомую в протекании. В литературе физики система обычно рассматривается в фиксированном размере 𝑁, а затем различные режимы в равенстве (4) сводятся к вопросу меньше ли 𝑝, чем 𝑝𝑐 , или наоборот. Подходящее значение 𝑝𝑐 , т. е. предел 𝑝𝑐 = 𝑝𝑐 (𝑁 → ∞) получается с помощью конечного масштабного преобразования. Базисом данного действия является предположение, что предел существует, отражая тот факт, что в конечном счете предел протекания не зависит от размера системы. Это в основном случай конечномерных систем, который включает большинство систем теории просачивания и критических явлений, представляющих интерес. Сети же, наоборот, по определению являются бесконечномерными: количество возможных соседей узла возрастает вместе с размером системы. Соответственно, в теории случайных графов вероятность соединения определяется как функция от размера: 𝑝 представляет из себя отношение количества существующих ребер и количества 𝑁(𝑁 − 1)/2 всех возможных. Более крупные графы с тем же 𝑝 будут содержать больше ребер, следовательно, такие свойства, как наличие циклов, будут иметь место для относительно маленьких 𝑝 в более крупных графах, нежели в меньших. Это означает, что для многих свойств 𝑄 для случайных графов нет единого независящего от 𝑁 предела, но мы можем определить предельную функцию, которая зависит от размера системы, и 𝑝𝐶 (𝑁 → ∞) → 0. Тем не менее, мы увидим, что средняя степень графа ⟨𝑘⟩ = 2𝑛/𝑁 = 𝑝(𝑁 − 1) ≃ 𝑝𝑁 (5) имеет критическое значение, независимое от размера системы. В следующей части мы проиллюстрируем эти идеи, рассматривая появление различных подграфов в случайных графах. Подграфы Первым свойством случайных графов, изученным Эрдосом и Ренйи (1959), было появление подграфов. Граф 𝐺1 , состоящий из 𝑃1 вершин и множества ребер 𝐸1 , является подграфом графа 𝐺 = {𝑃, 𝐸}, если все вершины в 𝑃1 содержатся также и в 𝑃 и все ребра из 𝐸1 являются также ребрами из 𝐸. Самыми простыми примерами подграфов являются циклы, деревья и полные подграфы (клики) (см. рисунок 5). Цикл порядка 𝑘_ это замкнутая петля из 𝑘 ребер такой что каждая пара последовательных ребер, и только она, имеет общую вершину. Таким образом, графически треугольник _ цикл порядка 3, а квадрат _ порядка 4. Средняя степень цикла равняется двум, т.к. у каждой вершины есть два ребра. Противоположностью к циклам являются деревья. Более точно, граф является деревом порядка 𝑘, если он имеет 𝑘 вершин и 𝑘 − 1 ребер, и ни один из его подграфов не является циклом. Средняя степень дерева порядка 𝑘 есть ⟨𝑘⟩ = 2 − 2/𝑘, что приближается к 2 для больших 𝑘. Полные подграфы (клики) порядка 𝑘 содержат 𝑘 вершин и все возможные 𝑘(𝑘 − 1)/2 ребер, другими словами, они полностью связаны. Рассмотрим процесс эволюции, описанном на рисунке 5 для графа 𝐺 = 𝐺𝑁,𝑝 . Рисунок 6. Предельные вероятности, при которых в случайных графах появляются различные подграфы. При 𝑝𝑁 3/2 → 0 граф состоит из отдельных вершин и ребер. При 𝑝~𝑁 −3/2 появляются деревья порядка 3, а при 𝑝~𝑁 −4/3 _ порядка 4. При −1 𝑝~𝑁 присутствуют деревья всех порядков, в то же время появляются циклы всех порядков. Вероятность 𝑝~𝑁 −2/3 отмечает появление полных подграфов порядка 4, а 𝑝~𝑁 −1/2 соответствует наличию кликов порядка 5. При приближении 𝑧 к нулю граф содержит полные подграфы увеличивающегося порядка. В начале имеем 𝑁 отдельных вершин, потом соединяем каждую пару вершин с вероятностью 𝑝. Для маленьких вероятностей соединения вершины изолированы, но с ростом 𝑝 и количества ребер вместе с ним, два ребра могут быть соединены с одной и той же вершиной, формируя деревья порядка 3. В общем случае мы можем спросить есть ли критическая вероятность, которая отмечает наличие произвольных подграфов с 𝑘 вершинами и 𝑙 ребрами. В теории случайных графов есть строго доказанный ответ на этот вопрос (Боллобас, 1985). Пусть имеем случайный граф 𝐺 = 𝐺𝑁,𝑝 . Пусть также имеем маленький граф 𝐹 с 𝑘 вершинами и 𝑙 ребрами. В принципе, случайный граф 𝐺 может содержать несколько таких подграфов 𝐹. Наша первая цель _ определить, сколько таких подграфов существует. 𝑘 вершин могут быть выбраны из всех 𝑁 вершин 𝐶𝑁𝑘 способами, а 𝑙 ребра формируются с вероятностью 𝑝𝑙 . В добавок, мы можем переставлять эти 𝑘 вершин и получить 𝑘! новых графов (точное значение есть 𝑘!/𝑎, где 𝑎 _ количество изоморфных графов). Таким образом, количество подграфов 𝐹, содержащихся в 𝐺, есть 𝐸(𝑋) = 𝐶𝑁𝑘 𝑘! 𝑎 𝑝𝑙 ≃ 𝑁 𝑘 𝑝𝑙 𝑎 . (6) Данная запись подсказывает о том, что фактическое количество таких подграфов, 𝑋, может отличаться от 𝐸(𝑋), но в большинстве случаев эти числа будут близки. Заметим, что подграфы не обязаны быть изолированными, т.е. могут существовать ребра с одной вершиной внутри подграфа и с другой _ снаружи. Равенство (6) показывает, что если p(𝑁) такое что 𝑝(𝑁)𝑁𝑘/𝑙 → 0 при 𝑁 → 0, то количество подграфов 𝐸(𝑋) → 0, т.е. почти ни один случайный граф не содержит подграф 𝐹. Тем не менее, если 𝑝(𝑁) = 𝑁 −𝑘/𝑙 , то среднее количество подграфов _ конечное число, которое обозначается через 𝜆 = 𝑐 𝑙 /𝑎, отмечая, что эта функция может быть критической вероятностью. Достоверность данного результата может быть проверена вычислением распределения количеств подграфов, 𝑃𝑝 (𝑋 = 𝑟), получая (Боллобас, 1985) 𝜆𝑟 lim 𝑃𝑝 (𝑋 = 𝑟) = 𝑒 −𝜆 𝑟! . 𝑁→∞ (7) Тогда вероятность того, что 𝐺 содержит хотя бы один такой подграф 𝐹, равняется −𝜆 𝑃𝑝 (𝐺 ⊃ 𝐹) = ∑∞ (8) 𝑟=1 𝑃𝑝 (𝑋 = 𝑟) = 1 − 𝑒 , 𝑘/𝑙 что стремится к 1 с увеличением 𝑐. Для значений 𝑝, удовлетворяющих 𝑝𝑁 → ∞, вероятность 𝑃𝑝 (𝐺 ⊃ 𝐹) стремится к 1. Итак, действительно, критическая вероятность, при которой каждый граф содержит подграф с 𝑘 вершинами и 𝑙 ребрами есть 𝑝𝐶 (𝑁) = 𝑐𝑁 −𝑘/𝑙 . Несколько важных особых случая следуют прямо из равенства (8): (a) Критическая вероятность наличия дерева порядка 𝑘 есть 𝑝𝐶 (𝑁) = 𝑐𝑁 −𝑘/(𝑘−1) . (b) Критическая вероятность наличия цикла порядка 𝑘 есть 𝑝𝐶 (𝑁) = 𝑐𝑁 −1. (c) Критическая вероятность наличия клики порядка 𝑘 есть 𝑝𝐶 (𝑁) = 𝑐𝑁 −2/(𝑘−1) . Эволюция графов Полезно посмотреть на результаты, обсужденные выше, с другой точки зрения. Пусть имеется случайный граф с 𝑁 вершинами. Допустим, вероятность соединения 𝑝(𝑁) меняется как 𝑁 𝑧 , где 𝑧 _ перестраиваемый параметр, который может принимать значения между 0 и ∞ (рисунок 6). Для значений 𝑧, меньших чем −3/2 почти все графы содержат изолированные вершины и ребра. Когда 𝑧 начинает превосходить −3/2, неожиданно начинают появляться деревья порядка 3. Когда 𝑧 достигает значения −4/3, появляются деревья порядка 4, и, по мере того как 𝑧 приближается к −1, граф содержит деревья большего и большего порядка. Тем не менее, пока 𝑧 < −1 такой что средняя степень графа ⟨𝑘⟩ = 𝑝𝑁 → 0 при 𝑁 → ∞, граф представляет из себя объединение несвязанных деревьев, а циклы отсутствуют. В точности когда 𝑧 перешагивает значение −1, что соответствует ⟨𝑘⟩ = 𝑐𝑜𝑛𝑠𝑡, не смотря на то, что 𝑧 равномерно меняется, асимптотическая вероятность наличия циклов всех порядков прыгает от 0 к 1. Циклы порядка 3 могут также быть рассмотрены как клики того же порядка. Клики порядка 4 появляются при 𝑧 = −2/3, и по мере того как 𝑧 продолжает расти, возникают клики все большего и большего порядка. И наконец, когда 𝑧 приближается к 0, граф содержит клики всех конечных порядков. Дальнейшие результаты могут быть получены для 𝑧 = −1, т.е. когда имеем 𝑝 ∝ 𝑁 −1 и средняя степень узлов ⟨𝑘⟩ = 𝑐𝑜𝑛𝑠𝑡. Для 𝑝 ∝ 𝑁 −1 случайный граф содержит циклы и деревья всех порядков, однако до сих пор мы не обсуждали размер и структуру типичной составляющей графа. Образующая графа по определению есть связный изолированный подграф, который в исследованиях сетей и теории просачивания также называется кластером. Как показывают Эрдос и Ренйи (1960), в структуре кластера случайного графа есть неожиданное изменение, когда ⟨𝑘⟩ приближается к 1. Если 0 < ⟨𝑘⟩ < 1, то все кластеры почти наверняка являются деревьями или содержат ровно один цикл. Несмотря на наличие циклов, почти все вершины принадлежат деревьям. Среднее количество кластеров есть число порядка 𝑁 − 𝑛, где 𝑛 _ количество ребер, т.е. при добавлении нового ребра количество кластеров уменьшается на 1. Самый большой кластер является деревом, размер которого пропорционален к ln 𝑁. Когда ⟨𝑘⟩ перешагивает предел ⟨𝑘⟩𝑐 = 1, структура графа неожиданно изменяется. В то время как для ⟨𝑘⟩ < 1 самый большой кластер является деревом, для ⟨𝑘⟩𝑐 = 1 он имеет приблизительно 𝑁 2/3 вершин и довольно сложную структуру. Более того, для ⟨𝑘⟩ > 1 самый большой (гигантский) кластер имеет [1 − 𝑓(⟨𝑘⟩)]𝑁 вершин, где 𝑓(𝑥) _ функция, которая экспоненциально уменьшается от 𝑓(1) = 1 к 0 при 𝑥 → ∞. Таким образом, конечная часть вершин, 𝑆 = 1 − 𝑓(⟨𝑘⟩) принадлежит самому большому кластеру. Кроме этого гигантского кластера, все остальные кластеры относительно невелики, большинство из них являются деревьями, а общее количество вершин, принадлежащих деревьям, есть 𝑁(⟨𝑘⟩). С увеличением ⟨𝑘⟩ маленькие кластеры сливаются и соединяются к гигантскому кластеру, причем чем меньше кластер, чем больше вероятность того, что он не соединится. Таким образом, при 𝑝𝑐 ≃ 1/𝑁 топология случайного графа внезапно изменяется от множества отдельных маленьких кластеров к системе с одним доминирующим гигантским кластером. Начало сверхкритической фазы было исследовано Боллобасом (1984), Колчином (1986) и Лукзаком (1990). Достигнутые ими результаты показывают, что в это время самый большой кластер явно отделяется от остальных кластеров, а его размер 𝑆 увеличивается пропорционально разделению критической вероятности, 𝑆 ∝ (𝑝 − 𝑝𝑐 ). (9) Как мы увидим с разделе IV.F, эта зависимость аналогична вероятности протекания в бесконечномерном протекании. Распределение степеней Эрдос и Ренйи (1959) были первыми, кто изучал распределение максимальных и минимальных степеней в случайном графе. Полное распределение степеней в дальнейшем было выведено Боллобасом (1981). В случайном графе с вероятностью соединения 𝑝 степень 𝑘𝑖 вершины 𝑖 имеет биномиальное распределение с параметрами 𝑁 − 1 и 𝑝: 𝑘 𝑃(𝑘𝑖 = 𝑘) = 𝐶𝑁−1 𝑝𝑘 (1 − 𝑝)𝑁−1−𝑘 . (10) Эта вероятность представляет количество способов, которыми 𝑘 ребер могут выходит из определенной вершины: вероятность 𝑘 ребер есть 𝑝𝑘 , вероятность отсутствия дополнительных 𝑘 ребер есть (1 − 𝑝)𝑁−1−𝑘 , и есть 𝐶𝑁−1 эквивалентных способа выбрать 𝑘 вершин на концах этих ребер. Более того, если 𝑖 и 𝑗 _ отличные друг от друга вершины, то 𝑃(𝑘𝑖 = 𝑘) и 𝑃(𝑘𝑗 = 𝑘) близки к тому, чтобы быть независимыми случайными переменными. Для нахождения распределения степеней графа нам необходимо изучить количество вершин со степенью 𝑘, 𝑋𝑘 . Нашей основной целью является определение вероятности того, что 𝑋𝑘 будет иметь заданное значение, 𝑃(𝑋𝑘 = 𝑟). Рисунок 7.Распределение степеней, полученное из цифрового моделирования случайного графа. Мы сгенерировали единственных случайный граф с 𝑁 = 10000 и вероятностью соединения 𝑝 = 0,0015 и вычислили количество вершин со степенью 𝑘, 𝑋𝑘 . График сравнивает 𝑋𝑘 /𝑁 с ожидаемой величиной в Пуассоновском 𝐸(𝑋 ) распределении (13), 𝑁𝑘 = = 𝑃(𝑘𝑖 = 𝑘), и мы можем увидеть, что отклонение _ небольшое. Согласно равенству (10), ожидаемое количество вершин со степенью 𝑘 есть 𝐸(𝑋𝑘 ) = 𝑁𝑃(𝑘𝑖 = 𝑘) = 𝜆𝑘 , (11) где 𝑘 𝜆𝑘 = 𝑁𝐶𝑁−1 𝑝𝑘 (1 − 𝑝)𝑁−1−𝑘 . (12) Как и в выводе условий существования подграфов (см. раздел III.B), распределение величин 𝑋𝑘 , 𝑃(𝑋𝑘 = 𝑟), приближается к Пуассоновскому распределению, 𝜆𝑟 𝑃(𝑋𝑘 = 𝑟) = 𝑒 −𝜆𝑘 𝑘!𝑘 . (13) Таким образом, количество вершин со степенью 𝑘 имеет распределение Пуассона со средним значением 𝜆𝑘 . Заметим, что ожидаемое значение в распределении (13) есть функция 𝜆𝑘 , заданная равенством (12), а не константа. Распределение Пуассона быстро затухает для больших значений 𝑟 со стандартным отклонением 𝜎𝑘 = √𝜆𝑘 . После небольшого упрощение можем сказать, что равенство (13) предполагает, что 𝑋𝑘 не отклоняется намного от приблизительного результата 𝑋𝑘 = 𝑁𝑃(𝑘𝑖 = 𝑘), что верно только если вершины независимы (см. рисунок 7). Таким образом, с хорошим приближением, распределение степеней случайного графа _ биномиальное, 𝑘 𝑃(𝑘) = 𝐶𝑁−1 𝑝𝑘 (1 − 𝑝)𝑁−1−𝑘 , (14) Что для больших значений 𝑁 может быть заменено распределением Пуассона, (𝑝𝑁)𝑘 ⟨𝑘⟩𝑘 𝑃(𝑘) ≃ 𝑒 −𝑝𝑁 𝑘! = 𝑒 −⟨𝑘⟩ 𝑘! . (15) После новаторской статьи Эрдоса и Ренйи, была проведена огромная работа в изучении существования и единственности минимальной и максимальной степени в случайном графе. Результаты показывают, что для большого множества значений 𝑝 и максимальная, и минимальная степень определены и конечны. Например, если 𝑝(𝑁)~𝑁 −1−1/𝑘 (а граф, следовательно, является множеством изолированных деревьев порядка не больше чем 𝑘 + 1), то почти ни один граф не имеет вершин со степенью выше чем 𝑘. Если же 𝑝 = {ln(𝑁) + ln[ln(𝑁)] + 𝑐 /𝑁}, то почти в каждом графе минимальная степень не меньше чем 𝑘. Кроме того, для достаточно большого 𝑝, соответственно, если 𝑝𝑁 ln(𝑁) → ∞, то максимальная степень почти всех случайных графов имеет тот же порядок величины, что и средняя степень. Таким образом, несмотря на то, что распределение ребер случайно, типичный случайный граф достаточно однородный и большинство вершин имеют одно и то же количество ребер. Связность и диаметр Диаметр графа _ максимальное расстояние между любой парой вершин. Строго говоря, диаметр несвязного графа (т.е. такого, который состоит из отдельных кластеров) бесконечен, но он может быть определен как максимальный диаметр кластеров графа. Случайные графы склонны иметь маленький диаметр, если конечно значение 𝑝 не слишком мало. Причина этого заключается в том, что граф вероятно будет распространяться: с большой вероятностью количество вершин, расстояние которых от некоторой фиксированной вершины есть 𝑙, не намного меньше ⟨𝑘⟩𝑙 . Приравнивая ⟨𝑘⟩𝑙 с 𝑁, получим, что диаметр пропорционален ln(𝑁)/ ln(⟨𝑘⟩); следовательно, от количества вершин он зависит только логарифмически. Диаметр случайного графа изучался многими авторами (см. Чанг и Лу, 2001). Общим выводом является то, что для большинства значений 𝑝 почти все графы с теми же значениями 𝑁 и 𝑝 имеют приблизительно одинаковый диаметр. Это означает, что при рассмотрении всех графов с 𝑁 вершинами и вероятностью соединения 𝑝 промежуток значений, в котором диаметры этих графов могут меняться, очень маленький, и обычно сконцентрированный вокруг 𝑑= ln(𝑁) ln(𝑝𝑁) = ln(𝑁) ln(⟨𝑘⟩) . (16) Ниже мы подытожим несколько важных результатов:  Если ⟨𝑘⟩ = 𝑝𝑁 < 1, типичный граф состоит из деревьев и его диаметр равен диаметру дерева.  Если ⟨𝑘⟩ > 1, появляется гигантский кластер. Диаметр графа равен диаметру гигантского кластера, если ⟨𝑘⟩ ≥ 3,5 и пропорционален ln(𝑁) / ln(⟨𝑘⟩).  Если ⟨𝑘⟩ ≥ ln(𝑁), то почти все графы полностью связные. Диаметры графов, имеющих одинаковые 𝑁 и ⟨𝑘⟩, сконцентрированы на нескольких величинах, близких к ln(𝑁) / ln(⟨𝑘⟩). Для определения степени разброса случайного графа можно также вычислить среднее расстояние между всеми парами вершин или посчитать среднюю длину пути. Можно ожидать, что средняя длина пути соотносится с количеством вершин также, как и диаметр, 𝑙𝑟𝑎𝑛𝑑 ~ ln(𝑁) / ln(⟨𝑘⟩). ( 17) Рисунок 8. Сравнение между средней длиной пути реальных сетей и предположения (17) теории случайных графов (пунктирная линия). Для каждого символа мы отмечаем соответствующее число в таблицах I и II: маленький ○, I.12; большой ○, I.13; , I.17; маленький □, I.10; средний □, I.11; большой □, II.13; маленькой ●, II.6; средний ●, I.2; ×, I.16; маленький , I.7; маленький ■, I.15; большой , I.4; маленький , I.5; большой , I.6; большой ●, II.6; маленький ♦, I.1; маленький , I.7; , I.3; средний ♦, II.1; большой ■, I.14; большой , I.5; большой ♦, II.3. В разделе II мы представили доказательство того, что средняя длина пути в реальных сетях близка к средней длине пути в случайных графах того же размера. Равенство (17) дает нам возможность для лучшего сравнения случайных графов и реальных сетей (см. Ньюман 2001a, 2001c). Согласно равенству (17), произведение 𝑙𝑟𝑎𝑛𝑑 ln(⟨𝑘⟩) совпадает с ln(𝑁), поэтому графическое представление 𝑙𝑟𝑎𝑛𝑑 ln(⟨𝑘⟩) как функции от ln(𝑁) для случайных графов разных размеров дает линию с наклоном 1. В рисунке 8 мы графически изображаем аналогичные произведения для нескольких реальных сетей, 𝑙𝑟𝑒𝑎𝑙 log(⟨𝑘⟩), как функция от размера сети, сравнивая ее с ожидаемым значением в равенстве (17). Мы можем увидеть, что направление данных совпадает с теоретическим предсказанием, и, с некоторыми исключениями, равенство (17) дает первое приемлемое приближение. Коэффициент кластерации Как мы заметили в разделе II, сложные сети имеют высокую степень кластерации. Если рассмотреть вершину в случайном графе вместе с двумя его ближайшими соседними вершинами, вероятность того, что эти соседи соединены равна вероятности того, что соединены две случайно выбранные вершины. Следовательно, коэффициент кластерации случайного графа равен 𝐶𝑟𝑎𝑛𝑑 = 𝑝 = ⟨𝑘⟩/𝑁. (18) Согласно равенству (18), если мы графически изобразим отношение 𝐶𝑟𝑎𝑛𝑑 /⟨𝑘⟩ как функцию от 𝑁 для случайных графов разных размеров, на графике в двойном логарифмическом масштабе они выстроятся в линию вдоль прямой с наклоном −1. На рисунке 9 мы изобразили отношение коэффициента кластерации реальных сетей и их среднюю степень как функцию от их размера, сравнивая с ожидаемой величиной в равенстве (18). График ясно показывает, что реальные сети не следуют предсказанию для случайных графов. Отношение не увеличивается как 𝑁 −1; вместо этого оно оказывается независимым от 𝑁. Это свойство характерно для больших упорядоченных сетей, коэффициент кластерации которых зависит только от числа координированности сети, а не от его размера (Уоттс и Строгатс, 1998). Спектр графа Произвольный граф 𝐺 с 𝑁 вершинами может быть представлен с помощью матрицы инцидентности 𝐴(𝐺) с 𝑁 × 𝑁 элементами 𝐴𝑖𝑗 , где 𝐴𝑖𝑗 = 𝐴𝑗𝑖 = 1, если вершины 𝑖 и 𝑗 соединены, и 0, в противном случае. Спектром графа 𝐺 называется множество собственных значений его матрицы инцидентности 𝐴(𝐺). Граф с 𝑁 вершинами имеет 𝑁 собственных значений 𝜆𝑗 𝑁 1 𝑝(𝜆) = ∑ 𝛿(𝜆 − 𝜆𝑗 ) , 𝑁 (19) 𝑗=1 что приближается к непрерывной функции, если 𝑁 → ∞. Рисунок 9. Сравнение коэффициентов кластерации реальных сетей и случайных графов. Все сети из таблицыI включены в рисунок, а символы совпадают с символами из рисунка 8. Пунктирная линия соответствует равенству (18). Рисунок 10. Спектральная плотность с измененным масштабом трех случайных графов с 𝑝 = 0,05 и с размерами 𝑁 = 100 (непрерывная линия), 𝑁 = 300 (линия с длинными пунктирами), и 𝑁 = 1000 (линия с короткими пунктирами). Изолированный пик соответствует главному собственному значению. Фаркас и др. (2001). Интерес к свойствам спектров связан с тем, что спектральная плотность напрямую связан с топологическими характеристиками графа, т.к. его 𝑘-ый момент может быть представлен как 𝑁 1 1 ∑(𝜆𝑗 )𝑘 = ∑ 𝐴𝑖1 ,𝑖2 , 𝐴𝑖2 ,𝑖3 , … , 𝐴𝑖𝑘,𝑖1 , 𝑁 𝑁 𝑗=1 𝑖1 ,𝑖2 ,…,𝑖𝑘 (20) т.е. количество путей, идущих к той же вершине в графе. Заметим, пути могут содержать вершины, которые уже были посещены. Рассмотрим случайный граф 𝐺𝑁,𝑝 , удовлетворяющий условию 𝑝(𝑁) = 𝑐𝑁 −𝑧 . Для 𝑧 < 1 в графе существует бесконечный кластер (см. раздел III.C), и при 𝑁 → ∞ почти наверняка каждая вершина принадлежит этому бесконечному кластеру. В этом случае спектральная плотность случайного графа стремится к полукружному распределению (см. рисунок 10), √4𝑁𝑝(1 − 𝑝) − 𝜆2 𝑖𝑓 |𝜆| < 2√𝑁𝑝(1 − 𝑝) 𝑝(𝜆) = { 2𝜋𝑁𝑝(1 − 𝑝) (21) 0 в противном случае Известное как закон Уингера (см. Уингер, 1955, 1957, 1958) или закон полуокружности равенство (21) имеет много применений в квантовой, статистической физике и физике твердого тела (Мегта, 1991; Крисанти и др., 1993; Гар, 1998). Самое большие (важнейшее) собственное значение, 𝜆1 , изолированно от объема спектра и увеличивается вместе с размером сети как 𝑁𝑝. При 𝑧 > 1 спектральная плотность отличается от закона полуокружности. Самым поразительным свойством 𝑝(𝜆) является то, что в нечетные моменты он равен нулю. Это означает, что для того, чтобы путь вернулся в первоначальную вершину, он должен пройти в точности через те же вершины. Это яркое свойство структуры дерева, и, в самом деле, в разделе III.B мы увидели, что в данном случае случайный граф состоит из деревьев. IV. Теория протекания Одним из самых интересных открытий в теории случайных графов _ это существование критической вероятности, при которой формируется гигантский кластер. Переводя на язык сетей, теория отмечает существование критической вероятности 𝑝𝑐 такой что до 𝑝𝑐 сеть состоит из изолированных кластеров, а после 𝑝𝑐 гигантский кластер охватывает всю сеть. Это явление заметно похоже на перколяционный переход, тема, много изученная в математике и статистической механике (Стауффер и Аарони, 1992; Бунд и Халвин, 1994, 1996; Гтиммет, 1999; бен Авраам и Халвин, 2000). И в самом деле, перколяционный перехода и появление гигантского кластера _ это одно и то же явление, выраженное на разных языках. Теория просачивания, тем не менее, прямо не воспроизводит предсказание в теории случайных графов. Рассматривая проблемы с другой точки зрения, она обращается к нескольким ключевым понимании реальных сетей вопросам, которые, однако, не обсуждаются в теории случайных графов. Следовательно, важно рассмотреть предсказания теории протекания, значимые для сетей, т.к. они _ ключевые для понимания важных аспектов топологии сетей. Интересные величины в теории протекания Рассмотрим регулярную 𝑑-мерную сеть, ребра которой имеют вероятность присутствия 𝑝 и отсутствия 1 − 𝑝. Теория протекания изучает возникновение путей, которые проходят сквозь сеть (начинаясь в одной стороне и кончаясь в противоположной). Для маленьких значений 𝑝 присутствует только несколько ребер, поэтому могут формироваться только маленькие кластеры вершин, соединенных ребрами, а при критической вероятности 𝑝𝑐 , называемой пределом перколяции, появляется перколяционный кластер вершин, соединенных ребрами (см. рисунок 11). Этот кластер также называется бесконечным кластером, т.к. его размер расходится с увеличением размера сети. Есть несколько хорошо изученных версий перколяции. Представленная выше версия называется “связной перколяцией”. Рисунок 11. Двумерная иллюстрация связной перколяции. Узлы размешены в сетке 25 × 25, два узла соединяются с вероятностью 𝑝. Для 𝑝 = 0,315 (слева), что ниже предела перколяции 𝑝𝑐 = 0,5, соединенные узлы формируют изолированные кластеры. Для 𝑝 = 0,525 (справа), что выше предела перколяции, появляется самый большой кластер. Самой известной альтернативой является позиционная перколяция, в которой все связи присутствуют, а узлы сети не являются изолированными с вероятностью 𝑝. Также, как и для связной перколяции, только для маленьких значений 𝑝 существуют конечные кластеры связанных ребер, а для 𝑝 > 𝑝𝑐 появляется бесконечный кластер. Ниже приведены основные величины, представляющие интерес в перколяции: (1) Вероятность перколяции 𝑃, обозначает вероятность того, что заданный узел принадлежит бесконечному кластеру: 𝑃 = 𝑃𝑝 (|𝐶| = ∞) = 1 − ∑ 𝑃𝑝 (|𝐶| = 𝑠), (22) 𝑠<∞ где 𝑃𝑝 (|𝐶| = 𝑠) обозначает вероятность того, что кластер в начале имеет размер 𝑠. Очевидно 0 если 𝑝 < 𝑝𝑐 𝑃={ . (23) > 0 если 𝑝 > 𝑝𝑐 (2) Средний размер кластера ⟨𝑠⟩, определенное как ∞ ⟨𝑠⟩ = 𝐸𝑝 (|𝐶|) = ∑ 𝑠𝑃𝑝 (|𝐶| = 𝑠), (24) 𝑠=1 давая ожидаемое значение размера кластера. Т.к. ⟨𝑠⟩ бесконечно при 𝑃 > 0, в таком случае лучше работать со средним размером конечных кластеров, убирая из системы конечный кластер |𝐶| = ∞ ⟨𝑠⟩ 𝑓 = 𝐸𝑝 (|𝐶|, |𝐶| < ∞) = ∑ 𝑠𝑃𝑝 (|𝐶| = 𝑠). (25) 𝑠<∞ (3) Распределение размера кластеров 𝑛𝑠 , определенное как вероятность того, что узел имеет фиксированную позицию в кластере размера 𝑠 (например, узел является левым концом, если данная позиция однозначно определена). 1 𝑛𝑠 = 𝑃𝑝 (|𝐶| = 𝑠). (26) 𝑠 Заметим, что 𝑛𝑠 не совпадает с вероятностью того, что узел является частью кластера размера 𝑠. Фиксируя позицию узла в кластере, мы выбираем лишь один из возможных 𝑠 узлов. Это отражено в том, что 𝑃𝑝 (|𝐶| = 𝑠) разделено на 𝑠, гарантируя, что мы считаем каждый кластер только один раз. Эти количества представляют интерес также и в случайных сетях. Тем не менее, есть одно важное различие между теорией протекания и случайными сетями: теория протекания определена на регулярных 𝑑-мерных сетях. В случайной сети (или графе) мы можем определить неметрическое расстояние вдоль ребер, но т.к. любая вершина может быть соединена ребром с любой другой вершиной, нет регулярной сети маленькой меры, в которую сеть может быть помещена. Тем не менее, как мы обсудим ниже, случайные сети и теория протекания встречаются в бесконечномерном пределе (𝑑 → ∞) протекания. К счастью, многие результаты в теории протекания могут быть обобщены для бесконечных измерений. Следовательно, результаты, полученные в контексте протекания, распространяются также и на случайные сети. Общие результаты 1. Субкритическая фаза (𝑝 < 𝑝𝑐 ). Когда 𝑝 < 𝑝𝑐 , в системе присутствуют только маленькие кластеры соединенных ребер. На данном этапе придвигаются следующие вопросы: (i) какова вероятность существования пути 𝑥 ↔ 𝑦, соединяющей две случайно выбранные вершины 𝑥 и 𝑦? и (ii) какова степень разложения 𝑃𝑝 (|𝐶| = 𝑠) при 𝑠 → ∞? Первый результат такого рода был достигнут Хаммерслейем (1957). Он показал, что вероятность соединения пути с первоначальной вершиной на поверхности, 𝜕𝐵(𝑟), куба с центром в начале и длиной сторон 2𝑟 затухает экспоненциально при 𝑃 < ∞. Мы можем определить длину корреляции 𝜉 как характеристическую длину экспоненциального затухания 𝑃𝑝 [0 ↔ 𝜕𝐵(𝑟)]~𝑒 −𝑟/𝜉 , (27) Где 0 ↔ 𝜕𝐵(𝑟) означает, что существует путь из первоначальной вершины к произвольному узлу в 𝜕𝐵(𝑟). Равенство (27) показывает, что радиус конечных кластеров в субкритической части имеет экспоненциально убывающий хвост, а корреляционная длина представляет средний радиус конечного кластера. Было показано (Гриммет, 1999), что 𝜉 равен 0 при 𝑝 = 0 и стремится к бесконечности при 𝑝 → 𝑝𝑐 . Экспоненциальное убывание радиусов кластеров предполагает, что вероятность того, что кластер имеет размер 𝑠, 𝑃𝑝 (|𝐶| = 𝑠), также убывает экспоненциально для больших значений 𝑠: 𝑃𝑝 (|𝐶| = 𝑠)~𝑒 −𝛼(𝑝)𝑠 при 𝑠 → ∞, (28) Где 𝛼(𝑝) → ∞ при 𝑝 → ∞ и 𝛼(𝑝𝑐 ) = 0. 2. Сверхкритическая фаза (𝑝 > 𝑝𝑐 ). Для 𝑃 > 0 существует точно один бесконечный кластер (Бартон и Кеан, 1989). В этой сверхкритической фазе прежде исследованные количества доминируются вкладом бесконечного кластера; таким образом полезно изучить соответствующие вероятности в терминах конечных кластеров. Вероятность того, что существует путь с начала до поверхности куба с длиной сторон 2𝑟, который не является частью бесконечного кластера, экспоненциально убывает 𝑃𝑝 [0 ↔ 𝜕𝐵(𝑟), |𝐶| < ∞]~𝑒 −𝑟/𝜉 . (29) В отличие от субкритической фазы, несмотря на то, что убывание размеров кластеров, (𝑑−𝐼)/𝑑 𝑃𝑝 (|𝐶| = 𝑠) < ∞, строго экспоненциально, 𝑒 −𝛽(𝑝)𝑠 , предлагая первое количество, которое зависит от размерности сети, но даже эта зависимость исчезает при 𝑑 → ∞, и распределение размера кластера экспоненциально убывает как и субкритической фазе. Точные решения: протекание в дереве Кэли Дерево Кэли (или сеть Бете) не содержит циклы (см. рисунок 12), в котором каждая вершина имеет 𝑧 соседей, за исключением вершин на поверхности. В то время как поверхность и объем регулярного 𝑑-мерного объекта подчиняется масштабному соотношению поверхность∝ объем 1−1/𝑑 и только в пределе 𝑑 → ∞ поверхность пропорциональна объему, для дерева Кэли количество вершин на поверхности пропорционально общему количеству вершин (т.е. объему дерева). Рисунок 12. Образец дерева Кэли с координированным числом 𝑧 = 3. Все вершины имеют три ребра, кроме вершин на поверхности, которые имеют только одно ребро. Соотношение между количеством вершин на поверхности и общим количеством вершин приближается к константе, (𝑧 − 2)/(𝑧 − 1), свойство, которое справедливо только для бесконечномерных объектов. Средняя степень приближается ⟨𝑘⟩ = 2, когда размер дерева стремится к бесконечности, свойство, которое довольно часто встречается у случайных деревьев (см. раздел III.B). Таким образом, в этом отношении дерево Кэли представляет собой бесконечномерный объект. Еще одним аргументом в пользу бесконечномерности дерева Кэли является то, что в нем нет циклов. Отсюда, несмотря на его регулярную топологию, дерево Кэли представляет имеющее смысл приближение к топологии случайных сетей в субкритической фазе, где все кластеры являются деревьями. Это неверно в сверхкритической фазе, т.к. при критической вероятности 𝑝𝑐 (𝑁) в графе появляются циклы всех порядков (см. раздел III.C). Для исследования протекания в дереве Кэли мы предполагаем, что каждое ребро присутствует с вероятностью 𝑝. Затем мы обсуждаем основные количества, представляющие интерес для данной системы. (a) Предел протекания: Присутствие хотя бы одного из 𝑧 − 1 возможных ребер из вершины (т.е.(𝑧 − 1)𝑝 ≥ 1) является условием существования бесконечного пути от начала. Отсюда, предел протекания равен 1 𝑝𝑐 = . (30) 𝑧−1 (b) Вероятность протекания: Для дерева Кэли с 𝑧 = 3, для которого 𝑝𝑐 = 1/2 вероятность протекания дается следующим образом (Стауффер и Аарони, 1192) 1 0 если 𝑝 < 𝑝𝑐 = 2 𝑃 = 2𝑝 − 1 (31) 1 если 𝑝 > 𝑝𝑐 = . { 𝑝2 2 1 Разложение в ряд Тейлора в окрестности 𝑝𝑐 = 1/2 дает 𝑃 ≃ 8(𝑝 − 2), следовательно, вероятность протекания, пропорциональную отклонению от предела протекания 𝑃 ∝ (𝑝 − 𝑝𝑐 )при 𝑝 → 𝑝𝑐 . (32) (c) Средний размер кластеров: Средний размер кластеров дается формулой ∞ 3 1 3 ⟨𝑠⟩ = ∑ 3 × 2𝑛−1 𝑝𝑛 = = (𝑝𝑐 − 𝑝)−1 . (33) 2 1 − 2𝑝 4 𝑛=1 Заметим, что ⟨𝑠⟩ расходится при 𝑝𝑐 → 𝑝, и расстояние 𝑝𝑐 − 𝑝 от предела протекания зависит от 𝑝. Такое поведение _ пример критического явления: параметр порядка приближается к нулю, следуя степенному закону в окрестности критической точки (Стенли, 1971; Ма, 1976). (d) Распределение размеров кластеров: Вероятность наличия кластера размера 𝑠 есть (Дуретт,1985) 1 𝑠−1 𝑠−1 𝑃𝑝 (|𝐶| = 𝑠) = 𝐶2𝑠 𝑝 (1 − 𝑝)𝑠+1 . (34) 𝑠 Здесь количество ребер, окружающих 𝑠 вершин есть 2𝑠, из которых внутренние 𝑠 − 1 ребра 𝑠−1 должны присутствовать, а наружные 𝑠 + 1 _ отсутствовать. Множитель 𝐶2𝑠 учитывает различные случаи, которые могут возникать при перестановке ребер, а 1/ 𝑠 _ нормализующий сомножитель. Т.к. 𝑛𝑠 = (1/𝑠)𝑃𝑝 (|𝐶| = 𝑠), то после применения формулы Стерлинга получим 𝑛𝑠 ∝ 𝑠 −5/2 𝑝 𝑠−1 (1 − 𝑝)𝑠+1 . (35) В окрестности предела протекания это выражение приблизительно равно следующему 𝑛𝑠 ~𝑠 −5/2 𝑒 −𝑐𝑠 где 𝑐 ∝ (𝑝 − 𝑝𝑐 )2 . (36) Таким образом, распределение размеров кластеров следует степенному закону с экспоненциальным хвостом: только кластеры размера 𝑠 < 𝑠𝜉 = 1/𝑐 ∝ (𝑝 − 𝑝𝑐 ) −2 играют значительную роль в средних значениях кластеров. Для этих кластеров 𝑛𝑠 фактически равно 𝑛𝑠 (𝑝𝑐 ) ∝ 𝑠 −5/2. Кластеры с 𝑠 ≫ 𝑠𝜉 экспоненциально редки, а их свойства не определяются поведением 𝑝𝑐 . Индексация 𝑠𝜉 демонстрирует, что т.к. длина корреляции 𝜉 _ характеристический размер длины диаметров кластеров, 𝑠𝜉 _ внутренняя характеристика размеров кластеров. Корреляционная длина дерева плохо определена, но в более общих случаях мы увидим, что 𝑠𝜉 и 𝜉 соотносятся простым степенным законом. Масштабирование в критических областях Основным анзацом теории протекания является то, что окрестности предела протекания самая общая задача перколяции в любом измерении подчиняется масштабному соотношению, аналогичному равенству (36). Следовательно, в общем случае размер кластера может быть представлен следующим образом: 1 𝑛𝑠 (𝑝)~ { 𝑠 −𝜏 𝑓− (|𝑝 − 𝑝𝑐 |𝜎 𝑠) 1 𝑠 −𝜏 𝑓+ (|𝑝 − 𝑝𝑐 |𝜎 𝑠) при 𝑝 ≤ 𝑝𝑐 (37) при 𝑝 ≥ 𝑝𝑐 . Здесь 𝜏 и 𝜎 _ критические степени, численные значения которых должно быть определено, 𝑓− и 𝑓+ _ гладкие функции на [0, ∞) и 𝑓− (0) = 𝑓+ (0). Результаты раздела IV.B подсказывают, что 𝑓− (𝑥) ≃ (𝑑−1)/𝑑 1 𝑒 −𝐴𝑥 и 𝑓+ (𝑥) ≃ 𝑒 −𝐵𝑥 для 𝑥 ≫ 1. Этот анзатс показывает, что значение 𝑠𝜉 ∝ |𝑝 − 𝑝𝑐 |𝜎 как хвоста та же, что и для дерева Кэли. Общее выражение (37) в качестве частного случая содержит дерево Кэли с 𝜏 = 5/2, 𝜎 = 1/2 и 𝑓∓ (𝑥) = 𝑒 −𝑥 . Еще одним элементом масштабной гипотезы является тот факт, что корреляционная длина расходится в окрестности пределе протекания, следую степенному закону: 𝜏−1 𝑃~(𝑝 − 𝑝𝑐 )𝛽 с 𝛽 = , (39) 𝜎 что оценивается как положительная степень величины 𝑝 − 𝑝𝑐 для 𝑝 ≫ 𝑝𝑐 ; следовательно она равняется 0 для 𝑝 = 𝑝𝑐 и возрастает при 𝑝 > 𝑝𝑐 . Средний размер конечных кластеров, ⟨𝑠⟩ 𝑓 , который может быть вычеслен в обоих сторонах предела протекания, имеет следующее значение: 3−𝜏 ⟨𝑠⟩ 𝑓 ~|𝑝 − 𝑝𝑐 |−𝛾 с 𝛾 = , (40) 𝜎 Что расходится при 𝑝 → 𝑝𝑐 . Показатели 𝛽 и 𝛾 называются критическими степенями для вероятности протекания и среднего размера кластеров, соответственно. Структура кластера До сих пор мы обсуждали размеры и радиусы кластеров, не обращая внимания на их внутреннюю структуру. Будем теперь считать, что периметром кластера 𝑡 называется количество вершин на внешних ребрах (листья). Периметр 𝑡𝑠 очень большого, но конечного кластера размера 𝑠 равен следующему (Леат, 1976) 1−𝑝 𝑡𝑠 = 𝑠 + 𝐴𝑠 𝜉 при 𝑠 → ∞, (41) 𝑝 где 𝜉 = 1 для 𝑝 < 𝑝𝑐 и 𝜉 = 1 − 1/𝑑 при 𝑝 > 𝑝𝑐 . Таким образом, ниже 𝑝𝑐 периметр кластера пропорционален его объему. Это свойство _ очень неправильное свойство, которое, тем не менее, верно для деревьев, включая дерево Кэли. Другом способом понимания непривычной структуры конечных кластеров _ оценивание соотношения между их радиусами и объемом. Корреляционная длина 𝜉 _ мера среднего радиуса 1/𝜈𝜎 кластеров, и мы знаем, что 𝜉 соотносится с размером 𝑠𝜉 хвоста кластера как 𝜉 ∝ 𝑠𝜉 . Отсюда, конечные кластеры являются фракталами (см. Манделброт, 1982), т.к. их размер измеряется не как 𝑑-ая степень радиуса, а как 𝑠(𝑟)~𝑟 𝑑𝑓 , (42) Где 𝑑𝑓 = 1/ 𝜎𝜈. Можно также показать, что в пределе протекания бесконечный кластер все еще является фракталом, но для 𝑝 > 𝑝𝑐 он превращается в нормальный 𝑑-мерный объект. В то время как радиусы кластера и корреляционная длина 𝜉 определены с использованием Евклидово расстояния, химическое расстояние определяется как длина кратчайшего пути между двумя противоположными сторонами кластера (Хавлин и Носсал, 1984). Следовательно, химическое расстояние _ эквивалент расстояния в случайном графе. Количество вершин в химическом расстоянии 𝑙 оценивается следующим образом 𝑠(𝑙)~𝑙 𝑑𝑙 , (43) где 𝑑𝑙 называется размерностью графа кластера. В отличие от фрактальной размерности 𝑑𝑓 Евклидово расстояния, для размерности графа 𝑑𝑙 пока не найдено соотношение с другими критическими показателями. Бесконечномерное протекание Протекание, как известно, имеет критическую размерность 𝑑𝑐 , ниже которого некоторые показатели зависят от 𝑑, но для любой размерности, выше 𝑑𝑐 , все показатели совпадают. Считается, что критическая размерность протекания _ 𝑑𝑐 = 6, однако независимость критических показателей от размерности показано только для 𝑑 ≥ 19 (см. Хара и Слейд, 1990). Таким образом, для 𝑑 > 𝑑𝑐 применяется бесконечномерная теория протекания, что предсказывает следующее:  𝑃~(𝑝 − 𝑝𝑐 ) при 𝑝 → 𝑝𝑐 ;  ⟨𝑠⟩~(𝑝𝑐 − 𝑝)−1 при 𝑝 → 𝑝𝑐 ; 2  𝑛𝑠 ~𝑠 −5/2 𝑒 −|𝑝−𝑝𝑐| 𝑠 при 𝑝 → 𝑝𝑐 ;  𝜉~|𝑝 − 𝑝𝑐 |−1/2 при 𝑝 → 𝑝𝑐 . Следовательно, критическими для бесконечномерного протекания являются показатели 𝜏∞ = 5/2, 𝜎∞ = 1/2 и 𝜈∞ = 1/2. Фрактальная размерность бесконечного кластера в пределе протекания равна 𝑑𝑓 = 4, а размерность графа 𝑑𝑙 = 2 (Бунд и Халвин, 1996). Таким образом, характеристическое химическое расстояние в конечном или бесконечном кластере при пределе протекания соотносится с его размером как 1 𝑙~𝑠 2/𝑑𝑓 = 𝑠 2 . (44) Параллели между теорией случайных графов и протеканием В теории случайных графов мы изучаем граф с 𝑁 вершинами, где каждая пара вершин соединена с вероятностью 𝑝. Это соответствует протеканию в максимум 𝑁 измерениях, таких что две соединенные вершины являются соседями, а ребра между вершинами графа _ ребра в задаче протекания. Т.к. теория случайных графов изучает предел 𝑁 → ∞, она аналогична бесконечномерному протеканию. В разделе IV.C мы увидели, что бесконечномерное протекание подобно протеканию в дереве Кэли. Предел перколяции для дерева Кэли есть 𝑝𝑐 = 1/(𝑧 − 1), где 𝑧 _ число координации дерева. В случайном графе из 𝑁 ребер число координации есть 𝑁 − 1; следовательно, “предел протекания”, который показывает вероятность соединения, при которой появляется гигантский кластер, должен быть 𝑝𝑐 ≃ 1/𝑁. И в самом деле, это ровно та вероятность, при которой фазовый переход, ведущий к наличию гигантского компонента, появляется в случайном графе, как это показали Эрдос и Ренйи (см. раздел III.C). Сравним предсказания для теории случайных графов и бесконечномерного протекания, часть которых отражают совершенную аналогичность: (1) Для 𝑝 < 𝑝𝑐 = 1/𝑁.  Вероятность наличия гигантского кластера в графе и бесконечного кластера в протекании равна 0.  Кластеры в случайных графах являются деревьями, а в протекании кластеры имеют фрактальную структуру и периметр, пропорциональный их объему.  Самый большой кластер в случайном графе _ это дерево с ln(𝑁) вершинами, а в протекании в общем случае 𝑃𝑝 (|𝐶| = 𝑠)~𝑒 −𝑠/𝑠𝜉 [см. равенство (28) в разделе IV.B], что подсказывает, что размер наибольшего кластера измеряется как ln(𝑁).     (2) Для 𝑝 = 𝑝𝑐 = 1/𝑁. Появляется единственный гигантский кластер или бесконечный кластер. Размер гигантского кластера _ 𝑁 2/3 , а для бесконечномерного протекания _ 𝑃𝑝 (|𝐶| = 𝑠)~𝑠 −3/2, поэтому размер наибольшего кластера измеряется как 𝑁 2/3 . (3) Для 𝑝 > 𝑝𝑐 = 1/𝑁. Размер гигантского кластера составляет (𝑓(𝑝𝑐 𝑁) − 𝑓(𝑝𝑁))𝑁, где 𝑓 _ экспоненциально возрастающая функция с 𝑓(1) = 1. Размер бесконечного кластера составляет 𝑃𝑁 ∝ (𝑝 − 𝑝𝑐 )𝑁. Гигантский кластер имеет сложную структуру, содержащую циклы, а бесконечный кластер является не фрактальным, а компактным. Все эти соответствия показывают, что переходная фаза в случайных графах принадлежит тому же всеобщему классу что и осредненное протекание. Численное моделирование случайных графов (см., например, Кристенсен и др., 1998) подтвердило, что критические показатели переходной фазы равны критическим показателям в бесконечномерном протекании. Эквивалентность этих двух теорий очень важна, т.к. это дает возможность взглянуть на ту же задачу по-разному. Например, часто интересно посмотреть на распределение размера кластеров в случайной сети с фиксированным количеством вершин. На этот вопрос легче найти ответ в теории протекания. Тем не менее, теория случайных графов отвечает на вопросы огромной важности для сетей, такие как появление деревьев и циклов, на которые теория протекания почти не обращает внимание. В некоторых случаях между предсказаниями теории случайных графов и теорией перколяции есть видимое различие. Например, теория перколяции предсказывает, что химическое расстояние между двумя узлами в бесконечном кластере измеряется как степень размера кластера [см. равенство (44)]. А теория случайных графов предсказывает [см. равенство (16)], что диаметр бесконечного кластера измеряется логарифмически вместе с размером (см. Чанг и Лу, 2001). Причиной этого явного различия является то, что два этих предсказания относятся к различным системам. Тогда как равенство (44) справедливо только тогда, когда бесконечный кластер только что образовался [например, 𝑝 = 𝑝𝑐 и ⟨𝑘⟩ = 1] и все еще является фракталом, предсказание теории случайных графов выполняется после перколяционного перехода при ⟨𝑘⟩ ≫ 1. Следовательно, используя эти два предела мы можем обращаться к эволюции химического расстояния в бесконечном кластере (см. Кохен и др., 2001). Таким образом, для того, чтобы полностью охарактеризовать случайные сети, нам необходимо быть знакомыми с этими двумя взаимодополняющими подходами. V. Обобщенные случайные графы В разделе II мы увидели, что реальные сети отличаются от случайных графов в том, что их степенное распределение часто подчиняется степенному закону 𝑃(𝑘)~𝑘 −𝛾 . Т.к. степенные законы не обладают характерного масштаба, эти сети называются “сетями без масштаба” (Барабаси и Альберт, 1999; Барабаси, Альберт и Йонг, 1999). Из-за того, что случайные графы не обладают свойством независимости от масштаба реальных сетей, нам нужна другая модель для описания этих систем. Одним из подходов является обобщение случайных графов, сконструировав модель, которая в качестве входных данных получает степенное распределение и является случайным по всем другим параметрам. Другими словами, ребра соединяют случайно выбранные вершины с ограничением, что степенное распределение подчиняется степенному закону. Теория таких полуслучайных графов должна ответить на вопросы, подобные тем, что поставили Эрдос и Ренйи и теория перколяции (см. разделы III, IV): Существует ли граница, при которой появляется гигантский кластер? Как развиваются размер и топология кластеров? Когда граф становится связным? Кроме того, необходимо определить среднюю длину пути и коэффициент кластерации такого графа. Первым шагом в развитии такой теории является определение существенного параметра, который, вместе с размером сети, дает статистически полную характеристику сети. В случае случайных графов таким параметром является вероятность связывания (см. раздел III.A); в теории перколяции _ это вероятность наличия связи (см. раздел IV). Т.к. единственным ограничением для этих графов является то, что их степенное распределение подчиняется степенному закону, показатель распределения степеней 𝛾 может выступать в качестве контрольного параметра. Соответственно, мы изучаем системы без масштаба систематически изменяя 𝛾 и смотрим есть ли граничное значение 𝛾, при котором важные свойства сетей внезапно изменяются. Сначала мы делаем некоторые интуитивные предположения. Рассмотрим большую сеть с распределением степеней 𝑃(𝑘)~𝑘 −𝛾 , где 𝛾 убывает от ∞ к 0. Средняя степень сети, или, что то же −𝛾+2 самое, количество ребер, возрастает с убыванием 𝛾, т.к. ⟨𝑘⟩~𝑘𝑚𝑎𝑥 , где 𝑘𝑚𝑎𝑥 < 𝑁 _ максимальная степень графа. Это очень похоже на процесс эволюции графа, описанный Эрдосом и Ренйи (см. раздел III.C). Соответственно, в то время как при больших значениях 𝛾 сеть состоит из изолированных маленьких кластеров, мы предполагаем, что существует критическое значение 𝛾, при котором формируется гигантский кластер, и даже при таком маленьком 𝛾 сеть становится полностью связной. Теория случайных графов с заданной степенной последовательностью возникла сравнительно недавно. Один из первых результатов был достигнут благодаря Луцзаку (1992), кто показал, что почти все случайные графы с фиксированным распределением степеней и со степенями вершин не меньше 2, имеют единственный гигантский кластер. Моллой и Рид (1995, 1998) доказали, что для случайных графов с распределением степеней 𝑃(𝑘) бесконечный кластер появляется почти наверняка при 𝑄 ≡ ∑ 𝑘(𝑘 − 2)𝑃(𝑘) > 0, (45) 𝑘≥1 обеспечивая, что максимальная степень меньше чем 𝑁1/4 . Метод Моллоя и Рида был применен к случайным графам с распределением степеней по степенному закону Аелло, Чангом и Лу (2000). Как мы покажем далее, их результаты полностью соответствуют предположениям, описанным выше. Предел в случайных графах, не зависящих от масштаба Аелло, Чанг и Лу (2000) представляют модель графа с двумя параметрами 𝑃(𝛼, 𝛾), который определяется следующим образом: Пусть 𝑁𝑘 _ количество вершин со степенью 𝑘. 𝑃(𝛼, 𝛾) определяет одинаковую вероятность для всех графов с 𝑁𝑘 = 𝑒 𝛼 𝑘 −𝛾 . Таким образом, в этой модели определено не общее количество вершин _ вместе с показателем 𝛾 _ в самом начале, а количество вершин со степенью 1. Тем не менее, количество вершин и ребер в графе может быть выведено, учитывая, что максимальная степень в графе 𝑒 𝛼/𝛾 . Для нахождения условия появления гигантского кластера в этой модели подставим 𝑃(𝛼, 𝛾) в равенство (45), получая в качестве решения 𝛾0 = 3,47875 …. . Таким образом, при 𝛾 > 𝛾0 случайный граф почти наверняка не содержит бесконечный кластер. С другой стороны, при 𝛾 < 𝛾0 почти наверняка присутствует единственный бесконечный кластер. Связность графа является очень важным вопросом. При 𝛾 > 𝛾0 граф точно является несвязным, т.к. он состоит из независимый конечных кластеров. В интервале 0 < 𝛾 < 𝛾0 Аелло Чанг и Лу (2000) изучили размер второго по величине кластера и обнаружили, что при 2 ≤ 𝛾 ≤ 𝛾0 второй по величине кластер почти наверняка имеет размер порядка ln(𝑁), что относительно мало. Тем не менее, почти наверняка при 1 < 𝛾 < 2 каждая вершина со степенью больше ln(𝑁) принадлежит бесконечному кластеру. Второй по величине кластер имеет размер порядка 1, т.е. его размер не возрастает, когда размер графа стремится к бесконечности. Это означает, что относительное количество вершин в бесконечном кластере приближается к 1 с увеличением размера системы; таким образом граф становится полностью связным в пределе бесконечного размера системы. И наконец, при 0 < 𝛾 < 1 граф почти наверняка связный. Формализм функции генерации Общий подход к случайным графам с заданным распределением степеней был разработан Ньюманом, Строгатзом и Уоттсом (2001) с использованием формализм функции генерации (Уилф, 1990). Функция генерации распределения степеней, ∞ 𝐺0 (𝑥) = ∑ 𝑃(𝑘)𝑥 𝑘 , (46) 𝑘=0 инкапсулирует всю информацию, содержащуюся в 𝑃(𝑘), т.к. 1 𝑑 𝑘 𝐺0 𝑃(𝑘) = | . (47) 𝑘! 𝑑𝑥 𝑘 𝑥=0 Важной величиной в изучении структуры кластера является функция генерации распределения степеней ближайших соседей случайно выбранной вершины. Она может быть выведена следующим образом: случайно выбранное ребро достигает вершину со степенью 𝑘 с вероятностью, пропорциональной 𝑘𝑃(𝑘) (т.е. легче найти связанную вершину). Если возьмем случайную вершину и проследуем за всеми ребрами выходящими из нее, то вершины, в которые мы попадем, имеют распределение, генерированное 𝑘𝑃(𝑘). Вдобавок, функция вывода будет содержать 𝑥 𝑘−1 [вместо 𝑥 𝑘 в равенстве (46)], т.к. мы должны вычесть ребро, с помощью которого мы дошли до этой вершины. Таким образом, распределение выходящих ребер генерируется функцией ∑𝑘 𝑘𝑃(𝑘)𝑥 𝑘−1 1 ′ 𝐺1 (𝑘) = = 𝐺 (𝑥). (48) ∑𝑘 𝑘𝑃(𝑘) ⟨𝑘⟩ 0 Среднее количество первых соседей равна средней степени графа, 𝑧1 = ⟨𝑘⟩ = ∑ 𝑘𝑃(𝑘) = 𝐺0′ (1). (49) 𝑘 1. Размеры компонент и фазовые переходы. При определении кластера с использованием ‘burning’ алгоритма (алгоритма поиск в ширину) мы начинаем с произвольной вершины и следуем за ребрами до тех про, пока не достигаем их ближайших соседей. Мы отмечаем эти вершины как часть кластера, затем следуем за выходящими из них ребрами (избегая уже отмеченные вершины) и отмечаем вершины, в которые мы пришли, как следующие ближайшие соседи первоначальной вершины. Процесс продолжается до тех пор, пока новые вершины не находятся. Множество отмеченных вершин составляет изолированный кластер. Этот алгоритм полностью включен в метод функции генерации. Функция генерации 𝐻1 (𝑥) распределения размера кластеров, полученных методом следования случайного ребра, удовлетворяет следующему итерационному равенству: ∑𝑘 𝑘𝑃(𝑘)[𝐻1 (𝑥)]𝑘 𝐻1 (𝑥) = = 𝑥𝐺1 [𝐻1 (𝑥)]. (50) ∑𝑘 𝑘𝑃(𝑘) Здесь 𝑘𝑃(𝑘) пропорционально вероятности того, что случайное ребро соединено с вершиной со степенью 𝑘, а [𝐻1 (𝑥)]𝑘 представляет 𝑘 способа, как кластер может быть продолжен рекурсивно (т.е. нахождением ближайших соседей ранее отмеченных вершин). Если начинать с произвольной вершины, то получим один такой кластер с этой вершиной на конце каждого ребра, и отсюда получим функцию генерации размера всего кластера: 𝐻0 (𝑥) = 𝑥 ∑ 𝑃(𝑘)[𝐻1 (𝑥)]𝑘 = 𝑥𝐺0 [𝐻1 (𝑥)]. 𝑘 (51) Когда в графе нет гигантского кластера, средний размер кластеров представляется следующим образом: 𝐺0′ (1) ⟨𝑠⟩ = 𝐻0′ (1) = 1 + . (52) 1 − 𝐺1′ (1) Это выражение расходится при 𝐺1′ (1) = 1, отмечая появление гигантского кластера. Подставляя значение 𝐺0 (𝑥), условие появления гигантского кластера можно записать так: ∑ 𝑘(𝑘 − 2)𝑃(𝑘) = 0, (53) 𝑘 что идентично с равенством (45), выведенным Моллоем и Ридом (1995). Равенство (53) дает неявную зависимость для критического распределения степеней случайного графа: Для любого распределения степеней, для которого сумма левой части отрицательна, в графе не присутствует гигантский кластер, а распределения степеней с положительной суммой ведут к появлению гигантского кластера. Когда гигантский кластер присутствует, 𝐻0 (𝑥) генерирует распределение вероятностей конечных кластеров. Это означает, что 𝐻0 (1) больше не равно 1, а принимает значение 1 − 𝑆, где 𝑆_ относительное количество вершин в гигантском кластере. Этот факт может быть использован для вычисления значения размера гигантского кластера 𝑆 (Моллой и Рид, 1998): 𝑆 = 1 − 𝐺0 (𝑢), (54) где 𝑢 _ наименьшее неотрицательное действительное решение равенства 𝑢 = 𝐺1 (𝑢). Т.к. мы имеем дело со случайными графами (несмотря на то, что распределение степеней), теория перколяции (см. раздел IV) отмечает, что в близи перехода фаз хвост распределения размера кластера,𝑛𝑠 , ведет себя следующим образом: 𝑛𝑠 ~𝑠 −𝜏 𝑒 −𝑠/𝑠𝜉 . (55) Характерный размер кластера 𝑠𝜉 может быть связан с первой особой точкой 𝐻0 (𝑥), 𝑥 ∗ , переходом фаз 𝑥 ∗ = 1 и 𝑠𝜉 → ∞. Используя разложение в ряд Тейлора в окрестности критической точки, мы видим, что 𝐻0 (𝑥) измеряется как 𝐻0 (𝑥)~(1 − 𝑥)𝛼 при 𝑥 → 1, (56) 1 где 𝛼 = 2. Этот показатель может быть связан с показателем 𝜏, используя связь между 𝑛𝑠 и 𝐻0 (𝑥), 5 получая значение 𝜏 = 𝛼 + 2 = 2, не зависимо от распределения степеней. Таким образом, в окрестности критической точки распределение размера кластеров следующее 𝑛𝑠𝑐 ~𝑠 −5/2 , как это было предсказано бесконечномерной перколяцией (см. IV.F), и сейчас было распространено на огромное семейство случайных графов с произвольным распределением степеней. 2. Средняя длина пути. Расширяя метод вычисления среднего количества ближайших соседей, мы находим среднее количество 𝑚-тых соседей, 𝑧2 𝑚−1 𝑧𝑚 = [𝐺1′ (1)]𝑚−1 𝐺0′ (1) = [ ] 𝑧1 , (57) 𝑧1 где 𝑧1 и 𝑧2 _ количество ближайших и вторых по близости соседей. Используя это выражение, мы можем вывести приблизительное соотношение для средней длины пути в графе. Пусть имеется некоторая вершина. Найдем количество ее ближайших, вторых ближайших, …, 𝑚-тых соседей. Предполагая, что все вершины графа могут быть достигнуты через 𝑙 шагов, получим 𝑙 1 + ∑ 𝑛(𝑚) = 𝑁, 𝑚=1 (58) где 𝑛(𝑚) _ количество 𝑚-тых соседей первоначальной вершины. Для того, чтобы приблизительно получить среднюю длину пути, можем заменить 𝑛(𝑚) на 𝑧𝑚 , получая 𝑙 1 + ∑ 𝑧𝑚 = 𝑁. (59) 𝑚=1 Для большинства графов с 𝑁 ≫ 𝑧1 𝑧2 ≫ 𝑧1, получим ln(𝑁/𝑧1 ) 𝑙= + 1. (60) ln(𝑧2 /𝑧1 ) В случае связных деревьев существует более точный метод (Амбъорн, Дуруус и Джонсон, 1990; Бурда, Коррея и Крзивики, 2001), согласно которому средняя длина связных деревьев с распределением степеней по степенному закону оценивается как 𝑁 (𝛾−2)/(𝛾−1) , где 𝛾 _ показатель степени. Ни смотря на то, что данная оценка имеет другой функциональный вид, при приближении 𝛾 к 2 зависимость от размера системы становится очень слабой и практически не отличается от логарифмической зависимости. Случайные графы с распределением степеней по степенному закону В качестве применения формализма функции генерации Ньюман, Строгатс и Уоттс (2001) рассматривают случай распределения степеней типа 𝑃(𝑘) = 𝐶𝑘 −𝛾 𝑒 −𝑘/к для 𝑘 ≥ 1, (61) где 𝐶, 𝛾 и к _ константы. Экспоненциальный остаток, который присутствует в некоторых социальных и биологических (см. Амараль и др., 2000; Йонг, Мейсон и др., 2001; Ньюман, 2001a), обладает техническим преимуществом, давая возможность нормализировать распределения для всех 𝛾, а не только 𝛾 ≥ 2, как в случае исключительно степенного закона. Константа 𝐶 фиксируется нормализацией, получая значение 𝐶 = [𝐿𝑖𝛾 (𝑒 −1/к )]−1 , где 𝐿𝑖𝑛 (𝑥)_ 𝑛-тый полилогарифм 𝑥. Таким образом, распределение степеней характеризуется двумя независимыми параметрами: показателем 𝛾 и остатком к. Следуя выше описанному формализму, мы получаем, что размер бесконечного кластера равен 𝐿𝑖𝛾 (𝑢𝑒 −1/к ) 𝑆 = 1− , (62) 𝐿𝑖𝛾 (𝑒 −1/к ) где 𝑢 _ наименьшее неотрицательное действительное решение равенства 𝑢 = 𝐿𝑖𝛾 (𝑢𝑒 −1/к )/ [𝑢𝐿𝑖𝛾−1 (𝑒 −1/к )]. Для графов с распределением по исключительно степенному закону (к → ∞) равенство, представленное выше, имеет вид 𝑢 = 𝐿𝑖𝛾−1 (𝑢)/[𝑢𝜁(𝛾 − 1)], где 𝜁(𝑥) _ функция Римана 𝜁. Для всех 𝛾 ≤ 2 это дает 𝑢 = 0, и следовательно 𝑆 = 1, предполагая, что случайно выбранная вершина принадлежит гигантскому кластеру с вероятностью, приближающейся к 1 при к → ∞. Для графов с 𝛾 > 2 такой случай не возможен, даже для бесконечного к, что означает, что такой граф содержит конечные кластеры, т.е. он не связный, согласно с выводами Аелло, Чанга и Лу (2000). Средняя длина пути следующая: ln 𝑁 + ln[𝐿𝑖𝛾 (𝑒 −1/к )/𝐿𝑖𝛾−1 (𝑒 −1/к )] 𝑙= + 1, (63) ln[𝐿𝑖𝛾−2 (𝑒 −1/к )/𝐿𝑖𝛾−1 (𝑒 −1/к ) − 1] где в пределе к → ∞ имеем ln 𝑁 + ln[𝜁(𝛾)/𝜁(𝛾 − 1)] 𝑙= + 1. (64) ln[𝜁(𝛾 − 2)/𝜁(𝛾 − 1) − 1] Заметим, что данное выражение не имеет конечного положительного действительного значения для любого 𝛾 < 3, обозначая, что для получения определенной средней длины пути необходимо определить конечный остаток к для распределения степеней. Уравнения (60) и (63) восстанавливают результат моделирований масштабирования конечных размеров всемирной сети, показывая, что ее средняя длина пути логарифмически соизмерима с ее размером. Но, предложили ли они хорошую оценку для средней длины пути реальных сетей? В разделе II мы увидели, что предварительная оценка теории случайных графов находится в качественном согласии с средними длинами пути реальных сетей, но есть также значительные отклонения от них. Таким образом, важно видеть, что, если принимать во внимание правильное степенное распределение, оно даст более лучшее соответствие. На Рис.13 мы сравниваем предварительную оценку равенства (63) с средней длиной пути реальной сети, представляя A( 𝑙-1)-B как функцию сети размере N, где 1 1 𝐴 = log[𝐿𝑖𝛾−2 (𝑒 −𝑘 )⁄𝐿𝑖𝛾−1 (𝑒 −𝑘 ) − 1] 1 1 𝐵 = log[𝐿𝑖𝛾 (𝑒 −𝑘 )⁄𝐿𝑖𝛾−1 (𝑒 −𝑘 )] и мы используем длину 𝜅 кратчайшего пути как получили из эмпирического распределения степеней. Для направленных сетей мы использовали значения 𝛾𝑜𝑢𝑡 . Для случайных сетей с одинаковыми N, 𝛾 , 𝜅 как в реальных сетях, значения A( 𝑙-1)-B будут выстраиваться в линию с наклоном 1 на графике линейного логарифма, заданный прерывистой линией на Рис.13. Реальные значения для реальных сетей подчиняются общему направлению, но они кажутся систематически больше предварительной оценки равенства (63), указывая что средняя длина пути реальных сетей больше длины среднего пути случайный графов с степенным распределением степеней. Это заключение подтверждается тремя столбцами таблицы II, которые напрямую сравнивают среднюю длину пути реальных сетей с степенным распределением степеней 𝑙𝑟𝑒𝑎𝑙 , с предварительной оценкой теории случайных графов 𝑙𝑟𝑎𝑛𝑑 и с теорией безмасштабных графов 𝑙𝑝𝑜𝑤 . Мы можем видеть, что общее направление для 𝑙𝑟𝑒𝑎𝑙 быть больше 𝑙𝑝𝑜𝑤 и 𝑙𝑟𝑎𝑛𝑑 , это знак неслучайных аспектов топологии реальных сетей. Двудольные графы и коэффициент кластеризации Коэффициент кластеризации безмасштабных случайных графов пока не рассчитан в литературе, но мы можем сделать некоторые предположения о общих характеристиках если примем во внимание что безмасштабные графы похожи на случайные графы Ердоса-Реньи в том смысле, что их вершины распределяются случайным образом. В результате коэффициент кластеризации безмасштабных случайных графов сходиться к 0 при возрастании размера сети. Нелишне отметить, что некоторые реальные сети представленные в разделе II, к примеру, сеть сотрудничества может быть более полно описана двудольными графами (Newman, Strogatz and Watts, 2001). В двудольном графе есть два типа вершин и ребра соединяют только вершины разных типов. К примеру, сеть сотрудничества актеров-проекция двудольного графа актеры-фильмы, в котором 2 типа вершин-актеры и фильмы и ребро соединяет каждый фильм с актером, сыгравшим в нем(См. Рис.14).Тот же подход применим к сотрудничеству между учеными (где ученые и их труды являются двумя типами вершин) и к метаболическим сетям (где вершинами могут быть субстраты или реакции). Рис.14 Схематическое представление двудольного графа, такого как граф фильмов и актеров сыгравших в них. В этом маленьком графе мы имеем четыре фильма, помеченных цифрами от 1 до 4, и одиннадцать актеров, помеченных буквами от A до K, ребра соединяют фильм с актером, снявшимся в нем. Нижняя фигура показывает проекцию графа для 11-и актеров. Newman, Strogatz, and Watts (2001). Метод порождающей функции может быть распространен на двудольные графы и это действует на ненулевой коэффициент кластеризации свойственный двудольной структуре 𝐶= 1 (𝜇 −𝜇 )(𝜈2 −𝜈1 )2 1+𝜇 𝜈2 (2𝜈1 −3𝜈 1 1 1 2 +𝜈3 ) (65) где 𝜇𝑛 = ∑𝑘 𝑘 𝑛 𝑃𝑎 (𝑘) и 𝜈𝑛 = ∑𝑘 𝑘 𝑛 𝑃𝑚 (𝑘). В структуре актер-фильм, 𝑃𝑎 (𝑘) представляет часть актеров, которая появилась в k фильмах, 𝑃𝑚 (𝑘) -часть фильмов, в которых появилось k актеров. Предварительная оценка (65) была протестирована для нескольких графов сотрудничества. В некоторых случаях было превосходное согласие, но в других она отклонялась множителем 2-и от коэффициента кластеризации реальной сети. Следовательно, мы можем заключить, что порядок, присутствующий в сети, благодаря не только определению сети, но и пока неизвестному принципу организации. VI. Сети малые миры В разделе II и III.A мы видели (Таблица I,Рис. 8 и 9) что реальные сети имеют характер малых миров как и случайные графы, но у них необычайно большие коэффициенты кластеризации. Несмотря на это, как показывает Рис.9 коэффициент кластеризации не связан с размером сети. Это последнее свойство является характеристикой упорядоченной решетки, коэффициент кластеризации которой не зависит от размера и зависит только от числа координирования. К примеру, в одномерной решетке с периодическими граничными условиями (кольцо узлов) в которой каждый узел связан с K узлами близкими к нему(Fig. 15), большинство из ближайших соседей любой позиции также являются соседями, т.е. решетка кластеризирована. Для такой решетки коэффициент кластеризации равен 𝐶= 3(𝐾 − 2) 4(𝐾 − 1) который стремится к ¾ при больших K. Такие низкоразмерные регулярные решетки, тем не менее, не умеют путей небольшой длины: для d-размерной гиперкубической решетки, среднее расстояние между узлами соизмеримо с 𝑁1/𝑑 , который увеличивается быстрее с N чем логарифмический рост обнаруженный в случайных и реальных графах. Первая удачная попытка генерации графов с высоким коэффициентом кластеризации и маленьким l принадлежит Уотсу и Строгатсу ( Watts and Strogatz) (1998). Модель Уотса-Строгатса Уотса и Строгатс (1998) предложили однопараметрическую модель, которая интерполирует между упорядоченной конечномерной решеткой и случайным графом. У модели следующий алгоритм(Рис.15): (1)Начать с порядка: Начать с круглой решетки с N узлами в которой каждый узел соединен со своими первыми K соседями (К/2 с другой стороны). Для того чтобы иметь редкую, но связанную сеть в любой момент времени надо предположить 𝑁 ≫ 𝐾 ≫ ln(𝑁) ≫ 1. (2) Рандомизировать. Каждое ребро решетки случайным образом пересоединить с вероятностью p так, чтобы исключались самосоединения и двойные ребра. Этот процесс представляет pNK/2 ребра широкого диапазона, которые соединяют узлы, которые в противном случае были бы частью разных окрестностей. Изменяя p можно отслеживать перемещения между порядком(p=0) и случайностью(p=1). Модель имеет корни в социальной системе в которой большинство людей является друзьями со своими непосредственными соседями - соседи по одной улице, коллеги, люди с которыми их познакомили друзья. Тем не менее у каждого есть один или два друга, которые находятся далеко - в другой стране, знакомые, которые представлены далекими ребрами, полученные пересоединениями в моделе Уотса-Строгатса. Для понимания сосуществования путей с малыми длинами и кластеризации, мы изучаем поведение коэффициента кластеризации C(p) и средней длины пути l(p) как функцию от вероятности p пересоединения. Для круглой решетки l(0)≅ 𝑁/2𝐾 ≫ 1 и C(0)≅ 3/4. l масштабируется линейно с размером системы и коэффициент кластеризации большой. С другой стороны при 𝑝 → 1 модель стремится к случайному графу, для которого l(1)~ln(N)/ln(K) и C(1) ~K/N. l масштабируется линейно с размером системы, коэффициент кластеризации уменьшается с N.Эти граничные случаи могут предлагать что большое C всегда связано с большим l, а маленькое C с маленьким l. Напротив Уотс о Строгатс(1989) нашли что существует широкий интервал p на котором l(p) близко l(1), но C(p)≫C(1)(Рис.16). Этот режим проявляется в быстром падении l(p) для маленьких значений p,в то время как C(p) остается почти неизменным, следствием чего является то, что сеть кластеризована, но имеет маленькую характеристику длины пути. Это сосуществование маленького l и большого C является прекрасным соглашением с характеристиками реальных сетей,рассмотренных в разделе II,что и побуждает многих называть такие системы сетями “малые миры”(small world networks). Свойства small-world сетей Новаторская статья Уотса-Строгатса положило начало исследованию свойств small-world сетей и модели Уотса-Строгатса. Широко изученный вариант модели Уотса-Строгатса был предложен Newman-ом и Watts-ом, в котором ребра добавляются между случайно выбранными парами сторон, но ни одно ребро не удаляется из регулярной решетки. Эта модель более проста для анализа чем оригинальная модель Уотса-Строгатса, так как она не приводит к формированию изолированных кластеров, тогда как это происходит в оригинальной модели. Для достаточно малых p и больших N это модель эквивалентна модели Уотса-Строгатса. Мы должны резюмировать основные результаты, относящиеся к свойствам small-world моделей. 1. Средняя длина пути Как мы уже говорили выше, в модели Уотса-Строгатса есть изменения в масштабировании характерной длины пути l так как доля p пересоединенных ребер увеличивается. Для малого p l масштабируется линейно с размером системы, в то время как для больших p масштабирование логарифмично. Как обсуждается у Watts(1999), Pandit, Amritkar (1999), корнем быстрого падения в l является появление путей напрямик(ссылок) между узлами. Каждая случайно созданная ссылка соединяет разделенные части графа и таким образом, имеет значительное влияние на характерную длину пути всего графа. Даже относительно низкая доля ссылок достаточна для резкого увеличения средней длины пути, но локально сеть остается в высшей степени упорядоченной. Относительно средней длины пути важен вопрос, является ли начало small-world поведения зависимым от размера системы. Уотс был первым, кто заметил что l не начинает уменьшаться пока p≥2/NK, гарантируя существования хотя бы одной ссылки. Это означает, что переход p зависит от размера системы или наоборот существует p-зависимая переходная длина(размер) N* такая что, если N<N* , l ~N, но если N>N* , l ~ ln(N). Концепцию переходного размера представили Barthe‘le´my и Amaral(1999),которые предположили, чтотипичная длина пути соизмерима со следующей величиной(Рис.17) l (N,p)~ N*F ( N N∗ ) (67) где F(u) = { 𝑢 если 𝑢 ≪ 1 ln(𝑢) если 𝑢 ≫ 1 (68) Численное моделирование и аналитические аргументы (Barrat1999; Barthe´le´my and Amaral, 1999; Newman and Watts,1999a; Argollo de Menezes et al.,2000;BarratandWeigt,2000) заключили что переходный размер N* соизмеримо с p как 𝑁 ∗ ~𝑝−𝜏 , где 𝝉=1/d и d это размерность исходной решетки к которой случайным образом добавляются ребра (Рис.18). итак, для исходной модели Уотса-Строгатса, определенной на круге (d=1), имеем 𝝉=1, начало small-world поведения имеет место с вероятностью пересоединения p*~1/N. Рис.17 Коллапс данных l(N,p)/N*(p) в сравнении с N/N*(p) для двух различных значений K:(a)логарифмолинейный масштаб показывающий логарифмическое поведение при больших N/N*; (b)линейный масштаб показывающий линейное поведение l(N,p) ~N/(4K).Barrat and Weigt(2000). Сейчас широко принято, что характерная длина пути подчиняется соотношению 1 l (N, p)~ Nd K f(pKN) (69) где f(u) универсальная функция масштабирования, которая определяется следующим образом 𝑐𝑜𝑛𝑠𝑡 f(u) = { ln(𝑢)/𝑢 если 𝑢 ≪ 1 если 𝑢 ≫ 1 (70) Newman,Moore and Watts(2000) подсчитали форму функции масштабирования f(u) для одномерной small-world модели используя метод среднего поля, который точен для малых или больших значений u, неточен в системах, в которых u≅1. 𝑓(𝑢) = 4 √𝑢2 +4𝑢 tanh−1 𝑢 √𝑢2 +4𝑢 (71) Они также решили для полного распределения длин пути в пределах приближений среднего поля. Масштабное соотношение (69) было подтверждено экстенсивными численными моделированиями (Newman and Watts,1999a;Argollo de Menezes et al.,2000), методами ренормализационных групп (Newman and Watts,1999a) и разложениями в ряды(Newman and Watts,1999b). Соотношение (69) показывает что средняя длина пути в small-world модели на первый взгляд зависит от 3-х параметров-p, K и N и полностью определяется одной скалярной функцией f(u) от одной скалярной переменной. Заметим, что функция f(u) и переменная u=pK𝑁 𝑑 имеют простое физическое объяснение. Переменная u-удвоенное среднее число случайных ссылок в графе при заданном p, и f(u)-средняя часть дроби, с помощью которой расстояние между двумя вершинами уменьшается при заданном u. Несколько попыток было сделано для точного подсчета распределения длин пути и средней длины пути l. Dorogovtsev and Mendes(2000a) изучили упрощенную модель, которая содержала круглую решетку с направленными ребрами длины 1 и центральную вершину, которая соединялась с вероятностью p с вершинами решетки ненаправленными ребрами длины 0.5. Они подсчитали точное распределение длин пути для этой модели, показав, что l/N зависит только от величины pN и функциональная форма этой зависимости похожа на l(p) численно полученную в мотели УотсаСтрогатса. Kulkarni et al. (1999) подсчитали вероятность P(m|n) того, что между двумя узлами с евклидовым расстоянием n имеется путь длины m. Они показали, что средняя длина пути связана со средним арифметическим <S> и средним квадратичным <𝑆 2 > кратчайшего расстояния между двумя диаметрально расположенными напротив друг друга вершинами (т.е разделенные наибольшим евклидовым расстоянием) следующим образом: l N = <𝑠> N−1 − <𝑠2 > L(N−1) (72) К сожалению подсчет кратчайшего расстояния между расположенными напротив друг друга вершинами так же тяжело как определить l прямо. 2. Коэффициент кластеризации В дополнение к средней длине короткого пути, small-world сети имеют относительно высокий коэффициент кластеризации. Модель Уотса-Строгатса демонстрирует эту двойственность для широкого диапазона вероятностей пересоединения p. В регулярной решетке (p=0) коэффициент кластеризации не зависит от размера решетки а только от ее топологии. Так как ребра сети случайны коэффициент кластеризации остается близким к C(0) при больших значениях p. Зависимость C(p) от p может быть получена используя немного другое, но эквивалентное определение C, представленное Barrat-ом и Weigt-ом(2000).Согласно этому определению C′(p) является отношением среднего числа ребер между соседями вершины к среднему числу возможных ребер между соседями. Более наглядная формулировка (Newman, Strogatz and Watts,2001), 3∗число треугольников C′= число связанных триад (73) Здесь треугольники-тройки вершин, в которых каждая вершина связана с двумя остальными, и связанные триады-тройки в которых пока немерие одна вершина связана с остальными, множитель 3 способствует формированию трех связанных триад. Это определение отвечает концепции “доля транзитивных троек”,которая используется в социологии (Wasserman and Faust 1994). Чтобы подсчитать C′( 𝑝) для модели Уотса-Строгатса начнем с регулярной решетки с коэффициентом кластеризации C(0). Для p>0 два соседа вершины i, которые были соединены при p=0 все еще соседи i и соединены ребром с вероятностью (1 − 𝑝)3 , есть три ребра, которые должны остаться нетронутыми. В результате C′( 𝑝)≅ C(0) (1 − 𝑝)3 . Barrat и Weigt(2000) подтвердили, что отклонение C(p) от этого выражения мало и стремится к 0 при N→∞.Соответствующее выражение для модели Уотса-Строгатса имеет вид (Newman,2001e) 3K(K−1) C ′ ( 𝑝) = (74) 2K(2K−1)+8pK2 +4p2 K2 3. Распределение степеней В модели Уотса-Строгатса для p=0 каждая вершина имела ту же степень K. Распределение степеней-дельта-функция с центром в K.Ненулевое p представляет беспорядок в сети, расширяя распределение в сети и сохраняя среднюю степень равной K.Так как только один конец каждого ребра пересоединяется (в целом pNK/2 ребер), каждая вершина имеет по крайней мере K/2 ребер после процесса пересоединения. В результате для K>2 нет изолированных вершин и сеть обычно связанная в отличие от случайного графа, который состоит из изолированных кластеров для широкого диапазона вероятностей соединений. Для p>0 степень 𝑘𝑖 вершины i может быть записана как (Barrat,Weigt,2000) 𝑘𝑖 =K/2+𝑐𝑖 где 1 𝑐𝑖 может быть разделено на две части: 𝑐𝑖 ≤ 𝐾/2 ребра оставлены на месте (с вероятностью 1-p), в то время как 𝑐𝑖2 = 𝑐𝑖 − 𝑐𝑖1 ребер было пересоединено по отношению к I, каждый с вероятностью 1/N. Распределения вероятностей 𝑐𝑖1 и 𝑐𝑖2 задаются следующим образом 1 1 𝑐𝑖1 1 𝑃1 (𝑐𝑖 ) = 𝐶𝐾⁄2 (1 − 𝑝)𝑐𝑖 𝑝𝐾⁄2−𝑐𝑖 (75) и 𝑃2 (𝑐𝑖2 ) = 2 𝑐𝑖2 1 𝑐𝑖 𝐶𝑝𝑁𝐾⁄2 ( ) 𝑁 2 1 𝑝𝑁𝐾 ⁄2−𝑐𝑖 (1 − ) 𝑁 2 ≃ (𝑝𝐾/2)𝑐𝑖 𝑐𝑖2 ! 𝑒 −𝑝𝐾/2 (76) для больших N. Объединяя эти два выражения получим распределение степеней (𝑝𝐾/2)𝑘−𝐾⁄2−𝑛 −𝑝𝐾/2 𝑓(𝑘,𝐾) 𝑃(𝑘) = ∑𝑛=0 𝐶𝐾𝑛⁄2 (1 − 𝑝)𝑛 𝑝𝐾⁄2−𝑛 𝑒 (77) (𝑘−𝐾 ⁄2−𝑛)! для k≥K/2 ,где 𝑓(𝑘, 𝐾) = min(𝑘 − 𝐾/2, 𝐾/2). Форма распределения степеней похожа на форму распределения степеней случайных графов.Оно имеет определенный максимум при ⟨𝑘⟩ = 𝐾 I убывает экспоненциально для больших k (Рис.1.9). Таким образом топология сети относительно однородна,все вершины имеют приблизительно одинаковое количество ребер Рис.1.9 Распределение степеней модели УотсаСтрогатса для K=3 и различных p.Мы можем видеть,что здесь присутствуют только значения k≥K/2 и средняя степень ⟨𝑘⟩ = 𝐾.Символы получены из численного моделирования модели Уотса-Строгатса с N=1000,а линии отвечают формуле (77). Для сравнения, распределение степеней случайного графа с теми же параметрами построена с заполненными символами. 4. Спектральные свойства Как обсуждалось в Разделе III.G, спектральная плотность выявляет важную информацию о топологии. В частности мы видели, что для больших случайных графов 𝑝(𝜆) сходится к полукругу. Неудивительно,что спектр модели Уотса-Строгатса зависит от вероятности пересоединения p (Farkas et al.,2001). Для p=0 сеть регулярна и периодична; 𝑝(𝜆) содержит многочисленные особенности (Рис.20(а)). Для промежуточных значений p эти особенности становятся неясными, но 𝑝(𝜆) сохраняет сильную асимметрию (Рис. 20(b) и (c)). Наконец, при p→1, 𝑝(𝜆) приближается к полукругу, слабо характеризуя случайные графы (Рис. 20(d)). Пока все детали спектральной плотности значительно изменяются с 𝑝 ,третий момент 𝑝(𝜆) единообразно высок, указывая на высокое число треугольников в сети. Результаты из Рис.20 позволяют нам заключить, что высокое число треуголников-основное свойство модели Уотса-Строгатса. Высокая регулярность small-world модели для широкого диапазона 𝑝 подчеркивается результатами, касающиеся спектральных свойств оператора Лапласа, который говорит нам о времени развития диффузионного поля графа. Рис.20. Спектральная плотность small-world сетей, сравненная с законом полукруга соответствующего случайным графам(сплошная линия). Вероятности пересоединений (a) p=50; (b) p=50.01; (c) p=50.3; и (d) p=51. VII. Безмасштабные (scale-free) сети Эмпирические результаты обсужденные в разделе II показывают, что много больших сетей безмасштабны, т.е распределение степеней следует степенному закону для больших k. Даже для тех сетей для которых P(k) имеет экспоненциальный хвост распределение степеней значительно отклоняется от распределения Пуассона. Мы видели в разделе III.D и VI.B.3,что теория случайных графов и модель Уотсастрогатса не могут воспроизвести эту черту. Это просто конструировать случайные графы, которые имеют степенное распределение степеней(разд. V) эти конструкции только отвечают на важный вопрос: что за механизм ответственен за появление безмасштабный сетей? В этом разделе мы увидим что ответ на этот вопрос требует перемещения от моделирования топологии сети к моделированию совокупности сети и к развитию. Несмотря на то, что с этой точки зрения эти два подхода не различаются мы обнаружим фундаментальное отличие между подходами моделирования в случайных графах и small-world модели – требуется восстанавливать степенное распределение степени. В то время как целью предыдущих моделей было построить граф с правильными топологическими характеристиками, моделирование безмасштабных сетей поставит акцент на фиксировании развития сети. Основное допущение в случае развивающихся или динамических сетей является то, что если нам удастся правильно выделить процессы, которые составляют сети, которые мы видим в наши дни, тогда мы можем правильно получить их топологию. Динамика играет главную роль, топология является только побочным продуктом этой философии моделирования. A. Модель Барабаси-Альберта (Barabási–Albert (BA) model) Происхождение степенного закона распределения степеней, наблюдаемого в сетях, было впервые рассмотрено Барабаси и Альбертом(1990), кто утверждал, что безмасштабный характер сетей коренится в двух общих механизмах, совместно используемых многими реальными сетями. Модели сетей, которые обсуждались до сих пор,предполагали,что мы начинаем с фиксированного числа N вершин, которые потом случайным образом соединяются или пересоединяются, не изменяя N. в противоположность этому большинство реальных сетей описывают открытые системы, которые растут продолжительным добавлением новых вершин. К примеру, Всемирная сеть экспоненциально растет во времени добавлением новых веб-страниц, и научная литература постоянно растет публикацией новых работ. Второе, модели сетей, которые обсуждались до сих пор, предполагали, что вероятность с которой две вершины соединяются (или они пересоединены) не зависит от степени вершины, т.е новые ребра расположены случайным образом. Большинство реальных сетей , тем не менее, показывают предпочтительное присоединение, когда вероятность соединения к вершине зависит от степени вершины. К примеру, вероятнее, что веб-страница будет включать гиперссылки на популярные документы, с уже высокими степенями, потому что такие сильно связанные документы легко найти и они хорошо известны, или новая рукопись вероятнее будет ссылаться на хорошо известные и много цитируемые издания нежели на мало известные и мало цитируемые документы. Эти два компонента-рост и предпочтительное соединение вдохновили на введение ВАмодели, которая впервые привела к сети с распределение степеней по степенному закону. Алгоритм ВА-модели следующий: (1) Рост. Начиная с небольшого числа 𝑚0 узлов, на каждом временном шаге добавляется один новый узел с m(≤ 𝑚0 ) связями, которые соединяют этот новый узел с m различными уже существующими узлами. (2) Предпочтительное присоединение (Preferencial attachment). Когда выбираются узлы, к которым присоединяется новый узел, предполагается, что вероятность Π с которой новой узел будет соединяться с уже существующим узлом i зависит от числа связей 𝑘𝑖 узла , так что 𝑘 Π(𝑘𝑖 ) = ∑ 𝑖 (78) j 𝑘𝑗 После t временных шагов эта процедура приводит к сети с N=t+𝑚0 вершинами и mt ребрами. Численное моделирование показало, что эта сеть эволюционирует в масштабноинвариантное состояние с вероятностью, что вершина имеет k ребер, которая удовлетворяетстепенному закону с экспонентой 𝛾𝐵𝐴 = 3 (FIG.21).Экспонента масштабирования на зависит от m, единственного параметра модели. B. Теоретические подходы Динамические свойства scale-free модели могут быть рассмотрены с использованием различных аналитических подходов. Теория континуума, предложенная Барабаси и Альбертом(1999) сосредоточивается на динамике степеней вершины, которая следует подходу Dorogovtsev, Mendes and Samukhin (2000a), который использует управляющие уравнения и подходу Krapivsky, Redner, and Leyvraz (2000), использующего уравнения скорости .Так как эти методы используются поочерёдно в данном подразделе мы кратко рассмотрим каждый из них. Теория континуума: Подход континуума представленный Baraba'si and Albert(1999) and Baraba´si,Albert, and Jeong(1999) вычисляет зависимость от времени степени 𝑘𝑖 заданной вершины i.Эта степень будет увеличиваться каждый раз,когда новая вершина входит в систему и соединяется с вершиной i, вероятность данного процесса будет Π(𝑘𝑖 ).Предполагая, что 𝑘𝑖 непрерывная вещественная переменная, ожидается, что скорость, по которой изменяется 𝑘𝑖 , пропорциональна Π(𝑘𝑖 ). Следовательно 𝑘𝑖 удовлетворяет динамическому уравнению Сумма в знаменателе проходит по всем вершинам в системе кроме новой. Так как ∑𝑗 𝑘𝑗 = 2𝑚𝑡 − 𝑚, получаем 𝜕𝑘𝑖 𝜕𝑡 = 𝑘𝑖 (80) 2𝑡 Решение этого уравнения, при условии, что каждая вершина i при введении имеет 𝑘𝑖 (𝑡𝑖 ) = 𝑚 𝑡 𝛽 𝑘𝑖 (𝑡) = 𝑚 ( ) 𝑡 где 𝛽 = 𝑖 1 (81) 2 Уравнение (81) показывает что степени всех вершин развиваются одинаково, подчиняются степенному закону, единственная разница – intercept степенного закона.Используя уравнение (81) можно написать вероятность того, что вершина имеет степень 𝑘𝑖 меньше k, т.е P[𝑘𝑖 (𝑡) < 𝑘] 𝑃[𝑘𝑖 (𝑡) < 𝑘] = 𝑃(𝑡𝑖 > 𝑚1/𝛽𝑡 𝑘 1/𝛽 ) (82) Предполагая, что мы добавляем вершины через равные временные интервалы в сеть, значения 𝑡𝑖 постоянную вероятностную плотность (83) Подставляя это в (82) получим (84) Распределение степеней P(k) есть прогнозировав, что асимптотически (t→∞) с не зависит от m согласно численным результатам. Так как степенной закон, рассмотренный для реальных сетей описывает системы разных размеров ожидается, что правильная модель должна обеспечивать распределение степеней, независимое от времени .Действительно, ур. (85) прогнозирует, что распределение степеней в ВАмодели не зависит от времени (и впоследствии не зависит от размера системы 𝑁 = 𝑚0 + 𝑡 ) показывая, что несмотря на непрерывный рост сеть достигает устойчивого scale-free состояния. Более того ур. (85) показывает, что коэффициент степенного распределения пропорционален 𝑚2 .Все предположения численно доказаны. (Fig.21). Master-equation (управляющее уравнение) подход. Метод (Dorogovtsev, Mendes, and Samukhin(2000a;see also Kullmann and Kerte´sz,2001)) изучает вероятность 𝑝(𝑘, 𝑡𝑖 , 𝑡) что в момент 𝑡 вершина i помещенная в момент 𝑡𝑖 имеет степень 𝑘 .В BA-модели,когда новая вершина с m ребрами входит в систему, степень вершины i увеличивается на 1 с вероятностью mΠ(k) = k/2t , в противном случае не изменяется. Управляющее уравнение, контролирующее 𝑝(𝑘, 𝑡𝑖 , 𝑡) для ВА-модели имеет вид (87) Распределение степеней имеет вид Уравнение (87) подразумевает что P(k) решение рекурсивного уравнения 𝑘−1 𝑃(𝑘 − 1), 𝑘 ≥ 𝑚 + 1 𝑃(𝑘) = {𝑘+2 2⁄(𝑚 + 2) , 𝑘 = 𝑚 (89) Получим очень близко к Ур.(86),если использовать теория континуума. Rate-equation(уравнения скорости) подход. Rate-equation подход (Krapivsky, Redner, Leyvraz(2000)) фокусируется на среднее число 𝑁𝑘 (𝑡) вершин с k ребрами в момент t.Когда новая вершина входит в сеть в scale-free модели, 𝑁𝑘 (𝑡) меняется след.образом Здесь первая часть считается для новых ребер, которые соединяются с вершинами у которых уже было k-1 ребер и это увеличивает их степень до k. Вторая часть описывает новые ребра, соединенные с вершинами у которых уже было k ребер, превращая их в вершины с k+1 ребрами, уменьшая кол-во вершин с k ребрами. Третья часть высчитывается для новых вершин с m ребрами. In the asymptotic лимит 𝑁𝑘 (𝑡) = 𝑡𝑃(𝑘) и ∑𝑘 𝑘𝑁 𝑘 (𝑡) = 2𝑚𝑡 приводит к одинаковому рекурсивному уравнению (89) как предполагалось в master-equation подходе. Master-equation и rate-equation подходы полностью эквивалентны и предлагают те же асимптотические результаты что и теория континуума. Однако, для подсчета scaling поведения распределения степеней они могут быть использованы поочерёдно. В добавок эти методы не используя континуум допущений, более удобны для получения конкретных результатов в более сложных сетевых моделях. C. Предельные случаи BA-модели Степенное масштабирование в BA-модели показывает, что рост и предпочтительное присоединение играют важную роль в развитии сети. Но необходимы ли они оба для степенного масштабирования. Для ответа два предельных случая BA-модели были изучены, которые содержат только один из этих двух механизмов. (Baraba´si and Albert,1999; Baraba´si,Albert,and Jeong,1999). Модель A содержит свойство роста без предпочтительного присоединения. Начиная с небольшого числа вершин(𝑚0 ) ,на каждом временном шаге мы добавляем новую вершину с m( ≤ 𝑚0 )ребрами. Мы предполагаем что новая вершина с одинаковой вероятностью соединяется с вершинами, уже находящимися в системе Π(𝑘𝑖 ) = 1⁄(𝑚0 + t − 1) не зависит от 𝑘𝑖 . Теория континуума прогнозирует, что 𝑘𝑖 (𝑡) имеет логарифмическую временную зависимость и для t→∞ распределение степеней экспоненциально убывает. [Fig.22(a)] Экспоненциальный характер распределения показывает, что отсутствие предпочтительного присоединения исключает scale-free характер результирующей сети. Модель B начинается с N вершинами и без ребер. На каждом временном шаге случайным образом выбирается вершина и соединяется с вероятностью Π(𝑘𝑖 ) = 𝑘𝑖 ∑j 𝑘𝑗 к вершине i в системе. Модель B исключает процесс роста, кол-во вершин остается неизменным при развитии сети. Численное моделирование показало что модель показывало степенное масштабирование, P(k) не стационарно. Так как N не меняется и кол-во ребер увеличивается со временем, то после 𝑇 ≃ 𝑁 2 временных шагов система достигает положения, когда все вершины соединены. Выделение времени отдельных степеней может быть рассчитано аналитически, с использованием теории континуума, указав что предположив N≫1 соглашаясь с численными результатами. [Fig.22(b)]. Так как теория континуума прогнозирует что после кратковременного периода средняя степень всех вершин должно иметь одинаковое значение, которое дается ур.(96),мы ожидаем что распределение степеней станет Гауссовским вокруг среднего значения. Действительно, Fig.22(b) показывает что форма P(k) меняется от степенного закона к гауссовскому. Провал моделей A и B показывает что рост и предпочтительное соединение нужны одновременно чтобы воспроизвести устойчивое распределение степеней, наблюдаемое в реальных сетях. D. Свойства BA-модели Несмотря на то, что ВА-модель фиксирует степенной хвост распределения степеней она имеет другие свойства, которые могут не согласовываться с эмпирическими результатами реальных сетей. Как мы обсуждали в разделе 1 характерной чертой реальных сетей является сосуществование кластеризации и коротких длит путей. Несмотря на это мы должны изучить вопрос о том имеет ли сеть, сгенерированная моделью small-world характер . 1.Средняя длина пути FIG.23 показывает среднюю длину пути сети Барабаси-Альберта со средней степенью ⟨𝑘⟩ = 4 как функцию от размера N сети, сравненную с средней длиной пути случайного графа с одинаковым размером и средней степенью. Рисунок показывает, что средняя длина пути в сети Барабаси-Альберта меньше чем в случайном графе для любого N, показывая что неоднородная (гетерогенная) безмасштабная топология эффективнее в приведении узлов близко друг к другу чем гомогенная топология случайных графов. Мы нашли, что средняя длина пути сети БарабасиАльберта увеличивается примерно логарифмически с N и наилучшее соответствие дается в обобщенной логарифмической форме Предыдущие аналитические результаты показали, что есть двойная логарифмическая коррекция логарифмической N зависимости т.е На Рис.23 мы также показали предварительную оценку ур.(60) для этих сетей, используя численно установленное число ближайших и следующих ближайших соседей. Несмотря на то, что соответствие хорошее для случайных графов, рав.(60) систематически преуменьшает среднюю длину пути сети Барабаси-Альберта также как среднюю длину путей случайного графа. Провал ур.60 лежит в основе факта, что топология сети, сгенерированной БАмоделью ,отличается от топологии случайной сети с степенным распределением степеней. Динамический процесс, который генерирует сеть представляет нетривиальные соотношения, которые влияют на все топологические свойства. 2. Соотношения степеней узлов В моделях случайных графов с случайным распределением степеней (see Aiello et al., 2000 and Newman,Strogatz, and Watts,2001)степени узлов не коррелированны. Показали, что в модели БА корреляции развиваются спонтанно между степенями связанных вершин. Предположим, что все пары узлов с степенями связаны ребром. Без ограничения общности мы можем предположить, что узел с степенью k был добавлен позже в систему и k < l. Согласно ур(81) старые вершины имеют степени больше чем молодые и для простоты мы используем m=1. Обозначая 𝑁𝑘𝑙 (𝑡) число связанных пар вершин с степенями k и l, имеем Первый элемент в правой части рассчитывается для изменений в 𝑁𝑘𝑙 благодаря добавлению ребра к вершине степени k-1 или k, которая соединена с вершиной степени l. Несмотря на то, что добавление ребра увеличивает степень узла на 1,первый элемент в числителе соответствует росту в 𝑁𝑘𝑙 ,в то время как второй соответствует уменьшению. Второй элемент правой части объединяет те же эффекты что и первый примененный к другому узлу. Последний элемент рассчитывает вероятность того, что k=1;таким образом, ребро, которое добавляется к вершине с степенью l-1 то же ребро, которое соединяет две вершины. Это уравнение может быть преобразовано в стационарное рекурсивное отношение, используя предположение Решая относительно 𝑛𝑘𝑙 получим. Для сети с случайным распределением степеней, если ребра расставлены случайным образом 𝑛𝑘𝑙 = 𝑛𝑘 ∗ 𝑛𝑙 .Самой важной особенностью результата (96) является то, что связанное распределение не факторизуется т.е 𝑛𝑘𝑙 ≠ 𝑛𝑘 ∗ 𝑛𝑙 . Это указывает на спонтанное появление корреляции между степенями связанных вершин. Единственный случай когда 𝑛𝑘𝑙 может быть упрощен до факторизированного выражения когда 1 ≪ 𝑘 ≪ 𝑙 и 𝑛𝑘𝑙 превращается в 𝑛𝑘𝑙 ≃ 𝑘 −2 𝑙 −2 (97) Но даже тогда, когда оно отлично от 𝑛𝑘𝑙 ≃ 𝑘 −2 𝑙 −2 как полагалось, если корреляция отсутствует в сети. Этот результат предлагает первое подробное доказательство того, что динамический процесс, создаваемый безмасштабной сетью, наращивает нетривиальные корреляции между вершинами, которых нет в некоррелированных моделях. 3.Коэффициент кластеризации В то время как коэффициент кластеризации был изучен в модели Уотса-Строгатса, нет аналитической предварительной оценки для БА-модели.Рис.24 показывает коэффициент кластеризации сети БА с средней степенью ⟨𝑘⟩ = 4 и разного размера, сравнимые с коэффициентом кластеризации 𝐶𝑟𝑎𝑛𝑑 = ⟨𝑘⟩/𝑁 случайного графа.Мы нашли,что коэффициент кластеризации безмасштабной сети где-то в 5 раз выше чем случайного графа.И этот коэффициент растет с числом узлов. Как бы ни было ,коэффициент кластеризации модели БА уменьшается с размером сети приблизительно следуя степенному закону 𝐶 ∼ 𝑁 −0,75 медленнее угасает чем 𝐶 = ⟨𝑘⟩/𝑁, которое рассмотрено в случайных графах. C не зависит от N. 4.Спектральные свойства Спектральная плотность БА модели непрерывна но имеет явную отличительную форму от полуокружностей спектральной плотности случайный графов. Численные моделирования показывают что большая часть 𝜌(𝜆) имеет треуголевидную форму с вершиной выше полукруга и ребрами уменьшающимися по степенному закону. Этот распад по степенному закону благодаря собственным векторам, которые располагаются на узлах с наибольшей степенью. В случае случайных графов главный собственный вектор 𝜆1 разделен от величины спектра. Нижняя граница 𝜆1 может быть задана как корень квадратный от наибольшей степени 𝑘1 . Степени вершин в модели БА увеличиваются как 𝑁 1/2, отсюда 𝜆1 увеличивается как 𝑁1/4 .Численные результаты показывают, что 𝜆1 отклоняется от ожидаемого поведения для малых размерах сетей, достигая его асимптотически при N→∞. Это указывает на присутствие корреляций среди самых длинных строковых векторов, предлагая дополнительный признак для корреляций в БА модели. Главный собственный вектор играет важную роль в моментах 𝜌(𝜆), определяя циклическую структуру сети. По сравнению с случайным графом( p < 1/N ) , где доля циклов становится незначительной в БА сети доля циклов с более чем четырьмя ребрами растет с N и уровень роста циклов растет с размером. Заметьте что доля треугольников уменьшается при N→∞. В то время как в случайных графах 𝜌(𝜆) следует полукруговому закону, (Wigner, 1955,1957,1958) извлекая простые выражения для малых миров, безмасштабные сети остаются вызовами

StatisticalMechanicsOfComplexNetworks(by Barabasi)

Products

Support

StatisticalMechanicsOfComplexNetworks(by Barabasi)

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib