Возвращаясь к Гэлтону

advertisement
Прайс, Дерек «Маленькая наука, большая наука, и за ее пределами». Глава 2
Возвращаясь к Гэлтону.
Фрэнсис Гэлтон (1822-1911), внук Эразма Дарвина, был одним из самых
разносторонних и любознательных умов девятнадцатого века. Он ввел дактилоскопию в
Скотланд Ярде, основал евгеническое общество, которое поддерживало воспитание
человечества на принципах разума и, более всего, положил отличное начало развитию
математической генетики. Его страстью было считать все и переводить это в статистику.
Те, кто считают, что общественные науки основаны на числовых измерениях и
математической теории, могли бы принять за родоначальника скорее его, чем сэра
Уильяма Петти, который обычно считается первым, кто внес цифры в изучение людей
через анализ документов о смертности в семнадцатом веке.
Думаю, страсть Гэлтона наиболее выражается в двух историях, которые могут
показаться более легкомысленными нам, чем ему. В первом он вычислил
дополнительные годы жизни Королевской семьи и духовенства из-за молитв, возносимых
за них большей частью населения; результат – отрицательное число. Во втором, чтобы не
скучать во время позирования портретисту, по двум разным случаям он подсчитал
количество мазков кистью и насчитал около 20 000 – по его подсчетам, такое же число
движений руки во время вязания пары носков.
Не подумайте, что Гэлтон был чудак. Его серьезная работа создана на высоком
научном уровне и имеет важное значение, но сегодня на него обращают мало внимания,
потому что, хотя его исследования зиждутся на увлекательной и обоснованной теории
эволюции Дарвина, Гэлтон упустил истинный механизм генетического воздействия,
обнаруженный его тщательным современником Менделем. Мендель опубликовал свои
открытия за пять лет до книги Гэлтона о наследственной гениальности, но мир не узнал о
нем до того, как Гэлтону исполнилось восемьдесят.
Мы будем изучать его книгу «Наследственная гениальность» и особенно, его
важный труд «Английские ученые» (Лондон, 1874г.). В своих работах Гэлтон увлекается
своим тезисом о том, что великие люди, включая творческих ученых, связаны между
собой и, таким образом, ряд элитных семей, возможно, дали миру большинство
выдающихся государственных деятелей, ученых, поэтов, судей и военачальников его
современности и прошлого. Его главная работа изобилует неверными заключениями и
сейчас мы интересуемся не столько подходом Гэлтона к генетике, сколько несколькими
его интересными побочными исследованиями. Это его пионерские изучения
распределения качества среди знаменитых ученых и ряд конспектов, которые сегодня
нам нужно назвать социологическими и психологическими, которые говорят нам что-то о
характеристиках этих исключительных людей.
Мы намерены пересмотреть эти две главные линии в свете двадцатого века и его
расширения работы Гэлтона. Первая, которая говорит сколько людей или научных статей
или исследований имеются на каждом из нескольких уровней качества, необходима, если
мы хотим понять природу научного качества и это знание – предварительное условие для
интерпретации нескольких различных указательных мер, ранее упомянутых в связи с
основными законами, контролирующими экспоненциальный и логистический темпы
роста науки. Вторая поможет нам сформулировать основные нормы того, что ожидать от
ученых, когда изменение условий, производимых Большой Наукой или Наукой
Насыщения меняет их обстоятельства, с которыми они были знакомы с прошлых веков.
Гэлтон начал с оценки того, как редко в Англии того времени встречались люди,
которые были вовлечены в общественные дела в общем и в науке в частности и тех,
которые находились на разных уровнях известности. Используя критерий, по которому
человек был знаменит, если его имя появилось в краткой биографической сводке 2 500
«Людей времени», который был только что выпущен, или в некрологах «Таймса», он
обнаружил, что таких заслуживающих внимания было один на каждые 2 000 взрослых
1
мужчин или один человек на 20 000 общего населения – очень небольшое количество тех,
кто жив в любое время в стране.
Для видных ученых он установил стандарт, который требовал, чтобы они должны
быть не просто членами Королевского общества – что уже считалось большой честью со
времен выборных реформ при м-ре Джастис Гровз за тридцать лет до этого, но и что они
должны при этом состоять в профессорским штате университета; быть отмечены
медалью от научного общества либо иметь должность в таковом; или быть членом
какого-нибудь элитного научного клуба. Его число людей, от которых он мог получить
полную биографию, достигло 180 и он подсчитал, что во всей стране таких может быть
самое большее 300 человек.
Подсчитав, что половина из них были в возрасте между 50-65, он вычислил, что
шанс подняться на такую высоту был у 1 из 10 000 взрослых мужчин этой возрастной
группы, цифра примерно соответствующая 1 из 100 000 общего населения. Однако, так
как общие биографические списки показывают, что только 1 из 10 известных людей был
вовлечен в науку или медицину, затем по его предыдущим стандартам должен быть
только один видный ученый на каждые 200 000 людей из общего населения. Тот факт,
что Гэлтон предполагает, что их должно быть в два раза больше, означает, что либо он
переоценил число хороших ученых, которые должны были быть в его списке и которых
не было, либо тенденция – охватить гораздо большее количество людей при поиске
великих ученых, чем при поиске великих людей в общем.
Польза этого исследования заключается в том, что оно дает оценку количества
ученых людей, которых Гэлтон считал достаточно важными, чтобы быть достойными
обсуждения, но не ограничивает рамки до предельно маленькой группуы так что
исследователь делает выводы всего лишь о небольшом количестве гениальных людей.
Так, около 5-10 человек из миллиона попадают под эту категорию. Как сравнить это с
положением дел после времен Гэлтона?
К счастью, существует замечательный биографический сборник «Американские
ученые», который перерабатывался 10 раз между 1903 и 1960гг. Редактор Д. Маккин
Каттелл (сам знаменитый психолог) производил отбор известных людей, начиная с 1 000
человек в первом издании, и пополняя это число по мере появления каждого нового
издания. Так случилось, что в первом издании было около 11 известных имен на один
миллион населения Соединенных Штатов, в выпуске 1938г. было около 12.4 на миллион,
и что обе цифры имеют то же значение, что и цифры, основанные Гэлтоном.Таким
образом, не наблюдается большого изменения в количестве «известных» ученых на
миллион население, ни при перемещении центра интереса из Великобритании в США, ни
при увеличении вдвое населения Соединенных Штатов. Можно поспорить, что критерий
известности Гэлтона отличатеся от критерия известности Каттелла. Можно утверждать
даже с большим основанием, что произвольное определение квоты в 1 000 известных
людей первоначально, с установленным возрастанием впоследствии было, возможно,
несоразмерно постоянному критерию известности. Несмотря на это, мы не находим
никаких быстрых изменений в этом предполагаемом проценте научной известности.
Если при изучении «Американских ученых» мы посмотрим не на отдельные
известные имена, а на все, мы обнаружим самое удивительное изменение в порядке
значимости с течением времени (таблица 2.1). Просто пробежаться взглядом по полке,
состоящей из десяти выпусков – значит почувствовать мгновенное уважение к власти
экспоненциального роста.
Очевидно, что за последние 50 лет произошло 16-кратное увеличение числа
людей, экспоненциальный рост с удвоенным периодом в 12,5 лет, цифра уже
предполагаемая как олицетворение роста науки. Даже в соотношении к размеру общего
населения можно увидеть, что та же половина века умножила концентрацию ученых
коэффициентом 8, удвоение за примерно 17 лет. Еще четыре таких полвека постоянного
роста дали бы миру более двух миллионов американских ученых на миллион населения,
2
если бы не то, что экспоненциальный рост неизбежно идет по логистической кривой и
заканчивается.
Мы уже показали, что из-за этой логистической структуры перспектива на
ближайшее будущее выглядит более интересной, чем перспектива медленного конца от
удушья в 2160 д н.э.
Таблица 2.1
Количество людей, приведенных в выпусках «Американских ученых»
Год выпуска
Количество людей
1903
1910
1921
1928
1933
1938
1944
1948
1955
1960
(не
включая
общественные науки)
4 000
5 500
9 500
13 500
22 000
28 000
34 000
50 000
74 000
96 000
Число на миллион
населения США
50
60
90
110
175
220
240
340
440
480
Наш кризис, похоже, может произойти уже через несколько лет, и он скорее
связан с природой роста, чем с конечным истощением населения. Тем более интересно
выявить причину того почему, несмотря на общий стремительный экспоненциальный
рост научных кадров – и в этой связи их публикаций и бюджетов – число действительно
великих людей не увеличивается с таким же быстрым темпом.
Корень этой проблемы,
в понимании Гэлтона, лежит в установлении
объективного критерия известности, не зависящего от времени. Вероятно, все, что мы
сказали – то, что когда люди выбираются по степени избирательности 10 из миллиона,
они становятся выдающимися по этой стандартной шкале. Та же проблема встречается в
самых последних оценках талантливого населения на основе интеллектуальных тестов.
Например, можно сказать, что на тестах призванных на военную службу для определения
военной специальности только один человек из 10 000 людей его возрастной группы
может набрать больше 170 баллов, один из 100 000 – больше 180, один из 1 000 000 –
больше 190 и так далее, с числом 10 (точнее, 11) баллов, которое определяет следующую
категорию. Но нельзя сказать, что знаменитость начинается с отметки 172 балла и не
меньше. Даже если гений – это дело только таланта, определяемого имеющимися
тестами, не было бы ясного среза, только постепенное разложение населения по мере
повышения стандартов. Ошибка состоит не столько в определении того, что является
научной способностью, сколько в неверном предположении, что исключительность или
гениальность может решаться на основе ответов «да» или «нет» (есть она или нет).
Более точных результатов, хотя и не более того, можно достичь, взяв достаточно
маленькую группу людей, открытий или даже научных институтов, журналов и стран, и
отмечая особо тех, которые прославились. Например, для выдающихся людей можно
использовать как критерий выбора приглашение ученого читать гостевые лекции и
получение научных награды, таких как Нобелевская премия. Это дает обычный тип
экспоненциального роста, но с удвоением времени значительно дольше 10 лет.
Например, если мы возьмем избранную элитную группу современных ученых в любой
крупной сфере, отобранную из обычных биографических справочников или других
источников, которые отбирают только малую элиту, удвоенное время – около 20 лет. Та
же цифра выводится из любого списка избранных великих научных открытий.
3
Для упрочения и улучшения значимости этого результата необходимо
сформулировать степени знаменитости, что дало бы не противопоставление выдающихся
и невыдающихся, а скорее скользящую шкалу, как бы распределение по скоростям. Одна
такая шкала – традиционная, используемая деканами и другими работодателями как мера
научного успеха – количество публикаций каждого человека в общепринятых научных
журналах. Давайте с самого начала признаем, что это плохая шкала. Кто осмелится
сопоставить работу Эйнштейна по относительности против даже сотни работ Джона Доя,
доктора философии, о степенях упругости различной древесины лесов Нижнего
Басутоленда?
Шкала плоха хотя бы потому, что ее существование толкает людей к тому, чтобы
они публиковались просто потому, что таким образом они могли быть оценены. Тем не
менее это все-таки начало, а потом оно может быть усовершенствовано для лучшего
соответствия нашим целям. Мы покажем, например, что такие распределения относятся к
одному типу и поэтому, хотя никто не может прямо измерить «научную способность», но
можно вполне вывести свойства ее предполагаемого распределения. Мы также должны
учитывать то, что данная шкала не вполне применима в эпоху Большой Науки, когда
осуществляется так много совместной работы, что не так уж просто определить чьи-то
баллы. Это еще один пункт, который позже потребует уточнения.
Давайте не будем начинать со слишком пессимистического взгляда на значимость
этого исследования. Там могут быть грубые нарушения, но в целом нравится нам или
нет, существует вполне четкая зависимость между известностью ученого и его научной
продуктивностью. Чтобы стать хорошим ученым, требуются настойчивость и упорство,
и это часто отражается в постоянном производстве научных работ. Затем, опять же, легко
продемонстрировать, что список ученых с высоким баллом содержит большое
количество имён, которые не просто известны, но и высоко признаны. И напротив,
список ученых с более низким баллом содержит меньше таких имен в качестве
абсолютных чисел, и значительно меньше в пропорциональном соотношении.
Точно такое исследование было сделано Вейном Деннисом. Используя в качестве
источника Биографические Мемуары 1943-1952 годов Национальной Академии Наук, он
показал, что из 40 людей, которые умерли после полной жизни, достигнув возраста
семидесяти, человек на самом верху списка имел 768 публикаций, а самый нижний - 27.
Среднее количество публикаций было 200 и больше, и только 15 людей имели 100 и
меньше в их библиографиях. Так же список 25 известных ученых 19 века показал, что
все, кроме одного, были в диапазоне 61-301 публикации. Далее, сделав выборку из
Библиографии Королевского Общества Научной Литературы 1800-1900, он показал, что
самые производительные 10 процентов всех авторов, каждый с более чем 50
публикациями, были такого масштаба, что 50 процентов из них были упомянуты в
Энциклопедии Британника; а из 5 процентов из самого верха, у каждого из которых в
библиографии было более 140 наименований, около 70 процентов были упомянуты.
Никто из упомянутых в Энциклопедии не имел менее 7 публикаций.
Поэтому, хотя нет гарантии, что маленький производитель - ничто и большой
производитель - выдающийся ученый, или даже что уровень признания соответствует
уровню производительности, есть сильная взаимосвязь, и мы заинтересованы в глубоком
изучении относительного распределения больших и маленьких производителей научной
литературы. Провести такие исследования легко путем подсчета количества работ под
каждым именем автора в общем индексе журнала. Самое первое исследование такого
рода было проведено Лоткой, и несколько других с тех пор повторили такие подсчёты
«по головам». Все они подтвердили простой, основной результат, который не зависит от
вида науки или даты, тома индекса; единственное требование - это то, что индекс
должен распространяться на достаточное количество лет, чтобы позволить ученым
создать несколько работ.
Результат этого исследования - обратный квадратный закон производительности
(рис. 2.1). Количество людей, которые производят n работ пропорционально 1/n2. На
4
Количество авторов, публикующих такое же
количество работ
каждые 100 авторов, которые производят только одну работу за какой-то период времени,
приходится 25 с двумя, 11 с тремя работами и т. д. Иначе говоря, когда выходит общий
результат, можно достичь интеграции, которая дает приблизительно обратный закон
первой степени для
количества
людей,
которые производят
Философские труды
больше чем n работ.
Королевского Общества
Таким
образом
Химические Абстракты
приблизительно 1 из
5 авторов производит
5 работ или больше,
и 1 из 10 производит
по крайней мере 10
работ (рис. 2.2).
Рис. 2.1 Закон Лотки
Количество авторов, публикующих точно n работ, как функция n. Пустые
круги представляют данные, взятые с первого индексного тома
сокращенных Философских трудов королевского общества Лондона (17 и
начало 18 вв.), заполненные круги – это данные из десятилетних индексов
Химических Абстрактов 1907-1915 гг. Прямая линия показывает точный
обратный квадратный закон Лотки. Все данные уменьшены до основания
точно 100 авторов, опубликовавших как минимум одну работу.
Удивительно,
что такой простой
закон так точно
соблюдается, что
возможно найти
такое же
распределение
научной
производительности
в ранних томах
Королевского
Общества и в
Химических
Абстрактах 20 века.
Регулярность, как
мне кажется, говорит
нам кое-что о
природе баллов,
которое мы
используем. Закон
обратного
квадратного
распределения
вероятности, или
обратная первая степень для совокупной вероятности, не похожа на распределения
Гаусса или Пуассона, как и на любую другую кривую распределения по принципу
простой случайной вероятности. Если бы количество научных работ было распределено
таким же образом, как и количество людей с разным ростом, или количество людей,
погибших от удара копытом, мы должны были бы найти гораздо меньше высоких баллов.
Научные работы не падают с небес, поэтому они не распределены по случайности;
наоборот, в какой-то степени, чем больше Вы их уже имеете, тем проще получить
очередную, принцип, к которому мы возвратимся позже.
Давайте сначала рассмотрим природу обратного квадратного закона производительности
(таблица 2.2). Если подсчитать общую производительность тех, которые пишут n работ,
оказывается, что большое количество авторов с небольшим количеством работ равно
5
Количество авторов, публикующих по крайней мере столько много
работ
общему числу маленького количества авторов с большим количеством работ; в простом
схематическом случае, симметрия может быть показана в
точке, соответствующей квадратному корню общего количества людей, или баллу
самого высокого автора. Если взять 100 авторов, и самый плодотворный имеет 100 работ,
половина всех работ должны были написаны 10 людьми, набравшие самые высокие
баллы, другая половина теми, которые имеют меньше чем 10 работ каждый. Фактически,
в этом идеальном случае, целая четверть работ написана двумя самыми плодотворными
авторам, и другая четверть теми, которые опубликовали только 1 или 2 работы.
Это
сразу же дает
Теоретические
Философские труды Королевского
объективный
Общества
метод
для
Химические Абстракты
разделения
крупных
и
мелких
авторов.
Можно
установить
лимит
и
сказать,
что
половина
работ
написана
авторами,
у
которых более
10 работам на
счету, или то,
что
количество
авторов
с
высокой
производитель
ностью,
кажется,
имеет тот же
самый
порядок
величины как
квадратный
Рис. 2.2. Количество авторов, публикующих по крайней
корень общего
мере n работ как функция n.
количества
Те же данные, и те же уменьшения как в рис. 2.1, но
полная кривая изменена в форму, которая учитывает
авторов.
переоценку Лоткой количества высоко плодотворных
Первый путь,
авторов.
устанавливая
некоторую
квоту в приблизительно 10 работ, которое называют методом Декана, достаточно
знаком; второй путь, предполагающий, что число авторов возрастает
по мере
возрастания квадрата количества хороших авторов, кажется совместимым с
предыдущими полученными данными, что количество ученых удваивается
каждые 10 лет, но число значительных ученых - только каждые 20 лет.
К сожалению, простой обратный квадратный закон Лотки нуждается в изменении
в случае высоких баллов (рис. 2.3). Вне упомянутых линий разделения, количество людей
уменьшается быстрее, чем обратный квадрат, и более сходно с обратным кубом. Это
6
примерно тоже же самое, если бы мы сказали, что их совокупное количество
уменьшается как квадратный корень балла ученого, а не как это число в первой степени.
Данные из работы Лотки и Денниса полностью согласуются с этим, т. е., если
располагать авторов с высокими баллами в порядке их достижений, то баллы
уменьшаются как квадратный корень категорий во всех случаях.
Посредством этого можно легко получить закон, который работает, и для тех с
высокими баллами, и для тех с низкими баллами, и который слегка срезает верхний хвост
распределения Лотки.
Можно понять, что это должно быть качественно необходимым, так как иначе
максимальные рекорды публикаций в течении жизни достигнут тысяч и десятки тысяч,
а не несколько сотен, которые казалось бы представляют самые плодовитые научные
жизни. Кейли, один из великих британских математиков девятнадцатого столетия, имел
995 наименований в своем собрании работ- одна научная работа каждые две-три неделия так и не смог найти кого-либо, кто мог бы побить этот рекорд.
Этот модифицированный закон ведет к результату, когда около одной трети
литературы и меньше чем одна десятая часть людей ассоциируются с высокими
рекордами. Это в свою очередь ведет к 3,5 научных работ на человека. Таким образом,
если мы знаем, сколько научных работ публикуется в одной области, мы можем
подсчитать количество людей, кто написал их, даже самое наименьшее количество,
которое вероятнее всего сделало вклад в этой области. И таким образом, для области
включающей 1000 научных работ, должно быть около 300 авторов. Около 180 из них не
напишут более 1 работы, но другие 30 переходят предел 10 научных работ на человека, а
10 являются самыми плодотворными, вносящими самый большой вклад.
Более важным, чем численная информация, является доказанное присутствие
действующего закона распределения. Можно сделать интересное сравнение между этим
законом и известным законом Парето о распределении прибыли. Вместо формы, где
1/n используют для маленьких значений и 1/n2 для больших, Парето обнаружил, что
совокупные числа для дохода, почти точно, и постоянно на протяжении долгого времени
в различных странах, следуют закону 1/n1.5 – что является серединой между нашими
двумя формами. Почему есть такой эмпирический закон, и почему он так отличается от
обычных законов ошибок, ударов лошадиным копытом и других распределений по
теории вероятности?
Причина, по моему мнению, заключается в простом факте, что число публикаций
не является линейной добавочной мерой продуктивности, как требуется для Госианских
распределений. Наша точка предела не среднее из наибольшего рекорда и не низшее, но
скорее их геометрическое среднее. Можно интуитивно почувствовать, что шаг от 3
научных работ до 6 схож скорее с шагом от 30 до 60 чем от 30 до 33. Из-за всего этого
уместно предложить, что у нас имеется что-то вроде приблизительного закона Фечнера
или Вебера в экспериментальной психологии, где правильная мера ответа берется не из
величины стимула, но из его логарифма. У нас должны быть равные интервалы усилия
соответствуя равным коэффициентам количества публикаций.
Мы можем определить человеческую солидность, s (каким солидным этот человек
является?) как логарифм его рекорда научных работ на протяжении жизни. Логарифм
числа людей, у которых по крайней мере s единиц солидности продуктивности сначала
будет линейно совпадать с s, а затем быстрее увеличиваться по мере приближения к
зафиксированному высшему пределу в 1 000 работ, выше которого никто еще не
поднимался. Другими словами, с каждой увеличивающейся единицей в солидности,
число людей, достигающих подобной солидности, сокращается из-за некоторого
постоянного фактора. Именно это сокращение популяции при постоянном факторе на
рост на каждую единицу s, является именно тем, что находится в хвосте нормального
распределения вероятности. Например, если мы возьмем распределение стандартного
умственного теста AGCT, который устроен таким образом, что нормой по шкале является
100, с половиной населения выше и половиной ниже, и распределение происходит таким
7
образом, что четверть всего населения получает балл от 80 до 120 (стандартное
отклонение 20), тогда для результатов более 140 (и так же меньше чем 60) число случаев
в хвосте опускается множителем на 10 на каждые 10 пунктов по шкале. Если мы
высчитываем солидность логарифмом с основанием 10, тогда каждая единица s
соответствует приблизительно 11 пунктам на шкале AGCT для всех случаев, кроме
самых солидных ученых, для которых он поднимается приблизительно на 20 пунктов.
Закон Парето может, следовательно, восприниматься как просто результат
соединения разумного вероятностного распределения возможностей с Фечнеровским
законом определения эффективности этих возможностей. В случае научной
продуктивности мы находим такой же расчет теоретической основы для формы
эмпирического закона. Единственной разницей между распределением денег и
распределением научных работ, или более обобщенным распределением, открытым
Зипфом, чтобы вычислить почти все естественные распределения вещей, расположенные
в порядке размера, является то, что в науке есть определенный верхний лимит количества
научных работ, который можно осуществить в жизни.
Осталась лишь одна неопределенность в новом законе нормального распределения
научной солидности - то, что мы не знаем, где поместить начало шкалы. Какие баллы
AGCT (испытания призванных на военную службу для определения военной
специальности) соответствуют состоянию s=0, минимальному состоянию одной научной
публикации в течение целой жизни? Если, не изменяя по-видимому абсолютные и
объективные минимальные стандарты для научной работы, можно было побудить
каждого члена населения получить высшее образование, заняться профессиональной
научной карьерой и пробовать достигнуть этой цели, сколько преуспело бы?
Таблица 2.2 Схематическая таблица, показывающая количество авторов с разными
степенями продуктивности (в работах за целую жизнь) и количество написаных работ.
Количество работ на одного
Люди
1
100
2
25
3
11.1
4
6.2
5
4
6
2.8
7
2
8
1.5
9
1.2
10
1
10-11.1
1
11.1-12.5
1
12.5-14.2
1
14.2-16.7
1
16.7-20
1
20-25
1
25-33.3
1
33.3-50
1
50-100
1
выше 100
1
Общее
165
Работы
100
50
33.3
25
20
16.7
14.2
12.5
11.1
10
10+
11.1+
12.5+
14.2+
16.7+
20+
25+
33.3+
50+
100+
586+
(75% людей, которые имеют
низкие баллы производят одну
четверть всех работ)
(10 человек производят
больше чем 50% всех работ)
(Самые верхние два
человека производят
одну четверть всех
работ).
Среднее количество работ на одного= 586/165= 3.54
Отметьте: таблица, построенная на основании точно 100 людей с единственной
изданной работой. Другие числа вычислены из закона Лотки.
8
На этот вопрос
необычайно трудно
ответить,
Химические Абстракта
поскольку
кроме
большого корпуса
Философские труды
общих
Королевского Общества
интеллектуальных
тестов,
уровень
компетентности
количественных
подсчетов
низок,
когда
он
используется для
определения
научного
творчества.
На
основе
нашей
недавно
вычисленной
теории,
можно
лишь
рискнуть
предположить,
используя
интеллектуальные
тесты
как
основание.
Фундаментальные
исследования
Ранг автора(с самого продуктивного, вниз)
Хармона в отчетах
Рис. 2.3.
о
докторах
Количество публикаций четырёх серий выдающихся и
философии
одновременно очень продуктивных авторов, каждый
оцениваемый в пределах серий
Соединенных
Штатов на 1958г.
Сериями являются (1) члены национальной академии Наук, отобранные на
позволяют
нам
основе некрологических биографий, (2) 19 известных ученых 19 века, (3)
сказать
кое-что
самые продуктивные авторы в десятилетнем индексе Химических
Абстрактов, (4) индекс томов 1-70, Философские труды Королевского
относительно
Общества.
особенностей
результатов
интеллектуального теста в этой группе. Так, степень кандидата наук, а также требования
к публикациям в признанных научных журналах берем за константу. Далее определяем в
качестве минимального требования написания одной научно-исследовательской работы.
Правда, эти вещи не всегда совпадают, потому что некоторые кандидаты наук никогда
нечего не публикуют, даже свои диссертации, в то время как многие авторы не являются
кандидатами, и все же в худшем случае они должно быть некое разумное постоянным
соотношение, не слишком далекое от единства.
Хармон нашел, что в возрастной группе населения в количестве около 2 400 000
человек возникает ежегодно приблизительно 8 000 кандидатов наук во всех областях, где
физические и биологические науки вместе составляют приблизительно половину общего
Количество публикаций на одного автора
Национальная Академия Наук
19 Известных ученых
9
количества. Как и можно было ожидать, баллы интеллектуальных тестов для этой группы
были значительно выше чем общий уровень, среднее число AGCT 130.8. Если брать
отдельные области, то вариация была от 140.3 для физики к 123.3 для кандидатов наук в
образовании:
Физика
Математика
Инженерия
Геология
Гуманитарные науки
Общественные науки
Естественные науки
Химия
Биология
Образование
140.3
138.2
134.8
133.3
132.1
132.0
131.7
131.5
126.1
123.3
Когда эти данные были применены к общему населению в той же самой
возрастной группе, оказалось, что на самом высоком уровне интеллектуального теста,
AGCT 170+, приблизительно 1 человек из 5 получил степень кандидата наук, хотя общий
процент кандидатов в этой возрастной группе был всего лишь 1 из 3000. Таким образом,
интеллект имеет непосредственное отношение к получению степени кандидата наук.
Если мы теперь считаем вероятным, что эта текущая фигура 1 из 5 относится к тем
высшим существам, которые становились очень производительными учеными, можно
было предположить, используя все средства, честные и нечестные, закрыть промежуток
так, чтобы они все заработали степень кандидата или даже доктора наук.
Мы знаем теперь, что общее количество ученых повышается как квадрат, более
или менее, числа хороших ученых. Поэтому, если мы хотим умножить хороших ученых
на пять, мы должны умножить целую группу на 25. Вместо возрастной группы
приблизительно 8000 кандидатов наук по смешанным предметам, мы должны тогда
иметь приблизительно 200 000 всех в науке. Как это случается, распределение интеллекта
показывает, что в возрастной группе 2,400,00, немного больше чем 160 000 достигают
AGCT 130, и таким образом уже сокращается количество потенциальных ученых,
которое является только немного меньше чем существующий способ, найденный для
кандидата или доктора наук. Эти два метода, таким образом, совпадают, чтобы указать,
что приблизительно 6 - 8 процентов населения, самое большее, могли быть стать
учеными даже на самом минимальном уровне.
Таким образом, в масштабе весомости по научным публикациям 0 можно
установить на уровне AGCT около 130, что соответствует приблизительно 1 человеку из
каждых 15 в его возрастной группе. Хотя иметь такой предел очень удобно, согласитесь,
если мы возьмем существующее количество кандидатов наук, различия весьма серьезны.
На первый взгляд кажется, что в настоящее время мы рассматриваем только
приблизительно 1 из 25 тех, кто мог бы стать учеными в принципе, и один из пяти тех,
кто мог бы стать выдающимися учеными. Если бы мы взяли весь талант населения без
потерь, то мы должны бы тогда иметь 8 000 000 ученых, пишущих работы в
Соединенных Штатах, и из них 80 000 были бы очень продуктивными, с больше чем 10
работами каждый. Таким образом, мы должны иметь список из 400 000 ученых на
миллион населения, и, из них 400 на миллион были бы выдающимися. Гэлтон, как Вы
помните, нашел приблизительно 5 - 10 выдающихся ученых на миллион населения, и
ранние томы Американских Ученых показали 50 на миллион. Таким образом, из всех
хороших ученых мы опустили еще один порядок величины и, даже за счет всех других
профессий, требующих высокого таланта, наука вряд ли завладеет больше чем 8
10
процентами населения. Даже в этом случае, похоже, что уменьшающееся количество
хороших ученых на каждые 100 кандидатов делает более трудным достижение уровня
этой величины. Только, насколько сильно это ограничение? Действительно ли возможно,
что уровень хороших ученых не мог повыситься на фактор 5, как мы предположили?
Почти половина фактора объяснена недоиспользованием научного потенциала
женской половины населения, потеря, которую Советский Союз частично устранил, но
которую мы, кажется, не можем избежать. Другой фактор числом 2 мог бы быть
приписан нехватке возможности и стимула в областях вне больших городов, где школы
не так хороши, нет сильной конкуренция и стимула к вдохновению. Действительно,
учитывая все это, высокая пропорция талантливых трудовых ресурсов, успешно
переключившихся в науку в настоящее время уже большой успех. Но если уровень не
может действительно повысится, то мы, как мы уже предполагали, находимся
приблизительно на половине пути к насыщенности в самом верхнем конце шкалы, и
любое увеличение числа ученых должно привести к серьезному увеличению количества
ученых, способных написать научные работы, но не способных написать выдающиеся
работы. Это заставляет задуматься о будущем научного образования. Стоит ли оно
больших жертв?
Я думаю, что мы теперь положили теоретическое основание для этого
исследования науки. Оно очень похоже на исследование эконометрики. С одной стороны,
мы имеем динамическую обработку, которая дает нам промежуток времени, сначала
экспоненциального роста, затем постепеного роста, приводящего к стандартным
логистическим кривым. С другой стороны, мы имеем статику закона распределения,
подобного закону Парето. Величина различия между анализом науки и анализом бизнеса
лежит в параметрах. Главная экспоненциальная часть роста науки удваивается только
каждые 10 лет, что намного быстрее, чем все остальное; характерный индекс закона
распределения - 1 в нижнем конце и 2 в высоком, вместо однородного 1.5.
Дополнительный вклад, который мы внесли в обеспечение разумного
теоретического основания для нашего закона Парето состоит в том, что, хотя среднее
число работ на автора остается заметно постоянным, можно провести черту между теми,
производительность которых высока и той большей массой авторов, производительность
которых низка. Эта масса, как замечают, растет как квадрат количества ученых с
высоким баллом, и поэтому количество ученых с высоким баллом удваивается только
каждые 20 лет.
Принцип закона Фечнера, который мы использовали, чтобы уменьшить
распределение Парето до линейной и добавочной меры, которая является необходимой
для стандартной кривой вероятности, намного более ценен, чем мы все же полагали. Если
мы можем взять вообще весомость массы публикаций как измерено логарифмом
количества работ, это имеет далее интересные последствия. Сочтите закон
экспоненциального роста предварительно упомянутым как универсальное условие
свободно расширяющейся науки. Очевидно, весомость области, логарифм числа работ,
растет линейно со временем. Таким образом, так как уходит приблизительно 50 лет на то,
чтобы количество ученых или количество работ в области увеличилось в 10 раз,
происходит увеличение единицы весомости каждые полвека.
Я не могу вполне понять, почему это так, или как можно было оценить это кроме
как чисто интуитивно, но две единици весомости, которые отделяют человека, который
может издать не больше одной работы за всю жизнь от того, который может написать сто
таких работ - по существу то же самое, что разделить два состояния субъекта по времени
на одно столетие. В грубых и неточных терминах можно сказать, что выдающийся
ученый на столетие впереди от минимального ученого.
Какие дальнейшее значение имеет предположение, что можно измерить развитие
области линейным маршем его весомости? Являются ли такие степени весомости
действительно совокупными? Должны ли мы судить одну область ста рабочих, добавляя
две единицы весомости в пределах определенного времени как низшую к десяти
11
отдельным областям десяти рабочих, каждый из которых добавит одну единицу к каждой
области, составляя в общей сложности десять единиц в пределах того же времени?
Если такой признак является верным, то кажется, что наука имеет сильное
желание скорее минимизировать его весомость, чем как можно больше увеличивать ее.
Вне явления экспоненциального роста, наука показывает несколькими способами
тенденцию кристаллизоваться, в смысле, что большие вещи растут за счет маленьких,
которые составляют своего рода маточный раствор. Большие области, кажется,
поглощают трудовые ресурсы и предмет маленьких областей. Даже при том, что новые
области, новые отделы, новые учреждения, и даже новые страны прибывают в научную
сцену в увеличивающемся количестве, несколько предварительно существующих
больших имеют естественный рост, позволяющий им вообще сохранить их лидерство.
Это скорее исключение, чем правило для одного из больших блоков, чтобы замедлить его
рост - по-видимому, через существование своего рода логистического потолка, который
лишает его устойчивости и делает так, чтобы он упал в ранге.
Тот факт, что общий рост науки увеличивается одинаково как размеры больших
блоков и количества маленьких блоков, представляя появление кристаллизации, в
действительности не настолько специфичен. То же самое происходит, когда растет
население страны. Вместо того, чтобы быть однородно распределенным по стране, он
кристаллизован в различные по величине блоки, названные городами. Рост городов в
стране обеспечивает полезную модель для роста научных блоков внутри науки. Как это
случается, иерархический порядок городов или других блоков, оцениваемых по
уменьшаемому размеру, предлагает еще один пример того же самого Парето-подобного
распределения, которое мы уже нашли для производительности научных авторов.
В случае городов, исторические статистические данные обеспечивают хороший
пример такого распределения в движении, со всем увеличивающим по экспоненте,
поддерживая нормальное распределение (рис. 2.4). Используя участок, показывающий
распределение каждое десятилетие, можно видеть постоянный наклон распределения в
шкале регистрации и непреклонном марше точек пересечения, которые говорят нам
величину самого большого города в одном масштабе и количество малых городов (здесь
взятый как население 2500) в другом масштабе. Оба увеличиваются регулярно каждое
десятилетие, в каждом занимает шестьдесят лет, чтобы пройти власть 10 или, как мы
назвали это ранее, одну единицу весомости. Если подробно изучать историю жизни
какого-нибудь определенного города, то его ранг изменялся бы со временем, поскольку
он иногда опережал и иногда был опережаем другими городами; однако, статистическое
распределение постоянно.
Этот общий образец, неся все значения нашего предыдущего анализа
распределения производительности, сопровождается достаточно справедливо такими
разнообразными иерархическими списками как те, которые дают размеры в
способностях, или в докторе философии за десятилетие, научных отделы колледжа, в
любой области или вообще, в Соединенных Штатах или в мире. Это сопровождается
оцениваемыми списками, показывая научные вклады в виде работ, журналов, или
расходов наций мира, начиная от нескольких больших производителей в любом
масштабе, относительном или абсолютном к незначительному производству большого
количества слаборазвитых стран (рис. 2.5).
Об этом процессе есть тот же самый вид существенной, встроенной
недемократии, которая дает нам скорее нации городов, а не страну, устойчиво
приближающую состояние однородной плотности населения. Ученые имеют тенденцию
сходиться в областях, в учреждениях, в странах, и в использовании определенных
журналов. Они распределены неоднородно, как бы это ни было желательно или
нежелательно. В частности рост таков, чтобы держать относительно постоянный баланс
между несколькими гигантами и массовыми пигмеями. Количество гигантов растет
настолько более медленно чем все население, что должно быть больше пигмеев на одного
12
гиганта, сожалеющих об их собственной нехватке высоты и задающихся вопросом отчего
ни человек, ни природа не продвигает нас к равноправной однородности.
Помимо ценностных суждений, кажется ясным, что существование разумного
распределения, которое говорит нам, сколько людей, работ, стран, или журналов есть в
каждом разряде производительности, полезности, или независимо от того, что Вы не
измеряли, обеспечивает мощный инструмент. Вместо того, чтобы пытаться получить
точность в определении того, кого включать в экспоненциальный рост, можно вместо
этого взять грубый подсчет и интерпретировать это посредством такого распределения.
Так же, как нельзя измерить индивидуальные скорости всех молекул в газе, нельзя
фактически измерить степени известности всех ученых. Однако, есть основания для того,
чтобы говорить, что такие размеры, если сделаны, следовали бы за стандартным
распределением. В частности мы можем взять это в виде Парето-подобного
распределения как гипотезу и увидеть, как последствия соглашаются с явлениями брутто,
которые мы можем измерить. Мы действительно, фактически находим подтверждающее
соглашение.
Такова
широкая
математическая
матрица
экспоненциального
роста,
логистического распада, и функций распределения. Это обеспечивает нам теперь общее
описание нормального расширения науки и ее состояния в любое время. Зная теперь
регулярное поведение, мы имеем мощный инструмент, чтобы исследовать существенные
неисправности, введенные в систему общими волнениями войны и революции,
логистическим рождением и смертью измеримых объектов, гением и критическим
открытием, и одним словом, организационными изменениями в пределах основы науки и
в ее отношениях с государством и обществом вообще.
Ранг
Рис. 2.4 Соединненые Штаты
Сообщества 2500 или больше жителей занимали место в уменьшающемся
порядке размера населения. Должно быть отмечено, что распределение в любой
данной дате показывает размер, уменьшающийся однородно с рангами;
поскольку города становятся многочисленными, и все они увеличиваются в
размере, образец распределения сохранен, кривая, перемещающая параллельно
себе по постоянной норме. От Джорджа К. Зипфа, Человеческое поведение и
принцип наименьшего усилия (Кембридж, Mass.: Эдисон-Уэсли, 1949) страница
420, рис. 10-2.
13
Ранг страны (от этого с большинством периодических изданий, вниз)
Рис. 2.5 Количество научных периодических изданий, изданных каждой страной,
оцениваемой в порядке убывания таких чисел.
Видно, что лучшие шесть стран составляют половину всех публикаций, лучшие
одиннадцать две трети, и т.д. Производительность журналов менее продуктивных
стран уменьшается очень быстро. Данные из предварительного обзора,
проводимые библиотекой Конгресса.
14
Download