Фізики бояться математики?

У передмові до своєї науково-популярної книги «Коротка історія часу» Стівен Гокінг обіцяв, що в ній буде тільки одне рівняння: E=mc2. Фізик аргументував це тим, що формули відлякують читачів («Хтось сказав мені, що кожне рівняння, яке я включу в книгу, відлякає половину читачів»...). Виявляється, з науковими статтями, незважаючи на їх призначення (доносити інформацію гранично точно), може відбуватися те ж саме: чим менше в них формул, тим більше їх цитують. Точніше, ці дві величини, ймовірно, негативно корелюють.


У 2012 році біологи Ендрю Хіггінсон і Тім Фосетт (Університет Ексетера) опублікували в роботу про цитованість статей з екології та еволюційної біології. Автори виявили, що велика кількість формул у теоретичних статтях зменшувала кількість їхніх цитувань в експериментальних роботах. Загалом аналіз містив майже 650 статей, опублікованих 1998 року в низці екологічних і біологічних журналів. Основним показником була середня кількість формул на сторінці. Головним висновком роботи була рекомендація: «Для того, щоб домогтися максимального ефекту від своєї статті, біологам слід задуматися про те, щоб знизити щільність формул у текстах теоретичних статей».


У відповідь на цю статтю з, як спочатку здавалося, логічним висновком, вийшло відразу кілька коментарів (1, 2, 3, 4), від позитивних, але зазначають, що треба не прибирати формули, а намагатися ясніше висловлювати думки, до негативних, що відзначають порушення важливого принципу статистики: «кореляція не означає причинності». Іншими словами, просте видалення формул зі статей не призведе до збільшення цитованості. Гарною ілюстрацією цього принципу є карго-культи.

У січні 2015 року, у відповідь на статтю Фосетта і Хіггінсона, фізики з Німеччини та Бразилії опублікували в аналогічне дослідження фізичних статей. Спочатку група Джонатана Коллмера перевірила висновки дослідження біологічних статей і звернула увагу на те, що невірний поділ на теоретичні та експериментальні статті міг вплинути на результат. Крім того, вираженість результату Хіггінсона змінювалася при зміні способу статистичної обробки (об'єднання статей у групи).

Після фізики побудували вибірку з двох тисяч статей журналу і графічно показали відсутність очевидних взаємозв'язків між кількістю формул і цитувань. Вчені звернули увагу на виражену позитивну кореляцію між числом авторів і цитуваннями. Фізики пояснили її тим, що кожен з авторів, публікуючи наступні статті, ймовірно зійшлється на попередні. Однак головним висновком дослідників було те, що на основі таких «галасливих» даних не можна отримати будь-яку явну кореляцію.

У відповідь на це, зовсім недавно, Фосетт і Хіггінсон опублікували результати статистичного аналізу тієї ж самої вибірки фізичних статей. Біологи знову знайшли негативну кореляцію великої щільності формул з кількістю цитувань, використавши ту ж модель негативного біноміального розподілу, що і в найпершій роботі. Результат відрізнявся від нульової гіпотези (відсутності взаємозв'язку) зі статистичною значущістю більше двох сигма. У загальній вибірці цитованість падала на шість відсотків на кожну формулу на сторінці, у вибірці статей з невеликою кількістю цитувань (щоб уникнути впливу «випадаючих точок») - на вісім відсотків.

Група Коллмера відповіла на це коментарем про те, що Фосетт і Хіггінсон знову забули про те, що причинність і кореляції - не одне і теж. Тому навіть наявність кореляцій не дозволяє стверджувати, що фізики недолюблюють математику. За словами опонентів Хіггінсона, якщо і намагатися встановити причинно-наслідкові зв'язки між кількістю формул у статтях і цитованістю, то для цього слід використовувати великі статистичні вибірки і не такі вузькоспеціалізовані методи аналізу. Фізики апелюють до того, що зараз для автоматичного аналізу доступні мільйони статей - «навіщо себе обмежувати?». Наприклад, у першій роботі (про екологію та еволюційну біологію) з вибірки в 649 статей лише 247 містили хоча б одну формулу.

Таким чином надійної та визнаної відповіді на запитання, чи бояться фізики математики (чи менше фізики цитують насичені формулами статті), немає. Але висновок Хіггінсона як і раніше виглядає розумним - якщо вчений хоче поділитися своїми вишукуваннями, то слід намагатися пояснити і адаптувати їх для своїх же колег. Можна згадати як приклад Нобелівську премію з фізики цього року - за теорію топологічних фазових переходів. Велика частина теоретичної роботи була проведена радянським фізиком, Вадимом Березинським. Однак його робота була настільки складна і насичена математичними викладками, що для того, щоб вона стала зрозумілою і загальноприйнятою її довелося сильно переробити лауреатам премії. Детальніше про цю історію можна прочитати в нашому матеріалі.


Цікаво зауважити, що буквально два дні тому Хіггінсон і його колега з Університету Брістоля опублікували статтю про те, що рухає вченими, які проводять «неякісні» дослідження. Її висновок зводиться до того, що в гонитві за кар'єрою і грантами вчені проводять багато поверхневих досліджень у пошуках «новизни». На закінчення біолог рекомендує вченим займатися більш глибоким аналізом даних, використовувати великі вибірки і надійну методологію. Можливо, через кілька років ми все-таки побачимо результати дослідження цитованості на великих вибірках і з'ясуємо, чи бояться фізики математики чи ні.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND