Большие данные произвели революцию в социальных науках

В Петербурге прошел очередной Science Slam, на условном ринге которого столкнулись пять исследователей с рассказом о своей научной работе. Одним из них стала старший преподаватель СПбГУ Лариса Марарица (кафедра социальной психологии). Ученый поведала о революции в социальных науках, а также о том, как большие данные помогают понять состояние человека и даже выявить депрессию.

Известно, что в социальных сетях и мессенджерах возможно собирать данные о людях. Многие относятся к этому с опаской и предпочитают не распространять сведения о себе в интернете. Однако, по словам Ларисы Марарицы, исследователей не интересуют приватные переписки: большая и объективная поведенческая информация открывает перед ними возможности для развития знаний о человеке.

К тому же цифровые данные не так просты. «На самом деле они похожи на привидение, — рассказала старший преподаватель СПбГУ. — Все о них слышали, все о них говорят, но никто не может "поймать". Они есть только у корпораций в закрытом виде. Их трудно хранить, а еще труднее обрабатывать».

Можно сказать, что цифровые данные совершили революцию в социальных науках.

Социология, психология, политология уже никогда не будут прежними! Теперь у них появились объективные данные — совсем как у физиков, биологов и других «нормальных» наук.

Старший преподаватель СПбГУ Лариса Марарица

В доказательство тому исследователь привела научную публикацию в журнале Science 2009 года, в которой группа известных ученых расширила термин «социальные науки», прибавив к нему слово «вычислительные».

По словам Ларисы Марарицы, для исследования потребуются не только данные. Также нужно понимание того, что именно должно быть обнаружено, а также научные модели, по которым будет строиться работа. Одной из них является модель социального окружения Робина Данбара, Алистера Сатклиффа и их коллег, которая опирается на два тезиса. Первый учитывает число Данбара, ограничивающее человека (и животных) по количеству контактов, которые он может постоянно поддерживать. Оно находится между 150 и 230. Как пояснила исследователь, число Данбара определяет доля неокортекса по отношению к остальной части мозга.

Второй тезис гласит о том, что человек неравномерно распределяет внимание по отношению к людям из своего окружения. С одними мы общаемся ежедневно и поддерживаем сильные связи, с другими — раз в год, поэтому связи с ними считаются слабыми.

«У каждого из нас есть один или два самых близких человека. Четверо или пятеро друзей, которые эмоционально поддерживают нас в случае конфликтов с другими людьми, — это "группа поддержки". Около 12–15 приятелей, готовых поделиться материальными или другими ресурсами, — "группа симпатии", с которой мы отдыхаем и проводим время. Также у человека насчитывается 45–50 контактов, с которыми его объединяют интересы, работа или родство, — пояснила Лариса Марарица. — Наконец, 150 человек — это "активная социальная сеть". Ее функция — передача информации, контроль, обмен и защита ресурсов. Из этих людей мы ищем партнера и кандидатов на перемещение в другие группы».

На основе этой модели и с использованием больших данных научной группой Робина Данбара и Алистера Сатклиффа было проведено исследование. На протяжении полутора лет ученые записывали телефонные разговоры 24 человек и определяли, насколько участникам близок каждый из их контактов. В результате они открыли феномен социального почерка — устойчивости в распределении внимания человека по отношению к своим контактам даже во время смены условий жизни и людей, с которыми он общается.

То есть если у человека есть три друга, с которыми он общается еженедельно, то даже при изменении работы или города он найдет других трех людей, которые их заменят.

Старший преподаватель СПбГУ Лариса Марарица

Совместно с коллегами старший преподаватель СПбГУ провела похожее исследование. Ученые изучили личные сообщения добровольцев в социальной сети «ВКонтакте» и выявили точно такую же закономерность, которая также была устойчива к изменению контактов человека. Несмотря на то, что люди вокруг меняются, каждый из нас все равно выделяет одного или двух близких друзей: на место одного человека в окружении приходит другой, но функция остается. «Мы обнаружили инвариант. Для социальных наук инварианты так же важны, как законы для физиков, — подчеркнула ученый СПбГУ. — Во многом их еще предстоит открыть. Однако наше исследование показывает, что работа с цифровыми данными позволяет находить подобные инварианты».

Как объяснила Лариса Марарица, такие технологии социальных наук найдут применение не только в изучении эффективности взаимодействия людей в офисе или предсказании, кто из них уволится первым. Они также смогут помочь в выявлении депрессивных состояний и своевременной поддержке человека.