Ученые СПбГУ научат программировать на языке R
В Университете завершился конкурс, по итогам которого уже в этом году на основе 11 лучших проектов будут подготовлены новые онлайн-курсы.
Один из победителей конкурса, ассистент Марина Варфоломеева (кафедра зоологии беспозвоночных СПбГУ), рассказала о том, какую дисциплину студенты теперь смогут освоить дистанционно.
Марина Александровна, какой онлайн-курс вы планируете запустить и чему научатся его слушатели?
Мы с моим коллегой, доцентом СПбГУ Вадимом Хайтовым, создаем для Coursera специализацию из нескольких курсов, которая называется «Основы статистики и анализ зависимостей с использованием R». Ее было бы сложно делать с нуля, поэтому за основу мы взяли курс «Линейные модели, дисперсионный и регрессионный анализ с использованием R», который с 2014 года ведем для магистрантов-биологов.
Подробнее о конкурсе по созданию онлайн-курсов читайте в материалах ректорского совещания, которое состоялось 12 февраля.
Мы надеемся создать универсальный набор курсов по анализу данных, который подойдет и новичкам, и людям, которые уже сталкивались со статистикой и хотят только освежить свои знания. Первый из пяти курсов поможет создать общую базу — он расскажет об основах статистики и тестировании гипотез, а оставшиеся будут посвящены более сложным техникам анализа взаимосвязей на основе линейных моделей.
В наших курсах статистики мы используем R — универсальный язык для анализа данных. На R реализовано множество передовых методов, он позволяет легко проводить первичную подготовку данных и строить сложные графики, поэтому знакомство с этим языком — хороший старт для освоения огромной вселенной методов анализа данных. Мы знаем, как можно научить R с нуля. Даже люди, никогда раньше не занимавшиеся программированием, могут научиться писать скрипты на языке R для самых необходимых видов анализа.
Этот курс будет узкоспециальным или подойдет всем интересующимся?
Конечно, его сможет освоить любой желающий. Простых, но глубоких курсов по статистике не так уж много. Во время работы над новым онлайн-курсом мы всегда старались придумывать простые и наглядные объяснения, в которых математика будет представлена только в виде неизбежного минимума, поскольку сами по образованию биологи и обучали студентов того же направления. Мы ориентируемся на студентов и практиков-исследователей в области естественных наук, но методы, о которых пойдет речь, универсальны, а значит, могут пригодиться во многих областях — например, психологии или социологии.
Как вы считаете, почему эту дисциплину можно преподавать в том числе и в виде онлайн-курса?
Тут факты говорят сами за себя — сейчас существует множество онлайн-курсов по статистике, особенно на английском языке, поэтому дистанционно освоить ее вполне реально. Думаю, что научиться чему-либо в таком формате можно, только если давать слушателю помимо разбитой на маленькие порции теории множество практических задач.
Без практики все изученное быстро забудется, поэтому мы планируем использовать в тестах не только теоретические вопросы, но и задания по анализу реальных данных.
Кроме того, мы постараемся создать для студентов много возможностей потренироваться применять знания статистики в условиях, приближенных к живой научной работе. В каждом курсе будет финальный творческий проект по анализу данных, где нужно написать отчет в формате мини-статьи и приложить код R, при помощи которого можно полностью воспроизвести анализ. Практика в таком формате — это хороший способ научить сознательно подходить к анализу данных и представлению результатов.
Почему вы решили принять участие в конкурсе на создание онлайн-курсов?
Мы давно хотели сделать онлайн-курс из нашего курса статистики для магистрантов, чтобы потом иметь возможность использовать его материалы офлайн в качестве дополнительных. Некоторые темы студенты смогут самостоятельно осваивать по видео и презентациям. Пока на русском языке написано не очень много простых и понятных учебников по статистике, и хотя видеозаписи не могут быть их полной заменой, но точно окажутся подробнее конспектов. С их помощью обучающимся легче будет разобраться в некоторых темах. Возможно, что за счет перераспределения времени на занятиях нам удастся сделать больше практических заданий, связанных с анализом данных.