Первокурсник HITs занял первое место в соревновании по анализу данных

Студент 1 курса Высшей IT-школы (HITs) Вячеслав Бакулин победил в авторитетном конкурсе, организованном компанией Wallarm. Участникам необходимо было разработать модель машинного обучения для классификации веб-атак на основе данных «хороших» запросов и запросов, содержащих атаки. Вячеслав справился с этим лучше всех и разделил первое место с магистрантом из Сколково.

Все мы пользуемся веб-сайтами, например, почтой, социальными сетями или онлайн-банкингом, где есть данные и функционал для работы с ними, например, по переводу денег. Однако через уязвимости в сервисе злоумышленники могут получить доступ к этим данным. Один из способов защиты – анализировать поступающие к сервису запросы и отделять «хорошие» от содержащих атаки. И здесь даже очень «хитрые» алгоритмы значительно проигрывают современным методам машинного обучения.

Точность модели машинного обучения, которую разработал Вячеслав Бакулин, по данным организаторов, составила 0,99985, и это очень высокий показатель.

– Задачи из этой области обычно не имеют точного решения, поэтому нужна такая математическая модель, которая с наибольшей точностью сможет классифицировать данные или предсказывать результаты, – поясняет студент. – В качестве модели нередко выступают нейронные сети, деревья решений и другие методы. Я использовал градиентный бустинг, а участник, разделивший со мной первое место, – архитектуру реккурентной нейросети.

 

Соревнования по анализу данных на платформе kaggle.com являются одними из самых популярных и авторитетных в сфере Data Science. Для людей, собирающихся стать специалистами в машинном обучении, такого рода конкурсы являются must have в портфолио. Компании, которым требуется решить сложную задачу по машинному обучению, предпочитают размещать свои проблемы и данные к ним именно на этой платформе и предлагают участникам солидные денежные призы за решения. На последних соревнованиях награда за 1 место составляла $1000.

Отметим, что Вячеслав уже побеждал в подобном соревновании, организованном компанией СИБУР.

Свои знания и навыки Вячеслав Бакулин совершенствует в группе Tomsk Machine Learning, где студенты, аспиранты и другие заинтересованные в машинном обучении специалисты разбирают нетривиальные темы и задачи. Подробности тем и информацию о том, как можно присоединиться, можно узнать в группе https://vk.com/tomskml.

В рамках направления «Программная инженерия» Высшая IT-школа (HITs) ТГУ применяет новый образовательный формат – основным принципом является тезис о том, что современный программный инженер развивается, если решает реальные задачи в современном IТ-окружении. Программа реализуется совместно с промышленными партнерами.