Тьюториал проводит Артур Андреяк, профессор института информатики Гейдельбергского университета, Германия
Последнее десятилетие ознаменовалось повсеместным распространением больших и сверх-больших наборов данных. Это привело к возникновению интереса к области решения задач масштабируемого анализа и переработки «больших данных». Посредством инструментов с открытым исходным кодом, таких как, Hadoop, в настоящее время эти задачи могут быть решены с умеренными затратами на разработку и без необходимости глубокого знания распределенных систем. На данном тьюториале мы обсудим все необходимые составляющие анализа «больших данных».
В первой части мы познакомимся с парадигмой программирования Map-Reduce, а также с системами Spark, Apache Pig и DryadLINQ, обеспечивающими его расширение концепцией «потоков данных».
Во второй части на примерах алгоритмов машинного обучения (таких как линейная регрессия и k-means кластеризация) будет проиллюстрировано, как последовательные алгоритмы могут быть адаптированы для этих моделей программирования.
Последняя часть будет посвящена обзору существующих крупномасштабных реализаций интеллектуального анализа данных (на примере Apache Mahout), а также практическим аспектам использования этих инструментов.
Для участия в тьюториале желательно наличие базовых знаний в области статистики, а также знакомство с Java или аналогичными языками программирования
Время и место проведения тьюториала: 1 апреля 2013 года, 14:00, ЮУрГУ, главный корпус, ауд. 1007.
Продолжительность тьюториала: 3 часа (3 блока: 50 минут занятия + 10 минут перерыв/неформальная дискуссия).
Тьюториал будет проводиться на английском языке.
Для участия в данном тьюториале необходимо до 28 февраля направить на адрес gleb.radchenko@gmail.com заявку следующего содержания:
Тема сообщения: ПаВТ-2013: заявка на тьюториал
============================
ID заявки: <<ID личной заявки на участие в конференции>>
ФИО: <<ФИО полностью>>
Название тьюториала: Анализ больших данных: парадигмы программирования, алгоритмы и инструменты
============================