Международная научная конференция
Параллельные вычислительные технологии 2013 (ПаВТ\'2013)

Тьюториал "Анализ больших данных: парадигмы программирования, алгоритмы и инструменты"
Русский | English

Тьюториал проводит Артур Андреяк, профессор института информатики Гейдельбергского университета, Германия

Последнее десятилетие ознаменовалось повсеместным распространением больших и сверх-больших наборов данных. Это привело к возникновению интереса к области решения задач масштабируемого анализа и переработки «больших данных». Посредством инструментов с открытым исходным кодом, таких как, Hadoop, в настоящее время эти задачи могут быть решены с умеренными затратами на разработку и без необходимости глубокого знания распределенных систем. На данном тьюториале мы обсудим все необходимые составляющие анализа «больших данных».

В первой части мы познакомимся с парадигмой программирования Map-Reduce, а также с системами Spark, Apache Pig и DryadLINQ, обеспечивающими его расширение концепцией «потоков данных».

Во второй части на примерах алгоритмов машинного обучения (таких как линейная регрессия и k-means кластеризация) будет проиллюстрировано, как последовательные алгоритмы могут быть адаптированы для этих моделей программирования.

Последняя часть будет посвящена обзору существующих крупномасштабных реализаций интеллектуального анализа данных (на примере Apache Mahout), а также практическим аспектам использования этих инструментов.

Для участия в тьюториале желательно наличие базовых знаний в области статистики, а также знакомство с Java или аналогичными языками программирования

Время и место проведения тьюториала: 1 апреля 2013 года, 14:00, ЮУрГУ, главный корпус, ауд. 1007.

Продолжительность тьюториала: 3 часа (3 блока: 50 минут занятия + 10 минут перерыв/неформальная дискуссия).

Тьюториал будет проводиться на английском языке.


Для участия в данном тьюториале необходимо до 28 февраля направить на адрес gleb.radchenko@gmail.com заявку следующего содержания:

Тема сообщения: ПаВТ-2013: заявка на тьюториал
============================
ID заявки: <<ID личной заявки на участие в конференции>>
ФИО: <<ФИО полностью>>
Название тьюториала: Анализ больших данных: парадигмы программирования, алгоритмы и инструменты
============================