Как найти иголку, стог и сено в данных ОФД Big data

Доклад принят в программу конференции
Михаил Лиманский
Первый ОФД

Начинал писать на Scala во времена Scala 2.9. Сейчас работает в команде Big Data в Первом ОФД в качестве Scala-разработчика. Кроме работы, есть несколько OpenSource-проектов.

Тезисы

Часто ли вам приходится искать данные в структурированной, но очень зашумленной базе с действительно большим объемом данных? Из этого доклада вы узнаете, как это делаем мы -- оператор фискальных данных Первый ОФД.

Я расскажу, почему мы решили разработать свою платформу для работы с данными, работающую поверх HBase, что она умеет, с какими трудностями мы столкнулись и как их преодолевали.

Базы данных / другое
,
Организация доступа к базам данных, ORM, собственные драйвера
,
Hadoop

Другие доклады секции Big data