Как найти иголку, стог и сено в данных ОФД Big data
Доклад принят в программу конференции
Михаил Лиманский
Первый ОФД
Начинал писать на Scala во времена Scala 2.9. Сейчас работает в команде Big Data в Первом ОФД в качестве Scala-разработчика. Кроме работы, есть несколько OpenSource-проектов.
Тезисы
Часто ли вам приходится искать данные в структурированной, но очень зашумленной базе с действительно большим объемом данных? Из этого доклада вы узнаете, как это делаем мы -- оператор фискальных данных Первый ОФД.
Я расскажу, почему мы решили разработать свою платформу для работы с данными, работающую поверх HBase, что она умеет, с какими трудностями мы столкнулись и как их преодолевали.