Сравнение подходов к крупномасштабному анализу данных

Сравнение подходов к крупномасштабному анализу данных

Молодежи свойственно увлекаться новыми идеями. Идея MapReduce, выдвинутая и реализованная сначала Google, а потом и сообществом open source в проекте Hadoop почти мгновенно овладела молодыми массами. Причем даже теми представителями компьютерной молодежи, которые получили хорошее образование и последующий практический опыт в области систем управления базами данных. Мне неоднократно приходилось слышать от молодых коллег, что они считают достоинствами MapReduce отсутствие схемы данных (в том числе, и отсутствие поддержки типов данных) и даже потребность в явном программировании конструкций, которые испокон веков поддерживались в СУБД на уровне высокоуровневых языковых конструкций языка SQL. Понятно, что дополнительным стимулом к применению MapReduce была привязка этой технологии к «облачным» вычислениям, возможность практически бесплатно арендовать виртуальный кластер с большим числом узлов и развернуть на нем свою MapReduce программу, почти автоматически достигнув громадной производительности своего приложения.
До поры до времени представители старшего и среднего поколений сообщества баз данных ограничивались ворчанием в адрес MapReduce, что, в свою очередь, еще больше привлекало молодежь к использованию соответствующих средств. Действительно, раз «старики» ворчат, значит, они просто не понимают, что средства управления данными их поколений просто устарели, и нужно переходить к использованию новых, прогрессивных технологий.

Два подхода к крупномасштабному анализу данных
Структуры и алгоритмы обработки данных
Работа с базами данных
Schism управляемый рабочей нагрузкой подход к репликации и разделению баз данных
Основы проектирования реляционных баз данных

История и актуальные проблемы темпоральных баз данных
Параллельная обработка данных
Методы добычи данных при построении локальной метрики в системах вывода по прецедентам
Выполнение транзакций, ориентированное на данные
МОГучие способности новые приемы анализа больших данных
Руководство по работе с БД Firebird с использованием библиотеки ADO .Net 2.0

Использование Cache SQL Gateway
Системы управления базами данных
Магия сохраняет силу
База знаний предприятий
Стратегические направления в системах баз данных

Анализ вклада Кодда в Великий Спор
Объектно-ориентированные базы данных - основные концепции
Закладывая основу нашего исследования наследования типов