Сравнение подходов к крупномасштабному анализу данных


Сравнение подходов к крупномасштабному анализу данных

Молодежи свойственно увлекаться новыми идеями. Идея MapReduce, выдвинутая и реализованная сначала Google, а потом и сообществом open source в проекте Hadoop почти мгновенно овладела молодыми массами. Причем даже теми представителями компьютерной молодежи, которые получили хорошее образование и последующий практический опыт в области систем управления базами данных. Мне неоднократно приходилось слышать от молодых коллег, что они считают достоинствами MapReduce отсутствие схемы данных (в том числе, и отсутствие поддержки типов данных) и даже потребность в явном программировании конструкций, которые испокон веков поддерживались в СУБД на уровне высокоуровневых языковых конструкций языка SQL. Понятно, что дополнительным стимулом к применению MapReduce была привязка этой технологии к «облачным» вычислениям, возможность практически бесплатно арендовать виртуальный кластер с большим числом узлов и развернуть на нем свою MapReduce программу, почти автоматически достигнув громадной производительности своего приложения.
До поры до времени представители старшего и среднего поколений сообщества баз данных ограничивались ворчанием в адрес MapReduce, что, в свою очередь, еще больше привлекало молодежь к использованию соответствующих средств. Действительно, раз «старики» ворчат, значит, они просто не понимают, что средства управления данными их поколений просто устарели, и нужно переходить к использованию новых, прогрессивных технологий.

Два подхода к крупномасштабному анализу данных
Структуры и алгоритмы обработки данных
Работа с базами данных
Schism управляемый рабочей нагрузкой подход к репликации и разделению баз данных
Основы проектирования реляционных баз данных
Характеристика связей и язык моделирования
Реляционная структура данных
Цели проектирования
Назначение и предметная область
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
История и актуальные проблемы темпоральных баз данных
Параллельная обработка данных
Методы добычи данных при построении локальной метрики в системах вывода по прецедентам
Различные подходы к классификации области добычи данных
Два подхода к интеграции вывода на основе прецедентов и добычи данных
Использование методов добычи данных для отбора прецедентов
Понятие контекстно-зависимой локальной метрики
Описание контекстно-зависимой локальной метрики
Заключение
Библиография
Выполнение транзакций, ориентированное на данные
МОГучие способности новые приемы анализа больших данных
Руководство по работе с БД Firebird с использованием библиотеки ADO .Net 2.0
Автоматическое управление транзакциями
Заполнение объекта DataSet
Взаимодействие СУБД Cache c внешним миром
Использование Cache SQL Gateway
Оптимизация загрузки данных в Cache
Использование Веб-сервисов в Cache
Третий манифест Кристофера Дейта и Хью Дарвена
Системы управления базами данных
Магия сохраняет силу
База знаний предприятий
Стратегические направления в системах баз данных
Анализ вклада Кодда в Великий Спор
Объектно-ориентированные базы данных - основные концепции
Закладывая основу нашего исследования наследования типов
POTT нарушает независимость данных
Селекторные операции
Статьи

*