Сравнение подходов к крупномасштабному анализу данных


оцифровка старых бабин

Сравнение подходов к крупномасштабному анализу данных

Сравнение подходов к крупномасштабному анализу данных
Предисловие переводчика
Аннотация
Введение

Введение - 2
Введение - 3
Два подхода к крупномасштабному анализу данных
Разделы
MapReduce
Reduce
Параллельные СУБД
Сравнение подходов к крупномасштабному анализу данных
Архитектурные элементы
Поддержка схемы

Поддержка схемы - 2
Индексация
Модель программирования
Распределение данных
Стратегия выполнения
Гибкость
Отказоустойчивость
Сравнение подходов к крупномасштабному анализу данных
Тесты для оценки производительности
Тестовая среда

Hadoop
СУБД-X
Vertica
Конфигурация узлов
Выполнение тестов
Исходная MR-задача
Загрузка данных
Hadoop
СУБД-X
Vertica

Результаты и обсуждение
Команды SQL
Программа MapReduce
Результаты и обсуждение
Сравнение подходов к крупномасштабному анализу данных
Аналитические задачи
Загрузка данных
Hadoop
СУБД-X
Vertica

Результаты и обсуждение
Задача Selection
Команды SQL
Программа MapReduce
Результаты и обсуждение
Задача Aggregation
Команды SQL
Программа MapReduce
Результаты и обсуждение
Задача Join

Команды SQL
Программа MapReduce
Функция Map
Функция Reduce
Функция Reduce
Функция Reduce
Результаты и обсуждение
Задача UDF Aggregation
Команды SQL
Программа MapReduce

Результаты и обсуждение
Сравнение подходов к крупномасштабному анализу данных
Обсуждение
Аспекты системного уровня
Инсталляция, конфигурирование и настройка систем
Инсталляция, конфигурирование и настройка систем - 2
Запуск задач
Сжатие
Загрузка и размещение данных
Стратегии исполнения

Модель отказов
Аспекты пользовательского уровня
Простота использования
Дополнительные инструментальные средства
Сравнение подходов к крупномасштабному анализу данных
Заключение
Заключение - 2
Заключение - 3
Заключение - 4
Благодарности

Литература
Содержание