Cassandra. Часть 5. Compaction

Главной причиной высокой скорости записи Cassandra является то, что запись данных последовательна. Данные попадают в оперативную память, сортируются в memtable, а затем блоком, в виде SSTable сбрасываются на диск. Именно благодаря такому подходу, Cassandra приближается тому, что ее производительность при сохранении равна скорости записи диска.

А что же с чтением? То, что Cassandra данные хранятся в отсортированном виде, конечно, конечно позволяет быстро находить нужную информацию в SSTable. Но как быть если SSTable у одной таблицы слишком много? Издержки на поиск среди этих них могут быть слишком велики. Причем, догадаться в какой именно SSTable лежат необходимые нам данные – нет никакой возможности,. Нужно заглядывать в каждую SSTable.

Что если объединить все эти SSTable в один большой? Тогда, чтобы найти запись, нужно будет прочитать всего 1 файл. Т.е. достаточно лишь один раз позиционировать головку диска в нужное место, а затем лишь непрерывно читать. Следовательно, для операций чтения, эффективнее хранить как можно меньше SSTable.

Именно этим и занимается операция compaction. Compaction - это процесс объединения нескольких SSTable в одну, данные внутри которой вновь SSTable сортируется, а также создается новый индекс и bloom-filter (у каждой SSTable есть Данные, Индекс и Фильтр).

dml_compaction

Алгоритм работы compaction

Дополнительным достоинством операции compaction является освобождение места на диске, т.к. при создании новой SSTable, можно отбросить удаленные записи. Операция очень сильно напоминает ребилдинг в реляционных БД. Основное отличие в том, что compaction выполняется автоматически и запускать его вручную нет необходимости.

Недостатком же является существенное влияние на систему I/O. Также на диске должно быть достаточно свободного места, на объединие двух SSTable по 1Гб, необходимо дополнительно 2Гб дополнительного места.

В Cassandra существуют различные алгоритмы compaction:

SizeTieredCompactionStrategy (STCS) - стратегия по умолчанию, рекомендуется для таблиц с высокой нагрузкой на запись
LeveledCompactionStrategy (LCS) - рекомендуется для таблиц с большим количеством операций чтения
DateTieredCompactionStrategy (DTCS) - предназначена для данных основе времени

Ссылки

http://docs.datastax.com/en/cassandra/3.0/cassandra/dml/dmlHowDataWritten.html

Written on June 6, 2017