Що таке Teradata? Її відмінності від аналогів

  • 13 марта, 17:52
  • 3819
  • 0

В даній статті наведено опис системи управління базами даних (СУБД) Teradata через призму порівняння з аналогічними, відомими і більш поширеними рішеннями:

  1. MS SQL - орієнтована на виконання запитів на одному фізичному сервері;
  2. Oracle - орієнтована на виконання запитів на одному фізичному сервері;
  3. Hadoop -орієнтована на розподіленому зберіганні даних.

Уявімо ситуацію, коли споживачу потрібна високопродуктивна, відмовостійка, масштабована СУБД.

Як би не були хороші і звичні MS SQL і Oracle, але ми обмежені одним сервером. У якийсь момент ми зіткнемося з проблемою обмеження по продуктивності.

Що таке Teradata? Її відмінності від аналогів

Hadoop дійсно позбавлена нестачі, в обмеженні використання одного сервера. Дозволяє, використовувати різнорідне обладнання, розміщене в великих мережах, а вартість зберігання даних невелика. Його слабкість полягає в використанні TCP / IP v4 / v6 протоколів між критичними вузлами Hadoop, що знижує продуктивність обміну інформацією в мережі.

СУБД Teradata для зв'язку фізичних серверів (нод) використовує спеціалізовану фізичну мережу BYNET, яка, при передачі даних, має низькі накладні витрати, забезпечує недоступну для конкурентів продуктивність і час доступу. Якщо врахувати, що швидкість мережі є найвужчим місцем в розподілених СУБД, то і наявність BYNET є серйозною перевагою. Пов'язано це з тим, що не всі запити добре распаралелені і грубі методи «fullscan» навантажують саме зв'язку між нодами.

Сховище даних Teradata представляє собою в'язку з жорстких дисків і SSD накопичувачів, що дає найкращі показники часу доступу до даних зі сховищ, що використовують жорсткі диски.

При організації СУБД Teradata під кожен певний обсяг дискового простору призначається віртуальний процесор «AMP» (Access Module Processor) і «PE» (Parsing Engine). Їх робота практично не залежить від інших віртуальних процесорів.

Якщо порівнювати з точки зору систем зберігання даних, то в Oracle, MS SQL, Hadoop - жорсткі диски підключають через високопродуктивні дискові контролери сторонніх виробників, а в Teradata використовуються спеціалізовані сховища, які в свою чергу краще інтегровані в систему.

Зазначена концепція зберігання дозволяє використовувати таке поняття, як «температура даних». Дана технологія є серйозною конкурентною перевагою так як в Teradata дані розподіляються в залежності від їх затребуваності на більш швидких секторах (циліндрах) жорсткого диска або навпаки.

У зв'язку з тим, що підключення до сховища відбувається на нижчому рівні, ніж у конкурентів, АМП виконує агрегацію, створює блокування, здійснює вставку, читання і видалення значно ефективніше. Тобто між споживачем і самими даними менше вузлів і витрат.

Завдяки уніфікованій структурі розміщення блоків даних на сховищах Teradata, підключаючи нові ноди до існуючого кластеру, ми отримуємо збільшення продуктивності, відмовостійкості, доступного дискового простору. Аналогічно при відключенні вузлів кластера ми отримуємо зниження всіх зазначених характеристик.

Головним недоліком СУБД Teradata щодо конкурентів, є висока вартість, як системи в цілому, так і вартість зберігання даних.

Другий недолік - мізерний інструментарій по роботі з СУБД.

Третім недоліком є той факт, що Teradata отримала менше поширення ніж Hadoop. З цього виходять і проблеми, з впровадженням і супроводом даної СУБД.

Підіб'ємо підсумок візуалізацією сильних і слабких сторін СУБД Teradata по відношенню до конкурентів:

По материалам NewTechAudit


0 комментариев
Сортировка:
Добавить комментарий