СХД (система хранения данных): что это такое, виды и типы средств, организация и обработка информации
Система хранения данных (СХД) — это комплекс аппаратных и программных структур, необходимых для содержания информации, которая, как правило, поставляется в значительном объеме. Объекты, помещаемые внутрь подобной конфигурации, могут обладать самым разным форматом: от классических медиа файлов до объемных баз. В качестве основных носителей используются всевозможные гибридные решения, состоящие из SSD и HDD. Главные отличия СХД от обыкновенной компьютерной памяти — это внушительная архитектура, возможность объединения контейнеров для транспортировки в сеть, присутствие отладочного управленческого ПО, а также техники копирования, архивирования и виртуализации.
«Физика» хранения
Сфера разработки систем для содержания и обработки данных предоставляет возможному пользователю внушительный выбор, позволяя ему выбирать нужные классы устройств, предназначенных для решения конкретных задач по индивидуальным характеристикам. Однако подобное разнообразие ассортимента конструкций существовало не всегда: отрасль развивалась постепенно, претерпевая огромное количество модернизаций, изменяясь под тот объем работы, который требовался человеку в определенное время.
Однако несмотря на наличие глобальных модификаций, сам принцип содержания остался неизменным. Физика полупроводниковых инноваций в конечном счете сводится к поиску новых научных достижений, обеспечивающих увеличение плотности транзисторов, размещенных на подложке. Схемы и микропроцессоры, взаимодействующие между собой, создают стройную систему, которая, кстати, пришла на смену модулям прошлого, состоящих из вакуумных ламп и отдельных электропроводящих элементов.
Как хранили данные раньше
Огромный технологический скачок рассматриваемая сфера совершила в течение последних 60-70 лет. За указанное время люди успели придумать, разработать и выпустить многочисленное количество устройств, применяемых для аккумулирования информации в рамках единого носителя. К их числу относились:
- магнитные и перфорированные ленты;
- барабаны;
- диски;
- оптические винты;
- перфокарты.
Каждый прибор характеризовался собственным набором преимуществ и недостатков. Создание любого из них постепенно приближало исследователей к успешно используемой современной аппаратуре.
Носители данных, использующие перфорацию
Самый первый модуль, являющийся прообразом всех нынешних систем, предназначенных для сбора и обработки информационных контейнеров. Их главная особенность — наличие значительного числа отверстий правильной формы, расположенных прямиком на листовом материале. В качестве подложки может приобретаться буквально все, вплоть до специального тонкого картона. Наиболее широко они применялись во второй половине XX века. С течением времени были заменены новыми конструкциями, представленными в виде компактных, быстрых и удобных полупроводниковых, магнитных или оптических носителей.
Перфокарты
Перфорированные элементы — это оборудование, применяемое людьми задолго до изобретения первого компьютера. Они задействовались, например, в ткацких станках, часах-карильонах, обыкновенных шарманках и пр. Первый человек, задумавшийся об использовании таких аппаратов для хранения данных — Герман Холлерит. Он реализовал свою идею для обработки статистики, полученной во время переписи населения. Позже ему удалось перенести информацию на другие приложения — это открытие привело современную группу компаний IBM к периоду благополучия, длящемуся до сих пор.
Перфоленты
На первый взгляд, более практичные носители, которые, к сожалению, в бизнесе и на крупных предприятиях практически не применялись. Основные проблемы устройства (последовательный доступ, небольшая емкость и низкая скорость ввода/вывода) сильно мешали дальнейшему распространению. Узкие 5-колонные ленточки с 1857 года можно было найти на телеграфах, а их широкие аналоги на 24 колонки задействовались в электромеханическом калькуляторе, изобретенном порядка 80 лет назад.
Магнитные ленты
Виды и средства хранения данных начали преобразовываться в 1924 г., с момента создания катушечных магнитных носителей. Такое оборудование обладало сильными преимуществами, выгодно отличаясь от устаревших перфокарт практически по всем фронтам. Побуждением к совершенствованию технологии стало то, что уже в середине восьмидесятых годов прошлого столетия, емкости дисков измерялись гигабайтами, а работать с такими величинами могли исключительно накопители нового формата. За три десятка лет исследователи разработали огромное количество подобных модулей, однако самым распространенным стандартом стал LTO. Именно на такой основе выпускают многие современные картриджи.
Магнитный барабан
Промежуточный вариант способ решения спора между регламентом пошаговой записи и нуждой обеспечения доступа к данным, расположенным во внешнем устройстве. Произведен в 1932 г, а его создателем считается Густав Тучек. Такие конструкции эксплуатировались до 1980 г: ими комплектовались машины ЭВМ БЭСМ-6, а также ее современники.
Гибкие диски
Просуществовали 30 лет, вплоть до конца 90-х. Распространению подобных структур способствовал факт наличия возможностей для передачи информации по сети. Тогда системами переноса обладал практически любой профильный ПК, а дисковые формации было удобно использовать для обмена материалами. Стандарт привычных «кругляшей» появился в 1983 году (он был предложен инженерами компании Sony).
Организация хранения данных: почему возникла необходимость в СХД
По результатам опросов бренда IDC Perspectives, до 23% от расходов в сфере IT уходит на операции по аккумулированию информационных контейнеров. Упомянутое положение дел обеспечивается чрезвычайно высокими темпами роста современного бизнеса: предприятия нуждаются в надстройках, способных сохранять и обрабатывать огромные потоки цифровых структур. Безвозвратная потеря каких-либо важных записей — это настоящая катастрофа, способная привести к краху даже самую успешную, и, казалось бы, непоколебимую корпорацию.
Факторы, способствующие развитию
Перед тем как начать разбираться с большим вопросом о том, что такое система хранения данных (СХД) в нынешнем формате, следует уточнить перечень причин, позволяющих говорить о чрезвычайной необходимости модернизации в целом:
- Развитие конкурентоспособности многих фирм, а также сложные характеры внутри рыночного противостояния
- Появление брендов, предлагающих решения для обустройства сеток предпринимательских учреждений.
- Пользовательская нужда в адаптивных платформах, способных работать с аналитикой в различных формах.
Все перечисленные факторы сыграли чрезвычайно важную роль во всем процессе становления отрасли.
Сферы применения СХД
В 2021 году рассматриваемые классы устройств используются в максимально широком ассортименте самых различных сфер:
- формирование отчетности;
- выработка прогнозов;
- бизнес-аналитика;
- переход на электронный документооборот в правительственном масштабе и пр.
На самом деле, намного проще перечислить отрасли, в которых подобные конструкции использованы не были.
Требования
В 2008 г., компания ТИМ выполнила исследование, основной целью которого стало получение данных от пользователей о приоритетных характеристиках аппаратуры, применяемой для аккумулирования информации. Исходя из результатов сотен опросов, можно сделать вывод о том, что люди, приобретающие рассматриваемые структуры, выделяют следующий набор их претенциозных качеств:
- функциональность;
- совокупная стоимость;
- прямые затраты;
- объем потерь на издержках при содержании;
- наличие рисков в плане обслуживания;
- присутствие гарантийного пакета и пр.
Все указанные факторы подталкивают предпринимателей к приобретению новых, более удобных, качественных и надежных модулей.
Из чего состоит
Обозреваемые структуры всевозможного класса создаются из определенного и стандартизированного числа элементов:
- носитель, выступающий в роли хранителя;
- инфраструктура обеспечения доступа;
- внутренняя группа дополнительной архивации и восстановления;
- ПО для настройки и отладки;
- сервис взаимодействия и диагностики.
Практически во всех случаях модели монтируются в классический шкаф (размером 19 дюймов), а их внешняя часть комплектуется наружными интерфейсами, отверстиями для коммутации портов, аккумуляторными батареями и пр.
Дисковые массивы
В конце 1990 года был создан уникальный коммерческий накопитель, полученный в результате объединения научных баз RAID и выпускаемых тиражом винчестеров. Незамысловатая логика устройств полностью соответствовала их физической конфигурации, а размеры одного такого контейнера могли варьироваться до 64 терабайт (конечно же, на современных аналогах). Впоследствии идея получила продолжение: дорогие и примитивные модули были заменены на легендарные версии 4200-ICDA, работа которых обеспечивалась мощностями 32-разрядного процессора.
Ключевые требования к СХД
Все системы обозреваемых классов предполагаются для использования в реальных, и достаточно непростых эксплуатационных условиях. Коммутацию к ним на практике осуществляют десятки и сотни серверов — этот фактор диктует основные условия, выдвигаемые к подобным интерфейсам:
- надежность и отказоустойчивость;
- доступность информации;
- наличие средств настройки и управления;
- производительность;
- масштабируемость.
Конечно, существуют и другие качества, однако представлять их следует именно в таком перечне.
Типы СХД
Комплект из достаточно сложных технических устройств функционирует по собственным регламентам, отладкой которого первоначально занимается разработчик, а затем — пользователь.
Дисковые
Модули применяются для оперативного взаимодействия с информационными контейнерами и формирования промежуточных копий. В 2021 году практикуется использование таких версий:
- для рабочих файлов;
- для резервного копирования;
- для долговременной архивации.
Все перечисленные виды storage-аппаратов обладают чрезвычайно широким набором сфер возможного применения.
Ленточные
Используются для создания вторичных дубликатов и архивированных структур. Как правило, поставляются в формате следующих категорий:
- отдельные полноформатные накопители;
- автоматические загрузчики;
- ленточные библиотеки.
Аналогичным образом применяются практически повсеместно.
Варианты подключений СХД
Для коммутации жестких дисков, пребывающих в составе единого хранилища, задействуются все возможные внутренние интерфейсы:
- SCSI;
- SAS;
- SATA;
- FC.
Также оборудование подобного профиля комплектуется и внешними средами:
- FC;
- FCoE;
- SCSI;
- iSCSI.
Еще есть узел взаимодействия между кластерами — Infiniband, также применяемый для получения доступа к рассматриваемым конструкциям.
Возможные топологии
Каждое стандартизированное хранилище состоит из набора некоторых активных элементов, обеспечивающих непосредственную функциональность всей аппаратуры:
- модуль коммутации серверов;
- емкости для хранения;
- компоненты сейфовых сетей и пр.
Такая архитектура была разработана в середине девяностых годов прошлого столетия. Она обладает некоторым перечнем неотъемлемых преимуществ: сниженные затраты, простое управление, уменьшенный трафик локальных сеток, высокая степень готовности и отличная протекция.
Для того чтобы добраться до вопросов о сетевом построении, современный предприниматель должен справиться с огромным количеством проблем радикально другого характера. Сегодня каждый инновационный бизнес не может существовать без средств автоматизации, поставкой которых занимается, например, российская компания «Клеверенс». Продукты можно использовать в магазинах, на складах, в различных учреждениях и на производствах.
Системы прямого подключения (DAS)
Модели Direct Attached Storage, коммутация которых выполняется непосредственно к серверной части всего построения. По сути, представляют собой разумный способ дискового расширения отдельно взятой ячейки, позволяющей пользователям взаимодействовать с конструкцией через сеть, в дистанционном, удаленном формате.
Устройства хранения данных, подключаемые к NAS
Накопитель, подключенный к сетевым настройкам, обеспечивающий файловый доступ к информации для сред LAN/WAN. Главные преимущества — высокая скорость развертывания, отлично организованные операции взаимодействия с контейнерами и возможность использования в узконаправленных секторах.
SAN
Структура блочного формата — отдельная сеть, служащая для организации доступа со стороны серверов и рабочих станций, отвечающих за мероприятия по обработке внутренних аккумулированных единиц. Благодаря наличию такого интерфейса, оборудование получает отличную готовность и хорошие параметры, связанные с интенсивностью осуществления запросов.
Решётка
Дополнительный вариант соединения, посредством которого создается архитектура с узлами, образующими регулярный одномерный решетчатый сервис. При этом каждое ребро полученного построения расположено параллельно наличествующей оси, и объединяет две смежных точки.
Кольцо
Сеть с такой топологией единообразно формирует все элементы, выстраивая их в окружность, коммутируемую каналами связи. Выход одного компьютера подключается к входу другого, а начав движение из одного места, сведения в итоге возвращаются в начало.
Центрально-распределенная система обработки и хранения данных
Каскадная решетка, основным предметным отличием которой являются элементы, с числом включений, варьирующимся в зависимости от топологических параметров всей конструкции. Используется в качестве принципиального модуля для создания распределительных структур, в формате сложных программируемых объектов.
Многоуровневая топология
Понятие Data multi tiering — наверное, один из самых классических аспектов процесса виртуализации. Первоначальный термин получил огласку в 1959 году, выступая в качестве обозначения виртуальной внешней памяти на дисках, расширяющих внутреннее контейнерное устройство, собираемое из магнитных сердечников. В рамках прогресса специалисты сумели создать сеть, состоящую из четырех отдельных уровней, на нулевом цикле которой монтируется классическая версия SSD. Далее идут быстрые узлы SAS, а затем — ленты.
Программный и аппаратный RAID
Все комплексы СХД, существующие и активно использующиеся в 2021 году, подразделяются на два класса:
- Использование отдельного RAID-контроллера с собственным процессором и кэшируемой памятью.
- Специализированное создание обеспечения, применяемого для расчета RAID.
Наиболее современным и качественным видом ПО считается именно программируемая структура. Например, в российском прайс-листе брендов, занимающихся поставками рассматриваемых архитектур, системы занимают до 20-30% от общей стоимости всей разработки.
Системы хранения информации на мировом рынке
Для того чтобы понять, что СХД — это элемент, обладающий по-настоящему весомой важностью во всемирном масштабе, можно просмотреть некоторые статистические показатели. Уже в 2018 году объем сектора составил порядка 5,9 млрд долларов, а, по прогнозам экспертов, ежегодный прирост отрасли колеблется в районе 24,53%. Таким образом, уже через несколько лет общая операционная прибыль сегмента достигнет планки в $ 17,8 — невероятные величины, даже в условиях повальной цифровизации абсолютно любых аспектов жизнедеятельности. Основными потребителями подобной продукции остаются классические дата-центры.
Российский рынок
По аналогичным показателям формируется и отрасль разработки и продажи систем хранения данных в Российской Федерации. Наша страна не отстает от мировых тенденций: объем профильного рынка еще в 2010 году достиг величины в 65 млн долларов.
Чрезвычайная динамика развития обусловлена молодостью большинства крупных фирм — отечественные создатели ПО и архитектур стремятся наверстать упущенные годы, постепенно зарабатывая авторитет на европейских и американских площадках. Сегодня подобными модулями пользуются не только традиционно крупные организации, но и бренды, представляющие различные отрасли малого и среднего бизнеса.
Основные этапы проектов создания хранилищ данных
Чтобы понять, что такое СХД на самом деле, следует просмотреть небольшую карту построения формаций:
- Выбор носителя.
- Создание технологии для оборудования ХД.
- Построение логической модели.
- Размещение информации из подобранных источников.
Конечно, каждый этап делится на огромное количество подкатегорий, обладающих различными нюансами. Мероприятия по формированию подобной конструкции отнимают множество времени, а проведением изысканий, как правило, занимаются специалисты с внушительным опытом практической деятельности.
Тенденции и перспективы
Компания Western Digital провела обширное исследование, основная цель которого — определение того, как именно будет развиваться вся отрасль СХД в обозримом будущем. Результаты, опубликованные в апреле 2020 года, выглядят приблизительно так:
- увеличение численности ЦОД;
- появление новых архитектур;
- стандартизация ИИ;
- способы простого развертывания периферийных устройств;
- деление базовых компонентов структуры на дополнительные уровни;
- появление инноваций в областях создания носителей;
- формирование решений для унификации доступа к контейнерам и пр.
Конечно, представленные идеи — это всего лишь прогнозы, которые, однако, могут с высокой вероятностью перейти в реальную жизнь.
Сравнение технологий обмена данными
Понять прогресс всего рынка в целом можно, например, благодаря сравнительному анализу прошлых, базисных устройств, используемых для компиляции классических сеток, с нынешними веяниями и аппаратами отрасли. Нетрудно догадаться, что новые серверные базы, а также совершенные комплексы, достигли невероятных высот как в плане технических характеристик, так и в функциональности. Прошлые перфокарты и решетчатые сервисы все еще существуют на отдельных порталах, однако до их полной замены осталось совсем небольшое количество времени.
Система обработки и хранения данных: отказоустойчивость
Один из самых главных показателей, влияющих как на стоимость, так и на привлекательность модуля в глазах потребителя. Оценить его можно по двум основным коэффициентам.
RPO (recovery point objective)
Максимальный период, за который может быть потеряна сохраняемая информация в результате какого-либо катастрофического и неприятного инцидента. Грубо говоря, представляет собой границу, в рамках которой специалисты могут действовать для проведения восстановительных работ.
RTO (recovery time objective)
Промежуток времени, в течение которого конструкция остается недоступной после аварийной деактивации. Чем меньше показатель, тем больше ресурсов требуется на финансовое обеспечение всей сетки.
Резервное копирование
Возможность создавать вторичные копии и дубликаты с определенной частотой. Такими модулями комплектуются практически все современные структуры, так что его важность уходит на второй план.
Как выбрать
Хранение данных — это отрасль, характеризующаяся по-настоящему широким ассортиментом решений, каждое из которых подходит под индивидуальные параметры конкретной задачи. Чтобы подобрать качественную и эффективную в заданных условиях конструкцию, потребитель должен обратить внимание на некоторый перечень показателей: число серверов, наличие блочного и файлового доступа, количество контроллеров, форм-фактор дисков, планируемый годовой рост архитектуры и требуемый рабочий объем. Учитывая все величины, пользователь без труда совершит нужную и действительно стоящую своих денег покупку.