Почему нам не обойтись без жёстких дисков: 5 причин
- Увеличивается объём онлайн-хранилищ. Работа мобильных приложений, сервисов стриминга музыки и видео, платформ электронной коммерции, социальных сетей и многих других сервисов, без которых трудно представить современное общество, требует использования огромных ЦОДов, главным носителем данных в которых остаются жёсткие диски. Спрос на такие ЦОДы растёт. Увидев это, вендоры в последнюю пару лет стали оптимизировать жёсткие диски объёмом более 10 ТБ, не только наращивая их ёмкость, но и увеличивая скорость работы. Большое количество таких дисков в сочетании с кэшем на базе SSD позволяет достичь повышения производительности и полезного объёма хранилищ данных без потери экономической эффективности.
- Внешние жёсткие диски с интерфейсом USB пользуются спросом. Хотя в некоторых клиентских устройствах типа сетевых видеорегистраторов для систем наблюдения или дешёвых настольных ПК продолжают использоваться жёсткие диски, почти во всех других устройствах — ноутбуках, ПК-моноблоках, компактных ПК и игровых консолях — к 2022 году их заменят SSD. Но вот что происходит: бизнес-ноутбуки предыдущих поколений обычно оснащались 1-терабайтным HDD, а сегодня ему на смену пришёл 500-гигабайтный SSD. Пользователям же таких устройств нужно от 2 до 4 ТБ памяти, в силу чего они вынуждены покупать внешние HDD. В результате популярность USB-дисков объёмом от 2 до 4 ТБ сегодня выше, чем когда-либо.
- Геймерам нужно больше места для данных. Ранее в игровых консолях для хранения данных применялись жёсткие диски на 1 ТБ. Переход игровых консолей на SSD не принёс увеличения ёмкости, и ни Xbox Series X, ни PlayStation 5 не имеют свободного 1 ТБ на встроенном накопителе: владельцам доступно не более 825 ГБ. В то же время системные требования игр очень увеличились: популярные игры могут занимать 50 ГБ и более. Поэтому внешние жёсткие диски стали выбором геймеров. Почему не внешние SSD? Потому что внешний SSD на 2 ТБ сейчас стоит в Европе более 200 евро, а жёсткий диск на 4 ТБ — меньше 100 евро. Производители жёстких дисков, включая Toshiba, стремятся удовлетворить имеющийся спрос и расширяют линейки внешних жёстких дисков с интерфейсом USB, в том числе за счёт специализированных моделей для гейминга, отличающихся улучшенными характеристиками.
- HDD нужны системам видеонаблюдения. Современные системы видеонаблюдения, в которых применяются ИИ-инструменты и реализовано распознавание лиц, а также «умный» мониторинг, используются для решения куда более сложных задач, чем охрана территорий и помещений с ограниченным доступом: они могут помочь анализировать поведение покупателей в магазинах, эффективнее управлять дорожным движением и т. д. Носитель в таких системах должен иметь наивысшую надёжность, поддерживать работу в режиме 24/7 и при этом, так как данные могут поступать неравномерно, справляться с высокими пиковыми нагрузками. Производители жёстких дисков, и Toshiba в их числе, с учётом этого предлагают продукты для систем видеонаблюдения, ориентированные как на крупных, так и на мелких бизнес-клиентов.
- Сетевые хранилища (NAS) теперь применяются повсюду: в системах «умного» дома, как медиасерверы для хранения аудио- и видеоконтента, в малых предприятиях и домашних офисах. Последнее по понятным причинам стало особенно популярно в последние два года. NAS продаются обычно без жёстких дисков, так что пользователю приходится подбирать подходящую модель самостоятельно. С интерфейсом проблем быть не должно, так как сетевые хранилища работают почти с любыми SATA-дисками, но при выборе модели, конечно, необходимо выбирать такие диски, которые оптимизированы для использования в сетевых хранилищах (пример: диски серии N300 от Toshiba). Заметим также, что регулярный бэкап — это не актуальный тренд, а вещь необходимая всем и всегда.
***
HPE StoreEver MSL3040 Tape Library
Это видео наглядно показывает устройство и принцип работы библиотеки HPE StoreEver MSL3040 Tape Library: в стоечном корпусе 3U по бокам расположены магазины общей вместимостью 40 картриджей. Посередине корпуса, как и в автозагрузчике — дорожка, по которой передвигается робот. С помощью фотоэлемента он считывает метки на картриджах, выбирает нужный, и доставляет его в один из приводов, установленных в задней части библиотеки. Так как приводы могут быть разных стандартов LTO и с разным типом подключения (FC или SAS), устройство продаётся без привода. Привод нужно покупать отдельно. Библиотека может расширяться дополнительными корпусами (до 6 штук), каждый из которых может содержать как картриджи, так и приводы.
Ответственность облачного провайдера
Для организации защиты персональных данных в облаке провайдер обязан выполнить требования законодательства, что подтверждается наличием аттестата соответствия 152 ФЗ . Он выдается контролирующими органами, и подтверждает, что инфраструктура облака соответствует приказам ФСТЭК, а информация надежно защищена. При передаче сведений в облако часть требований к каждому уровню защиты должен соблюдать облачный провайдер.
Провайдер облачных услуг при хранении персональных данных в облаке должен:
- получить лицензии ФСБ и ФСТЭК. Если помимо хранения ПДн, выполняются услуги передачи данных или телематические услуги (услуги связи по передаче данных), то также необходимо получить лицензию Минкомсвязи;
- определить актуальные угрозы и самый корректный уровень защиты облака;
- создать частную модель актуальных угроз для облака;
- реализовать защиту персональных данных в облаке;
- предоставить оператору дополнительные инструменты безопасности;
- помочь в реализации защиты ПДн с клиентской стороны.
Безопасность и защита данных
Infection of a Database on a Computer Network
Услуга резервного копирования в облако защищает от программ-шифровальщиков и криптомайнеров.
Один из опрошенных нами специалистов из компании DiPHOST с помощью бэкапа решил проблемы со зловредом:
«Я занимаюсь хостингом. Однажды я делал и настраивал клиенту виртуальную машину на основе Linux KVM. Виртуальная машина находилась на образе с ZFS — это файловая система для работы с большим объемом данных. Первая установка, типовых образов нет, то есть всю работу делал своими руками, подсмотреть было не у кого, никакой страховки.
Настраивал виртуальную машину я через стандартный VNC (Virtual Network Computing) — систему удаленного доступа к рабочему месту. По умолчанию VNC была подключена к интернету без пароля.
Час я там всё причесывал, после чего пошел кофе попить. Возвращаюсь — почему-то сессия прервалась. Сначала не обратил на это внимания. Примерно минуты через три понимаю, что кто-то на моей виртуалке майнит криптовалюту: процессор загружен, а еще запущена программа, которая была опознана как вирус-майнер. Половина моей инсталляции стерта. Два часа работы коту под хвост.
Вздохнул, установил пароль на систему удаленного доступа. Мне повезло: до заражения я настроил автоматическое создание снапшотов в ZFS каждые 15 минут. Поэтому я смог воспользоваться снапшотом ZFS, сделав моментальную копию файловой системы. Далее «откатил» снапшот на полчаса и продолжил настраивать виртуалку с момента создания снапшота. Благодаря этому потерял только полчаса времени, а не два с половиной, как могло бы быть».
Криптомайнеры и программы-вымогатели — частая угроза для бизнеса. Один из способов повысить сохранность данных — использовать СРК на базе технологий российского вендора «Киберпротект».
Обнаружив попытки изменить буквы на символы или запуск в фоновом режиме математических расчетов для генерации криптовалюты, решение блокирует подозрительную активность и оповещает администратора.
Вот так, например, решал эту задачу один из наших клиентов:
«ИТ-специалисты компании могут не видеть ноутбуки сотрудников долгое время, тем не менее данные на оборудовании защищены настроенными политиками резервного копирования. Перед внесением изменений все данные сохраняются в буфере. Даже если вредоносному ПО удалось зашифровать или повредить файлы, сервис успешно восстановит их».
Кроме того, вместе с СРК можно использовать VPN-подключения, шифровать резервные копии собственными паролями, передавать данные с SSL-шифрованием.
Последняя линия обороны против программ-вымогателей и других видов атак — неизменяемый репозиторий. Использование этого режима гарантирует наличие защищенной копии исходных данных в ее первозданном виде.
Организации, подпадающие под требования закона 152-ФЗ «О персональных данных», могут воспользоваться услугами резервного копирования в аттестованный сегмент. Например, областной детской клинической больнице потребовалось резервное копирование медицинской информации, включая ПДн пациентов, а также безопасное хранение данных согласно требованиям 152-ФЗ. С облачным решением госучреждение выполнило все требования регуляторов, сэкономило время и средства на закупку оборудования и ПО.
Популярность новых технологий пока невелика
По оценкам IDC, объем данных вырастет к 2025 году с 33 до 175 зетабайт. Неудивительно, что потребность в быстром доступе к данным и решениях для их хранения, обладающих высокой пропускной способностью или большой емкостью, сегодня выше, чем когда-либо, и постоянно растет.
Это стимулирует внедрение новых технологий и архитектур, дополняющих современные подходы к хранению данных. Так, из результатов опроса компании Spiceworks видно, что с одной стороны, уже через два года твердотельные накопители станут немного популярнее традиционных жестких дисков.
Однако, из того же опроса видно, что современные технологии хранения, например — постоянную память (NVDIMM, Intel Optane) используют лишь 16% респондентов, еще 12% планируют начать работать с ней в течение ближайших двух лет.
А с современными технологиями записи, такими как термомагнитная или микроволновая, знакомы вообще исчезающе малое количество.
Степень знакомства респондентов с технологиями хранения и записи
А ведь именно их использование — один из главнейших резервов ускорения процессов обработки данных.
Данные росли, растут и будут расти
Ожидаемый годовой рост объемов данных
- Более активное использование аналитики.
- Увеличение количества IoT-устройств.
- Перенос данных в облако.
Дейв Мосли, генеральный директор Seagate Technology
- Объем новых данных в 2025 году возрастет до 175,8 ЗБ, в то время как в 2015 году он составлял всего 18,2 ЗБ.
- В 2025 году предприятия будут хранить 9 ЗБ информации, тогда как в 2015 году этот показатель был равен 0,8 ЗБ.
- Результаты опроса Rethink Data подтверждают эту тенденцию. Практически все респонденты сообщали, что количество собираемых данных и емкость хранилищ в их организациях увеличиваются. Это говорит о том, что более активное использование аналитики и IoT-устройств, а также перенос данных в облако входят в тройку главных факторов, влияющих на рост объема хранимых данных.
- По результатам Global DataSphere, в 2015 году 65% данных было создано на конечных точках и 35% в центре и на периферии.
- Ожидается, что к 2025 году 44% всех данных, созданных в центре и на периферии, будет использоваться для аналитики, искусственного интеллекта и глубокого обучения, а данные с растущего числа IoT-устройств будут передаваться на периферию корпоративной сети.
- Центр тяжести данных смещается и в направлении центра, и в направлении периферии. К 2025 году почти 80% всех данных в мире будут храниться в центре и на периферии, что составит значительный рост по сравнению с 35% в 2015 году.
- По прогнозам IDC, к 2025 году емкость запоминающих устройств (жестких и оптических дисков, твердотельных и ленточных накопителей), используемых предприятиями, составит 12,6 ЗБ. Поставщики облачных услуг будут управлять 51% от этой емкости.
Где создаются и хранятся данные
- ИИ стал более экономичным и практичным.
- Развернуты миллиарды IoT-устройств.
- Операторы беспроводной связи модернизируют свои сети для поддержки пятого поколения мобильной связи (5G).
- Инновации в периферийных центрах обработки данных решают проблемы распределенных площадок, а удельные издержки снижаются.
Традиционное недоверие к облакам еще не изжито
В отношении облачных решений российские компании сохраняют скептицизм. Лишь 36% опрошенных используют возможности, которые дает интеграция собственного ЦОД с облачными сервисами.
Ответы на вопрос о том, пользуются ли респонденты арендованным оборудованием, подчеркнули приверженность к использованию «своего» железа (так ответило 57%). В финансовом и реальном секторе доля консерваторов 68% и 77% соответственно. 22% респондентов ответили, что арендуют часть оборудования, лишь 10% пользуются ЦОД как услугой.
Самым полезным функционалом облаков были названы «возможность «переезда» виртуальных машин» и «возможность хранения резервных копий» (по 24% от общего числа респондентов, или 66% от числа тех, кто применяет интеграцию ЦОД с облаками или планирует ее), а также «возможность репликации» (19% и 53% соответственно).
При этом наиболее консервативным оказался финсектор (всего 16% готовых к интеграции ЦОД с облаком), а самыми «продвинутыми» — предприятия торговли (50% утвердительных ответов).
Грантовая поддержка цифровизации российских компаний будет продолжена
Поддержка ИТ-отрасли
Лишь 19% респондентов хранят в облаках контейнеры «с помощью специального ПО» (23%), и «в выделенных СХД» (20%). Еще 22% респондентов заявили, что специальных средств не используют. Только в 11% компаний контейнеры не применяются вовсе.
Как пользоваться Mega.nz
После запуска хранилища перед вами открыто окно меню «Менеджер файлов». В самом верху находится панель меню, а ниже располагается область для работы с загруженными папками и файлами. Справа расположена колонка управления и отображения структуры хранилища.
Пользователям браузера Mozilla Firefox предлагается установить дополнение MEGA EXTENSION. Без установки дополнений разработчики рекомендуют использовать браузер Google Chrome. Так как у меня основной браузер Firefox, то я установил рекомендованное расширение для своего браузера.
Отличие в использовании сервиса именно в браузере Google Chrome состоит в том, что в отличие от других браузеров, используя Google Chrome, в облачное хранилище Mega.co можно будет загружать не только файлы, но и целые папки.
Вот так выглядит панель управления хранилища в браузере Mozilla Firefox. На панели расположена кнопка «Новая закачка». С помощью кнопки «Новая закачка» происходит загрузка файлов в облачное хранилище.
В браузере Google Chrome на панели расположены две кнопки «Закачать файл» и «Закачать папку». С помощью кнопки «Закачать файл», можно загрузить файл в облачное хранилище со своего компьютера. После нажатия на кнопку «Закачать папку», открывается окно Проводника, в котором вам нужно выбрать папку для ее загрузки в файловое хранилище.
Для того, чтобы это обойти, пользователи других браузеров могут создать в Mega папку с точно таким названием, как та папка на компьютере, которую нужно загрузить в хранилище. Затем необходимо открыть папку на компьютере и загрузить ее содержимое во вновь созданную папку в файловом хранилище. Таким образом, нужная папка будет полностью загружена в Mega.
В панели меню «Моя учетная запись» вы можете посмотреть на свой статус, объем используемого пространства хранилища, а также настроить передачу данных.
Здесь вы можете изменить количество параллельных соединений на загрузку и количество параллельных соединений на скачивание. Если вам это нужно, то вы можете ввести ограничение на скорость загрузки.
После нажатия на кнопку меню «Членство Pro», вы можете выбрать на выбор платный пакет для хранения более большего объема своих файлов от 500 ГБ до 4 ТБ.
Если вы нажмете на кнопку меню «Меню», то вы можете более подробно ознакомиться с правилами использования облачного хранилища Mega.co.
Можно создать новую папку, если нажать для этого на кнопку «Новая папка». Во вновь созданную папку, вы можете загружать файлы, а также создавать в этой папке, другие новые папки. После нажатия на папку правой кнопкой мыши, в контекстном меню вы можете выбрать соответствующие команды для дальнейших действий с папкой.
Для загрузки файлов в файловое хранилище Mega.co нужно нажать в браузере Google Chrome на кнопку «Закачать файл», а в других браузерах нажать на кнопку «Новая закачка». В открывшемся окне Проводника следует выбрать файл или сразу несколько файлов для загрузки в облачное хранилище.
Скорость загрузки файлов неограниченна, если вы не ограничили ее в настройках сервиса, и она зависит от скорости интернет-соединения вашего компьютера. Загруженные в облачное хранилище файлы вы можете перемещать по папкам, переименовывать, давать к ним общий доступ, получать на них ссылки, копировать или удалять.
Вы можете наблюдать за процессом загрузки и скачивания файлов в нижней части окна сервиса.
Работа с файлами в MEGA происходит через веб-интерфейс. Пока еще клиенты для компьютера и других устройств не выпущены.
HDD против SSD: мирное сосуществование и процветание
Подводя итог, можно сказать, что жёсткие диски и твердотельные накопители продолжат сосуществовать, а дискуссию о том, когда последние одержат окончательную победу, можно считать оконченной. Нужда современного мира в расширении онлайн-хранилищ при сохранении низкой стоимости их создания и эксплуатации растёт, а удовлетворить её могут только жёсткие диски, что гарантирует их востребованность на долгие годы.
В 2020 году производители комплектующих выпустили носители общим объёмом 1200 эксабайт (т. е. 1,2 млн терабайт). Из него на носители на базе SSD приходится только 200 ЭБ, а остальные 1000 ЭБ — в основном на жёсткие диски. Соотношение, заметим, 1:5. Стоимость на единицу ёмкости у твердотельных накопителей продолжает снижаться, но у и у жёстких дисков происходит то же — спасибо новым технологиям, описанным выше. Указанное соотношение общей ёмкости 1:5, как ожидается, со временем превратится в 1:4, но так как общий объём хранилищ продолжит увеличиваться почти экспоненциально, спрос будет расти на оба типа носителей.
Возможно, Вы бы хотели читать нас чаще, тогда вот наш Telegram
Не только архивы
Сервис ArcTape предназначен не только для архивирования, но и для хранения резервных копий данных. Бэкапы на ленте — это «последний оплот» всех имеющихся резервных копий. Он используется только в том случае, если невозможно восстановить данные из локальных резервных копий. Тем не менее, у решения ArcTape есть все необходимое, чтобы конкурировать с системами локального хранения резервных копий: высокая надежность и скорость доступа.
Каждый узел системы ArcTape зарезервирован, и в случае выхода из строя одного узла будет автоматически задействован резервный. Время ввода в строй резервного узла — около 15 минут.
В целом показатель надежности систем хранения данных определяется совокупностью трех характеристик:
- Доступность — промежуток времени, в течение которого данные доступны для работы с ними. Доступность сервиса ArcTape за 2021 год составила 99,2%
- RPO — объем потерянных при аварии данных (в часах). Синхронизация СХД с лентой происходит раз в сутки.
- RTO — время восстановления сервиса (доступа к данным) после аварии. Благодаря резервным узлам системы (СХД, сервер управления ленточным хранилищем, коммутаторы и резервные стримеры для записи) время восстановления системы до полного функционирования — около 15 минут.
Таким образом, для записи и чтения данных используется схема «СХД-лента». При записи на магнитную ленту все данные сначала загружаются на флэш-массив с высокой скоростью чтения\записи по оптическим каналам, а потом, в порядке очереди, записываются на магнитную ленту. Скорость чтения\записи у ленточного картриджа составляет около 300 МБ\с, что равноценно скорости HDD-накопителей.
«Узкое место» в скорости восстановления с ленты — наличие свободных стримеров для чтения данных с ленточного картриджа. В последнем обновлении системы доступно уже семь таких стримеров. Поэтому, если локальные резервные копии по какой-то причине испорчены или скомпрометированы, то восстановление с ленты может оказаться не только актуальнее, но и пройдет быстрее.
Многоуровневое хранение позволяет предоставить клиентам максимальную скорость записи и высокую сохранность данных, а также избежать задержек и очередей при записи. Благодаря быстрой флэш-системе, на которую первоначально записываются данные, заказчик пользуется системой как собственной сетевой СХД. Общая емкость системы сейчас составляет примерно 24 ПБ. Сервисом пользуются порядка 20 заказчиков.
И сервер, и хранилище
Еще один новый подходов к процессу обработки данных — «вычислительное хранение» (computational storage). В системах такой архитектуры СХД снабжаются собственными специализированными процессорами, которые «на месте» выполняют ряд операций, например — сжатие данных, их дедупликация, шифрование/дешифрование. Все эти операции вполне логично «переложить» на специализированные чипы, а не расходовать на их выполнение ресурсы центрального процессора.
Вычислительное хранение привлекает сегодня все большее внимание ввиду развития ИИ и приложений интернета вещей, которые требуют дополнительных вычислительных ресурсов. Тенденция перемещения этих ресурсов ближе к системам хранения наблюдается уже несколько лет и может получить массовое распространение, особенно в связи с развитием периферийных вычислений
Ресурсы Universal Analytics
Для ресурсов Universal Analytics срок хранения можно настроить для данных на уровнях пользователей и событий. Вы можете выбрать один из следующих вариантов:
- 14 месяцев;
- 26 месяцев;
- 38 месяцев;
- 50 месяцев;
- не удалять автоматически.
Если вы увеличите срок хранения или выберете вариант Не удалять автоматически, это не затронет уже собранные данные. Например, если выбран срок 14 месяцев, то собранные сейчас данные будут удалены через 14 месяцев, даже если в дальнейшем вы увеличите срок хранения до 26 месяцев.
Обратите внимание, что применение срока хранения данных не отразится на стандартных сводных отчетах Google Аналитики. Информация о пользователях и событиях нужна только при работе с дополнительными функциями, например во время применения специального сегмента или создания специального отчета
Что такое big data?
Отличия аналитика данных от Data ScientistОтличия аналитика данных от data scientist. Что они должны знать и уметь.
Большие данные — это огромный объем структурированной и неструктурированной информации. Также к big data относятся технологии, которые используют, чтобы собирать, обрабатывать данные и использовать их в работе.
К большим данным можно отнести поток сообщений из социальных сетей, датчики трафика, спутниковые снимки, стриминговые аудио- и видеопотоки, банковские транзакции, содержимое веб-страниц и мобильных приложений, телеметрию с автомобилей и мобильных устройств, данные финансового рынка.
Технологические компании практически никогда не удаляют собранную информацию, так как завтра она может стоить в разы больше, чем вчера. И даже сегодня она уже приносит миллиардные прибыли многим компаниям. Первые версии системы хранения больших данных Hadoop даже не имели команды «Удалить данные»: такой функции не предполагали.
Как пример — Facebook*. Компания использует информацию о поведении пользователей, чтобы рекомендовать новости, продукты внутри соцсети. Знания об аудитории повышают интерес пользователей и мотивируют посещать соцсеть как можно чаще. Как следствие — растет прибыль Facebook.
А гугл выдает результаты поиска не только на основе ключевых слов в поисковом запросе. Он также учитывает историю предыдущих запросов и интересы пользователя.
За последние годы производительность вычислительных систем сильно выросла. Это видно на графике роста количества транзисторов за последние 50 лет.
Транзистор — это полупроводниковый элемент. Из транзисторов собирают основные логические элементы, а на их основе создают различные комбинационные схемы и непосредственно процессоры. Чем больше транзисторов в процессоре — тем выше его производительность.
Закон Мура: количество транзисторов, размещаемых на кристалле интегральной схемы, удваивается каждые два года
Закон Мура: количество транзисторов, размещаемых на кристалле интегральной схемы, удваивается каждые два года График:
Благодаря высокой производительности появилась возможность обрабатывать данные с такой же большой скоростью, с которой они поступают.
Как работает дата-центр «Яндекса» в Финляндии
Видео: «Яндекс» на ютубе
Согласие на обработку персональных данных
Перед сбором персональных данных необходимо получить согласие на их обработку. Это делается двумя способами:
- Письменное согласие подписывают, когда происходит сбор ПДн с работников организации, при трансграничной передаче ПДн в страны, которые, по мнению Роскомнадзора, не обеспечивают адекватную защиту прав субъектов ПДн, если обрабатываются биометрические ПДн или данные о здоровье.
- Получение согласия через интернет, если сбор ПДн выполняется в сети. Обычно это реализуется через соответствующее поле на сайте: пользователь, поставив в него отметку, дает свое согласие на обработку его ПДн. При этом на сайте должна быть размещена Политика конфиденциальности.
Пример классического согласия на обработку данных (письменный вид)С 1 марта 2021 года пользователь может запретить или разрешить распространение своих ПДн всем или определенному перечню операторов ПДн. SberCloud не распространяет ПДн пользователя, которые тот оставляет на сайте, и обеспечивает их надежную защиту.Синкина Надеждаэксперт по методологии кибербезопасности Центра киберзащиты SberCloud
Преимущества облачного хранения данных
Внедрение облачного хранения данных в вашей организации поможет вам:
Сэкономить деньгиХотя многие облачные хранилища взимают ежемесячную и ежегодную плату, хранение файлов в облаке зачастую обходится дешевле, чем на внешнем жестком диске. Например, если вы хотите хранить пять терабайт данных, то ежегодная плата за облачное хранилище iDrive составит 59,62 доллара, а покупка портативного внешнего жесткого диска Seagate — 123,04 доллара + налог. Инвестиции в облачное хранилище также более гибкие, чем в локальное, поскольку вы можете использовать инструменты, предлагающие оплату по мере использования и автомасштабирование, так что вы платите только за то хранилище, которое вам необходимо.
Защита файлов от хакеров и вредоносных программХотя многие из нас знакомы с хакерами только по их роли в фантастических драмах, они представляют растущую угрозу для организаций по всему миру — в основном, когда используют вредоносное ПО. По состоянию на 2020 год, хакеры использовали более 677,66 миллионов известных типов вредоносных программ для взлома компьютеров, кражи данных и получения выкупа. Атака вредоносного ПО может иметь катастрофические последствия для организаций. Исследование, проведенное среди 1 998 потребителей из Германии, Франции, Северной Америки и Великобритании, показало, что 59% потребителей, скорее всего, не станут вести дела с организацией, подвергшейся кибератаке в предыдущем году.
Кроме того, более 66% потребителей уйдут к конкурентам, если компания не сможет восстановить свои системы и приложения в течение трех дней после кибератаки. Хотя у каждого хакера свой уникальный подход, многие используют методы социальной инженерии, такие как фишинг и ransomware, чтобы атаковать организации через такие уязвимые каналы, как электронная почта. Поскольку безопасные инструменты облачного хранения позволяют обмениваться документами без электронной почты, это снижает риск того, что кто-то взломает вас.
Доступ к файлам с других устройствПоскольку файлы облачного хранилища находятся вне вашего компьютера, вы можете получить к ним доступ с любого устройства, в любое время и из любого места (при условии, что у вас под рукой есть информация для входа в систему).
Как устроено хранение персональных данных в облаке
ФЗ 152 не запрещает хранение персональных данных в облаке, но при этом дата-центр выбранного облачного провайдера должен находиться на территории России. В соответствии ФЗ 152 о персональных данных с разъяснениями Минкомсвязи, данные могут передаваться за рубеж, но первично их запись, а также систематизация, накопление, хранение, уточнение (обновление, изменение) или извлечение должны производиться на сервере, физически расположенном в России.
Для защиты информации в облаке предусмотрены надежные инструменты, но управляет ими оператор персональных данных. Он также должен грамотно организовать доступ к сведениям внутри организации. Облачный провайдер не решает, кому и на каких условиях открывается доступ к информации компании.
Для примера сравним облако с флеш-накопителем: на нем хранится записанная информация, и владелец флешки следит за ее сохранностью. Облачный провайдер выполняет обязательства перед оператором ПДн в рамках заключенного соглашения – он не может просто так отдать информацию с флеш-накопителя, и должен ее защищать. Но провайдер ничего не сможет сделать, если вы сами разрешите любому желающему пользоваться информацией с флешки.
«При заключении договора на предоставление облачных услуг в нем прописываются условия об отсутствии доступа к размещаемым оператором данным, а также о разграничении зон ответственности.» Синкина Надежда, эксперт по методологии кибербезопасности Центра киберзащиты SberСloud
Оптимизация хранения
В связи с накоплением больших объемов данных оптимизация хранения становится важной задачей. Так, половина опрошенных компаний используют дедупликацию на all-flash СХД
Еще 34% — не применяют ее по разным причинам, например, у 13% из них нет all-flash решений.
«Ранее задачи по развитию СХД решались с помощью закупки оборудования. Теперь это сделать не так просто: стоимость оборудования, а значит, и стоимость хранения одного терабайта данных, существенно возросла. Поэтому те компании, которые до настоящего времени игнорировали технологии оптимизации хранения, воспользуются ими в ближайшее время», — считает Павел Тесленко, руководитель направления ИТ-консалтинга «Инфосистемы Джет».
Для оптимизации систем резервного копирования чаще всего используется интеграция с аппаратными снимками СХД и запуск виртуальных машин или баз данных с хранилища резервных копий без предварительного восстановления. Так ответили по 35% респондентов. Далее по популярности идут аплаинсы с дедупликацией (27%) и flash-системы для хранения резервных копий. При этом во многих компаниях применяется несколько решений для оптимизации.
Если смотреть по отраслевым различиям, то в реальном секторе чаще всего применяются средства интеграции (37%) и запуск виртуальных машин (30%). В торговле чаще применяются аплаинсы (36%). В финсекторе — виртуальные машины (47%) и средства интеграции (42%).
LTO — универсальный стандарт
Сегодня самым распространенным (и практически единственным) стандартом ленточных накопителей стал стандарт LTO (Linear Tape-Open). Он появился в 2000 году, и изначально разрабатывался компаниями IBM, Hewlett-Packard и Quantum. Позже к этому стандарту присоединились другие производители. Поэтому картриджи и приводы (накопители) LTO разных производителей полностью совместимы.
За прошедшее время сменилось несколько поколений LTO. Сейчас (2022 год) последним является девятое поколение – LTO-9.
Стандарт |
LTO-5 |
LTO-6 |
LTO-7 |
LTO-8 |
LTO-9 |
LTO-10 |
Год появления |
2010 |
2012 |
2015 |
2017 |
2021 |
план 2022 |
Физическая ёмкость |
1.5TB |
2.5TB |
6TB |
12.8TB |
18TB |
36TB |
Максимальная скорость (МБ/с) |
140 |
160 |
300 |
900-920 |
1000 |
2750 |
Картриджи девятого поколения имеют 18TB физической ёмкости. Информация может записываться на картриджи со сжатием (упаковкой). Считается, что в коэффициент сжатия общем случае составляет 2,5:1, поэтому иногда для картриджей указывается их ёмкость с учетом сжатия, например – 45ТБ для картриджей LTO-9.
Стандарт LTO регламентирует для приводов поддержку чтения на 2 поколения назад и записи на 1 поколение назад. Поэтому привод LTO-9, например, умеет читать картриджи LTO-9, LTO-8 и LTO-7, а писать на картриджи стандартов LTO-9 и LTO-8.
Сложности применения big data
Несмотря на плюсы и большие перспективы big data, в работе с ними есть сложности:
Большие данные требуют инфраструктуру для хранения. Часто под хранение данных выделяют отдельный центр обработки данных (ЦОД).
Чтобы создать аналитическую модель (например, некоторые виды нейронных сетей), нужно очень много времени для обучения. Так, чтобы обучить современную сеть создавать изображения на основе текстового описания, используют массив данных размером 270 терабайт
Обучение такой сети может занять около недели.
Знание технологий обработки больших данных очень важно, но так же важно понимать предметную область. Иногда понять, «что нужно?», сложнее, чем «как это сделать?».
Вебинары
20−21 декабря 18:00 мск
Изучаем лучшие профессии для фриланса в 2023
21–22 декабря 16:00 мск
Как стать аналитиком и сделать карьеру в крупной IT-компании
Основные выводы
Проведенное исследование показало, что крупные российские предприятия накопили достаточно большое количество данных, 21% — больше 2 Пбайт. При этом 30% респондентов используют объектные/S3 хранилища, еще 14% — планируют начать использовать их в течение ближайших двух лет.
В 50% опрошенных компаний используют дедупликацию на all-flash СХД, лишь у 13% респондентов до сих пор нет систем хранения такого типа.
Снепшоты применяют 69% респондентов, однако лишь 39% видят в них не только средство ускорения процессов архивирования, но и средство борьбы с вирусами-шифровальщиками.
К облакам в российских компаниях по-прежнему относятся настороженно. Лишь 36% опрошенных готовы использовать интеграцию своих СХД с облачными сервисами. Всего 10% опрошенных пользуются сервисом «ЦОД как услуга», предпочитая использовать лишь собственное оборудование.
В новых условиях 70% компаний предпочитают не менять оборудование, а оптимизировать работу существующих СХД. 41% надеются на параллельный импорт, 9% — на возвращение вендоров.
При этом выросла популярность облаков — перенести в них часть инфраструктуры готовы 41% респондентов.
Обслуживание техники 59% компаний собираются проводить своими силами. А 9% надеются, что производители не расторгнут уже действующие контракты на поддержку.
Лишь 30% респондентов готовы перейти на импортонезависимое оборудование.
Формально основная стратегия на текущий момент — ждать изменения ситуации, однако в процессе ожидания ИТ-директора рассматривают все возможные варианты развития событий.
Итоги
По мере того как растет наше понимание кибербезопасности и возможностей облачных технологий, растет популярность услуг облачного хранения данных. Естественно, если в 2015 году только 25% мировых данных хранилось в облаке, то в 2025 году эта цифра достигнет 50%. Если вы один из многих людей, желающих перейти на облачные технологии, мы рекомендуем:
- iDrive или pCloud для общего хранения данных
- Dropbox для персонального облачного хранилища
- Microsoft OneDrive для хранения данных для бизнеса
- Box для неограниченного хранения данных
- NordLocker для обеспечения безопасности
- Flickr для фотографий