Предизвикателствата пред управлението на данните в ерата на интернет: Част 1
Радикалните промени в създаването и използването на данни водят до експлозивен ръст.
Иновативните технологии, глобалната свързаност и моделите на употреба на компютрите дадоха възможност на ново поколение потребители да създават и споделят дигитално съдържание по-бързо и по-лесно, отколкото изобщо беше мислимо само преди пет години. Корпоративната среда, въпреки че изостава след потребителските пазари, бавно, но сигурно навлиза в сферата на Web 2.0. Дали ще става дума за онлайн общност, сайтове за социална мрежа, или съвместна работа, комерсиалният компютърен свят ще трябва да се подготви за бързо променящите се реалности на бизнеса. Инструменти като SharePoint, блоговете, уикитата и програмите за създаване и дистрибуция на дигитално съдържание позволяват на организациите да се предефинират много бързо. Ново медийно съдържание се създава за всичко - от обучението до пазара - и се превръща в задължителен компонент за всекидневния бизнес. Дали ще е във формата на блог или видео, дигиталното съдържание се създава по-лесно от всякога и за ефективното управление на данните са нужни нови инструменти.
В днешната ера на интернет се промени самият характер на данните. ИТ инициативите вече не са ангажирани предимно с блоково базирани транзакционни данни и трябва да се справят с нов вид - почти изцяло файлово базирани данни. Самите файлове също се променят – стават по-големи с увеличаване богатството на тяхното съдържание. С улесняване процеса на създаване на файлове не е чудно, че данните, с които трябва да се справяме, растат в геометрична прогресия. За съжаление поради бързия им ръст и сложните инфраструктури на организациите водят до неефективно управление и пропуснати възможности.
Базисното управление на данни е объркващ проблем в ИТ отделите от много години. Новите бизнес процеси заедно с неотстъпващия ръст на ново, голямо файлово базирано дигитално съдържание, без съмнение ще наложат нов подход. Необходимо е да се преосмислят транзакционно базираните модели от миналото и компаниите да се съсредоточат върху изискванията на новата ера. Начините, по които се справяме със съхраняването на файлове, с бекъпа, архивирането, търсенето, предаването на съдържание и съвместната работа върху дадени файлове ще трябва неизбежно да се променят – както като инфраструктура, така и като мениджмънт. В допълнение на това самите инфраструктурни файлове като виртуални машини, уеб базирани услуги, файлови системи и бази данни също се умножават. ИТ мениджърите, отговарящи за защитата и поддържането на динамично променящата се среда от файлове, са изправени пред една почти неудържима ситуация.
Скорошните изследвания на Enterprise Strategy Group (ESG) показват, че тези често объркващи нови технологии работят и биват използвани в ИТ средата на множество корпорации, а където все още не се използват, скоро ще започнат. В действителност 27% от участниците в неотдавнашно глобално проучване казват, че сървърната виртуализация се ползва широко в техните организации, а други 33% посочват, че използват, макар и ограничено. Също така приложенията за Web 2.0 като SharePoint и другите общностно ориентирани инструменти за създаване на дигитално съдържание се използват широко в 22% от организациите и поне частично в други 25%. Ориентираната към услуги архитектура (Service-Oriented Architecture - SOA) е друг значим фактор, като SOA базираните приложения са в широка употреба при 14% от респондентите и в ограничена при други 29%. По-лесното създаване на съдържание и глобалната свързаност се съединяват, за да породят драматичен ръст на файлово базираните данни, изисквайки все по-голям капацитет за съхранение на данни и предизвиквайки дори още по-сериозни проблеми с управлението на тези данни.
Използвайки сървърната виртуализация като пример, анализът показва, че тя изисква значително по-голям капацитет за съхранение на данни – както първични, така и вторични. Над половината (54%) от запитаните, които са в състояние да оценят колко е голям обемът на съхраняваните данни в тяхната организация, казват, че организацията им отбелязва нетен ръст на обемите на съхраняваните данни след въвеждането на сървърната виртуализация. Само 7% съобщават за някаква форма на намаление на нетния обем на съхраняваните данни.
Организациите, в които няма промяна или има спад на обемите на съхраняваните данни, може да са спечелили от консолидация на съхраняваните масиви или други инициативи за рационализация на инфраструктурата. Възможно е също тези респонденти да са в ранните фази на въвеждането на сървърна виртуализация и още да не са достигнали момента, в който се вижда необходимостта от увеличаване на капацитета за съхраняване на данни.
Ситуацията със съхранението и управлението на файлове ще се влошава
Файлово базираното съдържание представлява сферата на най-големия ръст на данни в тази нова ера. Прогнозата на ESG за пазара на архивирането на файлове гласи, че в световен мащаб капацитетът ще нарасне от 7119 петабайта (РВ) през 2007 на 62 749 РВ през 2012 – 55% ръст на година. Проучванията показват също, че ръстът в обема на архивираната файлово базирана информация надминава всички останали категории – големите корпорации показват близо десетократно увеличение на съхраняваните файлови данни през последните две години, докато средните и малки бизнеси отчитат почти 13-кратно увеличение през същия период. Повечето клиенти очакват, че ръстът на файлово базираното съхранявано съдържание ще продължи без прекъсване. 37% смятат, че тези данни ще продължат да нарастват с между 11 и 20% на година, а други 37% очакват ръст над 20%. Първичните данни може да нараснат дори по-бързо, когато корпорациите започнат да използват Web 2.0 и технологиите на SOA в своята традиционна ИТ среда.
Колкото и предизвикателна да изглежда тази скорост на растеж, анализът на ESG показва, че компаниите всъщност подценяват действителния ръст на файловите данни, създавани с новите дигитални средства, в това число аудио и видеофайлове, изображения и изискванията пред обема на тяхното съхраняване.
За това кое е най-отговорно за ръста на файловите съдържания повечето участници в изследването посочват офис програмите (22%) и системите за администриране на документи (20%). Както може да се очаква, по-структурираните приложения като ERP и CRM пораждат по-малко съдържание, защото данните, поддържащи тези системи, се съхраняват в структурирани бази данни. ERP и CRM транзакциите действително допринасят донякъде за увеличаване обема на неструктурираната информация (файловите данни), но много по-малко от офис програмите и системите за управление на документи.
Успешното управление на файлове изисква нови процеси и инструменти
Администраторите на центровете за данни се мъчат да използват нови, последователни и ценово ефективни процеси, политики и инструменти за управление на файлови масиви. Способността на ИТ да управлява файлове винаги е била много по-малко ефективна от способността й да управлява електронната поща и базите данни. Поддръжката на съдебни спорове и откриването на релевантна информация за тях са два примера за настоящи приложения, които изискват съществуващата информация да бъде индексирана и претърсвана – което е сравнително лесно да се прави със структурирани и полуструктурирани данни, но се оказва обезсърчаващо с неструктурираните файлово базирани данни. Без наличието на последователни политики е почти невъзможно да се автоматизира управлението на файлове като цяло, да не говорим за конкретни всекидневни функции като миграцията на данни, репликацията или бекъпа. Съществуващите процеси са обикновено заобиколни, ръчни и податливи на грешки.
Друг важен проблем е, че периодът на задържане на файловите данни е по-голям от този на всички останали видове информация. 46% от организациите казват, че трябва да задържат архивираните си файлове повече от 10 години. За сравнение: само 29 и 23% от изследваните организации смятат, че трябва да запазят архивираните бази данни и информация от електронната поща съответно за еквивалентно дълъг период от време.
