الانفجار المعلوماتي.. كيف تدير الكميات الهائلة من البيانات؟

مكتبة الكونغرس الأميركي و«أمازون» تشكلان أفضل الأمثلة

TT

إن كنت تعتقد أن نظم تخزين المعلومات في مراكز البيانات الخاصة بك هي خارج نطاق السيطرة، فتصور أنك تمتلك 449 مليار مادة أو بند في قاعدة معلوماتك، أو أن تضيف 40 تيرابايت (تيرابايت تساوي 1012 بايت أي ألف غيغابايت) من البيانات الجديدة عليها كل أسبوع. وتشمل التحديات التي تواجه إدارة الكميات الهائلة من البيانات على مهمات تخزين ملفات كبيرة، وفتح أرشيفات طويلة الأمد، وطبعا إمكانية الوصول إلى هذه البيانات.

وعلى الرغم من أن إدارة البيانات كانت دائما المهمة الرئيسية لشركات تقنيات المعلومات، فإن الفورة الجنونية الحالية قد أخذت نشاط السوق إلى مستويات جديدة تماما، وفقا إلى ريتشارد وينتر المحلل في «وينتركورب كونسلتنغ سيرفيزيز» المؤسسة التي تدرس اتجاهات الأحجام الكبيرة من البيانات.

وتظهر المنتجات الجديدة بشكل منتظم من الشركات الراسخة القدم والناشئة على حد سواء، التي تعمل في مختلف المجالات. لذلك «فنحن نملك منتجات تقوم بتحريك البيانات ونقلها، ونسخها، وتحليلها بشكل فوري وسريع»، كما يقول وينتر، لذا فإن العمل جار على قدم وساق لمواجهة ومعالجة الأحجام الكبيرة من المعلومات التي تفرزها الشبكات الاجتماعية. ونظم الاستشعار، والدوائر الطبية وأجهزتها، وغيرها من مصادر المعلومات الجديدة التي تتوسع باستمرار.

وتطلب الأمر بالنسبة إلى «أمازون دوت كوم»، و«نيالسين»، و«مازدا»، ومكتبة الكونغرس، اعتماد أساليب جديدة ومبتكرة لمعالجة مليارات المعلومات والوسائط المخزنة، وتبويبها وتصنيفها، بغية استرجاعها والتنقيب عنها بسرعة، مع استئصال النواقص والأخطاء.

وتقوم مكتبة الكونغرس الأميركي بمعالجة 2.5 بيتابايت (بيتابايت تساوي 1015 بايت، أي ألف تيرابايت) من المعلومات والبيانات سنويا، التي تصل إلى كميات أسبوعية هائلة تصل إلى 400 تيرابايت. ويقدر توماس يوكيل رئيس مجموعة هندسة نظم المشاريع في المكتبة المذكورة أن عبء حمل هذه البيانات سيتضاعف أربع مرات في الأعوام القليلة المقبلة مع استمرارها في قيامها بعملها المزدوج، ألا وهو تقديم المعلومات للمؤرخين، وبالتالي حفظها في جميع أشكالها. (تفاصيل تقنية المعلومات)