حجم توليد اطلاعات در سطح جهان روندي کاملا" تصاعدي و شگفت انگيز را طي مي نمايد . استفاده از اطلاعات در صورتيکه به توليد و ارائه دانش و دانائي منتهي گردد ، مي تواند دستاوردهاي مثبتي را براي يک جامعه بدنبال داشته باشد ، درغيراينصورت فقط سرمايه ها ي ملي که مهمترين آن عنصر زمان است را ازدست خواهيم داد .يکي از ويژگي هاي مهم عصر اطلاعات ، ميزان توليد ، ذخيره سازي و نشر اطلاعات در جهان است. اکثر کارشناسان و متخصصين فنآوري اطلاعات بر اين باور مي باشند که در عصر حاضر ما با اقيانوسي از اطلاعات مواجه بوده و مي بايست در عوض پرتاب نمودن خود به درون اين اقيانوس با نحوه شنا کردن درون آن آشنا شويم . با توجه به ميزان رشد سي درصدي اطلاعات ذخيره شده در هر سال ، ما شاهد تغييرات اساسي در اکولوژي انساني مي باشيم. همه چيز عمومي بوده و همه چيز در حال ثبت و ضبط است . سازمان ها و موسسات ، نيازمند مديريت هوشمندانه اطلاعات مي باشند . استفاده از راه حل هاي مبتني بر فنآوري اطلاعات صرفا" در اين راه کارساز نبوده و ما همچنان نيازمند بررسي و آناليز دقيق و موشکافانه اطلاعات مي باشيم .بشريت امروز در حال غرق شدن در اطلاعات مي باشد و ما نيازمند استفاده از روش هاي مطلوبتر بمظور سازماندهي و مديريت اطلاعات مي باشيم . فنآوري اطلاعات ، هرگز جايگزين تفکر هوشمندانه و قدرت تحليل گري انسان نخواهد شد. اطلاعات توليد شده همواره صحيح و درست نبوده ( در واژه اطلاعات هيچگونه جايگاهي در رابطه با صحت و درستي اطلاعات و حتي کيفيت پيش بيني نشده است ) و مي بايست پالايش و بهينه سازي اطلاعات توسط کارشناسان متخصص هر شاخه از علوم در جهت توليد دانش به دقت صورت پذيريد .
شايد اين سوال مطرح گردد که چه ميزان اطلاعات در هر سال توليد مي گردد؟ در سال 2002 ، بر اساس بررسي انجام شده ميزان توليد اطلاعات جديد به مرز پنج اگزابايت ( Exabytes ) رسيده است . اطلاعات توليد شده بر روي چهار رسانه ذخيره سازي کاغذ ، فيلم ، مغناطيس و نوري ، ذخيره و از طريق چهار کانال الکترونيکي تلفن ، راديو ، تلويزيون و اينترنت قابل دسترس و استفاده مي باشند . بر اساس تحقيقاتي که توسط دانشگاه برکلي کاليفرنيا در طي هر سال صورت مي پذيرد ، حجم اطلاعات توليد شده در جهان ، منابع ذخيره سازي اطلاعات و کانال هاي متفاوت نشر اطلاعات مورد تجزيه و تحليل دقيق قرار مي گيرد. در اين مقاله قصد داريم به بررسي نکات مهم آخرين نتايج منتشر شده پروژه تحقياتي فوق ، پرداخته و با آخرين دستاوردهاي بشريت در رابطه با توليد و نشر اطلاعات ( خصوصا" اينترنت ) بيشتر آشنا شويم .در بخش اول اين مقاله ، به روش استفاده شده در تحقيق انجام شده و خلاصه اي از نتايج منشتر شده ، اشاره مي گردد .
روش تحقيق
دانشگاه برکلي در سال 2000 مطالعه اي را در زمينه ميزان توليد اطلاعات در طي سال انجام و نتايج آن نيز منشتر و در اختيار علاقه مندان قرار گرفت . در اين گزارش، ميزان توليد اطلاعات در سال 1999 بين يک تا دو اگرابايت برآورد گرديد . دانشگاه فوق ، در تابستان 2003 ، تحقيقات مجددي را در اين راستا و با استفاده از داده هاي سال 2002 انجام تا اطلاعات لازم در خصوص ميزان توليد و مصرف اطلاعات بصورت دقيق تر ، مشخص گردد . برخي از داده هاي سال 1999 در مطالعه فوق تغيير نمودند ، علت اين امر شناسائي منابع طلاعاتي جديد بود. برآورد قبلي در رابطه با ميزان توليد اطلاعات در سال 1999 ، به دو تا سه اگزابايت ، تصحيح گرديد(عدم تخمين مناسب در رابطه با بايگاني سيستماتيک اطلاعات ) . در مطالعه جديد انجام شده ، دو موضوع ديگر و مرتبط با اينترنت به پروژه تحقيقاتي اضافه گرديد ، در اين راستا بمنظور تخمين اندازه پوسته وب و تعريف منابع ،عمليات و محتوي صفحات وب ، نمونه هائي مختلفي از وب مورد بررسي و ارزيابي قرار گرفت .همچنين در اين راستا به بررسي اين موضوع هم پرداخته گرديد که کاربران به چه صورت از اطلاعات اينترنت ، استفاده مي نمايند ( هدف ،عمدتا" بررسي جايگاه هارد ديسک هاي موجود در کامپيوترهاي Desktop بمنظور ذخيره سازي اطلاعات است ) .
با توجه به اينکه اطلاعات با فرمت هاي متفاوت توليد و يا از رسانه هاي مختلفي بمنظور توزيع آنان استفاده مي گردد ، استاندارد منحصر بفردي در رابطه با اندازه گيري ميزان اطلاعات توليد شده در طي هر سال وجود ندارد ( عدم وجود يک واحد اندازه گيري استاندارد با توجه به ماهيت متفاوت اطلاعات و روش هاي مختلف توزيع اطلاعات ). در اين راستا و بمنظور دستيابي به يک استاندارد قابل قبول ، محقيقن دانشگاه برکلي تمامي فرمت هاي متفاوت اطلاعات و رسانه هاي ذخيره سازي را به يک استاندارد واحد تبديل نمودند : ترا بايت ( Terabyte ) .ترابايت ، يک واحد استاندارد اندازه گيري بمنظور سنجش ميزان اطلاعات جديد مي باشد . استادارد فوق ، با توجه به اينکه اکثر اطلاعات جديد به شکل ديجيتال بوده و ساير فرمت هاي ذخيره سازي اطلاعات نيز بسرعت بسمت ديجيتالي شدن در حرکت بوده ( مثلا" تصاوير ديجيتال جايگزين تصاوير سنتي )، و يا بصورت ديجيتال آرشيو مي شوند ( مثلا" نشر روزنامه ها بر روي وب ) مفيد و کارساز خواهد بود . استاندارد فوق ، صرفا" به ارزيابي و سنجش حجم اطلاعات توليد شده اشاره داشته و در رابطه با کيفيت اطلاعات با يک فرمت خاص و يا کاربرد آن در جهت اهداف متفاوت ، معياري را ارائه نمي دهد .
جدول زير واحدهاي متفاوت سنجش و اندازه گيري اطلاعات ديجيتال را نشان مي دهد . در اين راستا و بمنظور تجسم ابعاد هر يک از واحدهاي فوق ، نمونه مثال هائي نيز ذکر شده است تا برداشت و تصوري واقعي از واحد اندازه گيري در ذهن خوانند ايجاد گردد .( مثال هاي ارائه شده با تقريب مي باشند ) .
يک اگزابايت چقدر است ؟
- معادل ده به توان سه بايت ( 1,000 = 103)
- دو کيلو بايت معادل يک صفحه تايپ شده
- يکصد کيلو بايت معادل يک تصوير با دقت پائين Kilobyte (KB)
- معادل ده به توان شش بايت (1,000,000 = 6 10 )
- يک مگابايت : يک فلاپي ديسک 3/5 اينچ
- دو مگابايت : يک تصوير با کيفيت بالا
- پنج مگابايت : تمامي نوشته هاي شکسپير
- ده مگابايت : يک دقيقه صوت با کيفيت بالا
- يکصد مگابايت : کتاب هاي موجود در قفسه اي يک متري
- پانصد مگابايت : يک CD-ROM Megabyte (MB)
- معادل ده به توان نه بايت ( 1,000,000,000 = 9 10 )
- يک گيگابايت : يک کاميون مملو از کتاب
- بيست گيگابايت : يک مجموعه هنري با کيفيت از آثار بتهون
- يکصد گيابايت : کف يک کتابخانه مملو از مجلات دانشگاهي Gigabyte (GB)
- معادل ده به توان دوازده بايت ( 1,000,000,000,000 = 12 10 )
- يک ترابايت : تبديل 50،000 درخت به کاغذ و چاپ آنان
- دو ترابايت : يک کنابخانه تحقياتي در دانشگاه
- چهارصد ترابايت : يک بانک اطلاعاتي بسيار حجيم Terabyte (TB)
- معادل ده به توان پانزده بايت ( 1,000,000,000,000,000 = 15 10 )
- يک پتابايت : معادل داده توليد شده سه سال در EOS
- دو پتابايت : تمامي کتابخانه هاي تحقيقاتي دانشگاه هاي امريکا
- دويست پتابايت : تمامي اطلاعات چاپ شده Petabyte (PB)
- معادل ده به توان هيجده بايت ( 1,000,000,000,000,000,000 = 18 10 )
- دو اگزابايت : تمامي اطلاعات توليد شده در سال 1999
- پنج اگزابايت : تمامي کلمات صحبت شده از زمان خلقت بشر Exabyte (EB)
خلاصه گزارش
• حجم اطلاعات ذخيره شده در سال 2002 ، بالغ بر پنج اگزابايت بوده است که معادل نيم ميليون کتابخانه ديجيتالي جديد است.
• اطلاعات ذخيره شده در طي هر سال سي درصد رشد مي نمايد ( هر سه سال حجم اطلاعات ذخيره شده دو برابر مي گردد) .
• بر اساس تحقيات انجام شده توسط پروفسور Peter Lyman و Hal Varian از دانشکده مديريت اطلاعات وسيستم ها در دانشگاه برکلي ، ميزان توليد اطلاعات در سال 1999، بين دو تا سه اگرابايت تخمين زده شده است . اغلب اطلاعات فوق ، ( 92 % ) بر روي رسانه هاي ذخيره سازي مغناطيسي ( عمدتا" هارد ديسک ) ذخيره شده اند .
• در مطالعه انجام شده ، در رابطه بانحوه پردازش اين حجم از اطلاعات توسط انسان ، تحقيقي انجام نشده است .بررسي نحوه مصرف اين اطلاعات و نحوه برخورد انسان با اين حجم از اطلاعات در دستور کار تحقيق سال آينده قرار داده شده است .
• حجم اطلاعات ذخيره شده، تمامي اطلاعات توليد شده در جهان را شامل نمي شود . کانال هاي الکترونيکي ( تلويزيون ، راديو، تلفن و اينترنت ) سه و نيم برابر اطلاعات بيش از اطلاعات ذخيره شده در سال 2002 را توليد نموده اند . اکثر اين اطلاعات از طريق تلفن مبادله شده که ذخيره نمي گردند . درصورتيکه قصد ذخيره سازي اطلاعات فوق وجود داشته باشد ، به فضاي ذخيره سازي معادل 3 / 17 اگزابايت ، نياز خواهد بود.
• اطلاعات موجود در صفحات عمومي وب ، بالغ بر 172 ترابايت تخمين زده شده است .
• عدم کاهش استفاده از کاغذ عليرغم رشد ذخيره سازي اطلاعات بصورت ديجيتال يکي از نکات جالب در تحقيق انجام شده است . حجم اطلاعاتي ذخيره شده ( منتشر شده ) بر روي کاغذ در فاصله بين سال هاي 1999 تا 2000 ، رشدي معادل 36 % را داشته است .استفاده از کاغذ بمنظور چاپ اسناد ادارات و نامه هاي الکترونيکي، علت اصلي اين موضوع مي باشد ( نه اينکه از آنان بمنظور نشر کتب و يا روزنامه ها استفاده شده باشد ) .حجم داده ذخيره شده بصورت مغناطييسي در فاصله سال هاي 1999 تا سال 2000 ، رشدي معادل 80 % را داشته است .
• رسانه هاي ذخيره سازي چاپي ، فيلم ، مغناطيسي و نوري بيش از پنج اگزابايت از اطلاعات را طي سال 2002 ، در خود ذخيره نموده اند . نود و دو در صد از اطلاعات جديد بر روي رسانه هاي ذخيره سازي مغناطيسي ، عمدتا" هارد ديسک ها ، ذخيره شده است .( محتوي نوزده ميليون کتاب موجود در کنابخانه کنگره امريکا صرفا" به ده ترابايت فضا نياز خواهد داشت . پنج اگزابايت ، فضائي معادل ذخيره سازي نيم ميليون کتابخانه در حد واندازه کتابخانه کنگره امريکا مي باشد ).
• هارد ديسک ها ، اکثر اطلاعات جديد را در خود ذخيره مي نمايند. بيش از 92 % از اطلاعات جديد بر روي رسانه هاي مغناطيسي ذخيره مي گردند ( عموما" هارد ديسک ها ) .فيلم 7 % ، کاغذ حدود يکصدم درصد و رسانه هاي نوري حدود دو هزارم درصد از اطلاعات را در خود ذخيره مي نمايند .
• چهل درصد از اطلاعات جديد در امريکا توليد مي گردد: 33 % از اطلاعات چاپي جديد، 30 % از عناوين فيلم جديد ، 40 % از اطلاعات ذخيره شده بر روي رسانه هاي نوري و تقريبا" 50 % از اطلاعات ذخيره شده بر روي رسانه مغناطيسي
• ميزان اطلاعات موجود به ازاء هريک از ساکنين زمين نيز روندي تصاعدي را طي مي نمايد . بر اساس گزارش Population Reference Bureau ، جمعيت جهان 3 / 6 ميليارد نفر مي باشد . بنابراين با توجه به حجم اطلاعات توليد شده طي يکسال ، سهم هر يک از ساکنين زمين 800 مگابايت مي باشد . بمنظور ذخيره نمود ن 800 مگا بايت اطلاعات بر روي کاغذ به حدود نه متر کاغذ نياز خواهد بود.
• جريان اطلاعات از طريق کانال هاي الکترونيکي متفاوت ( تلفن ، تلويزيون ، راديو ، اينترنت ) طي سال 2002 حدود هيجده اگزابايت در سطح جهان بوده است . 98 % اطلاعات فوق از طريق خطوط تلفن ارسال و يا دريافت شده است ( شامل صوت و داده بر روي خطوط ثابت و بدون کابل ) .
• در صورت ذخيره ديجيتال تمامي ارتباطات تلفني در سطح جهان (خطوط ثابت و موبايل ) ، به فضائي معادل 3 / 17 اگزابايت نياز خواهد بود .( 98 % از تمامي اطلاعات ارسال شده در فرآيند نشر الکترونيکي اطلاعات که اغلب آنان شخص به شخص بوده است ).
• اکثر محتويات ارائه شده توسط راديو و تلويزيون، شامل اطلاعات جديد نمي باشد . تقريبا" 70 ميليون ساعت ( 3500 ترابايت ) از 320 ميليون ساعت از برنامه هاي راديو ، برنامه هاي اوليه و غيرتکراري مي باشند .از مجموع 123 ميليون ساعت پخش برنامه هاي تلويزيوني نيز حدودا" 31 ميليون ساعت ( 70،000 ترابايت ) برنامه غيرتکراري بوده و شامل اطلاعات جديد بوده است .
• پيام هاي فوري ( IM ) ، در طي روز پنج ميليارد پيام و معادل 750 گيگابايت اطلاعات را توليد مي نمايد . حجم اطلاعات فوق در طي يکسال به 274 ترابايت خواهد رسيد .
• نامه هاي الکترونيکي در طي هر سال حدود 400،000 ترابايـت اطلاعات جديد توليد مي نمايند.
• مبادله فايل P2P ، بر روي اينترنت بسرعت در حال رشد است . هفت درصد از کاربران اينترنت فايل ها ي خود را براي اشتراک عرضه نموده اند . حدود 93 % از کاربران برنامه هاي P2P ، صرفا" فايل ها را download مي نمايند. حجيم ترين فايل هاي مبادله شده ، فايل هاي ويديوئي با بيش از 100 مگا بايت ظرفيت بوده و اکثر فايل هاي مبادله شده ، فايل هاي موزيک ( فايل هاي mp3 ) مي باشند .
• متوسط زمان استفاده از اينترنت طي هر ماه ، 11 ساعت و 24 دقيقه برآورد شده است ( در سطح جهان ) . شهروندان امريکا بطور متوسط در يک ماه 17 / 16 ساعت تلقن ، 90 ساعت به راديو و 131 ساعت از تلويزيون استفاده مي نمايند. حدود 53 % از جمعيت امريکا از اينترنت استفاده مي نمايند ، متوسط زمان استفاده هر فرد طي يک ماه و از طريق منزل 25 ساعت و 25 دقيقه و در محل کار 74 ساعت و 26 دقيقه مي باشد( 13 % از زمان خود را طي هر ماه صرف استفاده از اينترنت مي نمايند).
• تعداد وبلاگ هاي ( Web logs ) موجود و فعال تا سال 2003 ، بين 4 / 2 تا 9 / 2 ميليون تخمين زده شده است . در صورتيکه هر وبلاگ ظرفيتي معادل 50 کيلوبايت را به خود اختصاص داده باشد ، مجموع فضاي ذخيره سازي تمامي وبلاگ هاي موجود به مرز 81 گيگابايت مي رسد.
در بخش دوم اين مقاله به بررسي ميزان اطلاعات ذخيره شده بر روي هر رسانه ( کاغذ ، فيلم ، مغناطيس ، نوري) و جايگاه هر يک از کانال هاي الکترونيکي ( تلفن ، راديو ، تلويزيون ، اينترنت ) در ارتباط با توزيع اطلاعات ، خواهيم پرداخت .