|
|
|
|
|
چکيده افزايش فزاينده موتورهای كاوش وب، كتابخانه های ديجيتالي و سيستمهاي بازيابي اطلاعات و توسعه ابزارهاي جديد كاوش وب، نيازمند توسعه مقياسهاي ارزيابي جديدتر و بيشتر ارزيابي اطلاعات است. تحقيقات و تلاشهاي بسياري در جهت حل مساله ارزيابي سيستمهاي بازيابي اطلاعات صورت گرفته است و گفته مي شود كه بسياري از افرادي كه در زمينه ذخيره و بازيابي اطلاعات فعاليت دارند احساس مي كنند كه اين مساله تا حل شدن فاصله زيادي دارد. بيان مفاهيم بازیابی اطلاعاتطبق ISO 2382/1(1984) اينگونه تعريف شده است: اعمال، شيوهها و رويههايي براي بازیابی اطلاعات ذخیره شده در جهت تهيه اطلاعات حول موضوعي معين. در عمل این تعريف ارائه شده از ايزو، شامل نمايهسازي متن، تحليل پرسش، و تحليل ربط است؛ این استاندارد، متن، جداول، نمودارها، گفتار، تصوير و ... را به عنوان داده مشخص ميكند. همچنين ابررسانه را به منظور تمايز بين متون ساختيافته به صورت غير خطي و متون (اسناد) خطي تعيين ميكند. این استاندارد، اطلاعات را دانش مربوطي ميداند كه براي پيشرفت حل مشكل و دانشيابي و ... است. همچنين موضوع را پيوند دهنده يك مفهوم در مقابل يك رشته كاراكتري(واژه) ميداند. مفاهيم بازیابی دادهها، بازیابی سند، بازیابی اطلاعات، و بازیابی متن اغلب با هم اشتباه گرفته ميشوند. هر كدام از این مفاهيم پيكره از متون، نظريهها، كنشها و فناوريهاي مربوط به خود را دارد. نظامهاي بازیابی اطلاعات خودكار براي كاهش سرريز اطلاعاتی به كار ميروند. بسياري از دانشگاهها و كتابخانههاي عمومي نظامهاي بازیابی اطلاعاتی را براي دسترسي به كتب، مجلات، و ديگر اسناد به كار ميبرند. نظامهاي بازیابی اطلاعات اغلب با سؤال و موضوع مرتبط اند. پرسشها عبارات رسمي از نيازهاي اطلاعاتی هستند كه به وسيله كاربر در يك نظام بازیابی اطلاعات خودكار قرار ميگيرند. موضوعات ماهيّتهايي هستند كه اطلاعات را در يك پايگاه اطلاعاتی نگه داشته و يا ذخیره ميكنند. سؤالات كاربران با موضوعات ذخیره شده در پايگاههاي اطلاعاتی منطبق ميشوند. يك سند بنابراين يك شيء دادهاي است. اغلب خود اسناد مستقيماً در نظامهاي بازيابي نگه داشته يا ذخيره نميشوند، امّا در عوض در نظام به وسيله بدل اسناد نمايش داده ميشوند. از نگاه دايرهالمعارف بريتانيکا، بازيابي اطلاعات، استحصال اطلاعات، بخصوص در يك پايگاه اطلاعاتي ذخيره شده در رايانه است. در اين فرآيند، دو رويكرد اصلي عبارتند از انطباق واژگان در پرسش با نمايه موجود در پايگاه اطلاعاتي(جستجوي كليدواژهاي) و عبور كردن از پايگاه اطلاعاتي با بكارگيري پيوندهاي فرارسانهاي يا فرامتني. مقیاسهای جامعیت و مانعیت نخستين آزمونهاي نظامهاي بازيابي اطلاعات به طور جداگانه در آمريكا و انگلستان در سال 1953 انجام شد، ولي مطالعات ارزيابي در مقياس وسيع در اواخر دهه 1950 در كالج فضانوردي كرنفيلد در انگلستان آغاز شد. در پروژه كرنفيلد تاثيرات گوناگون نمايه سازي با زبان كنترل شده و زبان طبيعي بر بازيابي اطلاعات مورد آزمايش قرار گرفت. براي انجام اين كار آنها نه تنها استانداردي براي يك طرح تجربي براي ارزيابي عملكرد بازيابي اطلاعات ايجاد كردند، بلكه بحثي را براي روش شناسي ارزيابي بنا نهاده اند كه تا امروزادامه دارد در اين پروژه براي نظام بازيابي اطلاعات دو مقياس به كار گرفته شده است: جامعيت و مانعيت. دليل استفاده از اين معيارها اين است كه كاربران به طور متوسط تمايل به بازيابي مقادير زيادي از موضوعهاي مربوط به هم دارند (كه جامعيت بالايي را ايجاد مي كند) اين در حالي است كه مايلند به طور همزمان بخش اعظمي از موضوعهاي غير مرتبط (كه مانعيت بالایی را ایجاد میکند حذف شود. مفهوم ميزان بازيابي اطلاعات يا جامعيتRecall)) ميزان جامعيت عبارتست از نسبت تعداد اسناد بازيابي شده مربوط به تعداد كل اسناد مربوط موجود در مجموعه. به عبارتي ديگر، جامعيت نسبت اسناد مربوطي كه واقعاً بازيابي شدهاند، يا به عبارتي ديگر: جامعيت= نرخ موفقيت مفهوم ميزان دقت بازيابي اطلاعات يا مانعيت(Precision) ميزان مانعيت عبارتست از نسبت تعداد اسناد بازيابي شدة مربوط به تعداد اسناد بازيابي شده. مانعيت توانايي يافتن اسناد مربوط است. به عبارتي ديگر، مانعيت نسبت اسناد بازيابي شدهاي است كه واقعاً مربوط هستند. يا به عبارتي ديگر: مانعيت= نرخ پذيرش این دو اصطلاح به مقیاسهایی اطلاق میشود که عموما به ارزیابی عملکرد کاوش نظام های بازیابی ا طلاعات به کار می رود. جامعيت، توانايي بازيابي يک سيستم براي کسب تمام يا بيشتر مدارک مرتبط در مجموعه است. بنابراين(اندازه گيري آن) به دانستن نه فقط مدارک مرتبط و بازيابي شده بلکه مدارک بازيابي نشده نيز، نياز دارد. روش صحيحي براي اندازه گيري دقيق جامعيت موتورهاي کاوش وجود ندارد زيرا امکان دانستن تعداد کل مدارک مرتبط در پايگاه هاي اطلاعاتي عظيم وجود ندارد. مقدار جامعيت نسبي به اين صورت تعريف مي شود: جامعيت نسبي یا بازیافت= تعداد کل مدارک بازیابی شده مربوط مانعيت کسر خروجي يک جستجو است که براي يک عبارت جستجوي خاص، مرتبط است. به همين دليل، محاسبه آن نياز به دانستن نتايج مرتبط و نامرتبط در يک سري مدارک ارزيابي شده دارد. (کلارک و ويلت، 1997). مانعيت به اين صورت تعريف می شود: رابطه بين جامعيت و مانعيت كاربرد جامعيت و مانعيت سنجش جامعیت و مانعیت سنجش مانعیت برای یک کاوش به سهولت انجام می گیرد اما اندازه گیری جامعیت به سادگی مقدور نیست. تعیین نسبت جامعیت کار ساده ای نیست .برای این منظور باید مشخص کرد که چه تعداد از مدارک بازیابی نشده در کاوش با درخواست کاوشگر مرتبط است فقط یک راه برای تعیین دقیق جامعیت در یک کاوش وجود دارد و آن بررسی یکایک مدارک بازیابی نشده است و این امر به جز در مورد وضعیت های آزمایشی بسیار کوچک مقدور نیست .از آنجا که تعیین جامعیت مطلق عملا میسر نیست معمولا به برآورد جامعیت بسنده می شود یکی از روشهای مطلوب برای این منظور مبنا قرار دادن زیر مجموعه ای از مدارک نظام است که مرتبط تشخیص داده شده است. ربط مؤلفههای مؤثر بر جامعیت و مانعیت در نظامهای بازیابی وب مدار: سه مؤلفه کلی در برگیرنده جمیع عواملی است که بر میزان جامعیت و مانعیت در وب تأثیر میگذارد. این سه مؤلفه عبارتند از: مؤلفه اوّل: نحوه بيان درخواست بيان درخواست دقيق يا درخواست نامعلوم و فازي بر جامعيت و مانعيت تأثير ميگذارد.كليدواژهها را بايستي با شكل صحيح و در قالبي مناسب وارد كرد و در انتظار پاسخ از سوي نظام بود. امّا آيا هميشه كاربر ميتواند آنچه را در تفكر خود دارد در قالب كليدواژههاي مناسب به نظام عرضه كند؟ آنچه مسلم است اين است که کاربران تجارب، دانش، و مهارتهاي متفاوتي با يکديگر دارند. يک نظام بازيابي آرماني بايد قادر باشد کمال مطلوب کاربراني با شرايط مختلف را مهيا کند. براي اينكه كاربر بتواند نياز خود را با زباني قابل فهم براي نظام تبيين كند بايد مهارتها و دانش خاصي را نيز به كار بگيرد. برگمن نياز به سه دانش ذهني و فني و معنايي را براي رسيدن به مقصود براي کاربر ضروري ميداند. · دانش ذهني: دانش مورد نياز براي تبديل يک نياز اطلاعاتي به يک درخواست قابل جستجو است، براي مثال" در مورد مجموعه گستري منابع اطلاعاتي الکترونيک چه اصطلاحاتي براي پيدا کردن اقلام اطلاعاتي بايد به کار گرفت؟"؛ · دانش معنايي: چگونه و کي قابليتهاي موجود در نظام را بايد بکار برد؟ براي نمونه کي و چگونه دستور Browse يا Find را بايد به کار برد؟؛ و · دانش فني: مهارتهاي اساسي بکارگيري رايانه و ترکيب درخواستهاي وارد شده بهعنوان عبارتهاي جستجوي خاص، براي نمونه بايد Smith John F. تايپ شود يا John F. Smith. هر يک از سه دانش فوق تأثير شاياني بر ميزان جامعيت نتايج بازيابي شده ميگذارد چرا که بکارگيري اين سه نوع دانش، افزايش ميزان اسناد بازيابي شده را سبب ميشود. نكته قابل توجه اينكه نياز كاربر هميشه همان چيزي نيست كه در قالب سؤال آن را مطرح ميكند. همه كاربران قادر نيستند تا فضاهاي خالي ذهن خود را از يك مسأله به خوبي توصيف كنند. جهل كاربر نسبت به يك مسأله عمدتاً مرزي مشخص ندارد و به همين دليل است كه رفتار كاربران در حين جستجو تا حدي غير قابل پيشبيني میشود و ما از برخي از ابزارها براي مطالعه رفتار آنها استفاده ميكنيم. در مصاحبه مرجع به كاربر فرصت داده ميشود تا سؤال خود را دقيقاً بيان كند و طي اين فرآيند نياز او با فنون پرسش كاوي و مصاحبه توسط كتابدار مرجع روشن، بدون ابهام و قابل درك ميشود. در محيط وب، كاربر اين فرصت را ندارد تا نياز خود را به اين گونه بيان كند و رابطه فكري حاكم بر روابط كاربر و كتابدار در مصاحبه مرجع، ميان كاربر و نظام وجود ندارد، چرا كه نظام توان تفكر ندارد تا ببيند كاربر واقعاً به چه چيز نياز دارد. مسأله ديگر اينكه در مصاحبه مرجع، كتابدار نقش اساسي را در راهبري استراتژي جستجو دارد، امّا در وب اين امكان نيز در اختيار كاربر قرار ندارد و او خود بايد استراتژي مناسب را بر اساس دانش و تجربه خود تدوين نمايد. نقش کتابدار در انتخاب توصيفگر يا كليدواژه تفاوت ديگري از اين دو روند است. در مصاحبه مرجع توصيفگرها و كليدواژهها با همياري كاربر و كتابدار صورت ميگيرد، امّا در وب اين كار بر عهده كاربر است و كاربر بايد خود به توصيف آنچه ميخواهد در قالب كليدواژه يا توصيفگر بپردازد.
نظام وقتي با نيازهاي كاربر روبرو ميشود مسلّح به چه فناوريهايي است؟ اين فناوريها چقدر و چگونه به كاربر در پاسخدهي نياز اطلاعاتي او مؤثرند؟ اين سؤالات، سؤالاتي هستند که با پاسخ به آنها، نظام ميتواند در جامعيت و مانعيت بخشيدن به پاسخ کاربر به او کمک کند. فناوریها چگونه در میزان جامعیت و مانعیت دخالت میکنند؟ در موتورهاي کاوش، شايستگي روباتها براي كشف و نمايهسازي اسناد به طور خودكار، بهبود جامعيت را ممكن ميسازد. روباتها تواناييهاي متفاوتي در نمايه سازي اسناد موجود در وب دارند. طبق اخيرترين اطلاعات تا ژانويه 2005، بيش از 5/11 ميليارد صفحه در وب وجود داشته است. اما ميزان صفحات نمايهسازي شده توسط موتورهاي کاوش از اين مقدار کمتر است و اين مقدار در حدود 4/9 ميليارد صفحه يا حدود 82 درصد از صفحات موجود در وب است. گوگل با بيشترين تعداد صفحات نمايه سازي شده در بالاترين مکان قرار گرفته است. اين مسأله حاکي از اين است که ميزان جامعيت در اين موتور کاوش از همه موتورهاي کاوش بيشتر و روبات نمايه ساز آن شايستگي بيشتري از روباتهاي موتورهاي کاوش ديگر دارد. مؤلفه سوّم: استنباط نظام و کاربر از مفهوم ربط استنباط نظام از مفهوم ربط چيست؟ اين مفهوم چقدر به مفهوم موجود در ذهن كاربر نزديك است؟ سياستهاي رتبهبندي كدامند؟ نظام چگونه سعي ميكند مفهوم ربط را كه بر خودش اعمال ميشود به مفهوم ربط در ذهن كاربر نزديك كند؟ اين سؤالات، سؤالات اساسي مطرح در اين مؤلفه هستند. ابزار و رویکردهای به کارگرفته شده براي پاسخگويي به اين سؤالات، تأثير مستقيم بر ميزان جامعيت و مانعيت نتايج بازيابي شده ميگذارد. ربط عامل حاکم بر تأثير هر فرآيند ارتباطي است. از آنجا که هدف بازيابي اطلاعاتي برقراري ارتباط است، از اين رو ربط هم کليد جدايي ناپذير بازيابي مؤثر است. ربط را ميتوان ملاک توفيق بازيابي دانست. ربط مقياس مؤثر بودن ميان منبع اطلاعات و دريافت کننده است. ربط کيفيتي انتزاعي است، کيفيتي يگانه ميان فرد و مدرکي معين که پشتيبان اين پذيره است که آن را تنها کاربر اطلاعات ميتواند داوري کند. ربط کيفيتي فردي دارد که به وضعيت شناختي کاربر، مشکلي بايد گشوده شود، دانش قبلي از همان موضوع، فوريت کاربرد دانش جستجو شده و ارزشي که به اطلاعات نهاده ميشود بستگي دارد. (پائو، 1378) جامعيت و مانعيت، مفاهيمي مجرد و معيارهاي عينيِ يك نظام بازيابي اطلاعات نيستند، بلکه اين مفاهيم، مفاهيمي است که خود بر پايه مفهوم گستردهاي چون مفهوم ربط شکل گرفته است و نيز : 1-تعريف ربط بين اسناد و سؤالات يك مفهوم ذهني است و نه يک مفهوم عيني، و 2-حتي اگر ربط يك سند به اتفاق آرا مورد قبول واقع شود، اگر كاربر خاصي سند را دريابد، آن سند ممكن است مورد علاقه او نباشد.
نتیجه گیری علي رغم تمام ناكامي ها و موانعي كه در بازيابي اطلاعات وجود دارد، اهميت اقتصادي، سياسي و اجتماعي يافتن اطلاعات مرتبط در زمان، مكان و براي فرد مورد نظر، ضامن تلاشهاي آينده براي توسعه نظامهاي بازيابي است. با افزايش حجم اطلاعات اهميت نظامهاي بازيابي كارآمد هنوز هم بيشتر مي شود. توجه كنوني به مسايل بازيابي روي وب آخرين جلوه اين پديده است. به منظور توسعه نظامهاي بهتر، ايجاد فنون ارزيابي موثر ضروري است. نحوه بيان درخواست، فناوريهاي موجود در نظام، استنباط نظام و کاربر از مفهوم ربط، عمدهترين مؤلفههاي مؤثر بر ميزان جامعيت و مانعيت اطلاعات در نظامهاي بازيابي وب مدار است. مفاهیم جامعیت و مانعیت دو مفهوم زیر بنایی در بازیابی اطلاعات است که توانایی نظام در بازیابی مدارک مرتبط وکنار گذاشتن مدارک نامرتبط را به دنبال دارد.دو مقیاس جامعیت و مانعیت در روند کاوش نتیجه معکوس دارند .سنجش مانعیت برای یک کاوش به سهولت انجام می گیرد اما اندازه گیری جامعیت به سادگی مقدور نیست.نحوه بیان درخواست، استنباط نظام و کاربر از مفهوم ربط،نیاز استفاده کننده ،کل نگری،جزء نگری و تاثیر واژگان بر جامعیت و مانعیت تاثیرگذار اس
|
||