چکيده

افزايش فزاينده موتورهای كاوش وب، كتابخانه های ديجيتالي و سيستمهاي بازيابي اطلاعات و توسعه ابزارهاي جديد كاوش وب، نيازمند توسعه مقياسهاي ارزيابي جديدتر و بيشتر ارزيابي اطلاعات است. تحقيقات و تلاشهاي بسياري در جهت حل مساله ارزيابي سيستمهاي بازيابي اطلاعات صورت گرفته است و گفته مي شود كه بسياري از افرادي كه در زمينه ذخيره و بازيابي اطلاعات فعاليت دارند احساس مي كنند كه اين مساله تا حل شدن فاصله زيادي دارد.
مقدمه
 از سال 1940 مساله ذخیره و بازیابی اطلاعات مورد توجه بسیار قرار گرفت. این مساله از زمانی آغاز شد كه بشر سعی كرد محيط پيرامون خود را كنترل كند يا حداقل از فشارهاي خارجي كه باعث نابودي او مي شدند جلوگيري كند. بشر براي ايجاد محيطي مطلوب براي ادامه بقا به اتخاذ تصميمات سريع، صحيح، دقيق نياز داشت. كيفيت این تصميمات به توانايي تصميم گيرنده در حل مسايل وابسته بود ولي قبل از آن به ميزان ارتباط كيفيت اطلاعاتی وابسته بود كه تصميم گيرنده براي حل مشكل فراهم آورده بود. بتدريج در طول تاريخ جمع آوري، سازماندهي و نگهداري امري متداول و مرسوم شد.
در چند دهه اخير بازیابی رايانه اي مورد توجه خاصي قرار گرفته كه علت آن را مي توان 4 عامل دانست: افزايش اهميت زمان، تغيير در كميت و كيفيت اطلاعات، تغيير در ماهيت نيازهاي اطلاعاتی، تغيير در اهميت منابع اطلاعاتی. این عوامل تغيير و توسعه در سيستم هاي بازیابی اطلاعات را به دنبال داشته و موجب مطرح شدن بحث هايي از جمله لزوم تغيير در ابزارهاي اطلاعاتی، ايجاد سيستم هاي ارتباطي جديد و استفاده از آنها و تغيير معاني اشاعه اطلاعات شده اند.
امروزه رشد اهميت حياتي اطلاعات، لزوم صرفه جويي در وقت و هزينه جستجوكنندگان، جوان بودن شبكه هاي گسترده بخصوص از لحاظ سرعت، لزوم دستيابي سريع، جامع و مانع به اطلاعات خاص مورد نياز از جمله مسايل مهمي هستند كه اهميت يك فرايند بازیابی حساب شده، كنترل شده و كامل را آشكار مي سازند.

بيان مفاهيم

بازیابی اطلاعاتطبق  ISO 2382/1(1984) اينگونه تعريف شده است:

اعمال، شيوه­ها و رويه­هايي براي بازیابی اطلاعات ذخیره شده در جهت تهيه اطلاعات حول موضوعي معين. در عمل این تعريف ارائه شده از ايزو، شامل نمايه­سازي متن، تحليل پرسش، و تحليل ربط است؛ این استاندارد، متن، جداول، نمودارها، گفتار، تصوير و ... را به عنوان داده مشخص مي­كند. همچنين ابررسانه را به منظور تمايز بين متون ساخت­يافته به صورت غير خطي و متون (اسناد) خطي تعيين مي­كند. این استاندارد، اطلاعات را دانش مربوطي مي­داند كه براي پيشرفت حل مشكل و دانشيابي و ... است. همچنين موضوع را پيوند دهنده يك مفهوم در مقابل يك رشته كاراكتري(واژه) مي­داند.

مفاهيم بازیابی داده­ها، بازیابی سند، بازیابی اطلاعات، و بازیابی متن اغلب با هم اشتباه گرفته مي­شوند. هر كدام از این مفاهيم پيكره از متون، نظريه­ها، كنش­ها و فناوري­هاي مربوط به خود را دارد. نظام­هاي بازیابی اطلاعات خودكار براي كاهش سرريز اطلاعاتی به كار مي­روند. بسياري از دانشگاه­ها و كتابخانه­هاي عمومي نظام­هاي بازیابی اطلاعاتی را براي دسترسي به كتب، مجلات، و ديگر اسناد به كار مي­برند.

نظام­هاي بازیابی اطلاعات اغلب با سؤال  و موضوع  مرتبط ­اند. پرسش­ها عبارات رسمي از نيازهاي اطلاعاتی هستند كه به وسيله كاربر در يك نظام بازیابی اطلاعات خودكار قرار مي­گيرند. موضوعات ماهيّت­هايي هستند كه اطلاعات را در يك پايگاه­ اطلاعاتی نگه داشته و يا ذخیره مي­كنند. سؤالات كاربران با موضوعات ذخیره شده در پايگاه­هاي اطلاعاتی منطبق مي­شوند. يك سند بنابراين يك شيء داده­اي است. اغلب خود اسناد مستقيماً در نظام­هاي بازيابي نگه داشته يا ذخيره نمي­شوند، امّا در عوض در نظام به وسيله بدل اسناد نمايش داده مي­شوند.

از نگاه دايره­المعارف بريتانيکا، بازيابي اطلاعات، استحصال اطلاعات، بخصوص در يك پايگاه اطلاعاتي ذخيره شده در رايانه است. در اين فرآيند، دو رويكرد اصلي عبارتند از انطباق واژگان در پرسش با نمايه موجود در پايگاه اطلاعاتي(جستجوي كليدواژه­اي) و عبور كردن از پايگاه اطلاعاتي با بكارگيري پيوندهاي فرارسانه­اي يا فرامتني.

 مقیاسهای جامعیت و مانعیت

 نخستين آزمونهاي نظامهاي بازيابي اطلاعات به طور جداگانه در آمريكا و انگلستان در سال 1953 انجام شد، ولي مطالعات ارزيابي در مقياس وسيع در اواخر دهه 1950 در كالج فضانوردي كرنفيلد در انگلستان آغاز شد. در پروژه كرنفيلد تاثيرات گوناگون نمايه سازي با زبان كنترل شده و زبان طبيعي بر بازيابي اطلاعات مورد آزمايش قرار گرفت. براي انجام اين كار آنها نه تنها استانداردي براي يك طرح تجربي براي ارزيابي عملكرد بازيابي اطلاعات ايجاد كردند، بلكه بحثي را براي روش شناسي ارزيابي بنا نهاده اند كه تا امروزادامه دارد

در اين پروژه براي نظام بازيابي اطلاعات دو مقياس به كار گرفته شده است: جامعيت و مانعيت. دليل استفاده از اين معيارها اين است كه كاربران به طور متوسط تمايل به بازيابي مقادير زيادي از موضوعهاي مربوط به هم دارند (كه جامعيت بالايي را ايجاد مي كند) اين در حالي است كه مايلند به طور همزمان بخش اعظمي از موضوعهاي غير مرتبط (كه مانعيت بالایی را ایجاد میکند حذف شود.

مفهوم ميزان بازيابي اطلاعات يا جامعيتRecall))

ميزان جامعيت عبارتست از نسبت تعداد اسناد بازيابي شده مربوط به تعداد كل اسناد مربوط موجود در مجموعه. به عبارتي ديگر، جامعيت نسبت اسناد مربوطي كه واقعاً بازيابي شده­اند، يا به عبارتي ديگر: جامعيت= نرخ موفقيت

مفهوم ميزان دقت بازيابي اطلاعات يا مانعيت(Precision)

ميزان مانعيت عبارتست از نسبت تعداد اسناد بازيابي شدة مربوط به تعداد اسناد بازيابي شده. مانعيت توانايي يافتن اسناد مربوط است. به عبارتي ديگر، مانعيت نسبت اسناد بازيابي شده­اي است كه واقعاً مربوط هستند. يا به عبارتي ديگر: مانعيت= نرخ پذيرش        

این دو اصطلاح به مقیاسهایی اطلاق میشود که عموما به ارزیابی عملکرد کاوش نظام های بازیابی ا طلاعات به کار می رود.

   جامعيت، توانايي بازيابي يک سيستم براي کسب تمام يا بيشتر مدارک مرتبط در مجموعه است. بنابراين(اندازه گيري آن) به دانستن نه فقط مدارک مرتبط و بازيابي شده بلکه مدارک بازيابي نشده نيز، نياز دارد. روش صحيحي براي اندازه گيري دقيق جامعيت موتورهاي کاوش وجود ندارد زيرا امکان دانستن تعداد کل مدارک مرتبط در پايگاه هاي اطلاعاتي عظيم وجود ندارد. مقدار جامعيت نسبي به اين صورت تعريف مي شود:

جامعيت نسبي یا بازیافت=   تعداد کل مدارک بازیابی شده مربوط
                       کل مدارک مربوط در فایل

 مانعيت کسر خروجي يک جستجو است که براي يک عبارت جستجوي خاص، مرتبط است. به همين دليل، محاسبه آن نياز به دانستن نتايج مرتبط و نامرتبط در يک سري مدارک ارزيابي شده دارد. (کلارک و ويلت، 1997). مانعيت به اين صورت تعريف می

شود:
                        مانعيت یا دقت=    تعداد مدارک بازیابی شده مربوط
                                        مجموع کل مدارک بازیابی شده از فایل

 رابطه بين جامعيت و مانعيت
 نمايش رابطه بين جامعيت و مانعيت با استفاده از يك ماتريس دو در دو امكان پذير است. يك پيشينه ممكن است بازيابي شده و مرتبط، يا بازيابي شده و غير مرتبط، بازيابي نشده و مرتبط يا بازيابي نشده و غير مرتبط باشد.
يك كاوش كامل تنها پيشينه هايي را خواهد داشت كه بازيابي شده و مرتبط و يا بازيابي نشده و غير مرتبط باشند. پيشينه هاي بازيابي شده و غير مرتبط مانعيت و پيشينه هاي بازيابي نشده و مرتبط جامعيت را كاهش مي دهند.

كاربرد جامعيت و مانعيت
در آزمايشهاي كرنفيلد بين جامعيت و مانعيت نسبت معكوس يافت شد. تلاش براي افزايش يكي به كاهش ديگري منجر مي شود و جامعيت بيشتر فقط به ازاي كاهش مانعيت امكان پذير است. اگر هدف يك استراتژي بازيابي هرچه بيشتر مدارك مربوط به موضوع باشد، احتمال بازيابي پيشينه هاي نامربوط بيشتر نيز وجود دارد بعبارتي افزايش مانعيت منجر به كاهش جامعيت مي شود. در اين ارتباط معكوس منطقي حاكم است كه نه در همه بلكه در بسياري از آزمونهاي ارزيابي نشان داده شده است. كلوردن از توسعه و همه گير شدن استفاده از اين نسبت معكوس به عنوان نوعي قانون عمومي كه در تمام موارد و شرايط قابل اجراست ناخشنود مي باشد. با اين حال اغلب چنين ارتباط معكوسي بين جامعيت و مانعيت در نتايج حاصله توسط جستجوگران مشاهده مي شود.
اقدام جهت يافتن هرچه بيشتر پيشينه هاي مرتبط منجر به احتمال كاهش مانعيت خواهد شد و چنان كه راهبرد كاوش افزايش مانعيت باشد در اين صورت تعداد مدارك يافت شده عموما كاهش مي يابد.
آزمايش اين مطالب در هر نوع كاوش در ديسك فشرده پايگاه اطلاعاتي پيوسته، اوپك و شبكه جهاني وب ميسر است. فنوني از قبيل كاهش تعداد مفاهيم مختلف در يك كاوش، افزايش واژه هاي مترادف جهت بازنمايي مفاهيم كاوش و كوتاه كردن عبارات موجب افزايش جامعيت و كاهش مانعيت مي شود. اضافه كردن مفاهيم منحصر به فرد، كاهش تعداد واژه هاي مترادف، استفاده از عملگرهاي مجاورت و منحصر كردن كاوش به ميدانهاي خاص در پيشينه ها به طور معمول منجر به افزايش مانعيت و كاهش جامعيت مي شود.
جامعيت و مانعيت از زمان كرنفيلد در آزمونهاي بسياري به عنوان مقياس به كار گرفته شده اند. به عنوان نمونه در ارزيابي لنكستر از پايگاه اطلاعاتي مدلارز در اواخر دهه 60 معلوم شد كه بطور متوسط جامعيت كمتر از 60 درصد و مانعيت در حدود 50 درصد مي باشد.
لنكستر و وارنر خاطر نشان مي كنند كه مانعيت در درجات پايين ممكن است در يك پايگاه اطلاعاتي كوچكتر قابل تحمل تر از يك پايگاه اطلاعاتي بزرگتر باشد. يك كاربر ممكن است مايل باشد براي يافتن 20 پيشينه مفيد 60 پيشينه بازيابي شده را ارزيابي كند، ولي مسلما براي يافتن 200 پيشينه از ميان 600 پيشينه تمايل كمتري خواهد داشت هرچند كه در هر دو مورد نسبت مانعيت همان 23 درصد است.
كلارك و ويلت سه موتور كاوش وب را با استفاده از مقياسهاي جامعيت و مانعيت مقايسه كرده اند. آنها به هيچگونه تفاوت اساسي و مهم در جامعيت مابين موتورهاي كاوش اكسايت، لايكوز و آلتاويستا دست نيافتند، ولي در آلتاويستا مانعيت مشخصا بر لايكوز برتري داشت. هر سه موتور امتياز بيشتري در جامعيت در مقايسه با مانعيت كسب كرده اند. اين امر به ويژه در لايكوز قابل توجه بود.

سنجش جامعیت و مانعیت

سنجش مانعیت برای یک کاوش به سهولت انجام می گیرد اما اندازه گیری جامعیت به سادگی مقدور نیست.

تعیین نسبت جامعیت کار ساده ای نیست .برای این منظور باید مشخص کرد که چه تعداد از مدارک بازیابی نشده در کاوش با درخواست کاوشگر مرتبط است فقط یک راه برای تعیین دقیق جامعیت در یک کاوش وجود دارد و آن بررسی یکایک مدارک بازیابی نشده است و این امر به جز در مورد وضعیت های آزمایشی بسیار کوچک مقدور نیست .از آنجا که تعیین جامعیت مطلق عملا میسر نیست معمولا به برآورد جامعیت بسنده می شود یکی از روشهای مطلوب برای این منظور مبنا قرار دادن زیر مجموعه ای از مدارک نظام است که مرتبط تشخیص داده شده است.

ربط
 ربط يك مفهوم فردي است. كاربران مختلف ممكن است در مورد مربوط يا نامربوط بودن يك مدرك خاص به سوالات مطرح شده اختلاف نظر داشته باشند. با اين وجود اين اختلاف نظر به حدي نيست كه نتايج آزمايشهايي را كه بر روي مجموعه مدارك براي تشخيص ربط با سوالات انجام شده اند را باطل كند. اين سوالات معمولا از كاربران واجد شرايط استخراج مي شوند كه اينها كاربراني هستند در موقعيت خاص كه نياز اطلاعاتي دارند.
ربط يك مفهوم اساسي در اطلاع رساني است و به عنوان معيار اصلي ارزيابي اثربخشي بازيابي اطلاعات و عامل تاثير گذار بر طرح عملي و ارزيابي نظامهاي بازيابي اطلاعات عمل مي كند. ربط مفهومي پيچيده دارد و در اواخر دهه 1950 به وضوح مشخص شد كه انواع مختلف ربط وجود دارد. مفهومي از ربط وجود دارد كه مي توان گفت عيني و قابل توجه است. اين مفهوم از ربط توسط كوپر مشخص شد و بطرزي شايسته ربط منطقي نام گرفت. استفاده از اين مفهوم در سيستمهاي بازيابي امروزه محدود است و بيشتر در سوالاتي كه به پاسخ بله يا خير محدود مي شوند كارايي دارد.ربط معني دار بودن جملات است، گرچه كه ربط منطقي در ابتدا بين جملات مشخص مي شد ولي به راحتي مي توان آن را در مورد مدارك ذخيره شده گسترش داد. يك مدرك به يك نياز اطلاعاتي مربوط است اگر و تنها اگر محتويات آن در نهايت يك پاسخ مرتبط با آن نياز باشد.ربط ممكن است در معني وسيع آن ”درمورد“ و يا ”مناسب بودن“ معنا شود اما در نهايت مفهوم ربط قوي اما دست نخورده باقي مانده است. مشكل اصلي طبق نظر منتقدان، ذهني بودن آن است. آنها معتقدند كه ربط بازتابي از نظر مشاهده كننده است زيرا تنها جستجوگر مي تواند تعيين كند كه آيا مدرك بازيابي شده مرتبط با نياز اطلاعاتي او هست يا خير. از نظر تجربي، قضاوتهاي ربط اساسا به مقايسه بين محتواي موضوعي مدرك بازيابي شده و نياز اوليه اي كه جستجو را به دنبال دارد بستگي دارد. نكته قابل بحث اينكه تصميم گيري در مورد ربط موضوعي، يا بعبارت ديگر موضوعيت، از طريق متخصصان موضوعي امكان پذير است.
قضاوت در خلال جستجو درباره ميزان ربط، نتايج مياني و در نهايت استفاده از اين قضاوتها براي تجديد نظر در راهبرد جستجو اصطلاحا بازخورد ربط ناميده مي شود برخي از نظامهاي بازيابي اطلاعات به سادگي به جستجوگر براي آغاز بازخورد اتكا نمي كنند. بعنوان مثال خود نظام ممكن است به صورت خودكار در جستجوي يافتن پيشينه هاي بيشتري باشد كه عبارات نمايه مشترك با مداركي داشته باشد كه توسط كاربر مربوط تشخيص داده شده است. 

 مؤلفه­های مؤثر بر جامعیت و مانعیت در نظامهای بازیابی وب مدار: سه مؤلفه کلی در برگیرنده جمیع عواملی است که  بر میزان جامعیت و مانعیت در وب تأثیر می­گذارد. این سه مؤلفه عبارتند از:

 مؤلفه اوّل: نحوه بيان درخواست

بيان درخواست دقيق يا درخواست نامعلوم و فازي بر جامعيت و مانعيت تأثير مي­گذارد.كليدواژه­ها را بايستي با شكل صحيح و در قالبي مناسب وارد كرد و در انتظار پاسخ از سوي نظام بود. امّا آيا هميشه كاربر مي­تواند آنچه را در تفكر خود دارد در قالب كليدواژه­هاي مناسب به نظام عرضه كند؟ آنچه مسلم است اين است که کاربران تجارب، دانش، و مهارت­هاي متفاوتي با يکديگر دارند. يک نظام بازيابي آرماني بايد قادر باشد کمال مطلوب کاربراني با شرايط مختلف را مهيا کند.

براي اينكه كاربر بتواند نياز خود را با زباني قابل فهم براي نظام تبيين كند بايد مهارت­ها و دانش خاصي را نيز به كار بگيرد. برگمن نياز به سه دانش ذهني و فني و معنايي را براي رسيدن به مقصود براي کاربر ضروري مي­داند.

·    دانش ذهني: دانش مورد نياز براي تبديل يک نياز اطلاعاتي به يک درخواست قابل جستجو است، براي مثال" در مورد مجموعه گستري منابع اطلاعاتي الکترونيک چه اصطلاحاتي براي پيدا کردن اقلام اطلاعاتي بايد به کار گرفت؟"؛

·    دانش معنايي: چگونه و کي قابليت­هاي موجود در نظام را بايد بکار برد؟ براي نمونه کي و چگونه دستور Browse  يا Find  را بايد به کار برد؟؛ و

·    دانش فني: مهارتهاي اساسي بکارگيري رايانه و ترکيب درخواست­هاي وارد شده به­عنوان عبارت­هاي جستجوي خاص، براي نمونه بايد Smith John F. تايپ شود يا John F. Smith.

هر يک از سه دانش فوق تأثير شاياني بر ميزان جامعيت نتايج بازيابي شده مي­گذارد چرا که بکارگيري اين سه نوع دانش، افزايش ميزان اسناد بازيابي شده را سبب مي­شود.

نكته قابل توجه اينكه نياز كاربر هميشه همان چيزي نيست كه در قالب سؤال آن را مطرح مي­كند. همه كاربران قادر نيستند تا فضاهاي خالي ذهن خود را از يك مسأله به خوبي توصيف كنند. جهل كاربر نسبت به يك مسأله عمدتاً مرزي مشخص ندارد و به همين دليل است كه رفتار كاربران در حين جستجو تا حدي غير قابل پيش­بيني می­شود و ما از برخي از ابزارها براي مطالعه رفتار آنها استفاده مي­كنيم.

در مصاحبه مرجع به كاربر فرصت داده مي­شود تا سؤال خود را دقيقاً بيان كند و طي اين فرآيند نياز او با فنون پرسش كاوي و مصاحبه توسط كتابدار مرجع روشن، بدون ابهام و قابل درك مي­شود. در محيط وب، كاربر اين فرصت را ندارد تا نياز خود را به اين گونه بيان كند و رابطه فكري حاكم بر روابط كاربر و كتابدار در مصاحبه مرجع، ميان كاربر و نظام وجود ندارد، چرا كه نظام توان تفكر ندارد تا ببيند كاربر واقعاً به چه چيز نياز دارد. مسأله ديگر اينكه در مصاحبه مرجع، كتابدار نقش اساسي را در راهبري استراتژي جستجو دارد، امّا در وب اين امكان نيز در اختيار كاربر قرار ندارد و او خود بايد استراتژي مناسب را بر اساس دانش و تجربه خود تدوين نمايد. نقش کتابدار در انتخاب توصيفگر يا كليدواژه­ تفاوت ديگري از اين دو روند است. در مصاحبه مرجع توصيفگرها و كليدواژه­ها با همياري كاربر و كتابدار صورت مي­گيرد، امّا در وب اين كار بر عهده كاربر است و كاربر بايد خود به توصيف آنچه مي­خواهد در قالب كليدواژه يا توصيفگر بپردازد.


 مؤلفه دوّم: فناوري­هاي موجود در نظام

نظام وقتي با نيازهاي كاربر روبرو مي­شود مسلّح به چه فناوري­هايي است؟ اين فناوري­ها چقدر و چگونه به كاربر در پاسخدهي نياز اطلاعاتي او مؤثرند؟ اين سؤالات، سؤالاتي هستند که با پاسخ به آنها، نظام مي­تواند در جامعيت و مانعيت بخشيدن به پاسخ کاربر به او کمک کند.

فناوریها چگونه در میزان جامعیت و مانعیت دخالت می­کنند؟

در موتورهاي کاوش، شايستگي روبات­ها براي كشف و نمايه­سازي اسناد به طور خودكار، بهبود جامعيت را ممكن مي­سازد. روبات­ها توانايي­هاي متفاوتي در نمايه سازي اسناد موجود در وب دارند. طبق اخيرترين اطلاعات تا ژانويه 2005،  بيش از 5/11 ميليارد صفحه در وب وجود داشته است. اما ميزان صفحات نمايه­سازي شده توسط موتورهاي کاوش از اين مقدار کمتر است و اين مقدار در حدود 4/9 ميليارد صفحه يا حدود 82 درصد از صفحات موجود در وب است. گوگل با بيشترين تعداد صفحات نمايه سازي شده در بالاترين مکان قرار گرفته است. اين مسأله حاکي از اين است که ميزان جامعيت در اين موتور کاوش از همه موتورهاي کاوش بيشتر و روبات نمايه ساز آن شايستگي بيشتري از روبات­هاي موتورهاي کاوش ديگر دارد.

مؤلفه سوّم: استنباط نظام و کاربر از مفهوم ربط

استنباط نظام از مفهوم ربط چيست؟ اين مفهوم چقدر به مفهوم موجود در ذهن كاربر نزديك است؟

سياست­هاي رتبه­بندي كدامند؟ نظام چگونه سعي مي­كند مفهوم ربط را كه بر خودش اعمال مي­شود به مفهوم ربط در ذهن كاربر نزديك كند؟

اين سؤالات، سؤالات اساسي مطرح در اين مؤلفه هستند. ابزار و رویکردهای به کارگرفته شده براي پاسخگويي به اين سؤالات، تأثير مستقيم بر ميزان جامعيت و مانعيت نتايج بازيابي شده مي­گذارد.

ربط عامل حاکم بر تأثير هر فرآيند ارتباطي است. از آنجا که هدف بازيابي اطلاعاتي برقراري ارتباط است، از اين رو ربط هم کليد جدايي ناپذير بازيابي مؤثر است. ربط را مي­توان ملاک توفيق بازيابي دانست. ربط مقياس مؤثر بودن ميان منبع اطلاعات و دريافت کننده است. ربط کيفيتي انتزاعي است، کيفيتي يگانه ميان فرد و مدرکي معين که پشتيبان اين پذيره است که آن را تنها کاربر اطلاعات مي­تواند داوري کند. ربط کيفيتي فردي دارد که به وضعيت شناختي کاربر، مشکلي بايد گشوده شود، دانش قبلي از همان موضوع، فوريت کاربرد دانش جستجو شده و ارزشي که به اطلاعات نهاده ميشود بستگي دارد. (پائو، 1378)

جامعيت و مانعيت، مفاهيمي مجرد و معيارهاي عينيِ يك نظام بازيابي اطلاعات نيستند، بلکه اين مفاهيم، مفاهيمي است که خود بر پايه مفهوم گسترده­اي چون مفهوم ربط شکل گرفته است و نيز :

1-تعريف ربط بين اسناد و سؤالات يك مفهوم ذهني است و نه يک مفهوم عيني، و

2-حتي اگر ربط يك سند به اتفاق آرا مورد قبول واقع شود، اگر كاربر خاصي سند را دريابد، آن سند ممكن است مورد علاقه او نباشد.


ارتباط ريزش كاذب با جامعيت و مانعيت
 معمولاً ريزش كاذب درصد كمي از مدارك بازيابي شده را شامل مي شود؛ چرا كه برخي از خطاهاي بازيابي گريز ناپذيرند، بويژه هنگامي كه به منظور دستيابي به جامعيت بالا، كاوش را گسترده كنيم. يعني هر چه كاوش را گسترده تر كنيم و بخواهيم جامعيت را بالا ببريم، در مانعيت دچار مشكل ميشويم و ركوردهاي ناخواستة بازيابي شده زياد مي شود كه همان ريزش كاذب است. در نتيجه، هر چه ميزان جامعيت بيش تر باشد، ميزان ريزش كاذب نيز زياد مي شود و هر چه ميزان مانعيت زياد باشد، ميزان ريزش كاذب كاهش مي يابد.
بنابراين, فرمول زير براي ريزش كاذب، جامعيت و مانعيت ارائه مي شود
:ريزش كاذب – تعداد كل مدارك بازيابي شده= مانعيت
ريزش كاذب در بانك هاي اطلاعاتي
ريزش كاذب در بانك هاي اطلاعاتي ممكن است به علل زير اتفاق بيفتد:
1- اشتباه و خطا در بيان پرسش, كه مهم ترين مرحله است؛ زيرا اگر در اين مرحله اشتباه صورت پذيرد, در بقيه مراحل نيز دچار خطا خواهيم شد.
2- اشتباه در تحليل پرسش؛
3- اشتباه در انتخاب فايل و پايگاه اطلاعاتي مناسب؛
4- اشتباه در تدوين راهبرد كاوش؛
5- اشتباه در ساختار زباني و ساختار كلمه ؛
6- استفاده از زبان كنترل شده؛
7- استفاده از كليد واژه كنترل نشده؛
8- كاوش كلمه اي در كليه فيلدها، فيلد آزاد، يا متن آزاد ؛
9- نبودن اصطلاحنامه در پايگاه اطلاعاتي يا ضعيف بودن آن؛
10- بازيابي ناخواستة هم نويسه ها, بويژه در سرنام ها؛ مانند: Aids و AIDS كه اولي به معني وسايل و ابزار كمكي است و دومي حروف آغازين كلمات Acquired Deficiency Syndrome Immune يا SDI كه هم مختصر Selective Dissemination of Information است و هم مختصر Strategic Defense Initiative.
براي جلوگيري از ريزش كاذب در بانك هاي اطلاعاتي، استفاده از شيوه هاي زير توصيه مي شود:
1- آشنايي كامل با بانك اطلاعاتي مورد نظر، شيوه هاي كاوش، پوشش موضوعي و امثال آن؛
2- استفاده از عملگر AND براي اخص كردن مدارك بازيابي شده و افزايش مانعيت؛
3- استفاده از عملگر NOT براي حذف ركوردهاي ناخواسته؛
4- استفاده از زبان كنترل شده و اصطلاحنامه؛
5- كاوش كلمة مورد نظر در متن آزاد و بدون استفاده از زبان كنترل شده (در موارد استثنايي).
معمولاً استفاده از زبان كنترل شده باعث رفع بسياري از ريزش هاي كاذب مي شود. با وجود اين، اطلاعات جديد و بسيار جزئي و اخص، كه معمولاً اصطلاحنامه و كنترل واژگان وجود ندارد، اغلب اوقات فقط از طريق كاوش كلمه در متن قابل بازيابي و دستيابي هستند و اگر در چنين مواردي از زبان كنترل شده استفاده كنيم، ريزش كاذب خواهيم داشت.
 
نقد مقياسهاي جامعيت و مانعيت
 علي رغم كاربرد گسترده جامعيت و مانعيت به عنوان مقياس اثربخشي بازيابي، به دليل پاره اي كمبودهاي جدي و مهم اين مقياسها مكررا مورد انتقاد واقع مي شوند. حتي اگر اين مقياس ها از اعتبار برخوردار باشند، حداقل از نقطه نظر جستجوگران اين مقياس ها ارزيابي ناقص از بازيابي اطلاعات ارائه مي كنند. جستجوگران ممكن است جامعيت و مانعيت را به حداكثر برسانند ولي اين تنها روش قابل اجرا در ارزيابي يك كاوش موفق نيست. عواملي از قبيل مخارج و هزينه هاي لازم جهت تكميل كاوش، مدت زمان صرف شده و سهولت اجراي آن از طريق رابط نظام، ممكن است مهم و موثر باشند. به غير از نياز به محيط تجربي خاص اينها واقعيتهايي هستند كه جويندگان اطلاعات با آن درگير مي باشند.يك نظام بازيابي با نسبت هاي جامعيت و مانعيت موثر و قابل توجه، اگر هزينه هاي زياد در بر داشته باشند، طرفداران كمي خواهند داشت. صرف زمان طولاني و لزوم استفاده از ميانجي هاي غير مفيد نيز از عوامل موثر در انتخاب روش تلقي مي شود. لنكستر و وارنر گزارش مي كنند كه مطالعات بطور مداوم نشان داده اند كه سهولت استفاده و دسترس پذيري از نخستين عوامل موثر در انتخاب منابع اطلاعاتي ميباشند.
 

نتیجه گیری

 علي رغم تمام ناكامي ها و موانعي كه در بازيابي اطلاعات وجود دارد، اهميت اقتصادي، سياسي و اجتماعي يافتن اطلاعات مرتبط در زمان، مكان و براي فرد مورد نظر، ضامن تلاشهاي آينده براي توسعه نظامهاي بازيابي است. با افزايش حجم اطلاعات اهميت نظامهاي بازيابي كارآمد هنوز هم بيشتر مي شود. توجه كنوني به مسايل بازيابي روي وب آخرين جلوه اين پديده است. به منظور توسعه نظامهاي بهتر، ايجاد فنون ارزيابي موثر ضروري است.

نحوه بيان درخواست، فناوري­هاي موجود در نظام، استنباط نظام و کاربر از مفهوم ربط، عمده­ترين مؤلفه­هاي مؤثر بر ميزان جامعيت و مانعيت اطلاعات در نظام­هاي بازيابي وب مدار است. مفاهیم جامعیت و مانعیت دو مفهوم زیر بنایی در بازیابی اطلاعات است که توانایی نظام در بازیابی مدارک مرتبط وکنار گذاشتن مدارک نامرتبط را به دنبال دارد.دو مقیاس جامعیت و مانعیت در روند کاوش نتیجه معکوس دارند .سنجش مانعیت برای یک کاوش به سهولت انجام می گیرد اما اندازه گیری جامعیت به سادگی مقدور نیست.نحوه بیان درخواست، استنباط نظام و کاربر از مفهوم ربط،نیاز استفاده کننده ،کل نگری،جزء نگری و تاثیر واژگان بر جامعیت و مانعیت تاثیرگذار اس

 

 

 

 

 

 

 

 

 

 

+ نوشته شده در  دوشنبه 1388/10/07ساعت 9:3  توسط سهرابی   |