ذخیره وبازیابی

ادامه : بنابراین پایگاه اطلاعاتی

نظامی برای ذخیره، پردازش، جستجو و بازیابی سریع و آسان مقادیر فراوان اطلاعات

نظامی که امکان ذخیره، حذف، اصلاح، روزآمدسازی و بازیابی را فراهم می آورد

نظامی متشکل از فایل های مختلف که بر روی لوح فشرده، نوار مغناطیسی، فلش مموری، فلاپی و یا به صورت آن لاین ذخیره شده است.

ساختار پایگاه اطلاعاتی : بیت: داده هایی که به صورت دو دویی اطلاع مشخصی را منتقل می کند.

بایت: هشت بیت معادل یک بایت است که ترکیبات متفاوت آن 256 حالت را نشان می دهد

کاراکتر یا نویسه( character) : هر یک از حروف، علائم، ارقام قابل ذخیره

موجودیت entity: مفهوم یک شی ، فرد  یا سازمان یا هر چیزی که بخواهیم درباره آن اطلاعاتی را ذخیره کنیم. موجودیت ها با صفات خاصه از هم جدا می شوند.

فیلد: در پایگاه اطلاعاتی هر یک از صفات خاصه یک موجودیت جایگاه مشخصی دارد که به آن فیلد یا منطقه می گویند.

ادامه : رکورد/ پیشینه: پیشینه مجموعه ای از فیلدهاست. فیلدهای مرتبط با یکدیگر در یک پیشینه قرار می گیرند.

در نظامهای بازیابی پیشینه معمولا کتابشناختی است و دارای دو بخش: توصیف کتابشناختی و توصیف موضوعی

فایل/ پرونده /بایگانی: مجموعه ای از رکوردهای مرتبط که در برخی ویژگیها مشترکند. مانند برگه دان یک کتابخانه

q     انواع فیلدها: از نظر ساختار

  • فیلدهای معمولی: دارای ماهیتی یگانه و تفکیک ناپذیر(سرشناسه)
  • فیلدهای تکرار پذیر: مانند فیلد موضوع یا شرح مسئولیت
  • فیلدهای زیرمجموعه داریا فرعی: دارای اطلاعات مرتبط و تفکیک پذیر که ممکن است تکرار پذیر هم باشد(وضعیت نشر)
  • فیلدهای جستجوپذیر

q      از نظر محتوی

  • فیلدهای حرفی                                   
  • فیلدهای عددی
  • حرفی- عددی
  • زمانی/ تقویمی
  • فیلدهای داده ای رابطه ای/ Related database field

¢        انواعفایل/ بایگانی: بایگانی ورود اطلاعات

¢        بایگانی اصلی/ مادر: در این بایگانی داده های هر پیشینه به ترتیب ورود و یا به ترتیب شماره پیشینه از کم به زیاد مرتب می شوند. هر بایگانی اصلی می تواند چندین فایل مقلوب داشته باشد.

¢        بایگانی مقلوب: ابزاری موثر برای جستجوی اطلاعات. ساخته شده از واژه ها و عبارات جستجو پذیر به ترتیب حروف الفبا

 اهمیت و ضرورت فایل مقلوب       دسترسی سریع به اطلاعات

ویژگیهای فایل مقلوب:

  1. هر واژه فقط یک بار در نظم الفبایی قرار می گیرد.
  2. در مقابل هر واژه یا عبارت شماره کلیه پیشینه های مربوطه قرار می گیرد.
  3. ایجاد این فایل به حافظه بالا نیاز دارد و زمان بر است. اما جستجو در زمان کمتری صورت می گیرد.
  • بایگانی های جانبی یا مرتبط:هدف از ایجاد:اطمینان از صحت محتوا*اطمینان از شکل داده ها و عبارات
  • فعالیتهایمهم در پایگاه اطلاعاتی: ورود داده ها *اصلاح داده ها*بازیابی داده ها*چاپ داده ها

بایگانیاصلی:

¢       بایگانی ترتیبی منظم

  • Ø     ترتیب الفبایی          بازیابی راحت تر
  • Ø     ورود و حذف اطلاعات مشکل است
  • Ø     بایگانی ترتیبی نامنظم
  • Ø     دسته بندی اطلاعات بر اساس ترتیب ورود اطلاعات
  • Ø     تعیین محل اطلاعات جدید راحت تر
  • Ø     زمان ثبت سریع تر
  • Ø     استفاده از نمایه مقلوب برای جستجوپذیر نمودن داده ها

 

  1. نکات قابل توجه در طراحی پایگاه اطلاعاتی: نیاز اطلاعاتی کاربران(  توجه به وحدت ذخیره سازی و تعدد دید کاربران)
  2. فراوانی کاربرد یا فراوانی جستجو(بایگانی منظم)
  3. زمان پاسخگویی(بایگانی منظم)
  4. حجم بایگانی(برای اطلاعات زیاد از بایگانی نامنظم استفاده می شود)
  5. نوع عملیات (مانند حذف و اضافه کردن اطلاعات         بایگانی نامنظم ارجح است)

تعریف جامع پایگاه اطلاعاتی: مجموعه ای از داده های ذخیره شده (درباره موجودیتهای یک محیط اطلاعاتی و ارتباط آنها) به صورت مجتمع و مبتنی بر یک ساختار تعریف شده با استفاده از یک زبان برنامه نویسی با حداقل افزونگی، تحت کنترل متمرکز و مورد استفاده یک یا چند کاربر به صورت اشتراکی و همزمان

   نکات مستخرج از تعریف:

ü     تاکید بر ویژگی یکپارچگی نظام Integrity

ü     تاکید بر مدیریت و کنترل متمرکز

ü     عدم محدودیت

ü     همزمانی        از نظر کاربر (استفاده همزمان  کاربران از پایگاه)

                       از نظر نظام (عملکرد همزمان فرایندهای درون نظام)

¢       کاربرانپایگاه اطلاعاتی: برنامه نویسان*مدیران*استفاده کنندگان نهایی

¢        انواعپایگاههای اطلاعاتی (از لحاظ محتوی: پایگاههای اطلاعاتی کتابشناختی (اپک کتابخانه)

¢        پایگاههای اطلاعاتی ارجاعی ( راهنمای ناشران)

¢        پایگاههای اطلاعاتی عددی (سالنامه آماری یونسکو)

¢        پایگاههای اطلاعاتی عددی – متنی Iran Business Forecast

¢        پایگاههای اطلاعاتی خواص مواد

¢        پایگاههای اطلاعاتی تمام متن (دایره المعارف کتابداری)

¢        پایگاههای اطلاعاتی تمام تصویر (نمایه)

¢        پایگاههای اطلاعاتی چند رسانه ای : فرامتن و فرا رسانه در کنار هم قرار دارند

انواعپایگاه اطلاعاتىاز لحاظ ساختار: پایگاه اطلاعاتی تک پرونده اطلاعات از یک پرونده را در هر زمان ذخیره ،سازماندهی و بازیابی میکنند. امکان حذف حوزه های زائد در پیشینه ها وجود ندارد  بنابر این افزونگی اطلاعات بسیار زیاد است. پایگاه اطلاعاتی سلسله مراتبی پیشینه ها به صورت سلسله مراتبی وجود دارند. تنها یک پیشینه ریشه درخت است و هر پیشینه فقط یک رابطه با پیشینه قبلی خود دارد ولی در ایجاد رابطه با پیشینه های بعدی محدودیتی ندارد. برخی پیشینه ها با توجه به نوع ارتباط تکرار میشوند و موجب حجم پایگاه میشوند.

پایگاه اطلاعاتی شبکه ای:  رابطه انواع پیشینه ها یک به چند است. تعداد رابطه ها زیاد است در نتیجه سرعت بازیابی نسبت به سلسله مراتبی کند است. البته با قرار دادن پیشینه های نزدیک به هم این مشکل حل میشود. برتری شبکه ای نسبت به سلسله مراتبی ، استفاده از یک پیشینه در رابطه های نا محدود است و نیاز به پیشینه های یکسان ندارد. در نتیجه افزونگی اطلاعات کاهش یافته و اندازه پایگاه کوچک تر می شود.

پایگاه اطلاعاتی رابطه ای:رابطه ها به صورت جدول بکار رفته است.  سازماندهی اطلاعات بر پایه جدول(رابطه ها)، سطرها(پیشینه ها)و ستونها(حوزه ها) است. هرسطر جدول ، پیشینه ای است که بوسیله کلید مشخصی(شماره کد) با جدول دیگر مرتبط میشود.هر پیشینه دارای تعداد ثابتی حوزه یا ستون است(کتاب:شماره کد، ثبت،پدیدآور، عنوان،...) افزونگی وجود ندارد و گزارش گیری سریع و ساده است.

پایگاه اطلاعات شیئ گرا object – oriented database: متشکل از شیئ هاست. هر شیئ دارای اطلاعات (ویژگیها) و   برنامه ها(روشهایی) است که میتواند اطلاعات درون شیئ را پردازش کند.  شیئ نفوذ ناپذیر است یعنی نمی توان برنامه درون آن را تغییر داد فقط از طریق پیام میتوان با آن رابطه برقرار کرد. هر شیئ ، پس از دریافت پیام ، آن را پردازش کرده و سپس پیامهای مناسبی را ارسال میکند.در ساختار، شیئ هایی که دارای توانایی های مشترک هستند در رده واحدی قرار دارند و هر رده دارای زیر رده با توانایی های رده بالاتر از خود است. مانند: شبکه اینترنت

پایگاه اطلاعاتی توزیعی:برای ذخیره و بازیابی داده های غیر متمرکز بر روی رایانه های مختلف در مراکز متعدد ایجاد می گردد. مثال: همکاری چند کتابخانه در شبکه واحد که با ایجادپایگاه اطلاعاتی توزیعی در شبکه می توانند از برنامه کاربردی یکدیگر استفاده کنند.

مواردمورد توجه در یک نظام:هدف نظام هدف بر حسب وظایف خاص و نتایج خدمات اندازه گیری می شود.  در تعیین هدف توجه به عملکرد  و اثر بخشی  نظام اهمیت دارد. علاوه به اهداف کلی به اهداف خاص نیز توجه شود.توجه به امکان سنجی هدف (مورد توجه قرار دادن موانع) انواع اهداف قابل ملاحظه در نظامهای بازیابی اطلاعات*محتوای اطلاعاتی  منابع :(توجه به موضوع، توجه به خط مشی)*فایده منابع اطلاعاتی:(کاربرد نهایی پیشینه های اطلاعاتی فراهم شده چیست؟) گاهی برونداد یک نظام می تواند درونداد مناسبی برای نظامی دیگر باشد*کاربران :(نیازهای بالفعل و بالقوه)/  کاربران واقعی یا کتابداران و جستجو گران اطلاعات؟

 

q   معیارهای اجرایی/ عملکرد: (دیدگاه ها متفاوت است و اتفاق نظر وجود ندارد. برخی سرعت ارائه خدمات و برخی هزینه را معیار عملکرد می نامند)  جنبه های اقتصادی: توجه به هزینه – سودمندی

تمرین: در طراحی پایگاه اطلاعاتی پایان نامه ها اهداف را تبیین نمایید

2. اجزا ء نظام**داده ها*سخت افزار *نرم افزار*کاربران

 

. کارکردهای نظام:گزینش/ وجین/ ذخیره*تحلیل مدارک و بازنمون اطلاعات*سازماندهی فایل*راهبرد جستجو*خدمت/ اشاعه

 

ü  گزینشو فراهم آوری:   گزینش مواد مهمترین کارکرد یک نظام است یعنی فرایند فکری  شناسایی منابع بالقوه مفید برای کاربران متناسب با اهداف نظام اطلاعاتی*اولین گام ضروری در ایجاد و نگهداری نظام بازیابی اطلاعات*فعالیتی مداوم است زیرا نظام های بازیابی جنبه کاملا Dynamic  دارد و یک مجموعه Static  نیست.

مقوله های مورد توجه در گزینش: 1. خط مشی2. فرایند گزینش3. ابزارهای گزینش4. مراحل سفارش

تعیینخط مشی: مجموعه باید ها و نبایدها،اهداف، راهبردها،محدودیت ها، اولویتها، خط مشى ها و روش هاى انتخاب منابع اطلاعاتى

اهمیت خط مشی:توجه به اهداف*توجه به نیازهای بالفعل و بالقوه کاربران نظام*ابزاری برای ارزیابی نظام*افزایش عملکرد و کارآیی نظام*نتیجه : گزینشی هدفمند و تهیه بهترین منابع اطلاعاتی موجود و در دسترس

 

چهمواردی در خطی مشی؟تبیین برنامه هاى اساسى منطبق با اهداف سازمان مادر (آموزشی؟ پژوهشی؟ و ...)*کاربران و خصوصیات آنها*تعیین محدودیت ها*تعیین موضوعات(هسته و غیر هسته/ حدود و عمق)*تعیین نوع منابع و ویژگیهای هر یک*تعیین زبان منابع*تعیین میزان منابع

 

¢    تعیین موضوعات: تشکیل کمیته هاى تخصصى* تعیین موضوعات بر اساس گروه هسته(تحلیل استنادی)* نظر سنجی از مراجعان* تحلیل عملکرد و بازنگرى (رضایت مراجعین)

 

 

q   تعیینمحدودیت ها: منابع محدود*عدم انتشار منابع متنوع در یک موضوع*منابع مالی محدود*عدم تطابق درخواست کاربران با خط مشی

q     افرادشرکت کننده در انتخاب مواد: مدیران مراکز اطلاع رسانی وکتابداران*متخصصان*استفاده کنندگان*کارکنان مراکز

فرایند گزینش: فرایند و مراحلی  که سازمانها درفراهم آوری طی می کنند شامل : نیاز  سنجی از گروههای  مختلف  پژوهشی و آموزشی* تعیین اولویت ها* انتخاب منابع از طریق اینترنت یا سایر منابع(نمایشگاه)این فرایند حاصل تعامل بین گروه هاى تخصصى و سازمان است.

  

¢   ابزارهای گزینش: فهرست انتشارات سازمان ها، انجمن ها  و فهرست ناشران (Worldof learning)*کتابفروشى ها*فهرست کارگزاران*کتابشناسی ها*مجلات تخصصی*فهرست معرفی آثار مرجع*پایگاه هاى اطلاعاتی*راهنمای پایگاه های اطلاعاتی*اینترنت *نمایشگاه ها*منابع نقد و بررسی*نسخه های نمونه*نسخه های آزمایشی رایگان*خدمات چکیده نویسی و نما یه سازی

بازخورد: بررسی بازخوردها به بهبود نظام کمک می کند.

  • Ø  پژوهشهای دوره ای به روشهای مختلف (مثلا از طریق دریافت های صندوق پیشنهادات ، پرسشنامه و یا هر روشی که امکان تعامل بین کاربر و عاملین نظام را فراهم کند به منظور نیاز سنجی یا تعیین سطح رضایت) اشکال این روش ؟؟؟
  • Ø  میزان استفاده (با تحلیل اطلاعات بدست آمده از سیستم ثبت داد و گرفت Log analysis  اشکال این روش؟؟؟

بررسی مطالعات  Use study  & User study

نمایه سازی : تعریف؟انتساب نمادهای کلامی(کلیدواژه ها یا توصیفگر) یا غیر کلامی(شماره رده بندی) به مدارک برای بازیابی مفاهیم و محتوای آنها*فرآیند توصیف و ارائه ی یک مدرک در قالب اصطلاحات بر گرفته از محتوای موضوعی مدرک.  (ISOstandards, p. 581) *اهمیت نمایه سازی: نمایه سازی روش بنیادین سازماندهی دانش است(ابزاری که می تواند مخازن اطلاعات را از درهم ریختگی حفظ کند)*نمایه سازی با جستجو رابطه ای مستقیم دارد و منجر به دسترس پذیری اطلاعات و بازیابی اطلاعات می شود*نمایه سازی به بیان ایده های مهم مدارک می پردازد، به بیان دیگر نمایه سازی نمایش محتوا، معنی، هدف، ویژگیهای متون و مدارک است*در نتیجه:

نمایه سازی با دو هدف صورت می گیرد

  1. به حداقل رساندن زمان و تلاش برای جستجوی اطلاعات
  2. به حداکثر رساندن موفقیت جستجو

 یعنی رسیدن به اصل

اطلاعات مناسب به کاربر مناسب در زمان مناسب

عواملموثر بر کیفیت نمایه سازی : توجه به جامعیت و مانعیت: جامعیت از ویژگیهای نمایه سازی که در بازیابی اطلاعات نقش دارد*توانایی نظام نمایه سازی درشناسایی مدارک مرتبط، قدرت نظام تلقی

       می شود*در موضوعات جدید جامعیت مهم است*دستیابی به جامعیت بالا(بازیابی تمام مدارک مرتبط) آسان نیست اما با کل نگری (استفاده از اصطلاحات بیشتر) امکان پذیر است* 100      تعداد مدارک بازیابی شده مرتبط = جامعیت

                                تعداد مدارک مرتبط موجود در مجموعه            

راه های دستیابی به جامعیت بیشتر: استفاده از واژه های مترادف*استفاده از عملگر OR*استفاده از اصطلاحات اعم*استفاده از واژگان کنترل شده*استفاده از کوتاه سازی Truncation*حذف محدودیت هایی مثل تاریخ انتشار یا نوع مدرک

مانعیت:قابلیت نظام در دور نگه داشتن مدارک نامرتبط از کاربر و توانایی نظام در انتخاب گزینه های کاملا مرتبط*دستیابی به افزایش مانعیت با اخص نگری امکان پذیر است

*در موضوعات تکراری و قدیمی مانعیت مهم است و نمایه ساز به علت حجم زیاد اطلاعات در آن موضوع باید اخص نگر باشد.

 100      تعداد مدارک بازیابی شده مرتبط = مانعیت

                           کل تعداد مدارک بازیابی شده

 

راه های افزایش مانعیت: عدم استفاده از واژه های مترادف*استفاده از اصطلاحات اخص*عدم استفاده از کوتاه سازی*محدود کردن جستجو به نوع انتشارات، تاریخ و زبان

نکته قابل توجه:عدم تعادل بین جامعیت و مانعیت (رابطه معکوس)*کاربری که به جامعیت بالا نیاز دارد باید مانعیت پایین را قبول کند*پس نظام باید بتواند جامعیت و مانعیت بالا ایجاد کند تا بهبود بازیابی حاصل شود در این میان و برای رسیدن به تعادل مطلوب نمایه ساز و کاربر هردو نقش دارند

چهمنابعی فهرستنویسی و چه منابعی نمایه سازی می‌شوند؟ملاک تعیین منابعی که فهرستنویسی می شوند، قواعد فهرستنویسی انگلو امریکن است. *منابعی که براساس این قواعد فهرستنویسی نمی شوند را باید نمایه سازی ” کرد

انواع مدارکی که نمایه سازی می شوند:مقاله ها*پایان نامه ها *استانداردها*بخشی از کتاب*اسناد دولتی، تاریخی و قدیمی*گزارش های نهایی طرح های تحقیقاتی *انتشارات علمی که به تعداد محدود و در قالب سند منتشر می شوند (grey literature ) *پروانه های ثبت اختراع (Patents)

¢ 
دومفهوم پیش همارا و پس همارا: نظام‌های نمایه‌سازی از نظر قواعد آرایش شناسه‌ها، زمان و عامل هم‌آراکننده به دو دسته کلی تقسیم می شوند:

پیش‌همارا :Pre-Coordinate Indexing System    

پس‌همارا :Post-Coordinate Indexing System

توضیح: در حال حاضر با به کارگیری نظامهای رایانه ای برخی از مفاهیم گذشته نظیر نمایه سازی پیش همارا معنای خود را از دست داده اند. زیر امکانات جستجوی رایانه ای مشکل آنها را برطرف کرده است.

نظامپیش همارا: در این نظام‌ها برقراری رابطه نحوی بین اصطلاحات، قبل از  ذخیره‌سازی و توسط نمایه‌ساز صورت می‌گیرد .واژه ها در زمان نمایه سازی مدرک با هم ترکیب می شوند.

مانند نظام مبتنی بر سرعنوانهای موضوعی فارسی

نظام پس همارا:در این نظام:فراهم شدن امکان استفاده بیشتر از رایانه در ذخیره و بازیابی، موجب رواج بیشتر نظام‌های پس‌همارا شد.*نمایه ساز کلیدواژه ها را از مفاهیم بسیار ساده انتخاب می کند و تعدادی شناسه نیز زیر هر کدام اضافه می کند*برقرار کردن پیوند بین واژه‌های یک شناسه مرکب، در مرحله بازیابی و توسط جست‌وجوگر صورت می‌گیرد. *جست‌وجوگر می‌تواند موضوع مورد نظر خود را به تک ‌واژه‌ها تفکیک و هر واژه را جداگانه از نمایه استخراج کند

زبانهاینمایه سازی: نمایه سازی مستلزم برخورداری از یک زبان نمایه سازی با     مجموعه ای از اصول، روش ها، اصطلاح ها برای ساخت اصطلاح های نمایه ای است.* زبان نمایه سازی زبانی است که برای توصیف موضوع یا سایر جنبه های اطلاعات یا مدارک به کار می رود.*واژگان مورد استفاده در نمایه سازی همراه با قواعد استفاده از آن را زبان نمایه سازی می گویند.*عناصر زبان نمایه سازی به توصیفگرهایی اطلاق می شود که به قصد بازیابی اطلاعات در مجموعه ای قابل دسترس، سازمان یافته اند.

زبانهای نمایه سازی:زبان نمایه سازی آزاد(free indexing language)

*زبان نمایه‌سازی طبیعی (natural indexing language)   

       

*زبان نمایه سازی کنترل شده (مقید)  (Controlled indexinglanguage)

 

زباننمایه سازی آزاد: ویژگی ها:در این نظام نمایه ساز از توصیفگرهای که خود مناسب می داند برای توصیف مفاهیم موجود در مدرک استفاده می کند، خواه این توصیفگرها در متن آمده باشد یا نه*

در این نظام اصل وحدت در نمایه سازی(جلوگیری از پراکندگی یک مفهوم در زیر توصیفگرهای متعدد، با انتخاب یک توصیفگر ارجح و ارجاع مترادف هابه آن، ) و اصل انتخاب توصیفگر اخص مورد توجه است.*در این زبان محدودیتی از نظر نوع واژه وجود ندارد (واژه از متن گرفته شده باشد یا واژه متناسب با موضوع مدرک باشد)

مهارت نمایه ساز نقش مهمی دارد (با توجه به دیدگاه نمایه ساز از یک سو و یکدستی در اختصاص عبارات نمایه) این نوع نمایه سازی توسط انسان یا رایانه انجام می شود.نمایه سازی کتاب نوعی از نمایه سازی به زبان آزاد است

زباننمایه سازی طبیعی: ویژگی ها:در این نظام از واژه های به کار رفته در خود مدرک به عنوان توصیفگر استفاده  می شود*در این نظام هر واژه که بتواند موضوع مدرک را خوب توصیف کند بدون هیچ قید و شرطی به عنوان اصطلاح نمایه ای انتخاب می شود.*زبان نمایه سازی طبیعی زبان متن مدرک  یا متن آزاد نیز نامیده می شود*نمایه سازی بر اساس زبان طبیعی اغلب توسط رایانه انجام می شود*زبان طبیعی را متضاد با واژگان کنترل شده می دانند

مزایای زبان طبیعی: سهولت در نمایه سازی و عدم نیاز به تحلیل مدرک و استخراج مفاهیم*خودکارسازی ایجاد نمایه  وسرعت در نمایه سازی*روزآمدی، زیرا کلیدواژه ها را از مدارک جدید استخراج می کنند و همزمان با رشد مدارک، نمایه نیز پویا می شود.*امکان بازیابی بر اساس هر واژه ای( اسم، صفت، قید و ...)* جامعیت بالا

معایب زبان طبیعی: کاربر مجبور است برای بازیابی مدارک مورد نیاز همه کلیدواژه های ممکن را  حدس بزند*بازیابی مدارک نامرتبط ( وجود واژه های مشابه و مترادف در زبان طبیعی*صرف زمان و تلاش بیش از حد کاربران برای جستجو*نمایه سازی موتورهای جستجو نوعی از نمایه سازی به زبان طبیعی است

 

زبان نمایه سازی کنترل شده: ویژگی ها در این نوع نمایه سازی مفاهیم استخراج شده از متن مدرک به منظور انتخاب توصیفگر مناسب با منابع معیار یعنی اصطلاح نامه ها و سرعنوانهای موضوعی تطبیق داده می شود.*واژگان کنترل شده زیرمجموعه ای از زبان طبیعی است زیرا توصیفگر از زبان طبیعی متن مدرک گرفته می شود و توسط اصطلاحنامه کاربرد آن در نمایه سازی تجویز می شود.*زبان نمایه سازی کنترل شده مبتنی بر کنترل واژگان است.

مزایای زبان نمایه سازی کنترل شده: جستجوگران مختلف نمایه در موضوعی واحد به اصطلاح های مشابه و تا حدودی کامل دست می یابند.*دقت در اطلاعات بازیابی شده (مانعیت بالا)*وجود نظام ارتباطی بین واژه ها از طریق ایجاد ارجاع، سطح اطمینان را افزایش می دهد*ثبات و یکدستی واژگان

معایب زبان نمایه سازی کنترل شده: . نیاز به نیروی انسانی متخصص و ماهر                امکان بروز خطا* هزینه بر بودن3. وقت گیر بودن4. محدودیت نقاط بازیابی و در نتیجه جامعیت کمتر5. توجه کمتر به نیاز واقعی کاربران و دور بودن از زبان کاربران6. عدم آشنایی کاربران با اصطلاحات پذیرفته شده و نیاز به آموزش برای استفاده7. دشواری در افزودن مفاهیم جدید به نمایه و اصطلاحنامه (عدم روزآمدی)

v     نتیجه گیری: انتخاب زبان نمایه سازی از مهم ترین مراحل نمایه سازی است

v     انتخاب زبان نمایه سازی به نوع نمایه سازی، سیاست گذاری نمایه و نوع مدرک بستگی دارد

با توجه به محدودیتهایی که برای هر یک از زبانهای نمایه سازی وجود دارد امروزه توجه به سوی ترکیب زبانهای نمایه سازی به منظور بازیابی نتایج بیشتر و دقیق تردر اکثر پایگاههای اطلاعاتی معطوف است

v   کنترلیا مهار واژگان: تعریف: تعیین اصطلاح مورد استفاده در نمایه سازی و نحو یا دستور کار، همچنین تعداد لغات و شکل اصطلاحات

v      چرا از کنترل واژگان استفاده می کنیم؟برای

1. کنترل مترادفها با هدف:

 الف) بازیابی اثربخش

  ب) پرهیز از همپوشانی در کاربرد مفاهیم مشابه

 ج) انتخاب یک واژه استاندارد و ارجاع از سایر واژه های مترادف به آن

2. تعیین روابط سلسله مراتبی بین اصطلاح ها

3. کنترل شکل واژه ها (تمایز قائل شدن بین کلمات هم نگاشت مانند شیر)

واژگان را کنترل میکنیم تا به نتایج زیر برسیم: وحدت گونه ای: شناسایی رابطه های موجود در هر بافت معنایی و شکل دهی مقادیر(عناصر) موجود در هر نمونه از آن گونه بافتی بر اساس رابطه ها

               مشخص نمودن اصطلاحات اعم، اخص و وابسته و برقراری رابطه سلسله مراتبی

اهمیت:

1.آشنایی با مفاهیم و زمینه های موضوعی یک علم و آشنایی با اندیشه های مرتبط با این مفاهیم (کاربرد؟)

2. این امکان ایجاد میگردد که به هنگام بازیابی، ادامه جستجو به صورت نظام یافته قابل تجدید یا گسترش باشد (کاربرد؟)

¢        وحدت نمونه ای: رسیدن از پراکندگی معنایی به تراکم معنایی(گردآوری واژگان وابسته در یک جایگاه و ایجاد یک بافت معنایی متمرکز)

¢        وحدت ساختاری(صرفی و نحوی): کنترل تغییر پذیری ساختارهای صرفی و نحوی عبارات (واژگان) و تک ساختاری شدن آنها

¢        وحدت واژه ای(وحدت عبارتی): تک واژه ای یا تک عبارتی شدن یک معنا از طریق پذیرفتن یکی از واژه ها به عنوان واژه مرجح

¢        ویژگیهای مهم واژگان کنترل شده: توجه بیشتر به کاربر و جستجوگر

¢    متکی بر متون و نیازهای اطلاعاتی استفاده کنندگان بالقوه و بالفعل نظام باشد ( بدین مفهوم که تعیین موضوعها و ارتباط بین آنها با آنچه در مواد اطلاعاتی مشاهده می شود شباهت داشته باشد و اساس کار اطلاعاتی باشد که به عنوان درونداد به نظام وارد می شود نه ملاحظات نظری و تقسیم بندی های شناخته شده دانش) نتیجه: نظام پویایی خود را حفظ می کند.

¢        خاص شدن واژگان در حد کافی و مورد نیاز باشد

نتیجهگیری:\با توجه به آنچه مطرح شد پیش بینی عوامل زیر در حجم و ساختمان واژگان کنترل شده ضروری است:

  • Ø      محدوده موضوع: بدین مفهوم که موضوعات اصلی از جانبی تفویض گردد
  • Ø      وسعت مجموعه و افزایش نسبی آن: هرچه تعداد واحد اطلاعاتی که باید نمایه سازی شود بیشترباشد زبان بازیابی نیز باید مفصل تر باشد
  • Ø      فنون و ابزار ذخیره و بازیابی: در نمایه سازی خودکار، انتخاب واژگان دقیق تر است
  • Ø      خصوصیات پرسش ها: پرسش های تخصصی  حساسیت درانتخاب دقیق تر واژگان را می طلبد
  • Ø      نوع استفاده کنندگان نظام: پژوهنده یا متخصص اطلاع رسانی؟
  • Ø      ابزارهای کنترل واژگان:اصطلاحنامه (Thesaurus)
  • Ø      سرعنوانهای موضوعی (Subjectheadings)
  • Ø      نظام های رده بندی (Classificationscheme)
  • Ø      هستی شناسی (Ontology)

 توجه: معمولاً در نمایه سازی از اصطلاحنامه استفاده می شود.

تعریف اصطلاحنامه

q   درنمایه سازی به روش زبان کنترل شده ملزم به استفاده از سیاهه واژه های کنترل شده هستیم که به آن اصطلاحنامه می گویند. اصطلاحنامه بنا به تعریف انسی* (ANSI) عبارتست از:

q   مجموعه ای از واژه ها و عبارتها که روابط سلسله مراتبی، مترادفات، وابستگی ها و دیگر روابط بین مفاهیم را ارائه می کند و هدف آن ایجاد واژگانی استاندارد برای ذخیره و بازیابی اطلاعات است.

q    اصطلاحنامه به عنوان مجموعه لغات کنترل شده، وسیله ای است که برای کمک به بازیابی موثر اطلاعات  با هدف راهنمایی نمایه ساز و جستجوگر در انتخاب اصطلاحات یکسان برای بیان یک مفهوم خاص یا ترکیبی از مفاهیم طراحی می شود (صنعت جو، 1383)

تفاوت اصطلاحنامه و سرعنوانهای موضوعی:

اصطلاحنامه: ساختار سلسله مراتبی*ارجاعهای اعم و اخص تفکیک شده اند*ارجاع خاص به عام*اصطلاحات اخص بیشتر*بیشتر گرایش به زبان طبیع

/ 0 نظر / 46 بازدید