کتابخانه آموزشگاهی

عمارلو حسین

ذخیره وبازیابی
ساعت ٢:٥٥ ‎ب.ظ روز ۱۳٩٠/۱٠/۳   کلمات کلیدی: کتابداری

تعریف ذخیره و بازیابی اطلاعات

Operation performed by the hardware and software used in indexing and storing a file of machine readable records whenever a user queries the system for information relevant to a specific topic

(Encyclopedia of library and information science)

Information storage and retrieval, the systematic process of collecting and cataloging data so that they can be located and displayed on request (Info please encyclopedia)

ادامه    فعالیت هایی که برای تحلیل و سازماندهی مدارک و منابع صورت می گیرد ذخیره اطلاعات ، و تلاشهایی که برای یافتن یک یا چند مدرک از میان انبوه مدارک ذخیره شده انجام می شود بازیابی اطلاعات نام دارد. (دایره المعارف کتابداری)

پایگاه اطلاعاتی تفاوت پایگاه اطلاعاتی و بانک اطلاعاتی

دایره المعارف بین المللی کتابداری Feather and Sturge

پایگاه اطلاعاتی : مجموعه ای نظام مند از اطلاعات در هر شکل و قالبی حتی به صورت چاپی، داده ها در یک پایگاه اطلاعاتی به صورت پرونده های رایانه ای یا بر روی لوح فشرده  ذخیره شده و امکان بازیابی خودکار دارند.

بانک اطلاعاتی : مترادف پایگاه اطلاعاتی می باشد و در برخی موارد برای مشخص کردن مجموعه های غیر کتابشناختی و داده های عددی استفاده می شود.

Database is more general than databank and mostly used.

 


ادامه : بنابراین پایگاه اطلاعاتی

نظامی برای ذخیره، پردازش، جستجو و بازیابی سریع و آسان مقادیر فراوان اطلاعات

نظامی که امکان ذخیره، حذف، اصلاح، روزآمدسازی و بازیابی را فراهم می آورد

نظامی متشکل از فایل های مختلف که بر روی لوح فشرده، نوار مغناطیسی، فلش مموری، فلاپی و یا به صورت آن لاین ذخیره شده است.

ساختار پایگاه اطلاعاتی : بیت: داده هایی که به صورت دو دویی اطلاع مشخصی را منتقل می کند.

بایت: هشت بیت معادل یک بایت است که ترکیبات متفاوت آن 256 حالت را نشان می دهد

کاراکتر یا نویسه( character) : هر یک از حروف، علائم، ارقام قابل ذخیره

موجودیت entity: مفهوم یک شی ، فرد  یا سازمان یا هر چیزی که بخواهیم درباره آن اطلاعاتی را ذخیره کنیم. موجودیت ها با صفات خاصه از هم جدا می شوند.

فیلد: در پایگاه اطلاعاتی هر یک از صفات خاصه یک موجودیت جایگاه مشخصی دارد که به آن فیلد یا منطقه می گویند.

ادامه : رکورد/ پیشینه: پیشینه مجموعه ای از فیلدهاست. فیلدهای مرتبط با یکدیگر در یک پیشینه قرار می گیرند.

در نظامهای بازیابی پیشینه معمولا کتابشناختی است و دارای دو بخش: توصیف کتابشناختی و توصیف موضوعی

فایل/ پرونده /بایگانی: مجموعه ای از رکوردهای مرتبط که در برخی ویژگیها مشترکند. مانند برگه دان یک کتابخانه

q     انواع فیلدها: از نظر ساختار

  • فیلدهای معمولی: دارای ماهیتی یگانه و تفکیک ناپذیر(سرشناسه)
  • فیلدهای تکرار پذیر: مانند فیلد موضوع یا شرح مسئولیت
  • فیلدهای زیرمجموعه داریا فرعی: دارای اطلاعات مرتبط و تفکیک پذیر که ممکن است تکرار پذیر هم باشد(وضعیت نشر)
  • فیلدهای جستجوپذیر

q      از نظر محتوی

  • فیلدهای حرفی                                   
  • فیلدهای عددی
  • حرفی- عددی
  • زمانی/ تقویمی
  • فیلدهای داده ای رابطه ای/ Related database field

¢        انواع فایل/ بایگانی: بایگانی ورود اطلاعات

¢        بایگانی اصلی/ مادر: در این بایگانی داده های هر پیشینه به ترتیب ورود و یا به ترتیب شماره پیشینه از کم به زیاد مرتب می شوند. هر بایگانی اصلی می تواند چندین فایل مقلوب داشته باشد.

¢        بایگانی مقلوب: ابزاری موثر برای جستجوی اطلاعات. ساخته شده از واژه ها و عبارات جستجو پذیر به ترتیب حروف الفبا

 اهمیت و ضرورت فایل مقلوب       دسترسی سریع به اطلاعات

ویژگیهای فایل مقلوب:

  1. هر واژه فقط یک بار در نظم الفبایی قرار می گیرد.
  2. در مقابل هر واژه یا عبارت شماره کلیه پیشینه های مربوطه قرار می گیرد.
  3. ایجاد این فایل به حافظه بالا نیاز دارد و زمان بر است. اما جستجو در زمان کمتری صورت می گیرد.
  • بایگانی های جانبی یا مرتبط:هدف از ایجاد:اطمینان از صحت محتوا*اطمینان از شکل داده ها و عبارات
  • فعالیتهای مهم در پایگاه اطلاعاتی: ورود داده ها *اصلاح داده ها*بازیابی داده ها*چاپ داده ها

بایگانی اصلی:

¢       بایگانی ترتیبی منظم

  • Ø     ترتیب الفبایی          بازیابی راحت تر
  • Ø     ورود و حذف اطلاعات مشکل است
  • Ø     بایگانی ترتیبی نامنظم
  • Ø     دسته بندی اطلاعات بر اساس ترتیب ورود اطلاعات
  • Ø     تعیین محل اطلاعات جدید راحت تر
  • Ø     زمان ثبت سریع تر
  • Ø     استفاده از نمایه مقلوب برای جستجوپذیر نمودن داده ها

 

  1. نکات قابل توجه در طراحی پایگاه اطلاعاتی: نیاز اطلاعاتی کاربران(  توجه به وحدت ذخیره سازی و تعدد دید کاربران)
  2. فراوانی کاربرد یا فراوانی جستجو(بایگانی منظم)
  3. زمان پاسخگویی(بایگانی منظم)
  4. حجم بایگانی(برای اطلاعات زیاد از بایگانی نامنظم استفاده می شود)
  5. نوع عملیات (مانند حذف و اضافه کردن اطلاعات         بایگانی نامنظم ارجح است)

تعریف جامع پایگاه اطلاعاتی: مجموعه ای از داده های ذخیره شده (درباره موجودیتهای یک محیط اطلاعاتی و ارتباط آنها) به صورت مجتمع و مبتنی بر یک ساختار تعریف شده با استفاده از یک زبان برنامه نویسی با حداقل افزونگی، تحت کنترل متمرکز و مورد استفاده یک یا چند کاربر به صورت اشتراکی و همزمان

   نکات مستخرج از تعریف:

ü     تاکید بر ویژگی یکپارچگی نظام Integrity

ü     تاکید بر مدیریت و کنترل متمرکز

ü     عدم محدودیت

ü     همزمانی        از نظر کاربر (استفاده همزمان  کاربران از پایگاه)

                       از نظر نظام (عملکرد همزمان فرایندهای درون نظام)

¢       کاربران پایگاه اطلاعاتی: برنامه نویسان*مدیران*استفاده کنندگان نهایی

¢        انواع پایگاههای اطلاعاتی (از لحاظ محتوی: پایگاههای اطلاعاتی کتابشناختی (اپک کتابخانه)

¢        پایگاههای اطلاعاتی ارجاعی ( راهنمای ناشران)

¢        پایگاههای اطلاعاتی عددی (سالنامه آماری یونسکو)

¢        پایگاههای اطلاعاتی عددی – متنی Iran Business Forecast

¢        پایگاههای اطلاعاتی خواص مواد

¢        پایگاههای اطلاعاتی تمام متن (دایره المعارف کتابداری)

¢        پایگاههای اطلاعاتی تمام تصویر (نمایه)

¢        پایگاههای اطلاعاتی چند رسانه ای : فرامتن و فرا رسانه در کنار هم قرار دارند

انواع پایگاه اطلاعاتىاز لحاظ ساختار: پایگاه اطلاعاتی تک پرونده اطلاعات از یک پرونده را در هر زمان ذخیره ،سازماندهی و بازیابی میکنند. امکان حذف حوزه های زائد در پیشینه ها وجود ندارد  بنابر این افزونگی اطلاعات بسیار زیاد است. پایگاه اطلاعاتی سلسله مراتبی پیشینه ها به صورت سلسله مراتبی وجود دارند. تنها یک پیشینه ریشه درخت است و هر پیشینه فقط یک رابطه با پیشینه قبلی خود دارد ولی در ایجاد رابطه با پیشینه های بعدی محدودیتی ندارد. برخی پیشینه ها با توجه به نوع ارتباط تکرار میشوند و موجب حجم پایگاه میشوند.

پایگاه اطلاعاتی شبکه ای:  رابطه انواع پیشینه ها یک به چند است. تعداد رابطه ها زیاد است در نتیجه سرعت بازیابی نسبت به سلسله مراتبی کند است. البته با قرار دادن پیشینه های نزدیک به هم این مشکل حل میشود. برتری شبکه ای نسبت به سلسله مراتبی ، استفاده از یک پیشینه در رابطه های نا محدود است و نیاز به پیشینه های یکسان ندارد. در نتیجه افزونگی اطلاعات کاهش یافته و اندازه پایگاه کوچک تر می شود.

پایگاه اطلاعاتی رابطه ای:رابطه ها به صورت جدول بکار رفته است.  سازماندهی اطلاعات بر پایه جدول(رابطه ها)، سطرها(پیشینه ها)و ستونها(حوزه ها) است. هرسطر جدول ، پیشینه ای است که بوسیله کلید مشخصی(شماره کد) با جدول دیگر مرتبط میشود.هر پیشینه دارای تعداد ثابتی حوزه یا ستون است(کتاب:شماره کد، ثبت،پدیدآور، عنوان،...) افزونگی وجود ندارد و گزارش گیری سریع و ساده است.

پایگاه اطلاعات شیئ گرا object – oriented database: متشکل از شیئ هاست. هر شیئ دارای اطلاعات (ویژگیها) و   برنامه ها(روشهایی) است که میتواند اطلاعات درون شیئ را پردازش کند.  شیئ نفوذ ناپذیر است یعنی نمی توان برنامه درون آن را تغییر داد فقط از طریق پیام میتوان با آن رابطه برقرار کرد. هر شیئ ، پس از دریافت پیام ، آن را پردازش کرده و سپس پیامهای مناسبی را ارسال میکند.در ساختار، شیئ هایی که دارای توانایی های مشترک هستند در رده واحدی قرار دارند و هر رده دارای زیر رده با توانایی های رده بالاتر از خود است. مانند: شبکه اینترنت

پایگاه اطلاعاتی توزیعی:برای ذخیره و بازیابی داده های غیر متمرکز بر روی رایانه های مختلف در مراکز متعدد ایجاد می گردد. مثال: همکاری چند کتابخانه در شبکه واحد که با ایجادپایگاه اطلاعاتی توزیعی در شبکه می توانند از برنامه کاربردی یکدیگر استفاده کنند.

موارد مورد توجه در یک نظام: هدف نظام هدف بر حسب وظایف خاص و نتایج خدمات اندازه گیری می شود.  در تعیین هدف توجه به عملکرد  و اثر بخشی  نظام اهمیت دارد. علاوه به اهداف کلی به اهداف خاص نیز توجه شود.توجه به امکان سنجی هدف (مورد توجه قرار دادن موانع) انواع اهداف قابل ملاحظه در نظامهای بازیابی اطلاعات*محتوای اطلاعاتی  منابع :(توجه به موضوع، توجه به خط مشی)*فایده منابع اطلاعاتی:(کاربرد نهایی پیشینه های اطلاعاتی فراهم شده چیست؟) گاهی برونداد یک نظام می تواند درونداد مناسبی برای نظامی دیگر باشد*کاربران :(نیازهای بالفعل و بالقوه)/  کاربران واقعی یا کتابداران و جستجو گران اطلاعات؟

 

q   معیارهای اجرایی/ عملکرد: (دیدگاه ها متفاوت است و اتفاق نظر وجود ندارد. برخی سرعت ارائه خدمات و برخی هزینه را معیار عملکرد می نامند)  جنبه های اقتصادی: توجه به هزینه – سودمندی

تمرین: در طراحی پایگاه اطلاعاتی پایان نامه ها اهداف را تبیین نمایید

2. اجزا ء نظام**داده ها*سخت افزار *نرم افزار*کاربران

 

. کارکردهای نظام:گزینش/ وجین/ ذخیره*تحلیل مدارک و بازنمون اطلاعات*سازماندهی فایل*راهبرد جستجو*خدمت/ اشاعه

 

ü  گزینش و فراهم آوری:   گزینش مواد مهمترین کارکرد یک نظام است یعنی فرایند فکری  شناسایی منابع بالقوه مفید برای کاربران متناسب با اهداف نظام اطلاعاتی*اولین گام ضروری در ایجاد و نگهداری نظام بازیابی اطلاعات*فعالیتی مداوم است زیرا نظام های بازیابی جنبه کاملا Dynamic  دارد و یک مجموعه Static  نیست.

مقوله های مورد توجه در گزینش: 1. خط مشی2. فرایند گزینش3. ابزارهای گزینش4. مراحل سفارش

تعیین خط مشی: مجموعه باید ها و نبایدها،اهداف، راهبردها،محدودیت ها، اولویتها، خط مشى ها و روش هاى انتخاب منابع اطلاعاتى

اهمیت خط مشی:توجه به اهداف*توجه به نیازهای بالفعل و بالقوه کاربران نظام*ابزاری برای ارزیابی نظام*افزایش عملکرد و کارآیی نظام*نتیجه : گزینشی هدفمند و تهیه بهترین منابع اطلاعاتی موجود و در دسترس

 

چه مواردی در خطی مشی؟تبیین برنامه هاى اساسى منطبق با اهداف سازمان مادر (آموزشی؟ پژوهشی؟ و ...)*کاربران و خصوصیات آنها*تعیین محدودیت ها*تعیین موضوعات(هسته و غیر هسته/ حدود و عمق)*تعیین نوع منابع و ویژگیهای هر یک*تعیین زبان منابع*تعیین میزان منابع

 

¢    تعیین موضوعات: تشکیل کمیته هاى تخصصى* تعیین موضوعات بر اساس گروه هسته(تحلیل استنادی)* نظر سنجی از مراجعان* تحلیل عملکرد و بازنگرى (رضایت مراجعین)

 

 

q   تعیین محدودیت ها: منابع محدود*عدم انتشار منابع متنوع در یک موضوع*منابع مالی محدود*عدم تطابق درخواست کاربران با خط مشی

q     افراد شرکت کننده در انتخاب مواد: مدیران مراکز اطلاع رسانی وکتابداران*متخصصان*استفاده کنندگان*کارکنان مراکز

فرایند گزینش: فرایند و مراحلی  که سازمانها درفراهم آوری طی می کنند شامل : نیاز  سنجی از گروههای  مختلف  پژوهشی و آموزشی* تعیین اولویت ها* انتخاب منابع از طریق اینترنت یا سایر منابع(نمایشگاه)این فرایند حاصل تعامل بین گروه هاى تخصصى و سازمان است.

  

¢   ابزارهای گزینش: فهرست انتشارات سازمان ها، انجمن ها  و فهرست ناشران (World of learning)*کتابفروشى ها*فهرست کارگزاران*کتابشناسی ها*مجلات تخصصی*فهرست معرفی آثار مرجع*پایگاه هاى اطلاعاتی*راهنمای پایگاه های اطلاعاتی*اینترنت *نمایشگاه ها*منابع نقد و بررسی*نسخه های نمونه*نسخه های آزمایشی رایگان*خدمات چکیده نویسی و نما یه سازی

بازخورد: بررسی بازخوردها به بهبود نظام کمک می کند.

  • Ø  پژوهشهای دوره ای به روشهای مختلف (مثلا از طریق دریافت های صندوق پیشنهادات ، پرسشنامه و یا هر روشی که امکان تعامل بین کاربر و عاملین نظام را فراهم کند به منظور نیاز سنجی یا تعیین سطح رضایت) اشکال این روش ؟؟؟
  • Ø  میزان استفاده (با تحلیل اطلاعات بدست آمده از سیستم ثبت داد و گرفت Log analysis  اشکال این روش؟؟؟

بررسی مطالعات  Use study  & User study

نمایه سازی : تعریف؟انتساب نمادهای کلامی(کلیدواژه ها یا توصیفگر) یا غیر کلامی(شماره رده بندی) به مدارک برای بازیابی مفاهیم و محتوای آنها*فرآیند توصیف و ارائه ی یک مدرک در قالب اصطلاحات بر گرفته از محتوای موضوعی مدرک.  (ISO standards, p. 581) *اهمیت نمایه سازی: نمایه سازی روش بنیادین سازماندهی دانش است(ابزاری که می تواند مخازن اطلاعات را از درهم ریختگی حفظ کند)*نمایه سازی با جستجو رابطه ای مستقیم دارد و منجر به دسترس پذیری اطلاعات و بازیابی اطلاعات می شود*نمایه سازی به بیان ایده های مهم مدارک می پردازد، به بیان دیگر نمایه سازی نمایش محتوا، معنی، هدف، ویژگیهای متون و مدارک است*در نتیجه:

نمایه سازی با دو هدف صورت می گیرد

  1. به حداقل رساندن زمان و تلاش برای جستجوی اطلاعات
  2. به حداکثر رساندن موفقیت جستجو

 یعنی رسیدن به اصل

اطلاعات مناسب به کاربر مناسب در زمان مناسب

عوامل موثر بر کیفیت نمایه سازی : توجه به جامعیت و مانعیت: جامعیت از ویژگیهای نمایه سازی که در بازیابی اطلاعات نقش دارد*توانایی نظام نمایه سازی درشناسایی مدارک مرتبط، قدرت نظام تلقی

       می شود*در موضوعات جدید جامعیت مهم است*دستیابی به جامعیت بالا(بازیابی تمام مدارک مرتبط) آسان نیست اما با کل نگری (استفاده از اصطلاحات بیشتر) امکان پذیر است* 100      تعداد مدارک بازیابی شده مرتبط = جامعیت

                                تعداد مدارک مرتبط موجود در مجموعه            

راه های دستیابی به جامعیت بیشتر: استفاده از واژه های مترادف*استفاده از عملگر OR*استفاده از اصطلاحات اعم*استفاده از واژگان کنترل شده*استفاده از کوتاه سازی Truncation*حذف محدودیت هایی مثل تاریخ انتشار یا نوع مدرک

مانعیت:قابلیت نظام در دور نگه داشتن مدارک نامرتبط از کاربر و توانایی نظام در انتخاب گزینه های کاملا مرتبط*دستیابی به افزایش مانعیت با اخص نگری امکان پذیر است

*در موضوعات تکراری و قدیمی مانعیت مهم است و نمایه ساز به علت حجم زیاد اطلاعات در آن موضوع باید اخص نگر باشد.

 100      تعداد مدارک بازیابی شده مرتبط = مانعیت

                           کل تعداد مدارک بازیابی شده

 

راه های افزایش مانعیت: عدم استفاده از واژه های مترادف*استفاده از اصطلاحات اخص*عدم استفاده از کوتاه سازی*محدود کردن جستجو به نوع انتشارات، تاریخ و زبان

نکته قابل توجه:عدم تعادل بین جامعیت و مانعیت (رابطه معکوس)*کاربری که به جامعیت بالا نیاز دارد باید مانعیت پایین را قبول کند*پس نظام باید بتواند جامعیت و مانعیت بالا ایجاد کند تا بهبود بازیابی حاصل شود در این میان و برای رسیدن به تعادل مطلوب نمایه ساز و کاربر هردو نقش دارند

چه منابعی فهرستنویسی و چه منابعی نمایه سازی می‌شوند؟ملاک تعیین منابعی که فهرستنویسی می شوند، قواعد فهرستنویسی انگلو امریکن است. *منابعی که براساس این قواعد فهرستنویسی نمی شوند را باید نمایه سازی ” کرد

انواع مدارکی که نمایه سازی می شوند: مقاله ها*پایان نامه ها *استانداردها*بخشی از کتاب*اسناد دولتی، تاریخی و قدیمی*گزارش های نهایی طرح های تحقیقاتی *انتشارات علمی که به تعداد محدود و در قالب سند منتشر می شوند (grey literature ) *پروانه های ثبت اختراع (Patents)

¢ 
دو مفهوم پیش همارا و پس همارا: نظام‌های نمایه‌سازی از نظر قواعد آرایش شناسه‌ها، زمان و عامل هم‌آراکننده به دو دسته کلی تقسیم می شوند:

پیش‌همارا :Pre-Coordinate Indexing System    

پس‌همارا :Post-Coordinate Indexing System

توضیح: در حال حاضر با به کارگیری نظامهای رایانه ای برخی از مفاهیم گذشته نظیر نمایه سازی پیش همارا معنای خود را از دست داده اند. زیر امکانات جستجوی رایانه ای مشکل آنها را برطرف کرده است.

نظام پیش همارا: در این نظام‌ها برقراری رابطه نحوی بین اصطلاحات، قبل از  ذخیره‌سازی و توسط نمایه‌ساز صورت می‌گیرد .واژه ها در زمان نمایه سازی مدرک با هم ترکیب می شوند.

مانند نظام مبتنی بر سرعنوانهای موضوعی فارسی

نظام پس همارا: در این نظام:فراهم شدن امکان استفاده بیشتر از رایانه در ذخیره و بازیابی، موجب رواج بیشتر نظام‌های پس‌همارا شد.*نمایه ساز کلیدواژه ها را از مفاهیم بسیار ساده انتخاب می کند و تعدادی شناسه نیز زیر هر کدام اضافه می کند*برقرار کردن پیوند بین واژه‌های یک شناسه مرکب، در مرحله بازیابی و توسط جست‌وجوگر صورت می‌گیرد. *جست‌وجوگر می‌تواند موضوع مورد نظر خود را به تک ‌واژه‌ها تفکیک و هر واژه را جداگانه از نمایه استخراج کند

زبانهای نمایه سازی: نمایه سازی مستلزم برخورداری از یک زبان نمایه سازی با     مجموعه ای از اصول، روش ها، اصطلاح ها برای ساخت اصطلاح های نمایه ای است.* زبان نمایه سازی زبانی است که برای توصیف موضوع یا سایر جنبه های اطلاعات یا مدارک به کار می رود.*واژگان مورد استفاده در نمایه سازی همراه با قواعد استفاده از آن را زبان نمایه سازی می گویند.*عناصر زبان نمایه سازی به توصیفگرهایی اطلاق می شود که به قصد بازیابی اطلاعات در مجموعه ای قابل دسترس، سازمان یافته اند.

زبانهای نمایه سازی: زبان نمایه سازی آزاد(free indexing language)

*زبان نمایه‌سازی طبیعی (natural indexing language)   

       

*زبان نمایه سازی کنترل شده (مقید)  (Controlled indexing language)

 

زبان نمایه سازی آزاد: ویژگی ها:در این نظام نمایه ساز از توصیفگرهای که خود مناسب می داند برای توصیف مفاهیم موجود در مدرک استفاده می کند، خواه این توصیفگرها در متن آمده باشد یا نه*

در این نظام اصل وحدت در نمایه سازی(جلوگیری از پراکندگی یک مفهوم در زیر توصیفگرهای متعدد، با انتخاب یک توصیفگر ارجح و ارجاع مترادف هابه آن، ) و اصل انتخاب توصیفگر اخص مورد توجه است.*در این زبان محدودیتی از نظر نوع واژه وجود ندارد (واژه از متن گرفته شده باشد یا واژه متناسب با موضوع مدرک باشد)

مهارت نمایه ساز نقش مهمی دارد (با توجه به دیدگاه نمایه ساز از یک سو و یکدستی در اختصاص عبارات نمایه) این نوع نمایه سازی توسط انسان یا رایانه انجام می شود.نمایه سازی کتاب نوعی از نمایه سازی به زبان آزاد است

زبان نمایه سازی طبیعی: ویژگی ها:در این نظام از واژه های به کار رفته در خود مدرک به عنوان توصیفگر استفاده  می شود*در این نظام هر واژه که بتواند موضوع مدرک را خوب توصیف کند بدون هیچ قید و شرطی به عنوان اصطلاح نمایه ای انتخاب می شود.*زبان نمایه سازی طبیعی زبان متن مدرک  یا متن آزاد نیز نامیده می شود*نمایه سازی بر اساس زبان طبیعی اغلب توسط رایانه انجام می شود*زبان طبیعی را متضاد با واژگان کنترل شده می دانند

مزایای زبان طبیعی: سهولت در نمایه سازی و عدم نیاز به تحلیل مدرک و استخراج مفاهیم*خودکارسازی ایجاد نمایه  وسرعت در نمایه سازی*روزآمدی، زیرا کلیدواژه ها را از مدارک جدید استخراج می کنند و همزمان با رشد مدارک، نمایه نیز پویا می شود.*امکان بازیابی بر اساس هر واژه ای( اسم، صفت، قید و ...)* جامعیت بالا

معایب زبان طبیعی: کاربر مجبور است برای بازیابی مدارک مورد نیاز همه کلیدواژه های ممکن را  حدس بزند*بازیابی مدارک نامرتبط ( وجود واژه های مشابه و مترادف در زبان طبیعی*صرف زمان و تلاش بیش از حد کاربران برای جستجو*نمایه سازی موتورهای جستجو نوعی از نمایه سازی به زبان طبیعی است

 

زبان نمایه سازی کنترل شده: ویژگی ها در این نوع نمایه سازی مفاهیم استخراج شده از متن مدرک به منظور انتخاب توصیفگر مناسب با منابع معیار یعنی اصطلاح نامه ها و سرعنوانهای موضوعی تطبیق داده می شود.*واژگان کنترل شده زیرمجموعه ای از زبان طبیعی است زیرا توصیفگر از زبان طبیعی متن مدرک گرفته می شود و توسط اصطلاحنامه کاربرد آن در نمایه سازی تجویز می شود.*زبان نمایه سازی کنترل شده مبتنی بر کنترل واژگان است.

مزایای زبان نمایه سازی کنترل شده: جستجوگران مختلف نمایه در موضوعی واحد به اصطلاح های مشابه و تا حدودی کامل دست می یابند.*دقت در اطلاعات بازیابی شده (مانعیت بالا)*وجود نظام ارتباطی بین واژه ها از طریق ایجاد ارجاع، سطح اطمینان را افزایش می دهد*ثبات و یکدستی واژگان

معایب زبان نمایه سازی کنترل شده: . نیاز به نیروی انسانی متخصص و ماهر                امکان بروز خطا* هزینه بر بودن3. وقت گیر بودن4. محدودیت نقاط بازیابی و در نتیجه جامعیت کمتر5. توجه کمتر به نیاز واقعی کاربران و دور بودن از زبان کاربران6. عدم آشنایی کاربران با اصطلاحات پذیرفته شده و نیاز به آموزش برای استفاده7. دشواری در افزودن مفاهیم جدید به نمایه و اصطلاحنامه (عدم روزآمدی)

v     نتیجه گیری: انتخاب زبان نمایه سازی از مهم ترین مراحل نمایه سازی است

v     انتخاب زبان نمایه سازی به نوع نمایه سازی، سیاست گذاری نمایه و نوع مدرک بستگی دارد

با توجه به محدودیتهایی که برای هر یک از زبانهای نمایه سازی وجود دارد امروزه توجه به سوی ترکیب زبانهای نمایه سازی به منظور بازیابی نتایج بیشتر و دقیق تردر اکثر پایگاههای اطلاعاتی معطوف است

v   کنترل یا مهار واژگان: تعریف: تعیین اصطلاح مورد استفاده در نمایه سازی و نحو یا دستور کار، همچنین تعداد لغات و شکل اصطلاحات

v      چرا از کنترل واژگان استفاده می کنیم؟برای

1. کنترل مترادفها با هدف:

 الف) بازیابی اثربخش

  ب) پرهیز از همپوشانی در کاربرد مفاهیم مشابه

 ج) انتخاب یک واژه استاندارد و ارجاع از سایر واژه های مترادف به آن

2. تعیین روابط سلسله مراتبی بین اصطلاح ها

3. کنترل شکل واژه ها (تمایز قائل شدن بین کلمات هم نگاشت مانند شیر)

واژگان را کنترل میکنیم تا به نتایج زیر برسیم: وحدت گونه ای: شناسایی رابطه های موجود در هر بافت معنایی و شکل دهی مقادیر(عناصر) موجود در هر نمونه از آن گونه بافتی بر اساس رابطه ها

               مشخص نمودن اصطلاحات اعم، اخص و وابسته و برقراری رابطه سلسله مراتبی

اهمیت:

1.آشنایی با مفاهیم و زمینه های موضوعی یک علم و آشنایی با اندیشه های مرتبط با این مفاهیم (کاربرد؟)

2. این امکان ایجاد میگردد که به هنگام بازیابی، ادامه جستجو به صورت نظام یافته قابل تجدید یا گسترش باشد (کاربرد؟)

¢        وحدت نمونه ای: رسیدن از پراکندگی معنایی به تراکم معنایی(گردآوری واژگان وابسته در یک جایگاه و ایجاد یک بافت معنایی متمرکز)

¢        وحدت ساختاری(صرفی و نحوی): کنترل تغییر پذیری ساختارهای صرفی و نحوی عبارات (واژگان) و تک ساختاری شدن آنها

¢        وحدت واژه ای(وحدت عبارتی): تک واژه ای یا تک عبارتی شدن یک معنا از طریق پذیرفتن یکی از واژه ها به عنوان واژه مرجح

¢        ویژگیهای مهم واژگان کنترل شده: توجه بیشتر به کاربر و جستجوگر

¢    متکی بر متون و نیازهای اطلاعاتی استفاده کنندگان بالقوه و بالفعل نظام باشد ( بدین مفهوم که تعیین موضوعها و ارتباط بین آنها با آنچه در مواد اطلاعاتی مشاهده می شود شباهت داشته باشد و اساس کار اطلاعاتی باشد که به عنوان درونداد به نظام وارد می شود نه ملاحظات نظری و تقسیم بندی های شناخته شده دانش) نتیجه: نظام پویایی خود را حفظ می کند.

¢        خاص شدن واژگان در حد کافی و مورد نیاز باشد

نتیجه گیری:\ با توجه به آنچه مطرح شد پیش بینی عوامل زیر در حجم و ساختمان واژگان کنترل شده ضروری است:

  • Ø      محدوده موضوع: بدین مفهوم که موضوعات اصلی از جانبی تفویض گردد
  • Ø      وسعت مجموعه و افزایش نسبی آن: هرچه تعداد واحد اطلاعاتی که باید نمایه سازی شود بیشترباشد زبان بازیابی نیز باید مفصل تر باشد
  • Ø      فنون و ابزار ذخیره و بازیابی: در نمایه سازی خودکار، انتخاب واژگان دقیق تر است
  • Ø      خصوصیات پرسش ها: پرسش های تخصصی  حساسیت درانتخاب دقیق تر واژگان را می طلبد
  • Ø      نوع استفاده کنندگان نظام: پژوهنده یا متخصص اطلاع رسانی؟
  • Ø      ابزارهای کنترل واژگان: اصطلاحنامه (Thesaurus)
  • Ø      سرعنوانهای موضوعی (Subject headings)
  • Ø      نظام های رده بندی (Classification scheme)
  • Ø      هستی شناسی (Ontology)

 توجه: معمولاً در نمایه سازی از اصطلاحنامه استفاده می شود.

تعریف اصطلاحنامه

q   درنمایه سازی به روش زبان کنترل شده ملزم به استفاده از سیاهه واژه های کنترل شده هستیم که به آن اصطلاحنامه می گویند. اصطلاحنامه بنا به تعریف انسی* (ANSI) عبارتست از:

q   مجموعه ای از واژه ها و عبارتها که روابط سلسله مراتبی، مترادفات، وابستگی ها و دیگر روابط بین مفاهیم را ارائه می کند و هدف آن ایجاد واژگانی استاندارد برای ذخیره و بازیابی اطلاعات است.

q    اصطلاحنامه به عنوان مجموعه لغات کنترل شده، وسیله ای است که برای کمک به بازیابی موثر اطلاعات  با هدف راهنمایی نمایه ساز و جستجوگر در انتخاب اصطلاحات یکسان برای بیان یک مفهوم خاص یا ترکیبی از مفاهیم طراحی می شود (صنعت جو، 1383)

تفاوت  اصطلاحنامه و سرعنوانهای موضوعی:

اصطلاحنامه: ساختار سلسله مراتبی*ارجاعهای اعم و اخص تفکیک شده اند*ارجاع خاص به عام*اصطلاحات اخص بیشتر*بیشتر گرایش به زبان طبیعی دارد*تقسیم های فرعی غیر موضوعی به کار نمی رود و ترکیب از طریق همارایی اصطلاح هاست*نمایش روابط معنایی عمیق و گسترده*بیشتر مناسب محیط الکترونیکی (به علت پس همارایی)

 

 

فهرست سرعنوانهای موضوعی: فاقد ساختار سلسله مراتبی*ارجاع نیز نگاه کنید به حالتی   دو گانه دارد (هم مرتبط و هم اخص)*کمتر ارجاع خاص به عام مشاهده می شود*اصطلاحات اخص کمتر*کمتر گرایش به زبان طبیعی دارد*از انواع تقسیمات فرعی برای اخص کردن اصطلاح ها استفاده می شود*روابط معنایی به گستردگی اصطلاحنامه ها نیست*بیشتر مناسب منابع چاپی

 

شیوه استفاده از اصطلاحنامه ((Thesaurusاختصارات رایج در اصطلاحنامه عبارتند از:

ی. د. = یادداشت دامنه       SN = Scope Note    

توضیحی است که در زیر برخی از اصطلاحات وجود دارد و موارد استفاده و حدود معنایی و کاربرد  اصطلاح را بیان می دارد.

جنگلبانی

ی. د. علم توسعه، مراقبت و ازدیاد جنگلها، مدیریت رویش و رشد درختان جنگلی

هستی‌شناسی (انتولوژی:   Ontologyتعریف:یک هستی شناسی  مجموعه ای از مفاهیم ( موجودیتها، نگرشها و فرایندها)،  تعاریف آنها و روابط داخلی میان آنها است. بنابراین در ساده ترین مفهوم هستی شناسی  را می توان مانند اصطلاحنامه ها، واژگان لغات کنترل شده دانست؛ با این تفاوت که مفاهیم یک حوزه خاص با روابط معنایی خاص با توجه به حوزه موضوعی و بعضاَ متفاوت از حوزه های موضوعی دیگر به شکل خاصی طبقه بندی می شوند که هدف آنها نمایش مفاهیم در قالب زبان طبیعی است. بدین سبب بعضی آنرا نوع تکامل یافته اصطلاحنامه و برخی دیگر آنرا ابزاری کاملا جدید می دانند“ (آنسکفلد).

هستی‌شناسی انتولوژی   انتولوژی شاخه‌ای مهم از فلسفه است که به شناخت هستی، چیستی/ماهیت می‌پردازد.*هستی شناسی توسط پژوهشگران حوزه هوش مصنوعی و مهندسی دانش برای رده بندی مفاهیم بر روی وب مورد توجه قرار گرفت.*انتولوژی‌ها ویژگی‌های اصطلاحنامه‌ای رده‌بندی شده را دارند. *قواعد تدوین مقولات و سلسله مراتب در انتولوژی‌ها بسیار دقیق‌تر است Ontology
مقایسه اصطلاحنامه با هستی شناسی:با اصطلاحنامه : قابل درک برای کاربران انسانی*

      سیاهه ای از واژگان قابل کاربرد برای منابع موجود*روابط معنایی تا حدودی محدود است*استفاده مجدد از اطلاعات موجود در اصطلاحنامه در پایگاه  های دیگر امکان پذیر نیست.

هستی شناسی: قابل کاربرد توسط انسان و ماشین*سیاهه گسترده ای از واژگان یک حوزه موضوعی*روابط معنایی عمیق و واضح*امکان استفاده مجدد از دانش گردآمده به سهولت امکان پذیر است( به علت زبان تعریف شده در قالب استانداردهای خاص )

چکیده : تعریف طبق تعریفواژه‌نامه انجمن کتابداران امریکاچکیده خلاصه کوتاهی از یک کتاب، جزوه، یا مقاله همراه با نکات اصلی آن است. چکیده نکات عمده متن اصلی را چنان ارائه می‌کند که خواننده می تواند برای مراجعه یا عدم مراجعه به اصل مقاله تصمیم‌گیری کند.

تفاوت بین چکیده و خلاصه: خلاصه خلاصه به هر نوع فشرده‌ای از یک متن اطلاق می‌شود که ممکن است ملخص، فشرده، مستخرجه، و چکیده را دربر گیرد .*هر چکیده‌ای خلاصه است *خلاصه الزامی برای درج مهمترین مباحث ندارد *تهیه آن آسان است*در خلاصه اطلاعات کمتری ارائه می شود و نوشتن و ترکیب آن به عهده شخص خاصی نیست

چکیده:امّا چکیده خلاصه‌ای است که از قواعد دقیق و انضباط علمی پیروی می‌کند *هر خلاصه‌ای چکیده نیست *چکیده ملزم به درج مهم‌ترین مباحث است *تهیه آن به دانش و تجربه نیاز دارد*بسته به نوع چکیده اطلاعات ارائه شده و چکیده نویس متفاوت است

 

 

 

انواع چکیده
چکیده‌ها را می‌توان از دیدگاه‌های مختلف تقسیم کرد

1-از لحاظ لحن:چکیده راهنما*چکیده تمام‌نما*چکیده تلفیقی

2-از لحاظ تهیه‌کننده :*-چکیده مؤلف *-چکیده حرفه‌ای

3-از لحاظ حجم :چکیده تلگرافی (یا عنوانی) *چکیده تفضیلی

4-از لحاظ گرایش:چکیده عام*چکیده سویافته

5-از لحاظ شیوه تهیه:چکیده دستی*چکیده ماشینی

انواع چکیده: از لحاظ لحن: چکیده راهنما[Indicative ] ؛

  1. 1.                        چکیده تمام‌نما[Informative/Comprehensive]  
  2. 2.                        چکیده تلفیقی[Compound] .

چکیده تلفیقی به گونه‌ای تهیه می‌شود که بخشی به‌صورت تمام‌نما و بخشی به‌صورت راهنماست. ممکن است سیاستگذاری بر تهیه چکیده تمام‌نما برای مدارک باشد، اما ماهیت برخی بخش‌های متن به‌گونه‌ای است (مانند جداول و نمودارها) که امکان چکیده کردن آنها وجود ندارد. بنابراین، بخشی را که به متن می‌پردازد به صورت تمام‌نما و بخشی که به این گونه موارد اشاره می‌کند به‌صورت راهنما تهیه می‌شود

مقایسه چکیده راهنما و تمام نما: راهنما: صرفآ آنچه را سند درباره آن است توصیف می‌کند *ممکن است درباره نتایج به‌دست آمده سخن بگوید *ممکن است حاوی اطلاعاتی درباره هدف، دامنه، یا روش‌شناسی باشد، اما دربرگیرنده پیشنهادها نیست*غالبآ برای حوزه‌های علوم و فنون کاربرد دارد

 

انواع چکیده: از لحاظ تهیه ‌کننده: چکیده مؤلف *چکیده حرفه‌ای

 

انواع چکیده: از لحاظ حجم: چکیده تلگرافی (یا عنوانی) *-به‌طور بسیار کوتاه، و کمتر به شکل جمله، بیان می‌شود *در حقیقت این نوع چکیده ممکن است رشته‌ای از اصطلاحات بدون عناصر نحوی باشد

چکیده تفصیلی :به طور مفصل و با جمله بندی مناسب ارائه می شود

 

  1. 1.            انواع چکیده از لحاظ گرایش: چکیده عام
  2. 1.          تمرکز موضوع چکیده دقیقآ تابع محوریت متن اصلی است
  3. 2.          چکیده سویافته
  4. 1.      بر اساس علائق خاصی سوگیری می‌کند
  5. 2.      ممکن است هدف و غرض کلی نویسنده ناچیز شمرده شود
  6. 2.          انواع چکیده از لحاظ شیوه تهیه: چکیده دستی
  7. 1.      عامل نیروی انسانی چکیده را تهیه می‌کند امّا محصول نهایی ممکن است از طریق رایانه یا به شکل دیگری عرضه شود
  8. 3.    چکیده ماشینی
  9. 1.      چکیده‌ها به کمک رایانه و براساس روش‌های آماری خاصّی تهیه می‌شوند.
  10. 2.      برای تهیه این نوع چکیده، ابتدا کلمه‌هایی را که در آن متن بیش از سایر کلمات به کار رفته و بسامد آنها بیشتر است انتخاب می‌کنند؛
  11. 3.   سپس جمله‌هایی را که شامل این کلمه‌ها هستند و نیز محل استعمال آنها را پیدا کرده و به هر جمله بر حسب تعداد دفعاتی که این کلمه‌ها در آن آمده و نیز محلی که به کار رفته نمره‌ای اختصاص می‌دهند
  12. 4.       و سرانجام از میان این جمله‌ها آنهایی را که امتیاز بیشتری آورده‌اند انتخاب می‌کنند؛
  13. 5.      در نتیجه چکیده ماشینی مجموعه‌ای از جمله‌های ویژه‌ای است که در یک نوشته عینآ وجود دارد
  14. 3.            کاربرد چکیده ها: انتخاب را آسان میکند
  15. 4.                  صرفه جویی در زمان و هزینه
  16. 5.      خدمات آگاهی رسانی جاری(ابزار اساسی آگاهی رسانی در زمینه انتشارات جاری خدمات چکیده نویسی است)
  17. 6.                  کمک به نمایه سازان در شناسایی سریع موضوع(بویژه در گزارشات و مقالات)
  18. 7.                  پرهیز از دوباره کاری
  19. 8.   بازیابی اطلاعات (تسهیل شناسایی مدارک چاپی و ایجاد امکان دستیابی به مدارک ذخیره شده بویژه در نظام های بازیابی رایانه ای که در آن متن چکیده در قالبی قابل جستجو ذخیره شده)
  20. 9.      دسترسی به منابع خارجی

بازنمون اطلاعات: اطلاعات کتابشناختی :اهمیت و کارکرد

1. توصیف مدرک، به صورتی که ماهیت، محتوا و دامنه فکری ـ هنری اثر از طریق داده‌های توصیفی (اطلاعات کتابشناختی) به خواننده ارائه شود.

2. ایجاد قابلیت تمایز میان موجودیتهای کتابشناختی خاص، به شکلی که تفاوتهای میان چاپها و ویرایشهای مختلف یک اثر از یکدیگر تشخیص داده شود

3. ایجاد قابلیت نشان دادن ارتباط میان آثار و مدارک مرتبط؛بدین معنا که روابط میان موجودیتهای مختلف کتابشناختی نشان داده شوند (به عنوان مثال، رابطه میان یک اثر معروف با آثار وابسته به آن مانند برگزیده‌ها، اقتباسها، ترجمه‌ها، نقدها، تفسیرها و ...).

4. ایجاد قابلیت بازیابی آثار و یا موجودیتهای کتابشناختی خاص، به صورتی که بتوان هر اثر را با داشتن حداقل اطلاعات (حد اقل شناسه‌ها) بازیابی کرد

5. ایجاد قابلیت مکان یابی مدرک جهت دسترسی فیزیکی، که به طور معمول از طریق شماره راهنما، شماره ثبت، شماره شابک و مانند آنها حاصل می‌شود

6. ارائه اطلاعات کلی برای اهداف استنادی (مأخذ دادن در مقاله‌ها، پایان‌نامه‌ها، کتابها و ...) که با ارائه برخی اطلاعات کتابشناختی اصلی تحقق می‌یابد

7. ارائه اطلاعاتی در بارة چگونگی ایجاد، نگهداری، و انتقال هر پیشینه به منظور مدیریت و پشتیبانی پایگاه (به عبارت دیگر، حفظ نظم و مدیریت) که از طریق افزودن برخی داده‌ها و اطلاعات به پیشینه‌ها (مانند تاریخ ایجاد رکورد، نام فهرستنویس، منبع انتقال پیشینه، تغییرات خود کتابخانه در پیشینه‌های کپی شده و ...) حاصل می‌شود

q   کارکردهای اطلاعات کتابشناختی درفهرستهای پیوسته کنونی: بازیابی کلیه موجودیتهای کتابشناختی شامل:1.  آثاری که یک فرد یا یک تنالگان مسئول انتشار آن است.2.  برداشتهای مختلف از یک اثر   3.  آثار دارای یک موضوع واحد      4. آثار دارای یک فروست واحد

q           -بازیابی یک موجودیت کتابشناختی خاص:

1. هنگامی که نام فرد یا تنالگان مسوول تدوین آن معین باشد

2.  زمانی که عنوان آن مشخص باشد

3. زمانی که شناسه‌های خاصی از آن در دسترس باشند

q     شناسایی یک اثر

q     شناسایی برداشتی خاص از یک اثر

q     شناسایی یک موجودیت کتابشناختی خاص

q     انتخاب یک اثر

q     انتخاب اقتباسی خاص از یک اثر

q     انتخاب یک موجودیت کتابشناختی

q   دسترسی به آن موجودیت کتابشناختی.

¢        بازنمون اطلاعات: توصیف اسناد و مدارک

به منظور توصیف اسناد و مدارک ارائه اطلاعات توصیفی از جمله پدیدآور، عنوان  و .... و تحلیل موضوعی آن مورد توجه قرار می گیرد.

  1. پدیدآور:

نام افراد مسئول محتوای فکری/ هنری مدارک، به دلایل زیر مورد نیاز است: 1ـ برای جستجو و بازیابی 2ـ گردآوری آثار یک فرد در کنار هم 3ـ مرتب‌سازی پیشینه‌ها برای تمایز میان آثار مختلف و نیز مرور نمایه‌های نام افراد 4ـ ایجاد تمایز میان مدارک دارای عنوانهای مشابه و 5ـ شناسایی مدارک برای سفارش، امانت و امانت بین کتابخانه‌ای.

عنوان:عنوان یکی از مهمترین مشخصه های مربوط به شناسایی و بازیابی اثر بوده و معمولاً پس از خلق یک اثر، اولین کار پیش از انتشار، تعیین عنوان آن است

3. اطلاعات ویرایش : «شرح ویرایش» بیشتر نمایشگر تغییر محتوای فکری اثر نسبت به مدارک پدیدآمده از یک ریشه است تا تغییرات فیزیکی. این عنصر، برای شناسایی و توصیف بیشتر مدارک به کار رفته و میزان روزآمدی اثر رانشان می دهد 4. وضعیت نشر: اطلاعات مربوط به محلهای نشر، نام ناشران و تاریخهای نشر:

در حوزه ناشران و کتابفروشان هر یک از داده‌های وضعیت نشر، اهمیت فراوانی در شناسایی، بازیابی و مدیریت پایگاه دارد.5- مشخصات ظاهری (جزئیات و ابعاد فیزیکی مدرک ):

 این عناصر، توصیف ظاهری را امکان‌پذیر ساخته، به شناسایی بهتر ماهیت مدارک کمک می‌نماید

6. اطلاعات فروست:

اطلاعات فروست، کارکردی سه گانه دارد:

¢        توصیف بیشتری از مدرک ارائه داده و نشانگر گرایش موضوعی و مورد علاقه ناشر است.

¢        مدارک دارای فروست مشترک را از یک ناشر، از یک نویسنده و یا از یک حوزه موضوعی در کنار هم گردآوری می‌کند.

¢        می‌تواند در جستجو و شناسایی مدارک استفاده شود. این گونه اطلاعات برای ناشران، کتابفروشان، کتابداران و کاربران اهمیت دارد.

7-. یادداشتها:

یادداشتها نه تنها توصیفهای بیشتر و رویکردهای بهتری برای شناسایی محتوای مدارک هستند، بلکه می‌توانند اهداف فهرست را بویژه در محیطهای شبکه‌ای که در آنها دسترسی فیزیکی به مدرک امکان‌پذیر نیست، تحقق بخشند.

یادداشتها بیشتر از هر نوع عنصر داده‌ای دیگر، روابط متفاوت میان آثار را نشان می‌دهند (به عنوان مثال چنانچه یادداشت مندرجات نیز نقطه تحلیلی دسترسی به شمار آید، ثبت اسامی پدیدآورندگان و عنوانهای کامل، قابلیت بازیابی را بهبود می بخشد).

فراداده /Metadata

 

¢     The term "meta" comes from a Greek word that denotes  something of a higher or more fundamental nature. Metadata, then, is data about other data.

¢     The term refers to any data used to aid the identification, description and location of networked electronic resources

¢     ابرداده اطلاعاتی درباره منابع اطلاعاتی" است و اصطلاحآ به اطلاعات توصیفی سازماندار برای کمک به شناسایی، توصیف، مکان‌یابی، و مدیریت منابع موجود در شبکه وب اطلاق می شود(دایره المعارف کتابداری)

¢        ابرداده داده هایی است که اشیاء داده ای دیگر را تشریح می کند (گیلوری)

Defining Metadata

Does data about data mean anything?

—        Librarians equate it with a complete bibliographic record

—        Information technologists equate it to database schema or definitions of the data elements

—        Archivists include context information, restrictions and access terms, index terms, etc.

Bibliographic Metadata

¢     Providing a description of the information package along with other information necessary for management and preservation

¢     Encoding

¢     Providing access to this description

¢     Predominantly discovery and retrieval

Encoding

¢     Surrogate records are encoded by assigning tags, letter, or words

¢     Why encode?

  •        For display
  •       Provide access
  •        Integration of surrogate
  •        Management

Beyond Discovery and Retrieval

Gilliland-Swetland (1998) explains “metadata also documents how that objects behaves, its functions and use, relationship to other objects and how it should be managed”. 

 

 

ضرورت استفاده از ابرداده:

  • رشد شبکه جهانی اینترنت و وب که:

ü       انواع منابع اطلاعاتی به شکل الکترونیکی را بوجود آورده

ü      شیوه های اشاعه اطلاعات مختلف را بوجود آورده

ü      نیازهای متنوع کاربران را به همراه داشته

ü      مدیریت و کنترل منابع را دشوار کرده

  • مشکلات مربوط به تولید و نگهداری پیشینه های ماشین خوان مارک (زمان بر بودن و هزینه بر بودن)

بنابراین:

ü      نیاز به ابزاری نظام مند برای دسترس پذیرکردن اطلاعات و قالب فهم کردن منابع اطلاعاتی

ü      نیاز به ابزاری برای سازماندهی موثر و کارآمد اطلاعات در محیطهای دیجیتال

ü      نیاز به ابزاری برای نمایه سازی اطلاعات مفید نه همه اطلاعات

ü      نیاز به قالبی استاندارد برای ذخیره و بازیابی اطلاعات اینترنتی برای افراد مختلف

ü      نیاز به تولید پیشینه‌هایی که اطلاعات آن از نمایه بیشتر بوده و در عین حال از یک پیشینه فهرستنویسی خلاصه‌تر باشد

v      کاربرد ابرداده: مدیریت منبع:

  • §        پالایش اطلاعات از طریق مدیریت دسترسی به منابع بر اساس حق مولف ، حفاظت اطلاعات دیجیتالی و ...
  • §        مدیریت اطلاعاتی که دسترسی به آنها محدود است.
  • §         تحلیل محتوا و نمایه‌سازی طیف گسترده‌ای از انواع اطلاعات بدون نیاز به عرض باند شبکه
  • §        نظم بخشیدن به منابع اطلاعاتی موجود در اینترنت

v      توصیف منبع:

  • §        توصیف منابع بویژه منابع غیر متنی (فایلهای صوتی، تصاویر دیجیتالی، پایگاههای اطلاعاتی) با بیان ویژگی های منبع به شکلی ساختارمند
  • §        امکان تطبیق، اشتراک، یکپارچه سازی منابع اطلاعاتی ناهمگن شبکه اینترنت

v      کشف منبع:

  • §        شناسایی و مکان یابی منبع
  • §        بازیابی و دسترسی به منبع

عناصر و اجزاء تشکیل دهنده ابرداده

  1. عناصری که به ظاهر فیزیکی منبع مربوط است مانند تاریخ، شکل یا قالب
  2. عناصری که به محتوای منبع یا سایت مربوط است مانند عنوان، زبان، موضوع و ...
  3. عناصری که با مالکیت منبع در ارتباط است مانند مولف، همکار

q      انواع ابرداده: ابرداده توصیفی

به صفاتی از عناصر اطلاعاتی که توصیف شده و می تواند مفصل باشد

مانند: عنوان، کلیدواژه، موضوع ، چکیده

 با توصیف یک تصویر در میان صدها متن می توان ابرداده توصیفی ایجاد نمود

q   ابرداده ساختاری

ساختار مفهومی یا معنایی یک منبع را معرفی می کند

ساختار و رابطه مجموعه ای از عناصر رقومی را توصیف می کند مانند ارتباط بین بخش ها و فصل ها

ابرداده اجرایی

اطلاعات مورد نیاز برای مدیریت یک عنصر

اطلاعات مورد نیاز برای حفاظت از آن

اطلاعات مورد نیاز برای تولید یک عنصر، فرایند ثبت اثر و ...

Different Communities
….Different Metadata

¢      Developers of the Interoperability of Data in E-Commerce Systems (indices) identified metadata for protecting intellectual property rights of creators and publishers.

 

¢      The Research Library Group’s Working Group on Preservation Issues of Metadata identified metadata for  “digital master files that have preservation-based intent”.

Metadata Facts to Remember

¢      Metadata does not have to be digital

¢      Metadata relates to more than the description of an object.

¢      Metadata can come from a variety of sources

¢      Metadata continue to accrue during the life of an information object or system.

¢      One information object's metadata can simultaneously be another information object's data.

¢        ایجاد ابرداده: ایجاد ابرداده حین خلق منبع

  • §    عناصر ابرداده ای از طریق استانداردهایی چون زبان نشانه گذاری متنHTML، زبان نشانه گذاری گسترش پذیر XML، و زبان نشانه گذاری استاندارد عمومی SGML کدگذاری می شود

¢        ایجاد ابرداده پس از تولید و اشاعه منبع به عنوان بخشی از فرایند فهرست نویسی (این روش هزینه بر و زمان بر است)

( اولویت با روش اول)

تمرین

درباره زبان های نشانه گذاری فوق مطالعه نموده و تفاوت بین آنها را دریابید

مدلهای درج ابرداده: مدلهای‌ گوناگونی‌ برای‌ درج‌ ابرداده‌ در صفحه‌های‌ وب‌ وجود دارند که‌ به‌ نمونه ای از مهمترین‌ آنها اشاره‌ می شود.


 مدل هسته دوبلین/ دوبلین کور

Dublin Core: DC.

  • §    طرح ابرداده ای دوبلین کور نوعی استاندارد است که مجموعه ای از عناصر ابرداده را برای سهولت دسترسی به منابع الکترونیکی ارائه می دهد.
  • §    شامل‌ 15 عنصر فراداده ای‌ مشترک‌ برای‌ رسانه‌های‌ دیجیتالی‌ و غیردیجیتالی‌ (مثل‌ کتابخانه‌های‌ الکترونیکی‌، سنتی‌ و موزه‌ها) است‌

Dublin Core

¢   Metadata to improve information retrieval of internet resources

¢   Developed predominantly by the bibliographic community.  Elements similar to bibliographic surrogate

Dublin Core Elements

¢   Intellectual Property

                                                      

¢             Contributor

¢             Creator

¢             Publisher

         Rights

¢                      Content

—       Coverage

—       Description

—       Type

—       Relation

—       Source

—        Subject

—        Title

¢                               Dublin CoreInstantiation

—         Date

—         Format

—         Identifier

—         Language

 Element