وب

Archive of SID
فصلنامه دانش شناسی
(علوم کتابداری و اطلاع رسانی و فناوری اطلاعات)
سال سوم، شماره ( 12 ) بهار 1390
نقش وب معنایی در بازیابی اطلاعات
شهرزاد شریفی 1
مریم شعبان زاد 2
سیما فیاض 3
چکیده
هدف: معرفی نسل آتی وب که وب معنایی است و از طریق تجهیز اطلاعات با اجزاء معناشناختی مشخص
همکاری میان انسان و رایانه را فراهم می نماید. به بیانی دیگر وب معنایی نوعی روش برای کد گذاری و
بازیابی اطلاعات است به گونه ای که ماشین ها (رایانه ها) قادر به پردازش و فهم اطلاعات باشند.
روش شناسی: در این مقاله با استفاده از روش کتابخان های و بررسی متون اسناد، در ابتدا به گردآوری
اطلاعاتی در مورد شبکه جهانی وب پرداخته شده است و سپس لزوم ایجاد وب معنایی، ویژگی ها و مزایا و
مشکلات وب معنایی و نیز استفاده از فناوریهایی نظیر زبان نشانه گذاری توسعه پذیر(اکس.ام.ال 4) ، چار
چوب توصیف منبع( آر.دی.اف 5) و هستی شناسی وب که از مهمترین موضوعات وب معنایی هستند مورد
بررسی قرار گرفته است.
نتایج: نتایج این پژوهش، نشان می دهد که هستی شناسی ها ستون فقرات وب معنایی را تشکیل می دهند و
وب معنایی با به خدمت گرفتن هستی شناسی ها از طریق فراهم کردن ساختار مفهومی برای داده ها، این
امکان را برای ماشین های به هم مرتبط فراهم می کند تا به گونه ای هوشمند اطلاعات را یافته و در اختیار
جستجو گر قرار دهند. با تشکیل وب معنایی، کتابخانه های دیجیتال می نوانند معنا محور شوند و همچنین
تشکیل وب معنایی، تحول بزرگی در بازیابی اطلاعات و دسترسی به بانکهای اطلاعاتی پیوسته ایجاد می کند.
کلید واژه ها: وب معنایی، زبان نشانه گذاری توسعه پذیر (اکس.ام.ال)، چار چوب توصیف منبع (آر.دی.اف)،
هستی شناسی وب، بازیابی اطلاعات
مقدمه
اینترنت بزرگترین شبکه جهانی الکترونیکی، نمونه بخشی از چشم اندازهای تکنولوژیهای اطلاعاتی و ارتباطی نوین به شمار
( می آید. عصری که ما در آن به سر می بریم عصر توانایی انتخاب بهترین اطلاعات در زمان مناسب است. (غفوری، 1383
شبکه جهانی وب به عنوان مکانی برای اطلاعات طراحی شده است، با این هدف که برای جوامع انسانی مفید واقع شود اما
1 sharifi365@gmail.com دانشجوی کارشناسی ارشد کتابداری و اطلاع رسانی دانشگاه آزاد اسلامی، واحد تنکابن
2 shabanzadmaryam@gmail.com دانشجوی کارشناسی ارشد کتابداری و اطلاع رسانی دانشگاه آزاد اسلامی، واحد تنکابن
3 sima_fayyaz@yahoo.com دانشجوی کارشناسی ارشد کتابداری و اطلاع رسانی دانشگاه آزاد اسلامی، واحد تنکابن
4XML
5 RDF
www.SID.ir
Archive of SID
نقش وب معنایی در بازیابی اطلاعات. / شهرزاد شریفی، مریم شعبان زاد و سیما فیاض
42
کامپیوترها هم از قابلیت سهیم شدن و کمک کردن نیزبرخوردارند. طبق یافته های پژوهشی جست و جو گران بی پروا از وب
برای بازیابی 1 منابع اطلاعاتی استفاده می کنند، چنین جایگاهی از سویی شرایط بی سابقه ای در فرآیند ارائه و جستجوی
اطلاعات پدید آورده است اما از سوی دیگر چالش هایی را نیز به همراه دارد. شبکه جهانی وب که ابتدا به منظور فراهم کردن
بستر ارتباطی بین پژوهشگران بوجود آمده بود اکنون به دلیل سادگی آن که تا حدود بسیاری ناشی از سادگی زبان
اچ.تی.ام.ال 2 است، به بستری برای عرضه هر گونه اطلاعات از فردی و اجتماعی گرفته تا خانوادگی، علمی، ورزشی، سرگرمی و
مانند آن تبدیل شده است این امر چالش بزرگی است فراروی پژوهشگرانی که در پی اطلاعات دقیق و مرتبط هستند یکی از
راههایی که برای مهار رشدی چنین افسارگسیخته و نیز ایجاد زمینه های مناسب و آسان برای بازنمایی و جستجوی اطلاعات
به آن اندیشیده شده است وب معنایی 3 است. (کشاورز، 1386 ، ص 88 ) وب معنایی شکل گسترش یافته وب کنونی است که
انسان و کامپیوتر را قادر می سازد تا به شکل بهتری با یکدیگر کارکنند. بر اساس آرشیوها، ابزارهای متعدد کنونی در تفسیر
معنایی صفحات وب یا ساختار منابع اطلاعاتی به طور خودکار پیشرفت داشته اند مانند اکس.ام.ال و پایگاه های مرتبط بوسیله
( استفاده از آر.دی.اف 4. (کوهلر 5 و دیگران، 2006 ، ص 744
این مقاله سعی دارد پس از ارائه مفاهیم و تعاریف وب معنایی و لزوم ایجاد آن، ویژگی ها و مزایا و مشکلات و ساختار آن را
شرح داده و سپس به تحول در بازیابی اطلاعات که از ملموس ترین نتیجه تشکیل وب معنایی است بپردازد.
تعریف و مفهوم وب معنایی
تا کنون تعریف دقیقی از وب معنایی ارائه نشده است، حتی بر سر چگونگی تعریف آن نیز اختلاف نظرهایی وجود دارد اما
بطور خلاصه وب معنایی در پی آن است که اطلاعات را به گونه ای سازماندهی و ذخیره کند که جست و جو و بازیابی اطلاعات
توسط ماشین (رایانه) قابل پردازش و حتی قابل فهم باشد به بیانی دیگر وب معنایی نوعی روش برای کد گذاری و بازیابی
اطلاعات است به گونه ای که ماشین ها به پردازش و فهم اطلاعات قادر باشند. (کشاورز، 1386 ،) وب معنایی، شبکه ای از
اطلاعات در مقیاس جهانی است به نحوی است که پردازش آنها توسط ماشین ها به سادگی امکان پذیر است. وب معنایی برای
اولین بار توسط برنرزلی معروف به پدر وب در سال 1998 معرفی شد، اما تعریف رسمی آن که شامل یک معماری هفت لایه
است در سال 2001 ارائه گردید. ( خاتمی، آل شیخ ، همراه ، 1386 ، ) وب معنایی گسترش وب کنونی است با این نظر که به
اطلاعات موجود در آن، معنا و مفهوم کاملا تعریف شده ای داده شود تا رایانه ها و انسان ها را قادر سازد که در تعامل بهتر با
یکدیگر کار کنند. این وب که می توان آن را " وب آگاه 6" نیز نامید هدفش اطلاعاتی است که معنای آن توسط ماشین قابل
پردازش باشد. این امر زمانی میسر است که سطوح بالای میانکنش پذیری فراهم گردند. ( صفری، 1383 ،) در وب معنایی
اطلاعات به شکلی در وب قرار می گیرند که معنای آن قابل دسترس توسط ماشین باشد و همچنین در آن ماشین ها بتوانند
مانند انسان ها محتویات وب را پردازش کرده و در مفهوم عام ماشین ها نیز مانند انسان بتوانند آنچه را مرور کرده اند را
بفهمند. وب معنایی شامل داده های هوشمند وب است که توسط ماشین ها قابل پردازش است. وب معنایی مشابه شبکه
اینترنت است با این تفاوت که متشکل از اطلاعات ماشینی با هدف برنامه ریزی می باشد در صورتی که شبکه جهانی اینترنت
متشکل از صفحات خواندنی با هدف انسانهاست. وب معنایی گستره ای از وب رایج می باشد که اطلاعات به صورت معانی
557 ) وب معنایی دارای فضای اطلاعاتی ، 2003 ، ص 558 ، ومفاهیم تعریف شده به آن داده می شود. (گوها، مک کول 7
پچیده ای است زیرا نه تنها دربر گیرنده منابع می باشد بلکه روابط بین آنها را نیز در بر می گیرد . در وب معنایی دو مسئله
1 retrieval
2 Html
3 Semantic web
4 Resource Description Framework
5 kohler
6 Knowledgeable web 1
7 Guha, McCool
www.SID.ir
Archive of SID
فصلنامه دانش شناسی (علوم کتابداری و اطلاع رسانی و فناوری اطلاعات) سال سوم، شماره ( 12 )بهار 1390
43
مطرح می باشد: فرمت های تبادل اطلاعات (در حالی که در وب اصلی فقط به تبادل اسناد پرداخته می شود) و زبان چگونگی
(،2008 ، ثبت و ضبط اطلاعات در ارتباط با اجزای دنیای واقعی. ( ناینگ، جین، وو 1
هدف وب معنایی این است که وب را بیش از آن که به شبکه ای از مدارک تبدیل کند به شبکه ای از داده ها تبدیل
نماید منابع وبی نباید شامل رشته های یکپارچه متنی باشند بلکه آن ها باید قادر باشند که معنای موجود در متن خود را
نیز آشکار سازند. البته منظور از معنا عبارت است ا ز معنایی که توسط ماشین قابل پردازش باشد. برای نیل به هدف فوق،
وب معنایی باید بین تصورات و واقعیت های موجود در منابع وبی تعامل برقرار نماید. (کوبل، 1378 ،) ازدیگر اهداف وب
معنایی آنست که سیستم مدیریت دانش بهتری فراهم کند تا دانش در فضای مفهومی بر اساس معنای آن، سازمان دهی شود،
که بر این اساس ابزارهای اتوماتیک نگهداری از اطلاعات با بررسی ناسازگاری و استخراج دانش جدید مورد حمایت قرار
می گیرند و همچنین جستجو بر اساس کلمات کلیدی با جستجو معنایی جایگزین می شوند و در نهایت انجام پر سش از
(، چندین سند امکان پذیر می شود. ( خاتمی و دیگران، 1386
لزوم ایجاد وب معنایی
روزانه میلیون ها نفر و هزاران درخواست کاربردی اطلاعات خود را به اینترنت وارد می کنند. علاوه بر دسترسی سریع به
اطلاعات مورد نظر و اجرای خودکار درخواست های راه دور، زمان و بهره وری در فرایند جستجوی اطلاعات و یا ایجاد ارتباطات
خطی دشوار به حداقل رسیده است. در این خصوص به فناوری هایی نیاز است که از نظر معنایی درخواست دریافت اطلاعات را
درک کنند و بدین ترتیب اطلاعات درست و مورد نظر به سرعت بدست آید و یا خدمات ضروری برای اجرای درخواست های
2003 ، ) اطلاعات موجود بر روی وب برای درک بشر طراحی شده است. در ، راه دور ارائه شوند. (فیلیز، وودآلبرشت، ویچ هارد 2
این راستا می توان از برنامه هایی برای پردازش، تحلیل و طبقه بندی صفحات وب استفاده نمود تا پردازش اطلاعات توسط افراد
تسهیل شود. با این وجود به دلیل فقدان ساختار و نمایش اطلاعات قابل خواندن برای دستگا هها در اسناد وب، برنامه ها
نمی توانند محتوای صفحات وب را به دقت بررسی کنند در نتیجه نم یتوان اطلاعات معنایی را از اسناد وب استخراج کرد.
بنابراین به روشی نیاز بوده که با استفاده از آن بتوان اطلاعات را به نحوی ارائه کرد که برای برنام هها قابل درک، قابل
اشتراک گذاری و مبادله باشد. وب معنایی به عنوان بخش تکمیلی وب کنونی، مطرح شده که در آن اطلاعات به خوبی تعریف
2007 ،) این وب اطلاعات اضافی ، می شوند تا رایانه ها و افراد بتوانند به نحوی بهتر با یکدیگر به تعامل بپردازند. (تو، فانگ، هو 3
اضافی در مورد متن را همانند فایل ها و یا چارچوب وایت بورد، بصورت لایه ای بر روی وب اکس.ام.ال ذخیره می کند و بدین
صورت اطلاعات مربوطه به اشکال و مدلهای مختلف طراحی می شوند. وب معنایی همچنین در مراحل ابتدایی قرار دارد و با
توجه به تعداد در حال افزایش صفحات موجود برای وب های معنایی، امکانات بیشماری برای توسعه آن قابل تصور است. در
حال حاضر، در خواستهای انتزاعی همچنان اندک است و لیکن تعریف پروتکل های مبتنی بر اکس.ام.ال از جمله آر.دی.اف،
(، آر.دی.اف.اس 4 بوسیله دبلیو تری سی 5 نشان دهنده افزایش توجه به این پدیده است. (فیلیز و دیگران، 2003
ویژگی های وب معنایی
وب معنایی نه تنها منابعی از قبیل صفحات وب 6 ، تصاویر 7 ، کلیپ های صوتی 8 را که وب جاری نیز در بر دارد شامل
می شود بلکه اجزایی مانند مردم، تشکل ها و وقایع را نیز در بر می گیرد، همچنین وب معنایی شامل انواع مختلفی از روابط
1 Ning ,Jin,Wu
2 fillies,wood-albrecht,weichhardt
3 Tho , Fong , Hui
4 RDF vocabulary description language schema
5 W3C
6 Web pages
7 Images
8 Audio clips
www.SID.ir
Archive of SID
نقش وب معنایی در بازیابی اطلاعات. / شهرزاد شریفی، مریم شعبان زاد و سیما فیاض
44
بین انواع گوناگونی از منابع است. وب معنایی وب مستندات نمی باشد بلکه وبی است که روابط منابعی که نشان دهنده اجزای
جهان واقعی مانند انسانها، مکانها و وقایق را در بر میگیرد. قابلیت انبساط توزیع شده 1 یکی دیگر از ویژگی های مهم وب
معنایی است که این ویژگی در وب معنایی باعث شده سایت های مختلف اطلاعات را درباره یک منبع مشخص به اشتراک
(،2003 ، بگذارد. (گوها، مک کول 2
از نظر گوها و مک کویل ( 2003 ) ضروریات یک جستجوی شبکه ای در وب معنایی موارد ذیل می باشد:
1. سادگی: سایت باید ساده باشد تا بتواند اطلاعاتش را از طریق جستجوی شبکه ای به عرصه بگذارد .
2. قابلیت پیش بینی 3 : جستجو باید کاملا قابل پیش بینی باشد که این مسئله هم از نظر تولید کننده و هم استفاده
کننده اطلاعات مهم میباشد .
مزایای وب معنایی
تکنیک های سنتی جستجو بر خلاف جستجو از طریق وب معنایی، معمولا بر روی پیدا کردن اسناد و مقاله ها به صورت
کلمات کلیدی تمرکز دارد در حالی که روابط معنایی بین منابع نادیده گرفته شده است. آنی آن وو 4 ، مادوکو 5 و شس 6 پشنهاد
پشنهاد میکنند که روابط نقش مهمی را در وب معنایی ایفا میکنند، زیرا یک شیئ واحد هرگز جالب نیست بنابراین ضروری
است که استفاده کنندگان را با نتایجی که از نظر معنایی شبیه تر و وابسته تر به تقاضاهای جستجو کنندگان است آشنا کنیم
حتی اگر نتایج جستجو، کلمات کلیدی جستجو را به صورت واضح در برنگیرد. (ناینگ و دیگران، 2008 ،) در وب معنایی برای
لیست کردن سایت های قابل اطمینان از وب اعتماد استفاده می کنند که این امر می توانند برنامه ریزان نرم افزار ها را قادر
سازد که بر روی کار یکدیگر نفوذ کرده و تاثیر بگذارند و تعیین بکنند که کدام سایت های معنایی قابل اعتمادند. (گوها، مک
(،2003 ، کول 7
مشکلات وب معنایی
برخی از مسائل در امر توسعه وب معنایی مشکلاتی را به وجود می آورند که به چند مورد آن اشاره کوتاهی میکنیم:
1. یکی از مشکلات اختلاف معنایی و نبودن الگویی مناسب بین اطلاعات از سوی تولید کنندگان مختلف اطلاعات
می باشد. از آنجا که تولید کنندگان اطلاعات به صورت مستقل دست به انتشار اطلاعات می زنند باعث می شود که آنها از
نامها و مفاهیم متفاوتی برای یک سری از مفاهیم استفاده کنند که این امر برای استفاده کننده بسیار مشکل می باشد که
مفاهیم را از تولید کنندگان مختلف و تحت نامهای مختلف یکپارچه سازد
(، 2. از دیگر موارد رابط کاربر در وب معنایی است. (گوها، مک کول، 2003
3. وایجاد زبان مشترک برای انتقال مفاهیم: در واقع همانطورکه ما در دنیای حقیقی نیاز به زبان مشترک برای انتقال
مفاهیم و معانی داریم، در دنیای مجازی نیز نیاز به آن احساس می شود، تمامی تلاش وب معنایی آن است که با ایجاد یک هم
زبانی و انتقال معنای اطلاعات اولاً دسترسی به اطلاعات را به گونه ای بهینه میسرسازد و ثانیاً امکان پردازش این اطلاعات
(، توسط ماشین به طریقی صحیح فراهم شود. (خاتمی و دیگران، 1386
1 distributed extensibility
2 Guha, McCool
3 Predictability
4 Anyanwu
5 Maduko
6 Sheth
7 Guha, McCool
www.SID.ir
Archive of SID
فصلنامه دانش شناسی (علوم کتابداری و اطلاع رسانی و فناوری اطلاعات) سال سوم، شماره ( 12 )بهار 1390
45
مولّفه های وب معنایی 1
ساختاری که تیم برنرزلی و دبلیو تی سی برای فناوری ایجاد کننده وب معنایی پیشنهاد داده اند، به صورت سازماندهی
داده ها در یک فناوری توصیفی یعنی آر.دی.اف است که منابع داده و ارتباط آنها را مشخص می کند و یو.آر.ای 2 های منبع را
شناسایی کرده و یا نام گذاری می کنند و او.دبلیو.ال 3 به توصیف مشخصات و کلاس های داده با یک زبان مشترک می پردازد.
اسپارکوئل 4 یک زبان پرس و جو 5 است که داده های آر.دی.اف را جستجو می کند. بخش دیگری از وب معنایی، اطمینان از
این موضوع است که پایگاه داده های مختلف، از واژگان یکسانی برای توصیف تمامی موارد بهره می گیرند که وب معنایی به آن
هستی شناسی 6 می گوید. (رجبی مهر، 1386 ) بسیاری از استانداردها و ابزارهای وابسته به فنّاوری اکس ام ال را می توان به
اینترنت آینده و وب معانی نگر نیز مربوط دانست. از آن جمله باید شمای اکس ام ال 7، چارچوب شرح منابع(آر. دی . اف)، شمای
( شمای آردی اف 8، و زبان هستی شناسی وب ( او. دبلیو . ال.) 9 را از مولّفه های وب معنایی بر شمرد. ( ویکی پدیا، 2009
مولّفه های مختلف وب معنایی، در تصویر زیرآمده است آر.دی.اف که زبان پایه استفاده شده در وب معنایی است بر پایه
اکس.ام.ال بنا نهاده شده اند اکس.ام.ال نیز خود بر اساس یونیکد 10 و یو. آر. آی. بنا نهاده شده است بنابراین از زبانهای مختلف
پشتیبانی می کند. از یو.آر.آی نیز برای مشخص کردن مفاهیم در وب معنایی استفاده می شود، برای مثال یو.آر.ال نوعی
یو.آر.آی است که برای مشخص کردن منابع در وب استفاده می شود. قسمت اصلی وب معنایی هستی شناسی ها (آنتولوژی
ها) هستند که ارتباط بین برچسب های اسناد وب معنایی و اشیا واقعی که اسناد مذکور آنها را تشریح می کنند، برقرار
می کند. در بالای آنتولوژی قواعد قرار دارد که با استفاده از آنها می توان دانش جدیدی را از دانش موجود نتیجه گرفت. در
صورتی که یک چهارچوب استاندارد برای قواعد موجود بوجود آوریم، می توانیم به اثبات برسیم و اثبات های بدست آمده را در
کاربرد های مختلف به اشتراک بگذاریم . یکی از اهداف وب معنایی رسیدن به اطمینان است که در بالاترین لایه قرار دارد. در
( این جهت استاندارد های گوناگونی در حال شکل گیری و استفاده اند. ( ویکی پدیا، 2009
شکل 1. لایه های وب معنایی
1 Components of the Semantic Web
2(URI) Universal Resource Identifiers
3 ( OWL) Web Ontology Language
4 SPARQL
5 query
6 Ontology
7XML Schema
8 RDF Schema
9 Web Ontology Language
10 Unicode
www.SID.ir
Archive of SID
نقش وب معنایی در بازیابی اطلاعات. / شهرزاد شریفی، مریم شعبان زاد و سیما فیاض
46
اکس.ام.ال زبان نشانه گذاری گسترش پذیر
به معنای "زبان نشانه گذاری گسترش پذیر". یک زبان نشانه "eXtensible Markup Language" آغازه واژه های
گذاری همه منظوره و استانداردی باز و رایگان، در عین حال بسیار منعطف برای تبادل دادهها و اسناد ساختار یافته میان
نظامهای نامتجانس بر روی اینترنت است که توسط کنسرسیوم شبکه جهانی وب در نوامبر 1996 معرفی شد. اکس.ام.ال
هماننداچ.تی.ام.ال، یک مجموعه ثابت از عناصر و فقط محدود به اسناد وب نیست، بلکه با استفاده از این استاندارد، کاربران
می توانند عناصر (یا برچسب های) مورد نیاز خود را تعریف و در محیط های اطلاعاتی دیگر استفاده کنند. این زبان به عنوان
یک مجموعه فرعی ساده شده از "استاندارد زبان نشانه گذاری تعمیم یافته (اس.جی.ام.ال)” است ومیتوان باافزودن قیود
معنایی به آن،زبانهای کاربردی نظیر اکس.اچ.تی.ام.ال، آر.اس.اس، مت ام.ال، و غیره را در آن پیاده سازی نمود. اکس.ام.ال در
(، اصل برای حل مشکلات مربوط به انتشار الکترونیکی حجم گسترده و بزرگی از دادههای طراحی شده است. ( طاهری، 1387
اکس.ام.ال یک زبان ( اشکال و علائم 1) است که شکل و فرمتی را برای تشریح داده ها و اطلاعات ساخت یافته، تهیه
می کند در این زبان می توان بسیار آسان و مختصر مقادیر و کلمات معنی دار را تعریف کرده و در تمام پلت فرم ها بدنبال
نتایج آنها گشت. ( عدالت، 1380 ،) اکس.ام.ال در واقع یک ابر زبان نامیده می شود چرا که کاربر بسته به نیازهایی که دارد
می تواند با استفاده از آن، زبان نشانه گذاری جدیدی برای نشانه گذاری داده هایش ایجاد کند. اکس.ام.ال همچنین قادر است
ساختار داده ای ذخیره شده را نیز به همراه معنای آنها حفظ کند کاراکتر ها در یک فایل اکس.ام.ال مطابق استاندارد یونی کد
می باشند بنابراین فایلهای اکس.ام.ال قادر به نمایش کاراکترهای تمام زبانهای زنده دنیا هستند. ( آقامالیان، 1385 ) اکس.ام.ال
روشی ساده و استاندارد به منظور مبادله داده های ساختارمند بین نظامهای متفاوت رایانه ای است. بخشی از موفقیت
اکس.ام.ال جهت نیل به خواسته فوق، به نحوه نوشتن و خواندن این نوع بایگانی ها بر می گردد. با استفاده از یک ویراستار
متنی میتوان به سادگی و به سرعت اقدام به نوشتن یک سند اکس.ام.ال، و خواندن و اعمال تغییرات در آنان نمود. مهمترین
هدف اکس.ام.ال، ارتباط بین نظامهای متفاوت نرم افزاری بوده و در این راستا به دو نیاز حیاتی به خوبی جواب داده است:
الف. تفکیک داده از نمایش. نیاز به تفکیک اطلاعات از جزئیات نمایش بر روی یک دستگاه خاص همواره مورد نظر طراحان
و پیاده کنندگان بوده است. خواسته فوق، به موازات رشد دستگاه های مبتنی بر اینترنت به یک ضرورت حیاتی تبدیل شده
است.
ب. ارسال داده بین برنامهها. ارسال اطلاعات از سازمانی به سازمان دیگر بدون درگیر شدن در جزئیات، همواره از آرزوهای
( ، بزرگ طراحان و پیاده کنندگان نظام های نرم افزاری بوده است. ( سعیدی، 1383
به طور کلی از اکس.ام.ال در موارد زیر می توان استفاده کرد:
مبادله اطلاعات بین برنامه ها و نظام های نامتجانس ●
امکان فعال نمودن الگویی برای نمایش اطلاعات یکسان بر روی نظامهای متفاوت با اهداف و کاربران گوناگون ●
(، یک قالب ذخیره سازی مناسب برای داده ها (طاهری، 1387 ●
آر.دی.اف 2 چارچوب توصیف منبع
آر.دی.اف شکل داده ای است که بر مبنای اکس.ام.ال پایه ریزی شده است و به عنوان فرمت تبادل هستی شناسی ها و
واژگان کنترل شده مناسب خواهد بود. (کوهلر و دیگران، 2006 ،) پیش نیاز کاربرد هستی شناسی ها در وب معنایی، توسعه
استانداری برای تعریف و مبادله هستی شناسی یا به عبارتی، زبان های بازنمون هستی شناسی است. زبان هایی مانند آر.دی.اف
را که در توسعه زبان های دیگری چون او.آی.ال 3و او.آی.ال +دی.ای.ام.ال 4نقش داشته است می توان به عنوان نمونه هایی
1 meta-Markup
2 Resource Description Framework
3OIL: Ontology Interface Layer/language
4DAML: DAPRA Agent Mark up Language
www.SID.ir
Archive of SID
فصلنامه دانش شناسی (علوم کتابداری و اطلاع رسانی و فناوری اطلاعات) سال سوم، شماره ( 12 )بهار 1390
47
معروف از این زبان ها ذکر کرد. (صفری، 1383 ،) آر.دی.اف مدل و مجموعه ای از عناصر را تعریف می کند که برای توصیف
منابع بر حسب خصیصه ها و ارزش های نامگذاری شده به کار می رود علاوه بر این از کاربرد عناصر چندین طرح ابرداده ای
پشتیبانی می کند. از این مدل می توان برای نامگذاری اطلاعات در قالب قابل فهم برای ماشین استفاده کرد، از کاربردهای
دیگر این مدل تبادل داده ها میان نرم افزارهای کاربردی و پردازش اطلاعات معنایی است که برای هستی شناسی ها و
طرح های ابرداده ای قابل پردازش برای ماشین مناسب است. ( ژاکوب، 1384 ، ) آر.دی.اف برای تبادل داده ها پذیرفته شده
است و ویرایش آن برای هستی شناسی ها از موارد پراهمیت می باشد. (کوهلر و دیگران، 2006 ،)مبنای کار آر.دی.اف ارائه
الگویی برای بازنمایی ویژگی های منابع و مقادیر آنهاست که این الگو شامل سه بخش می باشد: منابع، ویژگی ها و جملات.
منابع، همه چیزهایی که توسط آر.دی.اف توصیف می شوند نام دارند، ویژگی ها عبارت است از یک وجه مشخصه، صفت،
خاصیت یا رابطه که برای توصیف یک منبع استفاده می شود و جملات که شامل یک منبع خاص به همراه یک ویژگی
مشخص به علاوه مقدار آن ویژگی برای آن منبع بخصوص می شود.
آنچه که حیاتی است این است که جمله آر.دی.اف به صورتی بیان شود که برای همه یک معنا را تداعی کند، اما ممکن
است واژه ای برای افراد مختلف معانی متفاوتی را القا کند، برای رفع این مشکل از فرانمای توصیف منبع استفاده می شود. این
( فرانما مکانیسم هایی برای توصیف گروه هایی از منابع و روابط میان آنها فراهم می کند. (جمالی مهموئی، 1382 ، ص 58
آر.دی.اف، مدلی است که معنا را در قالب داده بیان می کند. همان گونه که برنرزلی در مقاله خود شرح داده است، آر.دی.اف
در سه مرحله معنا را کد گذاری کرده و یا با استفاده از ساختار فاعل/ فعل/ مفعول، ارتباط میان آنها را بیان می کند. این سه
(، مرحله می توانند به شکل تگهای اکس.ام.ال نوشته شوند و اطلاعاتی را در مورد منابع ارائه دهند . ( رجبی مهر ، 1386
شکل 2. سه تایی ها در آر.دی.اف
هستی شناسی وب
هستی شناسی یکی از لایه های وب معنایی و ستون فقرات آن بشمار می آید. ( برنرزلی، هند لر، لازیلا، 2001 ،) سورگل 1
هستی شناسی را یک ابزار سازماندهی منابع وب که به بازیابی متون با زبان طبیعی کمک میکند، توصیف کرده است. اما وی
نیز عقیده دارد که در واقع مشکل ناشی از سازماندهی اطلاعات نیست، بلکه این مجموعه اصطلاحات هستند که مشکل ساز
شده اند و در نتیجه، زمینه ظهور هستی شناسی ها بصورت مجموعه لغات و یا اصطلاحنامه های تکمیل شده یا گسترش یافته
را فراهم کرده اند. (صنعت جو، 1384 ) محیط نوین اطلاعاتی به منظور بازنمون هوشمند دانش به نظامی انعطاف پذیرتری نیاز
دارد. هستی شناسی به سبب توانایی های منحصر به فردش در تعریف واضح معانی و روابط و نیز بیان آنها به زبانی ماشین فهم
به عنوان راه حل این مسائل مورد توجه قرار گرفته است. هستی شناسی نقش مهمی را در دسترسی دانش محور و میانکنش
پذیری نحوی و معنایی ایفا می کند و همچنین به عنوان ستون فقرات نسل آتی وب- وب معنایی- عمل می نماید. (صفری،
1383 ،) اکس.ام.ال به عنوان یکی از استاندارد ها به طور فزاینده ای در حال پذیرفته شدن به عنوان زبان وب و کنار زدن زبان
اچ.تی.ام.ال است. اما اکس.ام.ال و طرحواره 2 آن عمدتا مربوط به نحوی صفحات وب است ( بیشتر در ارتباط با ساختار فیزیکی
1 Soergel
2 Schema
www.SID.ir
Archive of SID
نقش وب معنایی در بازیابی اطلاعات. / شهرزاد شریفی، مریم شعبان زاد و سیما فیاض
48
مدارک وب ) و نام برچسب 1های اکس.ام.ال نیز فاقد مدل سازی معنایی واضح و روشن است ( هیچ گونه مدل سازی معنایی
دقیقی ندارند) که بتواند به رایانه در فهم وتفسیر معنا کمک کند .هستی شناسی عنصر اصلی و پایه ای برای وب معنایی است
چون معنایی رسمی را که قابل فهم برای رایانه هستند با معناهای دنیای واقعی که برای انسان قابل فهم هستند پیوند می دهد.
در نتیجه به انسان و رایانه اجازه می دهد تا به اطلاعات مورد نیاز خود دست یابند و به نحو موثری با یکدیگر ارتباط برقرار
کنند. دلیل اهمین یافتن هستی شناسی، فقدان استانداردهایی برای ارتباط نحوی و معنایی هم از منظر انسان و هم از منظر
رایانه است. این مسئله با افزایش روزافزون اضافه بار اطلاعاتی 2، ناکارآمدی موتورهای کاوش کنونی وب، و بازیابی درون خطی
اطلاعات حادتر می گردد. هستی شناسی به عنوان تعریف رسمی و واضح مفهوم سازی تسهیم شده، نوید بخش راهی برای غلبه
بر این مشکلات است. (صفری، 1383 ) در محیط وب معنایی، هستی شناسی با عنوان مفهوم سازی محدودی از یک حوزه
معین دانش معرفی می شود که در میان جامعه کاربران آن حوزه مشترک است. این مفهوم سازی به زبان رسمی و قابل
پردازش برای ماشین، و با هدف اشتراک اطلاعات معنایی در نظام های خود کار تعریف شده است در محیط وب، هستی
شناسی ابزار فشرده و منظمی برای تعریف معانی منابع وب است. هستی شناسی، مفاهیم حوزه مرتبط، خصیصه های آنها، و
روابط ممکن میان مفاهیم و خصیصه ها را مشخص می کند. (ژاکوب، 1384 ) همچنین دارای ساختار سلسله مراتبی است.
نمونه این ساختار را می توان در سرعنوان های موضوعی کتابخانه کنگره مشاهده کرد. به عنوان مثال، هستی شناسی مشخص
می کند که مولف نوعی پدیدآورنده است. همان طور که اشاره شد افراد کلمات را به معانی مختلف به کار می برند و ممکن
است برای مفهوم از کلمات متفاوتی استفاده کنند. هستی شناسی این امکان را فراهم می سازد که رایانه ها از واژه نامه ها با
سهولت و دقت بیشتری استفاده کنند. به عبارت دیگر، هستی شناسی وب، از یک نگاه کلی، مجموعه ای از تعاریف رده ها و
ویژگی ها و محدودیت های موجود در نحوه به کارگیری این رده ها و ویژگی هاست. (جمالی مهموئی، 1382 ) هستی شناسی ها
بنیاد مفهومی معناداری را تهیه می کنند که بدون آن، دستیابی به هدف وب معنایی امکان پذیر نخواهد بود. هر طرح ابر داده ای 3
با توجه به اینکه مجموعه ای از ویژگی های مفهومی و یا فیزیکی منابعی را مشخص می کند که برای گروهی از کاربران،
مناسب به نظر می رسند، در واقع یک هستی شناسی به حساب می آیند. به عنوان مثال مجموعه ای از عناصر و پالایش های 4
عناصری که در دابلین کورمعرفی شدند در نوع خودشان یک هستی شناسی هستند. دابلین کور با وجود کلی بودن، یک هستی
شناسی ست، به دلیل اینکه مدل مفهومی تعریف شده رسمی ای را اعمال می کند. این مدل، پردازش خودکار اطلاعات را که
برای حمایت از اشتراک دانش در میان نظام های رایانه ای ضروری ست، تسهیل می کند و به همین دلیل موجبات ظهور وب
( معنایی را فراهم می کند. ( ژاکوب، 1384
کنسرسیوم وب جهانی 5زبان های بازنمون هستی شناسی را در گروه کاری مربوطه تعریف کرده است. زبان هستی شناسی
ابزاری است که در سطحی انتزاعی- سطح مفهومی- مشخص می سازد چه چیزی در حوزه، لزوما درست است. به بیانی کوتاه
تر، زبان هستی شناسی باید نشانگر قید ها یا محدودیت ها باشد. بیان واضح محدودیت ها در نمونه سازی 6 اهمیت دارد از
جمله زبان های بازنمون هستی شناسی می توان ازاو.دبلیو.ال ،او.آی.ال , 7او.آی.ال +دی.ای.ام.ال , آر.دی.اف نام برد. از میان
زبان های مطرح شده او.دبلیو.ال 8 جدید ترین استاندارد زبانی توصیه شده است و قابلیت های بیشتری نیز نسبت به سایر
زبان ها دارد. این زبان بر مبنای آر.دی.اف و مشتق شده از او.آی.ال +دی.ای.ام.ال است. او.دبلیو.ال، زبان نشانه گذاری معنایی،
در مقایسه با اکس.ام.ال، آر.دی.اف.اس، آر.دی.اف به واسطه فراهم آوری واژگان بیشتر و معانی رسمی در افزایش عمل پذیری و
(، درونی موفق تر است. (شریف، 1385
1 Tag
2 Information overload
3 metadata scheme
4 Refinements
5 World Wide Web Consortium ( W3C)
6 Instantiation
7 Ontology Inference Markup Language
8 Web Ontology Language
www.SID.ir
Archive of SID
فصلنامه دانش شناسی (علوم کتابداری و اطلاع رسانی و فناوری اطلاعات) سال سوم، شماره ( 12 )بهار 1390
49
بازیابی اطلاعات مبتنی بر وب معنایی
نخستین و ملموس ترین نتیجه تشکیل وب معنایی، تحول در بازیابی اطلاعات خواهد بود. هم اکنون بازیابی اطلاعات وب،
عموما بر اساس تطابق لغات و عبارات مورد جستجو با واژه ها و عبارات موجود در متن صفحات وب صورت می گیرد. وب
معنایی پا را از تطبیق صرف واژه ها فراتر نهاده و جست جو را بر اساس موضوع، ارتباط میان داده ها، نوع داده ها، و
کیفیت های دیگر انجام می دهد. (جمالی مهموئی، 1382 ، ص 52 ) هدف بازیابی اطلاعات مدلسازی طراحی و اجرای
سیستم هایی است که قادر باشند دسترسی سریع و کارآمد بر پایة محتوا را به مقادیر عظیم اطلاعات، تأمین کنند. هدف یک
سیستم بازیابی اطلاعات، برآورد ربط اقلام اطلاعاتی با نیازهای اطلاعاتی یک کاربر (که در قالب یک سؤال بیان شده) می باشد.
این، کار مشکل و پیچیده ای است؛ زیرا با ذهنیت، ابهام و عدم دقت آکنده است. (یاتاز، 1384 ) وب معنایی در بازیابی اطلاعات
تحول بسیاری ایجاد کرده است، وب معنایی یک ابر وب میباشد که تعلقات صفحات وبی که به یکدیگر وابسته و مرتبط
هستند را بازیابی میکند تا نتایج تحقیق متمرکزی را ارائه دهد که این امر در بازیابی اطلاعات بسیار مفید و مؤثر می باشد که
در ذیل به طور خلاصه به چگونگی انجام این کار میپردازیم:
زمانی که کاربران در شبکه به جستجو می پردازند یک مسیر مجازی به دنبال خود ایجاد می کنند که این مسیر می تواند
با سایر کاربران تقسیم شود و آنها نیز در آن سهیم شوند ما این مسیرها را دریافت می کنیم و استفاده می کنیم تا جستجوی
هوشمند را میسر سازیم. افرادی که از شبکه با علایق و مقاصد مختلف استفاده می کنند مسیر های سودمندی ایجاد نمی کنند
تا افراد دیگر نیز بتوانند از آنها استفاده کنند، در صورتیکه افرادی که دارای علایق معین و مشابه باشند می توانند از
2007 ) وب معنایی با به خدمت ، مسیر هایی که توسط یکدیگر به وجود آمده استفاده کنند. (بیدون، کلت چیتسکی، ماناسه 1
گرفتن ابزارهایی مانند هستی شناسی ها این امکان را برای ماشین های به هم مرتبط فراهم می کند تا به گونه ای هوشمند
اطلاعات را یافته و در اختیار جست جو گر قرار دهد. از این رهگذر هنگام جست جوی اطلاعات ماشین ها تنها به تطابق دقیق
کلید واژه های درخواستی کاربر با واژه های موجود در منابع اطلاعاتی نمی پردازند، بلکه به نوعی جست جوی هوشمند در
منابع به هم پیوسته ای دست می زنند که محتوای آنها از قبل با استفاده از زبانها و ابزارهای خاصی معنادار شده است و برای
ماشین قابل نمایش هستند. با به کار گیری این شیوه ها از سویی ماشین ها قادر خواهند بود تا درک بهتری از وب داشته
باشند و از سوی دیگر انسانها از وب استفاده بهتری خواهند کرد. آنگونه که دامبیل ( 2000 ) می گوید صرف نظر از مسائل فنی،
ارزش وب معنایی حل مسائل ارتباطی در محیط وب است. (کشاورز، 1386 ،) از اطلاعات معنایی صفحات وب می توان برای
ارتقای فرایند بازیابی اطلاعات مبتنی بر وب استفاده کرد. در وب های سنتی می توان با استفاده از زبان تقویت شده توصیف
فراداده، اطلاعات معنایی را در صفحات وب تفسیر کرد. اس.اچ.او.ای زبان اچ.تی.ام.ال را توسعه داده تا کاربران بتوانند اطلاعات
مبتنی بر هستی شناسی را در صفحات وب شرح دهند. در آنتوبروکر اطلاعات مبتنی بر اکس.ام.ال در دو نسخه، یکی برای افراد
و دیگری برای دستگاه ها ذخیره می شوند. در وب کی.بی اطلاعات در ابتدا با استفاده از جداول مفهومی (سی.جی) 2 ارائه شده
سپس محتوای سی.جی ها با استفاده از زبان اکس.ام.ال در صفحه وب قرار داده می شود. کوئست زبان نشان گذاری را ارائه کرده
که او. اچ.تی.ام.ال نام داشته و از نشا نگذاری معنایی در صفحات اچ.تی.ام.ال پشتیبانی م یکند. ای.ال.ای.اکس.آی.آر 3زبان
جستجوی مبتنی بر اکس.ام.ال به نام اکس.ام.ال-کیو.ال را ارائه کرده تا از اپراتورهای شباهت متنی پشتیبانی کند. در این
سامانه ها کاربر می تواند با استفاده از زبان جستجوی مبتنی بر اکس.ام.ال مورد پشتیبانی سامانه به جستجو بپردازد. از آنجائی
که اطلاعات معنایی در صفحات وب گنجانده شده در نتیجه سامانه ها می توانند صفحات وب منطبق با موضوع مورد جستجو را
به دقت بازیابی کنند. با این حال به دلیل عدم وجود استاندارد مربوط به تشریح اطلاعات، چنین سامانه هایی هنوز نمی تواند
اطلاعاتشان را به اشتراک بگذارند. اخیراً با توسعه وب معنایی، درگاه های (پورتالهای) وب معنایی (درگاه های اس.دبلیو) نیز
مطرح شده اند. ای.آی.اف.بی نخستین درگاه وب معنایی بوده که دارای مدل نمایش اطلاعات اسناد متنی با استفاده از علم
1 Beydoun, Kultchitsky, Manasseh.
2 Conceptual Graphs.
3 Expressive and efficient language for xml Information Retrieval.
www.SID.ir
Archive of SID
نقش وب معنایی در بازیابی اطلاعات. / شهرزاد شریفی، مریم شعبان زاد و سیما فیاض
50
هستی شناسی است. اسپرنتو 1 و آنتووب 2 درگاه های علمی هستند که اطلاعات علمی را عمدتاً در اختیار شرکای صنعتی خود
قرار می دهند، امپولیس کی 342 و موندکا آیتم 4 درگاه های تجاری هستند که کاربرد آنها مدیریت اطلاعات در زمینه تجارت
(، است. اغلب درگاه های وب معنایی عمدتاً براساس اطلاعات خود به بازیابی اطلاعات می پردازند. (تو و دیگران، 2006
به طور کلی فرایند بازیابی اطلاعات مبتنی بر وب معنایی از طریق خدمات وب معنایی ارائه شده توسط درگاه های وب
معنایی پشتیبانی می شود. با این وجود از آنجائی که اطلاعات مختلفی توسط درگا ههای وب معنایی متفاوتی ارائه می شوند
سامانه های بازیابی 5 هنوز نمی توانند به آسانی خدمات وب معنایی مناسب را به صورت خودکار مشخص کنند. برای برطرف
ساختن این مشکل و یافتن خدمات وب معنایی مناسب می توان از یک عامل هوشمند به نام عامل ایجادکننده تطبیق 6 یا عامل
منطبق کننده 7استفاده کرد. از آنجائی که خدمات وب معنایی به صورت علم هستی شناسی ارائه می شوند در نتیجه عامل
هوشمند می تواند ورودی، خروجی و نحوه عملکرد آنها را درک کند. همچنین عامل هوشمند می تواند خدمات وب معنایی
مناسب برای انجام درخواست سایر خدمات وب معنایی را مشخص کند. اسووگل 8 موتور جستجوی مبتنی بر وب معنایی بوده
که از عامل هوشمند به عنوان وسیله جم عآوری اطلاعات ارائه شده توسط خدمات وب معنایی موجود در وب استفاده م یکند
سپس اطلاعات به دست آمده برای بازیابی، نمایه گذاری می شوند. سامانه پیشنهادی، وب معنایی علمی (اس.اس.وب) 9 نام دارد.
دارد. در اس.اس.وب از اطلاعات علمی به دست آمده از پایگاه داده های استنادی برای پشتیبانی از قابلیتهای جستجوی
پیشرفته استفاده می شود. اسکولاری آنتولوژی 10 برای به اشتراک گذاری اطلاعات علمی ایجاد شد. سپس خدمات وب معنایی
علمی به منظور فراهم کردن امکان دسترسی به اسکولاری آنتولوژی برای بازیابی اطلاعات علمی توسعه پیدا کردند. (تو و
(، دیگران، 2006
نتیجه گیری
محیط وب دستیابی گسترده به اطلاعات را مانند یک کتابخانه عمومی بزرگ پر از اسناد فراهم آورده است از طرف دیگر
وجود اطلاعات زیاد در وب، جست جو ی دقیق و یک پارچه سازی اطلاعات را غیر عملی می سازد. موتور های جستجو که بر
اساس کلمات کلیدی عملیات جستجو را انجام می دهند مشکلات زیادی در بازیابی اطلاعات دارند. وب فعلی یک سرویس
ارتباطی سند محور است که احتیاجات افراد را با کمک مرور گر ها تامین می کند، فناوری این وب برای پشتیبانی از نیازهای
محاسباتی پیشرفته نا کار آمد و ناکافی است.در نتیجه برای ساخت یافته کردن اطلاعات، بهبود جستجو ها و نمایش معانی
اطلاعات نیاز به فناوری جدیدی است تا بتواند بین اطلاعات موجود و سایر اطلاعات اتصال برقرار نماید و معنایی صریحی را در
حیطه ارائه اطلاعات مطرح کند در اینجا وب معنایی به عنوان فناوری جدید می تواند تحولی در امر بازیابی اطلاعات ایجا

/ 0 نظر / 208 بازدید