وب جهان‌گستر

جهان وب٬ وب جهان‌گستر٬ تار گیتی‌گستر٬ یا به طور ساده وب (به انگلیسی: World Wide Web) یک سامانهٔ اطلاعاتی از پرونده‌های ابرمتنی متصل‌به‌هم است که از طریق شبکهٔ جهانی اینترنت قابل دسترسی هستند. به‌کمک یک مرورگر وب می‌توان صفحات وب (که شامل متن، تصویر، ویدیو و سایر محتویات چندرسانه‌ای هستند) را مشاهده و به‌کمک ابرپیوندها در میان آن‌ها حرکت‌کرد.






تیم برنرز لی، یک پژوهشگر علوم رایانه و کارمند موسسهٔ سرن در نزدیکی ژنو، در ماه مارچ سال ۱۹۸۹ میلادی پیشنهاد اولیهٔ وب امروزی را مطرح کرد. پیشنهاد ارائه‌شده در ۱۹۸۹ قرار بود که یک سیستم ارتباطی برای موسسه سرن شود، اما برنرز لی به‌زودی متوجه‌شد که این ایده قابلیت جهانی‌شدن را دارد. برنرز لی به همراه رابرت کایلیائو در سال ۱۹۹۰ میلادی این پیشنهاد را به‌عنوان «پیوند و دسترسی به اطلاعات مختلف به‌صورت تارنمایی از گره‌هایی که کاربران به دل‌خواه در میان آن‌ها حرکت می‌کنند» ارائه دادند. برنرز لی در ماه دسامبر همان سال اولین وب‌گاه را به‌وجودآورد و در ۷ اوت سال ۱۹۹۱ میلادی آن‌را به‌عنوان یک پروژه بر روی گروه خبری alt.hypertext منتشر کرد.




واژهٔ وب

واژهٔ وب (به معنی تار) در بسیاری از ترکیبات «اینترنتی» می‌آید. کم کم «وب» به‌عنوان واژهٔ بین‌المللی جا افتاده و به منظورهای مختلفی به کار می‌رود. این واژه معمولاً به صورت اشتباه به جای اینترنت به کار می‌رود اما وب در حقیقت یکی از خدماتی است که روی اینترنت ارایه می‌شود (مانند پست الکترونیکی).

همچنین، وب مخفف کلمه وب‌سایت (website) است. سایت یعنی مکان و منظور از وب‌سایت صفحات مرتبط است. در پارسی واژهٔ تارنما جایگزین وب‌سایت شده است.




تاریخچه

ایده اولیه در مورد تارِ گیتی‌گستر به سال ۱۹۸۰ (میلادی) برمی‌گردد. زمانی که در شهر سرن سوئیس، تیم برنرز لی شبکه ENQUIRE را ساخت (که به "Enquire Within Upon Everqthing CSS" اشاره داشت و همنام کتابی بود که وی از جوانی خود به یاد داشت. اگرچه آنچه وی ساخت با وب امروزی تفاوت‌های زیادی دارد اما ایده اصلی در آن گنجانده شده است (و حتی برخی از این ایده‌ها در پروژه بعدی برنرزلی پس از WWW یعنی وب معنایی به کار گرفته شد).

در مارس 1989، برنرزلی یک پیشنهاد را نوشت که به ENQUIRE اشاره داشت و یک سیستم اطلاعاتی پیشرفته را توصیف می‌کرد. وی با کمک رابرت کایلا، پیشنهاد طراحی تور جهان گستر را در 12 نوامبر 1990 ارائه کرد. اولین مرور وب جهان توسط برنرزلی با عنوانNEXTcube مورد استفاده قرار گرفت و وی اولین مرورگر وب و تور جهان گستر را در سال 1990 طراحی کرد.

در کریسمس 1990، برنرز لی همه ابزارهای لازم برای کار با وب را فراهم کرد

در 6 آگوست 1991 وی خلاصه‌ای از پروژه تور جهان گستر را در گروه خبری alt.hypertext پست کرد. در همین روز وب به عنوان یک خدمات عمومی روی اینترنت ارائه شد. مفهوم مهم ابر متن در پروژه‌های قدیمی‌تر مربوط به دهه 1960 مانند Project Xanadu مربوط به تد نلسون و NLS (سیستم آنلاین) مربوط به داگلاس انگلبارت مطرح شد.

موفقیت برنرزلی در ایجاد ارتباط بین ابر متن و اینترنت بود. در کتاب "بافتن تور" وی اذعان می‌کند که بارها از امکان برقراری ارتباط میان دو تکنولوژی صحبت کرده بود اما چون کسی به حرف‌هایش توجه نکرد وی خودش دست به کار شد و پروژه را به سرانجام رساند. وی در سیستم خود شاخص‌های منحصر به فرد جهانی برای شناسایی منابع موجود روی وب و دیگر مکان‌ها در نظر گرفت و آنها را شناسه منبع یکپارچه نامید.

تور جهان گستر با بقیه سیستم‌های ابر متنی موجود تفاوت‌هایی داشت:

WWW به لینک‌های یک طرفه نیاز داشت و نه دوطرفه بنابراین فرد می‌توانست بدون آن که از جانب مالک منبع واکنشی صورت گیرد به منبع دسترسی پیدا کند. همچنین ابر متن مشکل پیاده‌سازی سرورهای وب و مرورگرها (در مقایسه با سیستم‌ها قبلی) را برطرف کرد اما در مقابل مشکل زمان در لینک‌های قطع شده را ایجاد کرد.
تور جهان گستر بر خلاف سیستم‌های قبلی مانند ابر کارت غیر انحصاری بود و این امکان را فراهم می‌کرد که سرورها و مرورگرهای مستقلی را ایجاد کرده و بدون هیچ محدودیتی آنها را به شبکه وصل کرد.

در 30 آوریل سال ۱۹۹۳ (میلادی)، CERN اعلام کرد که تور جهان گستر به صورت رایگان برای همه افراد قابل دسترسی است. این موضوع دو ماه پس از اعلام رایگان نبودن پروتکل گوفر مطرح می‌شد و در نتیجه تمایل به وب به شدت افزایش یافت. قبل از آن مرورگر وب معروفی به نامViolaWWW وجود داشت که بر اساس ابر کارت کار می‌کرد. نسخه گرافیکی تور جهان گستر با نام مرورگر وب موزائیک در سال 1993 توسط مرکز ملی برنامه‌های سوپرکامپیوتر که توسط مارک اندرسن راه اندازی شده بود مورد انتقاد شدید قرار گرفت. قبل از عرضه موزائیک، گرافیک و متن در صفحات وب از یکدیگر جدا بودند و در پروتکل‌های اینترنتی قبلی مانند پروتکل گوفر و مرور اطلاعات ناحیه وسیع گرافیک کاربرد زیادی نداشت. واسط کاربر گرافیکی موزائیک وب را به مشهورترین پروتکل اینترنتی تبدیل کرد.




اجزاء وب

تار گیتی‌گستر ترکیبی از چهار عنصر اصلی است:

hypertext یا بسامتن: فرمتی از اطلاعات که به افراد اجازه می دهد تا در محیط کامپیوتر با استفاده از ارتباط داخلی موجود میان دو متن از بخشی از سند به بخش دیگری از آن یا حتی سند دیگری مراجعه کنند و به اطلاعات جدیدی دسترسی پیدا کند.
URL: شناسه‌های منحصر به فردی که برای مشخص کردن محل حضور اطلاعات موجود روی شبکه (فایل کامپیوتری، سند یا منابع دیگر) به کار می روند.
مدل Client-Server یا مشتری-خدمت‌گزار: سیستمی که در آن نرم‌افزار یا کامپیوتر مشتری از نرم‌افزار یا کامپیوتر خدمت‌گزار تقاضای دریافت منابع اطلاعاتی مانند داده یا فایل می کند.
markup language یازبان علامتگذاری: کاراکترها یا کدهای موجود در متن که ساختار متن وب معنایی را مشخص می کنند.




معماری سیستم وب

کلاً از دیدگاه فنی سیستم وب در دو بخش سازماندهی می شود:

برنامه سمت سرویس دهنده ی وب و برنامه سمت مشتری وب
پایگاه اطلاعاتی توزیع شده از صفحات ابرمتن، فایل های داده مثل صدا، تصویر و بطور کل هر منبع

صفحه وب چیزی نیست مگر یک فایل متنی بسیار ساده که با یکی از زبان های نشانه گذاری ابرمتنی مثل HTML، XHTML ، DHTML یا XML تدوین می شود. کاری که مرورگر به عنوان مشتری وب انجام می دهد آن است که تقاضای دریافت یکی از صفحات یا فایل ها را در قالب قراردادی استاندارد (به نام پروتکل HTTP) به سمت سرویس دهنده ارسال کند. در سمت مقابل سرویس دهنده ی وب این تقاضا را پردازش کرده و در صورت امکان، فایل مورد نظر را برای مرورگر ارسال می کند. مرورگر پپس از دریافت فایل ابرمتنی ، آن را تفسیر کرده و به صورت صفحه آرایی شده روی خروجی نشان می دهد. اگر فایل ابرمتنی در جایی به فایل صدا یا تصویر پیوند خورده باشد آن ها نیز توسط مرورگر تقاضا شده و پس از دریافت در جای خود قرار می گیرند.




وب چگونه عمل می‌کند

برای مشاهده یک صفحه وب یا دیگر منابع اطلاعاتی روی تور جهان گستر معمولاً URL صفحه را در یک مرورگر وب وارد می‌کنیم و یا لینک ابر متن مربوط با آن صفحه یا منبع را انتخاب می‌کنیم. اولین گام که در پشت پرده انجام می‌شود اختصاص یک آدرس IP به بخش سرور URL است که توسط پایگاه داده توزیع شده اینترنت صورت می‌گیرد که به آن DNS می‌گویند.

در مرحله بعد یک درخواست HTTP به مرور وب در آن آدرس IP ارسال می‌شود و درخواست مشاهده صفحه ارائه می‌گردد. در صورتی که یک صفحه معمولی در خواست شده باشد متن HTML، تصاویر گرافیکی یا هر فایل دیگری که مربوط به آن صفحه است در اختیار مشتری (مرورگر وب) قرار می‌گیرد. سپس مرورگر وب صفحه HTML، و دیگر فایل‌های دریافت شده را ترجمه می‌کند. در نهایت "صفحه" مورد نظر مشتری در اختیار وی قرار می‌گیرد.

در تور جهان گستر، یک برنامه مشتری که عامل کاربر نام دارد منابع اطلاعاتی مانند صفحات وب یا فایل‌های کامپیوتری را با استفاده از URL از وب در خواست می‌کند. اگر عامل کاربر نوعی مرورگر وب باشد، اطلاعات را روی مانیتور نشان می‌دهد. کاربر می‌تواند با دنبال کردن لینکهای موجود در صفحه وب به بقیه منابع موجود روی تور جهان گستر دسترسی پیدا کند. همچنین می‌توان با پرکردن فرم‌های HTML و تحویل این فرم‌های وب می‌توان اطلاعات را بر اساس پروتکل انتقال ابرمتن به سرور وب برگرداند تا از آن ذخیره شده یا پردازش شوند. صفحات وب در کنار هم قرار گرفته و وب‌سایت‌ها را می سازند. عمل دنبال کردن ابرلینک از یک وب سایت به وب سایت دیگر را "مرور وب" یا " گشت و گذار" وب می‌نامند.

اصطلاح "گشت و گذار در اینترنت" اولین بار توسط جین آرمور پولی که یک کتابدار بود در مقاله یا به نام "Surfing the INTERNET" مطرح شد که ژوئن سال 1992 در "بولتن کتابخانه ویلسن" در دانشگاه مینوستا چاپ شد. اگر چه پولی مستقلاً از این کلمه استفاده کرد اما در یوزنت‌های مربوط به سال‌های 1991 و 1992 این کلمه دیده می‌شود و حتی عده‌ای می‌گویند که این کلمه در مجمع هکرها در دو سال قبل از آن به صورت شفاهی عنوان شده بود. پولی در تاریخ اینترنت به مادر اینترنت معروف است.

اغلب صفحات وب شامل ابر لینک‌هایی هستند که به صفحات و منابع اطلاعاتی مرتبط با آنها مانند صفحات دانلود، اسناد منابع، تعاریف و غیره منتهی می‌شوند. چنین مجموعه‌ای از منابع مفید و مرتبط با هم توسط لینک‌های ابر متن به یکدیگر متصل شده‌اند را "وب" اطلاعات می‌نامند. قرار دادن این مجموعه منابع روی اینترنت شبکه‌ای را تولید کرد که در اوایل دهه 1990 توسط تیم برنرز لی، " تور جهان گستر" نامیده شد.




عملکرد برنامه ی سرویس دهنده و مشتری وب

در سمت سرویس دهنده ی وب، پروسه ای وجود دارد که دائماً به پورت شماره 80 گوش می دهد و منتظر تقاضای برقراری اتصال توسط مشتریان می ماند. دقت کنید که برنامه ی سرویس دهنده از سوکت های نوع استریم استفاده می کند و اتصال از نوع TCP است. فرامین و داده هایی که بین سرویس دهنده و مرورگر وب مبادله می شوند تماماً متنی هستند.(همانند سیستم پست الکترونیکی) پس از آنکه ،ژ\ بین برنامه ی سویس دهنده و مشتری برقرار شد برنامه ی مشتری حق دارد یک یا چندین تقاضا بفرستد و این تقاضا ها باید در قالب استاندارد HTTP باشد. سرویس دهنده، یکایک تقاضا ها را دریافت و پردازش و در صورت امکان آن ها را اجرا می کند.




کش (cache)

اگر کاربر پس از مدت زمان اندکی به سرعت به صفحه وب برگردد احتمال دارد که اطلاعات از سرور وب اصلی بازیابی نشوند. به طور پیش فرض، مرورگرهای همه منابع وب را روی هارد کامپیوتر مشتری، مخفی (کش) می‌کنند. مرورگر درخواست HTML را تنها در صورتی که نیاز به روزآوری داده‌های قبلی وجود داشته باشد ارسال می‌کند. در غیر این صورت از داده‌های کش استفاده می‌شود.

این عمل باعث کاهش ترافیک شبکه اینترنت می‌شود. تصمیم‌گیری در مورد انقضای زمان استفاده از منبع تصویر، CSS، فایل جاوا اسکریپت و همچنین HTML به صورت مستقل انجام می‌گیرد. بنابراین حتی در برخی از سایت‌های با محتوای پویا، بسیاری از منابع اطلاعاتی اصلی فقط در هر بار مراجعه عرضه می‌شوند. بهتر است طراحان وب سایت همه فایل‌های جاوا اسکریپت و CSS را درون تعدادی فایل سایت جمع‌آوری کنند تا کش های کاربران بتوانند از آنها استفاده کنند و بدین ترتیب زمان دانلود شدن صفحه و تعداد مراجعات به سرور کاهش یابد.

همچنین بخش‌های دیگری از اینترنت می‌توانند محتوای وب را کش (مخفی) کنند. یکی از بهترین این اجزاء دیوارهای آتش است که در شرکت‌ها و محیط‌های دانشگاهی کاربرد دارد و منابع وب درخواست شده توسط یک کاربر را برای همه کاربران کش می‌کند. با وجود آن که این قابلیت‌ها در اغلب مرورگرهای وب دیده می‌شود طراحان صفحات وب می‌توانند عناوین HTTP که توسط کاربر درخواست شده را کنترل کنند تا صفحات در مواردی که لازم نیست در کش ذخیره نشوند؛ مثلاً صفحات خبری و بانک‌ها.

بدین ترتیب می‌توانیم بین اعمال "دریافت" و "ارسال" HTTP تفاوت قائل شویم. در صورتی که همه شرایط محقق شود، داده‌هایی که توسط فرمان دریافت (GET) درخواست شده‌اند می‌توانند در کش ذخیره شوند در حالی که داده‌های به دست آمده پس از ارسال (posting) اطلاعات به سرور در کش ذخیره نمی‌شوند.





جاوا و جاوا اسکریپت

این سیستم به سرورهای وب امکان می‌دهد تا برنامه‌های کوچکی (که اپلت (applet) نامیده می‌شوند) را مستقیماً در شبکه اطلاعات بازیابی شده قرار دهند و این اپلت‌ها که در کامپیوتر کاربر اجرا می‌شوند تعامل کاربر با اینترنت را سرعت می‌بخشد. در نهایت این سیستم به عنوان ابزاری برای تولید محتویات پیچیده طرف سرور مورد استفاده قرار گرفت. شرکت سان تلاش می‌کرد جاوا را به عنوان یک پلاتفرم برای اپلت‌های طرف مشتری مطرح کند اما به دلایلی مانند عدم وجود یکپارچگی با محتوا (اپلت‌ها به جعبه‌های کوچکی محدود می‌شدند که درون صفحه قرار داشتند) و عملکرد ضعیف (مخصوصاً شروع با تأخیر) ماشین مجازی بر روی سخت‌افزارهای PCهای آن زمان این امر هرگز محقق نشد.

با این وجود، جاوا اسکریپت یک زبان برنامه‌نویسی اسکریپتی است که برای صفحات وب طراحی شده است. نسخه استاندارد آن ECMAScript نام دارد. اگر چه نام آن شبیه جاوا است اما توسط شرکت ارتباطات نت اسکیپ (Netscape) طراحی شده است و تقریباً هیچ ارتباطی با جاوا که ساخت شرکت میکروسیستم‌های سان است ندارد. تنها شباهت آن با جاوا در این است که نحوه نگارش آن از زبان برنامه نویسی C گرفته شده است. جاوا اسکریپت مانند جاوا برنامه نویسی شیءگرا است اما شبیه سی پلاس پلاس و بر خلاف جاوا امکان استفاده از کدهای درهم (مخلوط) یعنی استفاده هم زمان از زبان برنامه‌نویسی شیء گرا و برنامه‌نویسی رویه‌ای را فراهم می‌آورد. جاوا اسکریپت در کنار مدل شیء سند به زبان برنامه‌نویسی بسیار قوی‌ای تبدیل شده که حتی طراحان آن چنین تصوری از موفقیت آن نداشتند. گاهی اوقات در مورد آن از کلمه HTML پویا (DHTML) استفاده می‌شود تا گذر از صفحات HTML "ایستا" بیشتر حس می‌شود.

(برنامه‌نویسی) آجاکس یک فناوری مبتنی بر جاوا اسکریپت است که تأثیر زیادی بر شکل‌گیری تور جهان گستر داشته است. در این روش در زمان‌های لازم، تنها بخشی از صفحه وب که مورد نیاز کاربر است به روز می‌شود تا سرعت کاربر بالاتر برود. آجاکس یکی از جنبه‌های مهم وب 2.0 محسوب می‌شود.




تأثیر بر روابط اجتماعی

وب در دنیای امروزی تبادل اطلاعات بین افراد در سراسر جهان را بسیار ساده و آسان نموده است و این امر با این حجم وسیع هرگز در تاریخ بشر سابقه نداشته است. افرادی که در گوشه و کنار جهان قرار دارند و هزاران کیلومتر از یکدیگر فاصله می‌توانند افکار خود را به راحتی مبادله کنند و یا از روحیات و خط مشی زندگی خود با دیگران صحبت کنند. تجربه‌های عاطفی، عقاید سیاسی، رسوم فرهنگی، ضرب‌المثل‌های ریتم‌دار، پندهای تجاری، کارهای هنری، تصاویر و عکس‌ها، قطعات ادبی بدون هیچ سرمایه‌گذاری از جانب کاربر به راحتی در اختیار وی قرار می‌گیرد. اگر چه کارایی وب به فناوری مادی آن وابسته است اطلاعات موجود روی آن به شیوه کتابخانه و یا مطبوعات به صورت فیزیکی ارائه نمی‌شوند. بنابراین انتشارات اطلاعات از طریق وب اینترنت به کتاب‌ها و مجله‌های فیزیکی و مادی محدود نمی‌شود و نیاز به کپی کردن فیزیکی اطلاعات وجود ندارد. اطلاعات موجود روی وب به صورت دیجیتال ارائه می‌شوند و بنابراین جستجو در آنها به سرعت زیادی صورت می‌گیرد. که بسیار سریع‌تر از جستجو در کتابخانه است و حتی فردی که در اینترنت جستجو می‌کند نسبت به فردی که از پست نامه، تلفن، تلگراف و یا وسایل ارتباطی دیگر استفاده می‌کند با سرعت بیشتری اطلاعات را بازیابی می‌کند.

وب مهم‌ترین ابزار تبادل اطلاعات است که در کره زمین رونق فراوانی یافته است. این قابلیت به کاربران اجازه می‌دهد تا با افراد و گروه‌های مختلفی که در سراسر جهان پراکنده هستند و در فضا و مکان متفاوتی قرار دارند ارتباط برقرار کنند و نیاز به برقراری ارتباط فیزیکی میان افراد را مرتفع می‌سازد.

از آنجا که وب در سراسر جهان فعال است، عده‌ای آن را عامل ایجاد تفاهم میان افراد ساکن در سراسر جهان می‌دانند. وب پتانسیل فراوانی برای ایجاد روابط اجتماعی دارد و می‌تواند حس نوع‌دوستی و درک متقابل را افزایش دهد و یا حتی باعث شو که خشونت به صورت وسیعی رواج یابد و یا رژیم‌های ظالم و عوام فریب به خواسته‌های خود که در طول تاریخ از دستیابی به آنها عاجز بودند بترسند.

امروزه در وب انواع مختلف اطلاعات را می‌توان یافت و افرادی که تمایل دارند با جوامع و فرهنگ‌های مختلف آشنا شدند مراجعه به وب ساده‌ترین راه است. اگر بخواهیم به شهری دور دست سفر کنید، وب بهترین مرجع ممکن برای یافتن اطلاعات مربوط به آن شهر است مخصوصاً اگر شهر مورد نظرتان در یکی از کشورهای توسعه نیافته قرار داشته باشد. روزنامه‌های محلی، مطبوعات دولتی و غیره از طریق اینترنت به راحتی قابل دسترسی هستند و به همین دلیل است که کاربران اینترنت روز به روز افزایش می‌یابند.




انتشار صفحات وب

صفحات وب در دسترس همه رسانه‌های جمعی قرار دارد. برای آنکه بتوانید یک صفحه وب را "منتشر" کنید لازم نیست به سراغ یک ناشر یا مؤسسه رسانه‌ای که در سرتاسر جهان مشاهده می‌شوند بروید. ابر متن، برخلاف کتاب و اسناد، دارای یک نظم خطی از ابتدا تا انتها نیست. ابر متن به بخش‌های فصل، زیر فصل و عناوین که در کتاب‌ها دیده می‌شود تقسیم‌بندی نمی‌شود.

اگر چه برخی از وب سایت‌ها به چند زبان عرضه می‌شوند بسیاری از آنها فقط به یک زبان ارائه می‌شوند. همه برنامه‌های کامپیوتری همه کاراکترهای خاص و متون دو سویه RTL را در بر نمی‌گیرند. این عوامل این ادعا را که تور جهان گستر، جهان را به سمت یکپارچه شدن پیش می‌برد به چالش می‌کشد. فرصت مناسب برای انتشار اطلاعات در صفحات وب شخصی و همچنین صفحات خانوادگی تجارت‌های خرد و غیره توسط خدمات رایگان میزبانی وب به اوج خود رسیده است.




سرعت در وب

نگرانی موجود در مورد ازدحام اطلاعات روی زیر ساختار اینترنت و تأخیر زیاد در دسترسی به داده‌ها به باعث شده است که نام World Wide Web به "World Wide Wait" تغییر کند! افزایش سرعت اینترنت مسأله‌ای مهم در بحث‌های مربوط به استفاده از همتا سازی و کیفیت خدمات (QOS) است. راه حل‌های ممکن برای کاهش انتظار برای مشاهده صفحات وب در سایت W3C ارائه شده است.

راهنمای استانداردهای موجود برای پاسخ زمانی ایده‌آل صفحات وب (مطابق کتاب نیلسن، چاپ 1999، صفحه 42) عبارتند از:

1/0 ثانیه (یک دهم ثانیه). زمان ایده‌آل پاسخ کاربر هیچ گونه تأخیری را حس نمی‌کند.
1 ثانیه. حداکثر زمان قابل قبول. زمان دانلود بیش از 1 ثانیه کاربر را خسته می‌کند.
10 ثانیه. زمان غیر قابل قبول. کاربر خسته شده و دوست دارد سایت را ترک کند. این اعداد برای طراحی ظرفیت سرور کاربرد زیادی دارند.



www در نام‌های وب‌سایت‌ها

از لحاظ فنی هیچ دلیلی وجود ندارد که نام سایت حتماً با www آغاز شود و اولین سرور وب در "info.cern.ch" قرار داشت. استفاده از پیشوند www یک توافق است که بین سازمان‌های ارائه دهنده خدمات وب انجام شده است تا تمامی نام‌های میزبان از یک پروتکل تبعیت کنند؛ برای مثال، بسیاری از سازمان‌ها نام سرور اصلی پروتکل گوفر خرد را به صورت gopher.wherever.edu تعریف می‌کنند و از پیشوندهای دیگری استفاده می‌کنند تا بتوان از چندین سرور وب استفاده کنند. برخی از مرورگرها به صورت خودکار www را به ابتدا و ".com" را به انتهای URL تایپ شده اضافه می‌کنند. در مرورگرهای اینترنت اکسپلورر و فایرفاکس موزیلا با فشردن همزمان کلیدهای ctrl و Enter پیشوند "http://www." و پسوند "com." به انتهای URL اضافه می‌شوند.




تلفظ "www

در زبان انگلیسی، WWW طولانی‌ترین تلفظ ممکن تور جهان گستر است که یک سرواژه سه حرفی است که به نه سیلاب نیاز دارد. داگلاس آدامز اظهار داشت: World Wide Web تنها عبارتی است که تلفظ شکل مختصر آن سه برابر بیشتر از تلفظ خود آن طول می‌کشد.

نسخه‌های کوتاه‌تر عبارتنداز "triple double 'u'"، "triple dub"، "dub dub dub"، "wuh wuh wuh" و "all the 'double u's". در زبان‌های دیگر "WWW" را اغلب "VVV" تلفظ می‌کنند. در زبان چینی، World Wide Web را به صورت wàn wéi wǎng تلفظ می‌کنند (به چینی: 万维网) که به معنای "شبکه ده هزار بعدی" است.




وب ۲٫۰
در وب ۲٫۰، کاربران قادرند خود به ایجاد و خلق محتوا در فضای اینترنت پرداخته، و دیگران را در داشته‌ها و اطّلاعات خود شریک سازند، و یا کارهای موجود از ناحیه دیگران را به صورتی مستقیم و بی واسطه مورد نقد و تغییر قرار دهند.




وب معنایی

وب معنایی یک جنبش مشترک است که توسط w۳c رهبری می شود که فرمت های رایج داده را روی شبکه گسترده جهانی ترویج می کند. با تشویق به گنجاندن محتوی معنایی در صفحات وب، وب معنایی به تبدیل شدن وب حاضر مشتمل بر اسناد ساختار نایافته به یک "وبی از داده ها" کمک می کند. این در چارچوب شرح منابع (RDF) از w۳c ساخته می شود.

بنابر w۳c، " وب معنایی یک چارچوب مشترک فراهم می آورد که اجازه می دهد داده ها به اشتراک گذاشته شوند و در سراسر مرزهای کاربردی، اقتصادی و اجتماعی دوباره استفاده شوند."

این واژه توسط تیم برنزلی،مخترع وب گسترده جهانی و گرداننده w۳c،ابداع شد که هم اکنون بر توسعه استانداردهای مطرح شده وب معنایی نظارت دارد. او وب معنایی را این گونه معنی کرد که " تارنمایی از داده که می تواند مستقیم و غیر مسقیم توسط ماشین مورد پردازش قرار بگیرد. " درحالی که منتقدان پرسش هایی درباره امکان پذیر بودن آن دارند، طرفداران استدلال می کنند که برنامه های کاربردی در صنعت، زیست شناسی و تحقیقات علوم انسانی، در حال حاضر، اعتبار مفهوم اصلی را ثابت کرده است.




تاریخچه

مفهوم مدل شبکه معنایی در اوایل دهه شصت توسط دانشمند شناختیAllan M.Collins، زبان شناس M. Ross Quillian و روان شناس Elizabeth F.Loftus در نشریات مختلف به عنوان یک فرم برای نمایش دادن دانش ساخت یافته معنایی، ابداع شد. با قراردادن ابرداده قابل خواندن توسط ماشین ،درباره صفحات و چگونگی ارتباط آن ها با یکدیگر، فعال کردن عامل های خودکارشده برای دسترسی هوشمندانه تر وب و انجام وظایف از طرف کاربران موجب گسترش یافتن شبکه صفحات وب ابرپیوند شده که تنها توسط انسان قابل خواندن بود، شد.

خیلی از فناوری هایی که توسط w۳c مطرح شده است قبل از این که زیر چتر w۳cقرار بگیرند، وجود داشته اند. این ها در زمینه های مختلف استفاده شده است، به خصوص برخورد با اطلاعاتی است که شامل یک دامنه محدود و تعریف شده است، و جایی که داده به اشتراک گذاشته شده یک نیاز مشترک است، مانند تحقیقات علمی یا داده های تبدیل شده مابین کسب و کارها. به علاوه، فناوری هایی با هدف مشترک ، مانند microformat ها، ظهور کرده اند.




هدف

اصلی ترین هدف وب معنایی قادر ساختن کاربران برای پیداکردن، اشتراک گذاشتن و راحت تر ترکیب کردن اطلاعات جهت تکامل بخشیدن وب حاضر است. انسان ها توانایی استفاده از وب را برای پیش بردن وظایفی مانند پیدا کردن معادل ایرلندی کلمه "پوشه"، رزرو کردن یک کتاب از کتابخانه و جستجو برای پایین ترین قیمت یک DVD را دارند. به هرحال، ماشین ها نمی توانند تمام این وظایف را بدون دستورالعمل انسان انجام دهند، چرا که صفحات وب طوری طراحی شده اند که توسط مردم خوانده شود، نه ماشین ها. وب معنایی یک چشم انداز از اطلاعات است که می تواند به آسانی توسط ماشین تفسیر شود، بنابرین ماشین ها می توانند بسیاری از کارهای خسته کننده شامل پیداکردن، ترکیب کردن و اقدام بر اساس اطلاعات بر روی وب را انجام دهند. وب معنایی، همان طور که در ابتدا پیش بینی می شد، سیستمی است که ماشین ها را به کار می اندازد که "بفهمند" و به درخواست های پیچیده انسان براساس معنای آن ها پاسخ دهند. چنین "فهمیدن" مستلزم آن است که منابع اطلاعاتی مربوطه به طور معنایی ساختار یافته شوند،یک کار چالش برانگیز. تیم برنز لی در ابتدا چشم انداز وب معنایی را این گونه توصیف کرد:

من رویایی دارم برای وب که در آن کامپیوتر ها توانایی تحلیل تمام داده های روی وب، مثل محتوی،پیوندها و تراکنش های بین مردم و کامپیوتر ها را دارند. یک وب معنایی، که این امر را ممکن می سازد، فعلا در حال ظهور است، اما زمانی که کامل شود، روال های روزانه تجارت ، بروکراسی و زندگی روزمره ما توسط گفتگوی بین ماشین ها انجام می شود. عامل های هوشمند بین مردم برای دوره ای که نهایتا این امر محقق شود تبلیغ می کنند.

وب معنایی به عنوان یک جمع کننده بین تمام محتوی مختلف،سیستم ها و برنامه های کاربردی اطلاعاتی در نظر گرفته شده است. برنامه های کاربردی در زمینه نشر، وبلاگ نویسی و خیلی سطوح دیگر وجود دارد.

معمولا واژه های معناشناسی، ابرداده، هستی شناسی و وب معنایی متناقض استفاده می شوند. به طور خاص، این واژه ها به عنوان کلمات فنی هر روز توسط محققین و پزشکان،جهت پوشش یک گستره وسیعی از زمینه های مختلف فن آوری، مفاهیم و سطوح برنامه های کاربردی استفاده می شوند. به علاوه، با توجه به وضعیت فعلی، نسبت به فعال کردن فناوری هایی که برای تحقق وب معنایی پیش بینی می شد، سردرگمی وجود دارد. در یک مقاله که توسط Greber,Barnard, Van der Merwe ارائه شد، چشم انداز وب معنایی جدول بندی شده و خلاصه ای از واژگان و فناوری های راه انداز ارائه شده است. مدل معماری مطرح شده توسط تیم برنزلی به عنوان مبنایی که مدل وضعیت فناوری های حال حاضر و در حال ظهور را ارائه می کند، استفاده می شود.




محدودیت های HTML

بسیاری از فایل های روی یک کامپیوتر معمولی را می توان آزادانه به اسناد قابل خواندن توسط انسان و داده های قابل خواندن برای ماشین تقسیم کرد. اسناد مثل پیام نامه ها، گزارشات و بروشورها توسط انسان خوانده می شود. داده، مثل تقویم، دفترچه آدرس،لیست پخش و صفحات گسترده از یک برنامه کاربردی برای نمایش، جستجو و ترکیب در حالات مختلف استفاده می کنند.

در حال حاضر، تارنمای گسترده جهانی عمدتا بر مبنای اسنادی است که با HTML نوشته شده است، یک استاندارد نشانه گذاری که برای کدینگ مجموعه ای از متن در خلال عناصر چند رسانه ای مانند تصاویر و فرم های تعاملی استفاده شده است. تگ های ابر داده روشی را فراهم می آورد که هر کامپیوتر می تواند محتوی صفحات وب را دسته بندی کند .




چالش ها

برخی از چالش های وب معنایی شامل وسعت، ابهام، تردید، تناقض و فریب. سیستم های استدلال کننده خودکار مجبور خواهد بود با تمام این مسائل مقابله کند به جای این که وعده وب معنایی را ارئه دهد.

وسعت : تارنمای گسترده جهانی شامل میلیاردها صفحه شده است. SNOMED CT هستی شناسی واژه شناسی پزشکی به تنهایی شامل 370,000 نام کلاس است و فناوری موجود هنوز قادر نبوده است که واژهای تکراری از جهت معنا را ازبین ببرد. هر سیستم استدلال کننده خودکاری مجبور است با ورودی های واقعا بزرگ مفابله کند.

ابهام : وجوه مبهمی مانند "جوان" و "بلند" وجود دارد. این ناشی می شود از ابهام درخواست کاربران، از وجوه ارائه شده توسط گردآورندگان محتوی، از انطباق واژه های درخواست با واژه های گرداورندگان و از تلاش برای ترکیب مبانی دانش های مختلف با وجوه مشترک ولی جنبه های متفاوت. منطق فازی رایج ترین تکنیک برای مقابله با ابهام است.

عدم قطعیت : وجوه دقیقی با ارزش های مشکوک وجود دارد. برای مثال، یک بیمار ممکن است مجموعه ای از علائم را که هرکدام متناظر با تشخیص مشخص و احتمال متفاوت باشد، را ارائه کند. روش های استدلال احتمالاتی به طور کلی کار برای رسیدگی به عدم قطعیت است.

تناقض : تناقضات منطقی ای وجود دارد که به ناچار در طول توسعه هستی شناسی بزرگ، و زمانی که هستی شناسی ها از منابع جدا با هم ترکیب شده اند، بوجود خواهد آمد. استدلال استقرایی یا قیاسی با شکست روبروست وقتی با تناقض مواجه است، زیرا "هر چیزی به دنبال یک تناقض" است. استدلال فسخ کردنی و استدلال paraconsistent، دو روش است که می تواند برای مقابله با تناقض به کار رود.

فریب : زمانی رخ می دهد که تهیه کننده اطلاعات عمدا مصرف کننده اطلاعات را گمراه کند. تکنیک های رمز نگاری در حال حاضر برای کاهش این تهدید مورد استفاده قرار می گیرند.

این لیست چالش ها بیش از این که کامل باشد، روشنگر است و روی چالش های لایه های "منطق وحدت" و "برهان" از وب معنایی، تمرکز دارد .گزارش آخر گروه رشد برای استدلال عدم قطعیت W3C، تمام این مشکلات را تحت عنوان "عدم قطعیت" جمع کرد. خیلی از تکنیک های ذکر شده در اینجا الحاقاتی نیاز خواهند داشت به زبان هستی شناسی وب مثلا برای حاشیه نویسی احتمالات شرطی.این منطقه از پژوهش فعال است.




استانداردها

استانداردسازی وب معنایی در وب3 تحت پوشش W3C می باشد.




اجزا

واژه "وب معنایی" معمولا استفاده می شود برای اشاره به فرمت ها و فناوری هایی که آنرا به کار می اندازند.جمع آوری، ساختاربندی و بازیابی داده های پیوندشده با فناوری ها یی که یک توضیح رسمی از وجوه،واژه ها و روابط در خلال یک دامنه دانش داده شده فراهم می آورد. این فن آوری ها طبق استانداردهای W3C مشخص شده اند و شامل این موارد می شود :

چارچوب تشریح منابع (RDF) یک روش عمومی برای توصیف اطلاعات

شمای RDF (RDFS)

سیستم سازمانی دانش ساده (SKOS)

SPARQL یک زبان پرس و جوی RDF

نشان گذاری3 (N3)، طراحی شده با توانایی خواندن انسان در ذهن

N-Triples، فرمتی برای ذخیره کردن و انتقال داده

لاک پشت[سه تایی](زبان RDF سه مختصر و مفید)

زبان هستی شناسی وب(OWL)، یک خانواده از زبان های ارائه دانش

پشته وب معنایی روشنگر معماری وب معنایی است. توابع و روابط اجزا می تواند به صورت زیر خلاصه شود :

XML یک گرامر عنصری برای ساختار محتوی داخل اسناد فراهم می آورد.XML در حال حاضر یکی از اجزا لازم فناوری های وب معنایی در خیلی از موارد نیست، به عنوان جایگزین گرانرهای موجود، از قبیل لاک پشت. لاک پشت یک استاندارد بالفعل است اما از طریق یک فرآیند استاندارد رسمی نبوده است.

شمای XML یک زبان برای فراهم آوردن و محدود کردن ساختار و محتوی عناصری است که در اسناد XML وجود دارند.

RDF یک زبان ساده برای توصیف مدل های داده است که به اشیا ("منابع") و روابطشان اشاره دارد. یک مدل برپایه RDFمی تواند در گرامرهای مختلفی ارائه شود، مثل RDF/XML،N3،لاک پشت و RDFa. RDF یک استاندارد پایه ای از وب معنایی است.

شما RDF، RDF را توسعه داده است و یک لغت برای توصیف ویژگی ها و کلاس های منابع بر پایه RDF، با معانی برای تعمیم سلسله مراتب از خواص و طبقات است.

OWL لغات بیشتری برای توصیف ویژگی ها و کلاس ها اضافه می کند: از بین آن ها،روابط بین کلاس ها(disjointness)، cardinality(برای مثال "دقیقا یک" )، برابری،نوع سازی غنی تر از ویژگی ها، مشخصات ویژگی ها وشمارش کلاس ها.

SPARQL یک پروتکل و زبان کوئری از مبانع وب معنایی است.

وضعیت فعلی استاندارد سازی

استاندارد سازی های در حال پیشرفت فعلی شامل :

قانون فرمت تبادل(RIF) به عنوان لایه ای از پشته وب معنایی.

لایه هایی که هایی که هنوز به طور کامل بیرون نیامده اند شامل :

لایه های منطق وحدت و مدرک تحت تحقیقات فعال هستند.

مقصود بالابردن قابلیت استفاده و فایده وب است و ارتباط تنگاتنگ آن با منابع از طریق :

سرورهایی سیستم های داده ای موجود را با استفاده از RDF و SPARQL نشان می دهند.خیلی تبدیل کننده ها به RDF از برنامه های کاربردی مختلف وجود دارد.پایگاه داده های رابطه ای یک منبع مهم هستند. سرور وب معنایی بدون تاثیر گذاری بر عملکرد سیستم موجود به آن پیوست می شود.

اسناد "نشانه گداری شده" با اطلاعات معنایی(یک توسعه از تگ <meta>در HTML در صفحات وب امروزی برای تامین اطلاعات موتورهای جستجوی وب، با استفاده از وب خزنده، به کاربرده می شود). این می تواند اطلاعات قابل فهم برای ماشین درباره محتوی اسناد قابل فهم برای انسان باشد(از قبیل تولید کننده،عنوان،توضیحات اسناد) یا می تواند صرفا ابرداده نمایش دهنده مجموعه ای از حقایق باشد(از قبیل منابع و خدمات در هرکجای سایت ها).(توجه کنید که هرچیزی که بتواند با شناسه منبع یکنواخت شناسایی (URI) شود، می تواند توصیف شود، بنابرین وب معنایی می تواند درباره حیوانات،مردم،اماکن،ایده ها استدلال کند.) نشانه گذاری معنایی معمولا خودکار، تا به صورت دستی، تولید می شود.

واژگان ابرداده رایج(هستی شناسی ها) و نگاشت بین واژگان که به خالقان اسناد اجازه می دهد بدانند که چگونه اسنادشان را نشانه گذاری کنند، بنابرین عامل ها می توانند اطلاعات در ابرداده تامین شده را استفاده کنند( بنابرین مولف درمقام 'مولف صفحه' با مولف در مقام مولف کتابی که موضوع مرور یک کتاب است، اشتباه گرفته نمی شود. )


عامل های خودکارشده برای اجرای وظایف برای کاربران وب معنایی با استفاده از این داده

خدمات برپایه وب(معمولا با عامل های خودشان) برای تامین اطلاعات مخصوص عامل ها(برای مثال یک خدمت مورد اعتماد که یک عامل بتواند درباره تاریخچه خدمات ضعیف یا هرزه نگاری برخی فروشگاه های برخط بپرسد)
4:44 pm
داده

به طور کلی، می‌توان همهٔ دانسته‌ها، آگاهی‌ها، داشته‌ها، آمارها، شناسه‌ها، پیشینه‌ها و پنداشته‌ها را داده یا دیتا (به انگلیسی: Data) نامید. انسان برای ثبت و درک مشترک هر واقعیت و پدیده از نشانه‌های ویژهٔ آن بهره گرفته‌است.

انسان برای نمایاندن داده‌ها نخست از نگاره و در ادامهٔ سیر تکاملی آن از حروف، شماره‌ها و نشانه‌ها کمک گرفت. برای بازنمودن داده‌ها از این موارد کمکی یا ترکیبی از آن‌ها استفاده می‌شود





در رایانه

به اعداد، حروف و علائم که جهت درک و فهم مشترک از انسان‌ها یا رایانه سرچشمه می‌گیرند داده می‌گویند. داده‌ها معمولاً از سوی انسان‌ها بصورت حروف، اعداد، علائم و در رایانه به صورت نمادهایی (همان رمزهای صفر و یک) قراردادی ارائه می‌شوند. اصطلاح داده یک عبارت نسبی است یعنی اگر موجب درک و فهم لازم و کامل دراین مرحله شده‌است به عنوان آگاهی یا اطلاعات از آن نام می‌برند و چنانچه موجب درک و فهم کامل نگردد به عنوان همان داده به شمار می‌آیند و چون هدف نهایی آگاهی و اطلاعات است باید از سوی دست‌اندرکاران (انسان یا رایانه) دستکاری یا پردازش شوند. منظور از دستکاری یا پردازش داده‌ها انجام عملیاتی از قبیل جمع، تفریق، ضرب، تقسیم، مقایسه وغیره‌است.

داده‌ها مجموعه‌ای از نمادها (برای انسان حروف، اعداد، علائم و برای رایانه رمزهای صفر و یک) هستند که حقایق را نشان می‌دهند و برای انسان از طریق رسانه‌های وی (بینایی، شنوایی، چشایی، بویایی، بساوایی) و برای رایانه از طریق لوازم ویژه (صفحه کلید موس و غیره) به دست می‌آیند.

داده‌ها امروزه فقط از سوی انسان یا رایانه پردازش می‌شوند یعنی کارهایی روی آن‌ها صورت می‌گیرد. در پردازش داده‌ها (داده‌پردازی) در رایانه ابتدا داده‌ها به رایانه وارد می‌شوند. این داده‌ها درابتدا ذخیره شده و روی آن‌ها عملیاتی (جمع، تفریق، ضرب، تقسیم و...) صورت می‌گیرد. پس از این که این عملیات (پردازش) صورت گرفت معمولاً داده‌ها به یک رایانه دیگر یا دوباره به انسان‌ها منتقل می‌شود. در اغلب گزارش‌ها و یادداشت‌های سازمانی، داده‌ها به چشم می‌خورند. برای نمونه، تاریخ و مقدار یک صورت‌حساب یا چک، جزئیات فهرست حقوق، تعداد وسایل نقلیه‌ای که از نقطهٔ خاصی در کنار جاده گذشته‌اند،... نمونه‌هایی از داده‌ها هستند.



انواع داده‌ها از نظر ساخت‌یافتگی

داده‌های ساخت‌یافته
داده‌های نیمه‌ساخت‌یافته



داده‌های زمانی
در بسیاری از کاربردهای مبتنی بر داده‌ها و اطلاعات ذخیره‌سازی و بازیافت حالا ت و وضعیت‌های سیستم در طی زمان اهمیت می‌یابد.



داده‌های مکانی
داده‌های مکانی (geospatial data ) به مجموعه‌ای از داده‌ها گفته می‌شود که بیان کننده موقعیت جغرافیایی یک عارضه(طبیعی یا مصنوعی) بر روی زمین باشند. داده‌های مکانی معمولاً به صورت موقعیت و یا روابط هندسی ذخیره شده و قابل نمایش در نقشه‌ها می‌باشند. داده‌ها مکانی بیشتر در سامانه‌های اطلاعات مکانی نگهداری شده، قابل دسترسی و پردازش می‌باشند.



پردازش رایانه‌ای داده‌ها

پردازش رایانه‌ای داده‌ها هر فرایندی است که از برنامه‌ای رایانه‌ای برای واردسازی داده‌ها، خلاصه‌بندی، تحلیل و در غیر اینصورت تبدیل‌داده به اطلاعات قابل استفاده استفاده می‌کند.

علوم و فناوری پردازش داده‌ها دارای وسعت، گوناگونی، و پیچیدگی فراوانی بوده، و این زمینه از دانش به شاخه‌ها و زیر شاخه‌های متعددی تقسیم می‌شود

پردازش علائم
پردازش علائم (سیگنال‌ها) را باید یکی از شاخه‌های وسیع و پر کاربرد در پردازش داده‌ها به حساب آورد.

پردازش تصاویر
پردازش تصاویر یکی از زمینه‌های عمده و خاص در پردازش علائم به حساب می‌آید که در آن داده‌های مورد پردازش و عمل‌آوری تصاویر و سیگنال‌های دو بعدی‌ست.

پردازش متون
یکی از مسائل عمده در پردازش متون و به طور عمومی‌تر در پردازش زبان‌های طبیعی عملیات و فرایندهای مربوط به مدل‌سازی داده‌ها است.





فشرده‌سازی داده‌ها

کدگذاری منبع روش‌های فشرده‌سازی یک منبع اطلاعات را مطالعه می‌کند. منابع اطلاعاتی طبیعی، مانند گفتار یا نوشتار انسان‌ها، دارای افزونگی است؛ برای مثال در جمله «من به خانه‌مان برگشتم» ضمایر «مان» و شناسه «م» در فعل جمله را می‌توان از جمله حذف نمود بدون اینکه از مفموم مورد نظر جمله چیزی کاسته شود. این توضیح را می‌توان معادل با انجام عمل فشرده سازی روی اطلاعات یک منبع اطلاعات دانست؛ بنابراین منظور از فشرده سازی اطلاعات کاستن از حجم آن به نحوی است که محتوی آن دچار تغییر نامناسبی نشود.

در علوم کامپیوتر و نظریه اطلاعات، فشرده سازی داده‌ها یا کد کردن داده‌ها، در واقع فرایند رمزگذاری اطلاعات با استفاده از تعداد بیت‌هایی (یا واحدهای دیگر حامل داده) کمتر از آنچه یک تمثال رمزگذاری نشده از همان اطلاعات استفاده می‌کند و با به کار گرفتن روش‌های رمزگذاری ویژه‌ای است.

مانند هر ارتباطی، ارتباطات با اطلاعات فشرده، تنها زمانی کار می‌کند که هم فرستنده و هم گیرندهٔ اطلاعات، روش رمزگذاری را بفهمند. به عنوان مثال این نوشته تنها زمانی مفهوم است که گیرنده متوجه باشد که هدف پیاده‌سازی با استفاده از زبان فارسی بوده. به همین ترتیب، دادهٔ فشرده سازی شده تنها زمانی مفهوم است که گیرنده روش رمزگشایی آن را بداند.

فشرده سازی به این دلیل مهم است که کمک می‌کند مصرف منابع با ارزش، مانند فضای هارد دیسک و یا پهنای باند ارسال، را کاهش دهد. البته از طرفی دیگر، اطلاعات فشرده سازی شده برای اینکه مورد استفاده قرار بگیرند باید از حال فشرده خارج شوند و این فرایند اضافه ممکن است برای بعضی از برنامه‌های کاربردی زیان آور باشد. برای مثال یک روش فشرده سازی برای یک فیلم ویدئویی ممکن است نیازمند تجهیزات و سخت‌افزار گران‌قیمتی باشد که بتواند فیلم را با سرعت بالایی از حالت فشرده خارج سازد که بتواند به طور همزمان با رمزگشایی پخش شود (گزینه‌ای که ابتدا رمزگشایی شود و سپس پخش شود، ممکن است به علت کم بود فضای برای فیلم رمزگشایی شده حافظه امکان‌پذیر نباشد). بنابراین طراحی روش فشرده سازی نیازمند موازنه و برآیندگیری بین عوامل متعددی است. از جمله این عوامل درصد فشرده سازی، میزان پیچیدگی معرفی شده (اگر از یک روش فشرده سازی پر اتلاف استفاده شود) و منابع محاسباتی لازم برای فشرده سازی و رمزگشایی اطلاعات را می‌توان نام برد. فشرده سازی به دو دسته فشرده‌سازی اتلافی (فشرده‌سازی با اتلاف) و فشرده‌سازی بهینه فشرده‌سازی بی‌اتلاف اطلاعات تقسیم می‌شوند. کدگذاری منبع، علم مطالعه روش‌های انجام این عمل، برای منابع متفاوت اطلاعاتی موجود است.




فشرده سازی بهینه در مقابل اتلافی

الگوریتم‌های فشرده سازی بهینه معمولاً فراوانی آماری را به طریقی به کار می‌گیرند که بتوان اطلاعات فرستنده را اجمالی تر و بدون خطا نمایش دهند. فشرده سازی بهینه امکان‌پذیر است چون اغلب اطلاعات جهان واقعی دارای فراوانی آماری هستند. برای مثال در زبان فارسی حرف "الف" خیلی بیش تر از حرف "ژ" استفاده می‌شود و احتمال اینکه مثلاً حرف "غین" بعد از حرف "ژ" بیاید بسیار کم است. نوع دیگری از فشرده سازی، که فشرده سازی پر اتلاف یا کدگذاری ادراکی نام دارد که در صورتی مفید است که درصدی از صحت اطلاعات کفایت کند. به طور کلی فشرده سازی اتلافی توسط جستجو روی نحوهٔ دریافت اطلاعات مورد نظر توسط افراد راهنمایی می‌شود. برای مثال، چشم انسان نسبت به تغییرات ظریف در روشنایی حساس تر از تغییرات در رنگ است. فشرده سازی تصویر به روش JPEG طوری عمل می‌کند که از بخشی از این اطلاعات کم ارزش تر "صرف نظر" می‌کند. فشرده سازی اتلافی روشی را ارائه می‌کند که بتوان بیشترین صحت برای درصد فشرده سازی مورد نظر را به دست‌آورد. در برخی موارد فشرده سازی شفاف (نا محسوس) مورد نیاز است؛ در مواردی دیگر صحت قربانی می‌شود تا حجم اطلاعات تا حد ممکن کاهش بیابد.

روش‌های فشرده سازی بهینه برگشت پذیرند به نحوی که اطلاعات اولیه قابلیت بازیابی به طور دقیق را دارند در حالی که روش‌های اتلافی، از دست دادن مقداری از اطلاعات را برای دست یابی به فشردگی بیشتر می‌پذیرند. البته همواره برخی از داده وجود دارند که الگوریتم‌های فشرده سازی بهینهٔ اطلاعات در فشرده سازی آن‌ها ناتوان اند. در واقع هیچ الگوریتم فشرده سازی ای نمی‌تواند اطلاعاتی که هیچ الگوی قابل تشخیصی ندارند را فشرده سازی کند. بنابراین تلاش برای فشرده سازی اطلاعاتی که قبلاً فشرده شده‌اند معمولاً نتیجهٔ عکس داشته (به جای کم کردن حجم، آن را زیاد می‌کند)، هم چنین است تلاش برای فشرده سازی هر اطلاعات رمز شده‌ای (مگر حالتی که رمز بسیار ابتدایی باشد).

در عمل، فشرده سازی اتلافی نیز به مرحله‌ای می‌رسد که فشرده سازی مجدد دیگر تأثیری ندارد، هرچند یک الگوریتم بسیار اتلافی، مثلاً الگوریتمی که همواره بایت آخر فایل را حذف می‌کند، همیشه به مرحله‌ای می‌رسد که دیگر فایل تهی می‌شود.


الگوریتم‌ها و برنامه‌های اجرایی نمونه
"الگو" عبارت است از رشته‌ای از عناصر که به طور متوالی تکرار شده است و "طول" تعداد تکرار آن است) است. این روش اغلب برای بهینه‌سازی فضای دیسک در کامپیوترهای اداری و یا استفادهٔ بهتر از طول باند اتصال در یک شبکهٔ کامپیوتری به کار می‌رود. برای داده‌های نمادی مانند متن‌ها، صفحه گسترده‌ها ( Spreadsheet)، برنامه‌های اجرایی و… غیراتلافی بودن ضروری است زیرا تغییر کردن حتی یک بیت داده قابل قبول نمی‌باشد (مگر در موارد بسیار محدود). برای داده‌های صوتی و تصویری کاهش قدری از کیفیت بدون از دست دادن طبیعت اصلی داده قابل قبول می‌باشد. با بهره بردن از محدودیت‌های سیستم حواسی انسان، می‌توان در حجم زیادی از فضا صرفه جویی کرد و در عین حال خروجی ای را تولید کرد که با اصل آن تفاوت محسوسی ندارد. این روش‌های فشرده سازی اتلافی به طور کلی یک برآیند گیری سه جانبه بین سرعت فشرده سازی، حجم نهایی فشرده سازی و میزان کیفیت قابل چشم پوشی (درصد اتلاف قابل قبول) است.



نظریه
سابقهٔ نظری فشرده سازی برای فشرده سازی‌های بهینه توسط نظریهٔ اطلاعات (که رابطه نزدیکی با نظریهٔ اطلاعات الگوریتمی دارد) و برای فشرده سازی‌های اتلافی توسط نظریهٔ آهنگ-پیچیدگی ( Rate–distortion theory) ارائه شده‌اند. این شاخه‌های مطالعاتی در اصل توسط کلوده شانون( Claude Shannon)، که مقالاتی بنیادی در این زمینه در اواخر دهه‌ای ۱۹۴۰ و اوایل دههٔ ۱۹۵۰ به چاپ رسانده است به وجود آمده. "رمزنگاری" و "نظریهٔ رمزگذاری" نیز رابطه بسیار زیادی با این زمینه دارند. ایدهٔ فشرده سازی رابطهٔ عمیقی با آمار استنباطی دارد.




اطلاعات
اطّلاع یا آگاهش (و با نگرسوی آشکارتر ابزاری نیز آگاهِه) در کوتاه ترین تعریف، "داده‌های پردازش شده" است. داده ها(data) مواد خام بالقوه معنی داری هستند که ما آن‌ها را در راستای شناختن و فهمیدن و حتی تفسیر چیزها، کالاها، رویدادها یا هرگونه هستی ای که در جهان واقعیت و یا دنیای خیال یافت می‌شوند، به واسطه روش‌های پژوهشی، ابزارهای شناختی مانند دستگاه زبان، احساسات پنج گانه، ذهن و مغز و حتی تجربه خود به دست می‌آوریم. اطلاعات، آگاهی‌های به دست آمده از عنصرها و رویدادهای جهان هستی است. به زبان محدود تکنیکی، مجموعه‌ای از نمادهای زبانی معنی دار و پیوسته درباره موجودات است. اطلاعات در زبان انگلیسی(information)از نظمی ساختاری و ذاتی خبر می‌دهد.





فناوری اطلاعات

فناوری اطلاعات (فا) (به انگلیسی: Information Technology یا IT)، همان طور که به‌وسیله انجمن فناوری اطلاعات آمریکا (ITAA‎) تعریف شده‌است، «به مطالعه، طراحی، توسعه، پیاده‌سازی، پشتیبانی یا مدیریت سیستم‌های اطلاعاتی مبتنی بر رایانه، خصوصا برنامه‌های نرم‌افزاری و سخت‌افزار رایانه می‌پردازد». به طور کوتاه، فناوری اطلاعات با مسائلی مانند استفاده از رایانه‌های الکترونیکی و نرم‌افزار سروکار دارد تا تبدیل، ذخیره، حفاظت، پردازش، انتقال و بازیابی اطلاعات به شکلی مطمئن و امن انجام پذیرد.

اخیرا تغییر اندکی در این عبارت داده می‌شود تا این اصطلاح به طور روشن دایره ارتباطات مخابراتی را نیز شامل گردد. بنابراین عده‌ای بیشتر مایلند تا عبارت «فناوری اطلاعات و ارتباطات» (فاوا) (Information and Communications Technology) یا به اختصار ICT را به کار برند.


عناصر کاملا اصلی

فناوری اطلاعات متشکل از چهار عنصر اساسی انسان، ساز و کار، ابزار، ساختار است، به طوری که در این فناوری، اطلاعات از طریق زنجیره ارزشی که از بهم پیوستن این عناصر ایجاد می‌شود جریان یافته و پیوسته تعالی و تکامل سازمان را فراراه خود قرار می‌دهد:

انسان: منابع انسانی، مفاهیم و اندیشه، نوآوری
ساز و کار: قوانین، مقررات و روشها، سازوکارهای بهبود و رشد، سازوکارهای ارزش گذاری و مالی
ابزار: نرم‌افزار، سخت‌افزار، شبکه و ارتباطات
ساختار: سازمانی، فراسازمانی مرتبط، جهانی

بسیاری مفهوم فناوری اطلاعات را با کامپیوتر و انفورماتیک ادغام می‌کنند، این درحالیست که این‌ها ابزارهای فناوری اطلاعات می‌باشند نه تمامی آنچه که فناوری اطلاعات عرضه می‌کند. سید حامد خسروانی شریعتی در مقاله‌ای در همین زمینه آورده‌است که:" با فرض اینکه فناوری اطلاعات یک سیب باشد، کامپیوتر، شبکه، نرم‌افزار و دیگر ابزارهای مرتبط با این حوزه همانند دم سیب است که میوه توسط آن تغذیه می‌گردد، حال این خود سیب است که محصول اصلی است و هدف و نتیجه در آن خلاصه می‌گردد.



زمینه‌های IT
امروزه معنای اصطلاح «فناوری اطلاعات» بسیار گسترده شده‌است و بسیاری از جنبه‌های محاسباتی و فناوری را دربر می‌گیرد و نسبت به گذشته شناخت این اصطلاح آسان‌تر شده‌است. چتر فناوری اطلاعات تقریباً بزرگ است و بسیاری از زمینه‌ها را پوشش می‌دهد. متخصص فناوری اطلاعات وظایف گوناگونی دارد، از نصب برنامه‌های کاربردی تا طراحی شبکه‌های پیچیده رایانه‌ای و پایگاه داده‌های اطلاعاتی. چند نمونه از زمینه‌های فعالیت متخصصین فناوری اطلاعات می‌تواند موارد زیر باشند:[۲] فناوری اطلاعات و علوم کتابداری و اطلاع رسانی ارتباط تنگاتنگی با هم دارند. Information Technology در ایران متولی اصلی فناوری اطلاعات و ارتباطات را وزارت ارتباطات و فناوری اطلاعات می‌دانند.



ابزارهای نرم‌افزاری مدیریت خدمات فناوری اطلاعات
با افزایش چشمگیر تنوع تجهیزات و خدمات مربوط به فناوری اطلاعات، مدیریت خدمات ارائه شده در این حوزه نیز با چالشهای فراوانی روبرو شده‌است. مدیریت رسیدگی به مشکلات و درخواستها، مدیریت تجهیزات و منابع در رابطه با خدمات پشتیبانی فنی و تخصیص آنها به کاربران، و همچنین نظارت، کنترل و برنامه ریز در این زمینه از جمله مواردی است که مدیران حوزه فناوری اطلاعات را بر آن می‌دارد تا برای خود ابزارهای سودمند و کارا تدارک ببینند. از جمله این ابزارها، می‌توان به نرم‌افزارهای مدیریت خدمات فناوری اطلاعات اشاره نمود که می‌توانند مدیران و کارشناسان و تکنسین‌ها را در این رابطه یاری نمایند.
ساعت : 4:44 pm | نویسنده : admin | مطلب قبلی | مطلب بعدی
آلما | next page | next page