Глава 6: Структура и функции территориальных сетей
6.14. Информационная система WWW.
WWW (World Wide Web - всемирная паутина) - гипертекстовая информационная система сети Internet. Другое ее краткое название - Web. Это более современная система по сравнению с Gopher и предоставляет пользователям большие возможности.
Во-первых, это гипертекст - структурированный текст с введением в него перекрестных ссылок, отражающих смысловые связи частей текста. Слова-ссылки выделяются цветом и/или подчеркиванием. Выбор ссылки вызывает на экран связанный со словом-ссылкой текст или рисунок. Можно искать нужный материал по ключевым словам.
Во-вторых, облегчено по сравнению с Gopher представление и получение графических изображений. К 1996 г. в мире насчитывалось около 30 тысяч WWW-серверов.
Информация, доступная по Web-технологии, хранится в Web-серверах. Сервер имеет программу Listener, постоянно отслеживающую приход на определенный порт (обычно это порт 80) запросов от клиентов. Сервер удовлетворяет запросы, посылая клиенту содержимое запрошенных Web-страниц или результаты выполнения запрошенных процедур.
Клиентские программы WWW называют браузерами (brousers). Имеются текстовые (например, Lynx) и графические (наиболее известны Netscape Navigator и MS Explorer) браузеры. Sun предлагает браузер HotJava. В браузерах имеются команды листания, перехода к предыдущему или последующему документу, печати, перехода по гипертекстовой ссылке и т.п. Из браузеров доступны различные сервисы - FTP, Gopher, USENET, E-mail. Для подготовки материалов для их включения в базу WWW разработаны специальный язык HTML (Hypertext Markup Language) и реализующие его программные редакторы, например Internet Assistant в составе редактора Word или SiteEdit, подготовка документов предусмотрена и в составе большинства браузеров.
Для связи Web-серверов и клиентов разработан протокол HTTP, работающий на базе TCP/IP. Web-сервер получает запрос от браузера, находит соответствующий запросу файл и передает его для просмотра в браузер. Популярными серверами являются Apache Digital для ОС Unix, Netscape Enterprise Server и Microsoft Internet Information Server (IIS), которые могут работать как в Unix, так и в Windows NT, и Netware Web Server, предназначенный для работы в ОС Netware. Все три сервера поддерживают язык CGI, имеют встроенный HTML-редактор. Кроме того, в первых двух из них поддерживается стандарт шифрования SSL (Secure Sockets Layer) для защиты передаваемых по сети данных от несанкционированного доступа. Опыт показывает, что для крупных серверов предпочтительнее платформа Unix, тогда как для серверов с малым числом транзакций лучше подходит ОС Windows NT.
На базе HTML создан язык виртуальной реальности VRML (Virtual Reality Modeling Language)- в нем дополнительно можно использовать 3D графику.
В новых ОС (например, ОС Cairo) ожидается появление специальных средств поиска информации в серверах Internet. Пример такой технологии RDF (Resource Definition Format) - упорядочение метаинформации наподобие библиотечных каталогов (классификация по содержанию). В настоящее время для облегчения поиска применяют информационно-поисковые системы (ИПС), располагаемые на доступных пользователям Internet серверах. В этих системах собирается, индексируется и регистрируется информация о документах, имеющихся в обслуживаемой группе Web-серверов. Индексируются или все значащие слова, имеющиеся в документах, или только слова из заголовков. Пользователю предоставляется возможность обращаться к серверу с запросами на естественном языке, с сложными запросами, включающими логические связки. Примером таких ИПС может служить AltaVista. Например, для функционирования AltaVista фирма DEC выделила 6 компьютеров, самый мощный из них - 10-процессорная ЭВМ Alpha-8400, база данных имеет объем в 45 Гбайт. В этой ИПС к 1996 г. была собрана информация с 30 миллионов страниц Web-серверов.