Значение системы World Wide Web в функционировании сети Интернет
Введение
Internet – глобальная компьютерная сеть, охватывающая весь мир. Сегодня Internet имеет около 30 миллионов абонентов в более чем 180 странах мира. Ежемесячно размер сети увеличивается на 5-7%.
Всплеск интереса к глобальной информационной сети Internet наблюдается сейчас повсеместно. В сложившихся условиях потребность в информации о сети Internet становится особенно острой.
В действительности Internet не просто сеть, - она есть структура, объединяющая обычные сети. Internet – это «Сеть сетей».
Для организации межсетевых соединений необходим соответствующий протокол.
Протокол – это набор договоренностей, который определяет обмен данными между различными программами. Протоколы задают способы передачи сообщений и обработки ошибок в сети, а также позволяют разработать стандарты, не привязанные к конкретной аппаратной платформе. Все программы – от скорости передачи данных до методов адресации при транспортировке отдельных сообщений – задаются протоколом, используемых в данной конкретной сети.
В Internet базовым протоколом служит ТСР/ IP. IP отвечает за адресацию сетевых узлов, а ТСР обеспечивает доставку сообщений по нужному адресу. Эти мощные протоколы были предложены в 1974 г. Робертом Кэном, одним из основных разработчиков ARPANET, и ученым – компьютерщиком Винтоном Серфом, вице – президентом CNRI. Internet ныне превратилась в многопротокольную сеть, интегрирующую другие стандарты. Основные среди них – стандарты взаимодействия открытых систем (OSI).
В Internet нет единого пункта подписки или регистрации; вместо этого вы контактируете с поставщиком услуг, который предоставляет вам доступ к сети через местный компьютер. Последствия такой децентрализации с точки зрения доступности сетевых ресурсов также весьма значительны. Среду передачи данных в Internet нельзя рассматривать только как паутину проводов или оптоволоконных линий. Оцифрованные данные пересылаются через маршрутизаторы, которые соединяют сети и с помощью сложных алгоритмов выбирают наилучшие маршруты для информационных потоков.
История Internet
Для начала постараемся дать простое определение того, что такое Интернет. Здесь существует две стороны - техническая и гуманитарная. С технической точки зрения, Интернет - это просто совокупность разбросанных по всему миру хостов (компьютеров, каждый из которых имеет свой уникальный IP-адрес), соединенных между собой маршрутизаторами (узлами, имеющими более двух каналов). С гуманитарной точки зрения, Интернет - это новое измерение культуры, новый способ хранения и распространения знаний и информации, новый способ существования самого человечества, если угодно. Техническая сторона Интернет сводится к разработке и использованию протоколов связи между хостами (IP, TCP, SMTP, HTTP и др.). С другой стороны, применение Интернет дает в руки человечества невиданные ранее возможности, но одновременно с этим порождает массу новых проблем.
С гуманитарной точки зрения, применение Интернет в развитых странах (США, Западная Европа и т.п.) ориентирован преимущественно на коммерцию (продвижение товаров), в то время как в России и Украине Интернет выполняет преимущественно информационную функцию (политика и новости). Это связано как с отличием круга реальных пользователей сетевых сервисов, так и с особенностями менталитета населения различных государств. Если говорить о возрастном аспекте, то новое поколение использует Интернет преимущественно как средство коммуникаций и среду для развлечения. Как новая "виртуальная реальность", Интернет превратился в огромный плацдарм свободы слова и породил массу так называемых "виртуалов" - скромных и тихих в "обычной" жизни людей, которые оказываясь в сети сразу превращаются рьяных поборников различных маргинальных течений. В этом отношении, Интернет стал новым средством самовыражения, способом ухода от серой действительности, предоставляя возможность проявить себя многим людям, которым не удалось найти свое место в реальной жизни.
Параллельно с развитием технической базы сети Интернет шло и развитие системы адресации. Изначально весь наш Интернет располагался в домене SU, но с развалом Советского Союза Россия и Украина обрели свои независимые домены - RU и UA. Администрированием домена RU занимается в настоящее время РосНИИРОС, а доменом UA управляет ООО "Хостмастер". РосНИИРОС (Российский научно-исследовательский институт развития общественных сетей) был создан рядом министерств Российской Федерации совместно с Институтом атомной энергии имени Курчатова как некоммерческая организация. В противоположность этому, администратором украинского национального домена является коммерческая структура - частное общество с ограниченной ответственностью, состав учредителей которого не известен широкой публике. В то время как в домене RU работа по регистрации и поддержке доменов носит прозрачный и устойчивый характер, этого нельзя сказать о домене UA. Тщательно скрываемый ООО "Хостмастер" монополизм отношений в домене UA, несоблюдение установленных самой же этой закрытой структурой правил регистрации и другие серьезные злоупотребления систематически вызывают закономерные протесты украинской интернет-общественности. В то время как в России прямое участие государства в управлении национальным доменом RU не привело ни к каким известным провалам в области доменостроения, любимой темой ООО "Хостмастер" и близких к нему кругов является развитие темы мнимого апокалипсиса, который якобы наступит в украинском интернете, если управление доменом UA будет передано государству. Конечно, структура государственного управления на постсоветском пространстве страдает многими недостатками, однако все это не идет ни в какое сравнение с тем произволом, который демонстрируют отдельные приватные структуры, распоряжающиеся общенациональными ресурсами в силу совершенно непонятного никому недоразумения.
WWW-Технология
Такая технология базируется на применении системы World Wide Web (сокращенно - WWW, или просто - Web) - "Всемирная паутина". Эта система является попыткой интегрировать разнообразные инструментальные среды и форматы данных на базе концепции гипертекста. Понятие гипертекста предполагает использование выделенных слов, фраз и даже пиктограмм в документе для организации ссылок к соответствующей информации в этом же или другом документе. Если, например, вы пользовались подсистемой Help в Windows, у вас уже есть навыки работы с гипертекстом).
Программы, называемые WWW-навигаторами и обеспечивающие пользователю работу в системе WWW, расширяют трактовку гипертекста, осуществляя связи между документами, размещенными в разных узлах сети. Документы в системе WWW обычно представляются в полноценном полиграфическом формате и могут содержать ссылки на графические данные и фотоснимки, аудио- и видео-файлы. Таким образом, система WWW это - "гипертекст + мультимедиа + информационная навигация". К числу WWW-навигаторов относятся такие широко известные программы как Netscape Navigator и Microsoft Internet Explorer. Выполняя свою интеграционную миссию, WWW-навигаторы реализуют доступ не только к материалам WWW-серверов, но и ко многим другим системам (телеконференции, FTP, Gopher и др.).
Технология WWW очень быстро завоевала признание пользователей и относится сегодня к числу самых популярных средств, формирующих современное лицо Интернет. В 1995 году число WWW-серверов в Интернет удваивалось каждые несколько месяцев, а общий трафик обращений к ним устойчиво вышел на первое место. И в нашем регионе весьма в короткие сроки появились сотни WWW-серверов. В Интернет интенсивно развиваются системы (Yahoo, Lycos и др.), позволяющие осуществлять индексный поиск более чем в 90% WWW-сеpверов (включая и наши отечественные) и некоторых других системах (FTP, Gopher).
Энтузиазм разработчиков WWW-серверов легко понять. Какой бы ни была информационная проблема - создание справочной системы, архива документов самой разной направленности (например, рекламных материалов), красивого интерфейса к базе данных, демонстрационных и обучающих систем, иллюстрированных электронных изданий - все это прекрасно ложится в "прокрустово ложе" WWW-технологии. Впрочем, все это лучше хотя бы раз увидеть, "побродив" по нескольким интересным серверам Уфы и других гоpодов, не забыв при этом поинтеpесоваться "а как там у них, за бугром?". Разнообpазная юpидическая, коммеpческая, и научная отечественная инфоpмация, библиотека и музей Ватикана, пеpвая в Интернет энциклопедия Britannica Online, Белый дом и Голливуд, унивеpситеты Оксфоpда и Пенсильвании - вот далеко не полный пеpечень интеpесных и прекрасно оформленных сведений, которые сегодня можно получить, совершая информационный круиз по WWW-серверам EUnet/Relcom и Интернет.
Сеть EUnet/Relcom (да и ряд других наших сетей) получили редкую и весьма пpивлекательную возможность не повторять всю (в достаточной меpе противоречивую) историю развития Интернет, а сосpедоточить усилия на совершенствовании национальных компьютерных информационных ресурсов на базе интегрированной WWW-технологии.
Использование WWW-Технологии для создания образовательных ресурсов
Использование сети Интернет как инфраструктуры информационного обмена для образовательного процесса в высшей школе имеет широкие перспективы. С одной стороны сеть может обеспечить недорогую оперативную связь между преподавателем и студентом, находящимися в географически удаленных точках, создавая базу для развития дистанционного обучения, а с другой -- позволяет передавать и воспроизводить с помощью WWW-технологии на абонентских точках сети учебно-методические материалы в форме, удобной для восприятия.
WWW-технология, широко используемая в сети Интернет, позволяет хранить информацию в распределенной гипертекстовой форме с включением графических иллюстраций, видео и аудио фрагментов. Фрагменты гипертекста могут размещаться на разных компьютерах, на которых должно быть установлено программное обеспечение, поддерживающее фрагмент как ресурс в сети. Такие ресурсы называются WWW-серверами.
Фрагменты гипертекста связаны между собой посредством гиперссылок. Пользователь, работая с клиентским программным обеспечением, может легко переходить от одного фрагмента к другому, перемещаясь по гиперссылкам и не заботясь о том, на каком из WWW-серверов находится требуемый фрагмент.
Совокупность фрагментов гипертекста, находящуюся на всех WWW-серверах сети Интернет называют гиперпространством.
Установка WWW-серверов учреждениями высшей школы и перевод перевод наработанных учебно-методических материалов в гипертекстовую форму приведут к возникновению в сети гиперпространства образовательных ресурсов( ГОР). Успешное развитие образовательных ресурсов в состоянии решить проблему эффективного переиспользования наработанных учебно-методических материалов по всем специальностям в масштабах высшей школы страны в целом, что должно резко повысить качество образовательного процесса во всех учреждениях высшей школы.
Для этого необходимо решить ряд организационных и технических задач. Рассмотрим одну из важнейших технических задач -- сокращение издержек в ГОР. Издержки определяются двумя взаимосвязанными величинами: затратами времени пользователя на получение информации и загрузкой сети при выполнении транзакций по поиску и доставке информации.
Следует отметить, что задача сокращения издержек на получение информации актуальна и для всего гиперпространства в целом, поэтому применительно к образовательным ресурсам предлагается решать ее с помощью апробированных методов, а именно за счет оптимизации структуры ГОР.
Такую оптимизацию целесообразно проводить на двух уровнях:
- всего ГОР в целом,
- отдельных WWW-серверов.
На уровне ГОР предлагается создать службу, позволяющую проводить распределенный поиск учебно-методических материалов на образовательных WWW-серверах по ряду критериев, например, по номеру специальности и названию дисциплины, для которых предназначен тот или иной учебно-методический материал. Это в свою очередь накладывает определенные требования на оформление WWW-серверов как образовательных ресурсов.
Поэтому на уровне WWW-серверов необходимо разработать рекомендации по их оформлению, которые бы гарантировали работоспособность глобальной поисковой службы и минимизировали издержки на получение информации в рамках одного фрагмента. Рекомендации должны быть обеспечены программными средствами, облегчающими создание WWW-серверов, а также средствами, позволяющими в автоматическом режиме проводить проверку WWW-серверов на соответствие данным рекомендациям.
Для сокращения издержек на получение информации на уровне WWW-серверов рекомендации должны учитывать следующие требования:
- конструкции языка HTML, используемые при создании гипертекста, должны обеспечивать получение информации для пользователей, применяющих разное клиентское программное обеспечение,
- предоставляемая информация не должна в общем случае зависеть от возможности получения иллюстраций, видео и аудио фрагментов;
- размер иллюстраций, видео и аудио фрагментов должен учитывать среднюю пропускную способность каналов передачи информации;
- WWW-сервер должен содержать оглавление разделов и список ключевых слов с указанием страниц, на которых эти слова встречаются;
- на WWW-сервере должна быть обеспечена возможность поиска информации по словам, задаваемым пользователем.
Всемирная паутина
Несмотря на то, что в первые годы своего существования Gopher завоевал большую популярность, назревала нужда в какой – то более простой и в то же время максимально универсальной системе, в которой связи между ресурсами были бы более свободными и ассоциативными. Такая система была разработана в 1993 г. и названа WWW. Система WWW строится на понятии гипертекстом, или, точнее, гипермедиа. Гипертекст – это текст, составные части которого связаны друг с другом и с друг и с другими текстами с помощью ссылок. Гипермедиа – это то, что получится из гипертекста, если заменить в его определении слово «текст» на выражение «любые виды информации». WWW означает буквально «всемирная паутина». WWW позволяет не отказываться от информационных ресурсов уже накопленных в Internet, доступных с помощью других средств: FTP, Telnet и Gopher. Больше того, работа с этими ресурсами через WWW настолько удобна, что FTP клиенты, бывшие когда - то отдельным классом программ, теперь используются лишь немногим.
И все - таки главное в WWW – это не удобства доступа FTP архиву и Gopher меню. Большинство серверов системы предлагают информацию, которая без WWW вряд ли вообще когда – либо попала бы в сеть. Быстрота создания и обновления, богатые изобразительные возможности в сочетании с легкостью доступа и огромной аудиторией сделала WWW новым средством массовой информации. С другой стороны, быстрому распространению системы, столь естественно объединяющий разнородные ресурсы, способствовало не в последнюю очередь ее зарождение не в недрах коммерческой фирмы, а в научном учреждении – Европейской лаборатории физики частиц, сотрудники которой не стали делать секретов из своей разработки и даже не попытались на ней разбогатеть. К счастью, сама природа WWW как средства поиска и организации информации позволяет надеяться, что это изобретение не превратится в инструмент одной лишь коммерции и рекламы. Серверы и клиенты WWW связываются между собой по протоколу НТТР. URL для WWW выглядит так http://<адрес сервера>.
Поисковые инструменты первого типа чаще всего называются предметными, или тематическими каталогами. Компания, владеющая таким каталогом, непрерывно ведет огромную работу, исследуя, описывая, каталогизируя и раскладывая по полочкам содержимое WWW серверов и других сетевых ресурсов, разбросанных по всему миру. Результатом ее титанических усилий является постоянно обновляющийся иерархический каталог. На верхнем уровне каталога собраны самые общие категории, такие как «бизнес», «наука» и др. Элементы самого нижнего уровня представляют собой ссылки на отдельные WWW страницы вместе с кратким описанием их содержимого. Гарантий того, что такой каталог действительно охватывает все содержимое WWW, никто не даст, однако возможная неполнота и даже однобокость подбора материалов с лихвой искупается тем, что пока еще не под силу никакому компьютеру – осмысленность отбора.
Предметные каталоги представляют и возможность поиска по ключевым словам. Однако поиск этот происходит не в содержимом самих WWW серверов, а их кратких описаниях, хранящихся в каталоге. Предметные каталоги Internetа можно пересчитать буквально на пальцах, так как их создание и поддержка требуют огромных затрат. К наиболее известным относятся Yahoo, WWW Virtual Library, Galaxy и некоторые другие.
Одно из самых известных систем такого рода – каталог Magellan. Эта база данных содержит сведенья о 80 тыс. WWW страниц, что очень немного в сравнении с теми миллионами, которые существуют в сети. Однако если Yahoo в качестве описания ресурса использует одну – две строчки текста, то сотрудники системы Magellan на некоторые из страниц, заносимые в их базу данных, сами пишут небольшие рецензии, а также оценивают качество этих информационных ресурсов по пятибалльной шкале. Помимо базы рецензии, Magellan владеет также собственным автоматическим индексом, для поиска в котором нужно перебросить переключатель под полем ввода в положение entire database. Как правило, запрос представляет собой одно или несколько ключевых слов, разделенных пробелом.
Похожая по своим принципам служба фирмы Point вообще основной упор делает не на поиск, а на работу с тематическим каталогом. Служба Point известна в сети тем, что ее сотрудники постоянно заняты оцениванием сетевых ресурсов и ведут списки тех узлов, которые как они считают, принадлежат к «лучшим пяти процентам WWW».
Сама фирма Point ведет общедоступную базу данных всех «пятипроцентных» WWW страниц, где о каждом можно прочитать подробную лицензию. Самым старым предметным каталога WWW является каталог Virtual Library. Эта система достаточно полно охватывает научную прослойку WWW серверы университетов, лабораторий и учебных заведений.
Для пользователей в нашей стране определенный интерес может представлять тематический каталог Russia – on- line sub>ject Guide. Этот каталог содержит довольно пестрое собрание ссылок на зарубежные источники плюс тематический обзор российских и русскоязычных ресурсов WWW.
К проблеме поиска информации в Internet можно подойти и с другой стороны. Существуют программы, в которые загрузили несколько тысяч общеизвестных программ, в которые загрузили несколько тысяч общеизвестных URL адресов. Будучи запущена на компьютере с доступом к WWW, эта программа начинает автоматически скачивать из сети документы по этим URL, причем из каждого нового документа она извлекает все содержащиеся в нем ссылки и добавляет их в свою базу адресов. Поскольку все WWW документы связаны между собой, рано или поздно такая программа обойдет весь Internet. Разумеется, программа не может ни понять, ни как – либо классифицировать то, что она видит в сети. Программы такого типа называются роботами. Они ограничиваются сбором статической информации и построением слов – указателей (индексов) по текстам документов. Собираемая роботом база данных – индекс – хранит в себе сведения о том, в каких WWW документах содержатся те или иные слова. Именно такой автоматически собираемый индекс и лежит в основном поисковых систем второго типа, которые часто так и называют – Автоматические индексы. Автоматический индекс состоит из трех частей: программы – роботы, собираемой этим роботом базы данных и интерфейса для поиска в этой базе, с которым работает пользователь. Все эти компоненты вполне могут функционировать без вмешательства человека. Поскольку какая – либо классификация или оценивание материалов в системах такого рода отсутствует, к ним следует прибегать только тогда, когда вы точно знаете ключевые слова, относящиеся к тому, что вам нужно, например фамилию человека или несколько достаточно редких терминов из соответствующей области.
Если же задать по сколько – нибудь распространенным словам, то вам не хватит жизни, чтобы обойти все полученное в результате прииска URL адреса. Например, индекс системы Alta Vista содержит 11 млрд. слов, извлеченных из 30 млн. WWW страниц. Автоматических индексов WWW страниц существует немало: WebCrawler, Lycos, Excite, Inktomi, Open Text и др. Некоторые из них (например, Lycos) представляют собой более или менее удачливый синтез предметного каталога и автоматического индекса.
Одним из мощных поисковых средств в World Wide Web является система Hot Bot, содержащая сведения о полных текстах 110 млн. страниц. Адрес: http://www. Hotbot.com. Hotbot принадлежит к новейшим системам, поэтому его углубленный поиск дает поразительно широкие возможности для детализации запроса. Это достигается за счет использования многоступенчатого меню, предполагающего различные варианты составления поискового предписания. Можно осуществить поиск по наличию в документе одного или нескольких терминов, поиск по определенной фазе, поиск конкретного лица или ссылки на определенный электронный адрес.
Заключение
всемирная паутина интернет сеть
Сделаем вывод, что ключевыми аспектами WWW-технологии являются: протокол HTTP, язык HTML и информационно-поисковые системы (AltaVista, HotBot, Lycos, Yahoo и др.). Индексирование Web-сайтов. Типовые информационно-поисковые языки как средство проведения поиска информации в Web. Построение сложных поисковых запросов. Коррекция запросов по релевантности отклика. Средства электронного поиска в FTP-архивах (поисковая машина Archie, национальные поисковые системы и Web-шлюзы). Информационные ресурсы Internet, доступные по протоколу Telnet. Русскоязычные ресурсы Сети. Проблема кодировок. Поисковые машины, специализирующиеся в поиске информации на кириллице. Элементы векторного стандарта - Flash.
Трудно себе представить человека XXI века без Internet, с его появлением есть возможность быстро и удобно найти необходимую информацию. Теперь можно не заниматься подбором и изучением огромного количества литературы в книжных магазинах и библиотеках. Нужную для себя информацию можно получить, не выходя из дома или офиса.
Благодаря разнообразию поисковых систем, специально разработанных для рядового пользователя, каждый может без труда отсечь заведомо ненужный поток информации, лишь правильно сформулировав цель поиска.
Список используемой литературы
Меженный О.А. «Microsoft Windows Vista, краткое руководство» - М.: ООО «И.Д.Вильямс», 2007 г.
Волков А.К. «Моя первая книга об информационных технологиях» - М.: Эксмо, 2007 г.
http://www.internet-history.org
http://www.internet-history.org
Сапков В.В. «Информационные технологии и компьютеризация делопроизводства» - М.: Издательский центр «Академия» 2008 г.
1