Глобальная международная компьютерная сеть Интернет
Содержание
Тип подключения
Доступ к информации
Типы сервисов Интернет
Поисковые системы в сети Интернет
Список литературы
Тип подключения
Основу Интернет составляют каналы большой пропускной способности – backbones, связывающие крупные узлы сети.
Существует два основных способа подключения пользователя к сети Интернет:
постоянное подключение по выделенной линии,
сеансное телефонное подключение Dial-up.
Постоянное подключение
При постоянном подключении сеть или компьютер клиента имеет постоянное соединение с маршрутизатором Internet.. Провайдер предоставляет в распоряжение клиента выделенный канал для доступа к Интернет. В качестве выделенного канала может быть использована обычная или цифровая телефонная линия, оптический или радиоканал, линия ISDN. Подключение локальной сети к Интернет по выделенному каналу Оплата за подобный вид услуг обычно производится помесячно. Она складывается из оплаты физического канала передачи данных и оплаты объема направляемой или принимаемой информации (трафик). Стоимость постоянного соединения довольно высока, и она зависит от пропускной способности канала. Обычно для такого доступа используется выделенная телефонная линия, обеспечивающая связь со скоростью до 64 кбит/с с помощью высокоскоростных модемов и до 1,5 Мбит/с в случае применения специальной аппаратуры. Как правило, для этого подходят линии МГТС, однако некоторые провайдеры могут проложить и свои. Отдельные поставщики услуг Internet предлагают доступ по радиоканалу, и тогда пропускная способность может достигать 2 Мбит/с. Для небольших фирм очень удобен такой способ выхода в Internet, как подключение по ISDN-линии. Данная технология позволяет разделить одну физическую линию на несколько логических каналов, обеспечив одновременно и телефонную связь, и соединение с Internet.
Подключение по выделенной линии, как правило, обеспечивает надежное и скоростное соединение с Интернет.
Сеансовое подключение Dial-up. В случае сеансного подключения dial-up клиент устанавливает временное соединение с узлом провайдера с помощью модема и обычной телефонной линии. Этот способ подключения существенно дешевле, однако скорость подключения и качество связи сильно зависит от многих факторов:
Основные факторы, определяющие качество связи с Интернет при модемном соединении:
тип модема и его характеристики (фирма-изготовитель, скорость, стоимость);
устройство телефонного подключения на месте – наличие параллельного телефона, факса, экранирование кабеля;
качество связи вашего телефонного номера на АТС с провайдером;
количество входных модемных номеров провайдера, их загрузка;
канал провайдера, выход в Интернет самого провайдера. .
Любой из этих факторов может оказаться решающим. Для того чтобы обеспечить нормальное соединение и работу в Интернет, стоит позаботиться и о качественном модеме одной из зарекомендовавших себя фирм-производителей (US Robotix, Motorola, Zyxel и др.), постараться избежать дополнительных помех и нагрузок на телефон в офисе, и, конечно, выбрать провайдера, который может обеспечить надежное соединение с сетью.
Ассиметричный сервис спутникового Интернета предполагает наличие "наземного" канала передачи данных, используемого в качестве запросного канала. Для программной поддержки этого интерфейса передачи данных часто используются только стандартные, то есть встроенные в операционную систему ПК, средства. В зависимости от особенностей соединения, предоставляемых "наземным" провайдером компьютеру пользователя, существует несколько вариантов подключения к спутниковому интернет-сервису:
- соединение через прокси-сервер,
- подключение по VPN (Virtual Private Network),
- доступ с использованием OpenVPN.
При подключении через прокси-сервер требуется реальный (маршрутизируемый) IP-адрес, выдаваемый "наземным" провайдером. Такое соединение может быть использовано в различных условиях доступа, имеющихся у пользователя:
1) Домашний компьютер – подключается к наземному провайдеру через dial-up или ADSL соединение с помощью модема. IP-адрес задается наземным провайдером динамически и обновляется при каждом новом соединении.
2) Компьютер включен в локальную сеть и имеет маршрутизируемый IP-адрес. В этом случае наземное соединение служит для установки связи с прокси-сервером "спутникового" провайдера.
Доступ к информации
Дискуссия, организованная в Государственной Думе, обнаружила множество предметных граней Интернета, каждая из которых нуждается в том, чтобы найти свое место как в проблеме политики, так и в законодательстве. Особо хотелось бы обратить внимание на вопросы, связанные с темой интеллектуальной собственности, с пониманием необходимости единого информационного пространства страны, с проблемами гармонизации законодательства различных стран.
а) Проблема интеллектуальной собственности в глобальных информационных системах получила дополнительные аргументы для принципиально нового взгляда на этот институт и для нормативного закрепления механизмов защиты имущественных исключительных прав авторов и личных неимущественных прав лиц, чей авторский продукт попадает в Интернет. При создании закона, который затрагивает тему глобальных сетей, обойти вниманием вопрос о политике в области интеллектуальной собственности и способах решения вновь возникших проблем, выходящих за рамки проблематики и методов Всемирной организации интеллектуальной собственности, сложившихся в 60–70 гг. прошлого века, невозможно. Хотя ясно, что национальный закон одной страны не может решить этот вопрос, важно обратить внимание на его решение в собственной правовой системе. Это вопрос государственной важности, поэтому его нельзя игнорировать при постановке темы "политика" и подготовке специального закона об Интернете, ведь проблема интеллектуальной собственности затрагивает сферу личных и исключительных имущественных прав физических и юридических лиц, а также интересы государства в целом. Судьба продукта интеллектуального творчества (как и его форма), гарантии охраны прав субъектов интеллектуальной деятельности подвергаются массированному наступлению угроз организационного, правового, морального плана. Проблемы монополизма на технологии, на продукт, на инфраструктуру в Интернете приобретают такую остроту, что начинают остро нуждаться в правовом регулировании. Но и эти вопросы даже в рамках российской практики не стали предметом внимания данного законопроекта. Если же его оценить и с точки зрения терминов и предметов регулирования, свойственных Интернету: домен, сайт, страница, сервер, хост, институт посредников (провайдеров), администраторов и т. д., то также увидим, что и эти вопросы не находятся в поле зрения данного документа.
б) Проект обошел молчанием и другие реалии процесса глобализации, в том числе требуемое государственное воздействие на расширение активности России в Интернете. Сегодня число активных пользователей данной сети в России не превышает двух миллионов. Чтобы довести эту цифру хотя бы до 15 миллионов, необходимы определенные усилия: создание соответствующей научно-технической базы, структуризация целей с учетом потребностей современного общества и, в первую очередь, образования, создание условий для включения в гарантированный прожиточный минимум затрат на технику и ее использование в активном режиме. Одновременно необходимо решать задачи активного использования информационных технологий в органах государственной власти, в производственном секторе, во всех направлениях социальной структуры. И этот вопрос не нашел отражения в проекте обсуждаемого закона.
в) Интернет – особая сфера, где сосредоточены и сеть обмена информацией, и структура, в рамках которой совершаются самые разные деловые отношения субъектов. Особенно активно развивается электронный бизнес, финансовые операции, научное общение. Многие стороны социальной жизни приобретают в этом случае виртуальный характер, отношения реализуются в так называемом нулевом пространстве. Это ставит особые задачи перед правом. С сожалением следует констатировать, что и эта сторона дела не развернута в предлагаемом проекте.
г) Еще один вопрос касается проблемы гармонизации законодательства стран, соприкасающегося через различные контакты отдельных субъектов между собой или при помощи посредников в процессе информационного взаимодействия. Наряду с обновлением законодательства каждого отдельного государства в условиях глобальных информационных систем и сетей должны активно развиваться международные нормы частного и публичного права, договоров, должен ставиться вопрос о создании наднационального права для всех, о повышении авторитета признанных международным сообществом стандартов.
Таким образом, если суммировать все, что было высказано в процессе обсуждения самой идеи закона о политике в области Интернета и о данном проекте ФЗ, то следует прийти к выводу: предстоит еще большая работа по выявлению, структуризации и нормативному воплощению всего комплекса вопросов данной темы. Заметим, что еще в декабре 1999 года Институт государства и права РАН представил свой отзыв на проект закона об Интернете, где были отмечены общие и частные позиции, требующие внимания разработчиков. Однако ни одно из предложений или замечаний не нашло отклика, если судить по обсуждаемому проекту. В настоящее время также необходимо уяснить, что же готовит пользователям проект ФЗ "О доступе к информации", то есть обратить внимание на согласованность проектов двух упомянутых федеральных законов. При осуществлении такого сравнения надо, безусловно, учитывать, что данные проекты находятся в разных "весовых категориях" с точки зрения их проработки. Проект закона "О доступе к информации" находится в Государственной Думе на стадии подготовки ко второму чтению. Проект закона "О государственной политике…" пока еще только на стадии внесения в Государственную Думу, что дает реальную возможность проследить взаимосвязь и преемственность этих проектов.
Типы сервисов Интернет
Прежде чем перейти к рассмотрению конкретных сервисов Интернет, надо описать некоторые категории, использующиеся при оценке различных сервисов и их применимости к тем или иным задачам. Конечно, для того, чтобы лучше представить себе схему передачи информации в Интернет, полезно было бы классифицировать сервисы, разделив их на группы в соответствии с каким-либо набором критериев оценки. Однако по ряду причин нельзя ввести сколько-нибудь жесткую или определенную классификацию. Основная причина - уникальность каждого сервиса и одновременная неотделимость его от остальных. Каждый сервис характеризуется свойствами, часть которых объединяет его с одной группой сервисов, а другая часть с другой группой. Наиболее подходящим для классификации сервисов Интернет является деление на сервисы интерактивные, прямые и отложенного чтения. Эти группы объединяют сервисы по большому числу признаков. Сервисы, относящиеся к классу отложенного чтения, наиболее распространены, наиболее универсальны и наименее требовательны к ресурсам компьютеров и линиям связи. Основным признаком этой группы является та особенность, что запрос и получение информации могут быть достаточно сильно (что, вообще говоря, ограничивается только актуальностью информации на момент получения) разделены по времени. Сюда относится, например, электронная почта. Сервисы прямого обращения характерны тем, что информация по запросу возвращается немедленно. Однако от получателя информации не требуется немедленной реакции. Сервисы, где требуется немедленная реакция на полученную информацию, т.е. получаемая информация является, по сути дела, запросом, относятся к интерактивным сервисам. Для пояснения вышесказанного можно заметить, что в обычной связи аналогами сервисов интерактивных, прямых и отложенного чтения являются, например, телефон, факс и письменная корреспонденция.
Электронная почта (e-mail) - первый из сервисов Интернет, наиболее распространенный и эффективный из них. Электронная почта - типичный сервис отложенного чтения (off-line). Вы посылаете Ваше сообщение, как правило в виде обычного текста, адресат получает его на свой компьютер через какой-то, возможно достаточно дли- тельный промежуток времени, и читает Ваше сообщение тогда, когда ему будет удобно. E-mail очень похож на обычную бумажную почту, обладая теми же достоинствами и недостатками. Обычное письмо состоит из конверта, на котором написан адрес получателя и стоят штампы почтовых отделений пути следования, и содержимого - собственно письма. Электронное письмо также состоит из заголовков, содержащих служебную информацию (об авторе письма, получателе, пути прохождения по сети и т.д.), играющих роль конверта, и собственно содержимого письма. Вы можете вложить в обычное письмо что-нибудь, например фотографию; аналогично, Вы можете послать файл с данными электронным письмом. Вы можете подписать обычное письмо - можно подписать и электронное письмо. Обычное письмо может не дойти до адреса- та или дойти слишком поздно - как и электронное письмо. Обычное письмо весьма дешево, и электронная почта самый дешевый вид связи.
Сетевые новости Usenet, или, как их принято называть в российских сетях, телеконференции - это, пожалуй, второй по распространенности сервис Интернет. Если электронная почта передает сообщения по принципу "от одного - одному", то сетевые новости передают сообщения "от одного - многим". Механизм передачи каждого сообщения похож на передачу слухов: каждый узел сети, узнавший что-то новое (т.е. получивший новое сообщение), передает новость всем знакомым узлам, т.е. всем тем узлам, с кем он обменивается новостями. Таким образом, посланное Вами сообщение распространяется, многократно дублируясь, по сети, достигая за довольно короткие сроки всех участников телеконференций Usenet во всем мире.
Списки рассылки (maillists) - простой, но в то же время весьма полезный сервис Интернет. Это практически единственный сервис, не имеющий собственного протокола и программы-клиента и работающий исключительно через электронную почту. Идея работы списка рассылки состоит в том, что существует некий адрес электронной почты, который на самом деле является общим адресом многих людей - подписчиков этого списка рассылки. Вы посылаете письмо на этот адрес, например на адрес u-l11n@jet.msk.su (это адрес списка рассылки, посвященного обсуждению проблем локализации операционных систем класса UNIX), и Ваше сообщение получат все люди, подписанные на этот список рассылки. Еще один широко распространенный сервис Интернет - ftp. Русского перевода этого слова, вообще говоря, нет, и его так и называют в разговоре - эфтэпэ. Расшифровывается эта аббревиатура как протокол передачи фай- лов, но при рассмотрении ftp как сервиса Интернет имеется в виду не просто протокол, но именно сервис - доступ к файлам в файловых архивах. Вообще говоря, ftp - стандартная программа, работающая по протоколу tcp, всегда поставляющаяся с операционной системой. Ее исходное предназначение - передача файлов между разными компьютерами, работающими в сетях tcp/ip: на одном из компьютеров работает программа-сервер, на втором пользователь запускает программу-клиента, которая соединяется с сервером и передает или получает по протоколу ftp файлы. Тут предполагается, что пользователь зарегистрирован на обоих компьютерах и соединяется с сервером под своим именем и со своим паролем на этом компьютере. Протокол ftp, разумеется, оптимизирован для передачи файлов. Archie - это не самостоятельный сервис, но сервис, облегчающий работу с серверами anonymous ftp, обеспечивающий поиск файлов на таких серверах. Вам наверняка никогда не придется организовывать свой сервер archie, но пользоваться его услугами придется наверняка. Их всего существует с десяток, и каждый из них сильно загружен. Серверы archie "помнят" списки всех файлов на многих серверах anonymous ftp, и по Вашему запросу могут искать интересующий Вас файл по имени или части имени. Вы задаете шаблон для поиска, указываете характеристики поиска и получаете список имен серверов и мест расположения файлов на них, которые удовлетворяют Вашему запросу. Существуют специальные программы-клиенты archie, но можно воспользоваться услугами такого сервера, и соединившись с ним по протоколу telnet и войдя под именем archie. Одним из достаточно известных и распространенных сервисов Интернет является gopher. Хотя сейчас он уже практически не развивается, или, во всяком случае, развивается гораздо медленнее прочих сервисов похожего назначения, но тем не менее через gopher доступно довольно-таки большое количество информации - в первую очередь, по историческим причинам - был период, когда gopher был лучшим средством экспорта информации для публичного доступа и некоторые компании до сих пор продолжают использовать его. Современные средства работы с информацией в Интернет обеспечивают в том числе доступ к серверам gopher, поэтому Вам не нужно учиться работать со специальными программами-клиентами gopher. Что касается использования сервера gopher для предоставления своей информации в публичное пользование - вряд ли Вам придется это делать, поскольку gopher морально устарел. Gopher - это распределенная система экспорта структурированной информации. При работе с gopher Вы находитесь в системе вложенных меню, из которых доступны файлы различных типов - как правило, простые тексты, но это может быть и графика, и звук и любые другие виды файлов. Таким образом, в публичный доступ экспортируются файлы с информацией, но не в виде файловой системы, как в ftp, а в виде аннотированной древовидной структуры. Gopher - сервис прямого доступа и требует, чтобы и сервер, и клиент были полноценно подключены к Интернет.
WWW (World Wide Web - всемирная паутина) - самый популярный и интересный сервис Интернет сегодня, самое популярное и удобное средство работы с информацией. Самое распространенное имя для компьютера в Интернет сегодня - www, больше половины потока данных Интернет приходится на долю WWW. Количество серверов WWW сегодня нельзя оценить сколько-либо точно, но по некоторым оценкам их более 30 тысяч. Скорость роста WWW даже выше, чем у самой сети Интернет. Сегодня WWW - самая передовая технология Интернет, и она уже становится массовой технологией - возможно, недалек тот день, когда каждый человек, знающий, что такое телефон, будет знать, что такое WWW.WWW не была единственной попыткой создать глобальную гипермедийную распределенную информационную систему. Другой такой системой является Hyper-G. Этот сервис Интернет менее известен, но весьма интересен. Hyper-G значительно моложе WWW (хотя темпы роста и не указывают на то, что Hyper-G сможет когда-либо сравниться по популярности с WWW) и это академическая разработка - плод стараний технологического университета в Граце (Graz), Австрия. Система эта вряд ли окажется практически полезной для Вас, но заслуживает внимания как очень интересная технология, и ее рассмотрение позволяет многое добавить в картину сервисов Интернет и их развития. Если Вы интересуетесь Интернет, Вы могли слышать название WAIS, но до сих пор не знать, что это такое. WAIS - еще один сервис Интернет, сегодня почти не использующийся, или, по крайней мере, практически не развивающийся. WAIS расшифровывается как информационная система широкого профиля, но на самом деле это комплекс программ, предназначенных для индексирования больших объемов неструктурированной, как правило просто текстовой, информации, поиска по таким документам и их извлечения. Существуют программы для индексирования, для локального поиска по полученным индексам, а также серверная и клиентская программа, общающиеся между собой по специальному протоколу Z39.50.К интерактивным сервисам, служащим общению людей через Интернет, от- носится IRC - Internet Relay Chat, разговоры через Интернет. В Интернет существует сеть серверов IRC. Пользователи присоединяются к одному из каналов - тематических групп и участвуют в разговоре, который ведется не голосом, но текстом. Узлы IRC синхронизованы между собой, так что, подключившись к ближайшему серверу, Вы подключаетесь ко всей сети IRC.
Поисковые системы в сети Интернет
Поисковая система состоит из трех компонентов: -1- поискового робота; -2- индекса системы; и -3- программы, которая (а) обрабатывает запрос пользователя, (б) находит в индексе документы, отвечающие критериям запроса, и (в) выводит список найденных документов в порядке убывания релевантности.
Как и большинство систем, Lycos дает возможность применять простой запрос и более изощренный метод поиска. В простом запросе в качестве поискового критерия вводится предложение на естественном языке, после чего Lycos производит нормализацию запроса, удаляя из него так называемые stop-слова, и только после этого приступает к его выполнению. Почти сразу выдается информация о количестве документов на каждое слово, а позже и список ссылок на формально релевантные документы. В списке против каждого документа указывается его мера близости запросу, количество слов из запроса, попавших в документ, и оценочная мера близости, которая может быть больше или меньше формально вычисленной. Пока нельзя вводить логические операторы в строке вместе с терминами, но использовать логику через систему меню Lycos позволяет. Такая возможность применяется для построения расширенной формы запроса, предназначенной для искушенных пользователей, уже научившихся работать с этим механизмом. Таким образом, видно, что Lycos относится к системе с языком запросов типа "Like this", но намечается его расширение и на другие способы организации поисковых предписаний.
AltaVista. Индексирование в этой системе осуществляется при помощи робота. При этом робот имеет следующие приоритеты:
слова содержащиеся в теге <title> имеют высший приоритет; ключевые фразы в <Meta> тэгах;
ключевые фразы, находящиеся в начале странички;
ключевые фразы в ALT - ссылках
ключевые фразы по количеству вхождений\присутствия слов\фраз;
Если тэгов на странице нет, использует первые 30 слов, которые индексирует и показывает вместо описания (tag description)
Наиболее интересная возможность AltaVista - это расширенный поиск. Здесь стоит сразу оговориться, что, в отличие от многих других систем AltaVista поддерживает одноместный оператор NOT. Кроме этого, имеется еще и оператор NEAR, который реализует возможность контекстного поиска, когда термины должны располагаться рядом в тексте документа. AltaVista разрешает поиск по ключевым фразам, при этом она имеет довольно большой фразеологический словарь. Кроме всего прочего, при поиске в AltaVista можно задать имя поля, где должно встретиться слово: гипертекстовая ссылка, applet, название образа, заголовок и ряд других полей. К сожалению, подробно процедура ранжирования в документации по системе не описана, но видно, что ранжирование применяется как при простом поиске, так и при расширенном запросе. Реально эту систему можно отнести к системе с расширенным булевым поиском.
Yahoo. Данная система появилась в Сети одной из первых, и сегодня Yahoo сотрудничает со многими производителями средств информационного поиска, а на различных ее серверах используется различное программное обеспечение. Язык Yahoo достаточно прост: все слова следует вводить через пробел, они соединяются связкой AND либо OR. При выдаче не указывается степень соответствия документа запросу, а только подчеркиваются слова из запроса, которые встретились в документе. При этом не производится нормализация лексики и не проводится анализ на "общие" слова. Хорошие результаты поиска получаются только тогда, когда пользователь знает, что в базе данных Yahoo информация есть наверняка. Ранжирование производится по числу терминов запроса в документе. Yahoo относится к классу простых традиционных систем с ограниченными возможностями поиска.
OpenText. Информационная система OpenText представляет собой самый коммерциализированный информационный продукт в Сети. Все описания больше похожи на рекламу, чем на информативное руководство по работе. Система позволяет провести поиск с использованием логических коннекторов, однако размер запроса ограничен тремя терминами или фразами. В данном случае речь идет о расширенном поиске. При выдаче результатов сообщается степень соответствия документа запросу и размер документа. Система позволяет также улучшить результаты поиска в стиле традиционного булевого поиска. OpenText можно было бы отнести к разряду традиционных информационно-поисковых систем, если бы не механизм ранжирования.
Infoseek. В этой системе индекс создает робот, но он индексирует не весь сайт, а только указанную страницу. При этом робот имеет такие приоритеты:
слова в заголовке <title> имеют наивысший приоритет;
слова в теге keywords, description и частота вхождений\повторений в самом тексте;
при повторении одинаковых слов рядом выбрасывает из индекса
Допускает до 1024 символов для тега keywords, 200 символов для тэга description;
Если тэги не использовались, индексирует первые 200 слов на странице и использует как описание;
Система Infoseek обладает довольно развитым информационно-поисковым языком, позволяющим не просто указывать, какие термины должны встречаться в документах, но и своеобразно взвешивать их. Достигается это при помощи специальных знаков "+" - термин обязан быть в документе, и "-" - термин должен отсутствовать в документе. Кроме этого, Infoseek позволяет проводить то, что называется контекстным поиском. Это значит, что используя специальную форму запроса, можно потребовать последовательной совместной встречаемости слов. Также можно указать, что некоторые слова должны совместно встречаться не только в одном документе, а даже в отдельном параграфе или заголовке. Имеется возможность указания ключевых фраз, представляющих собой единое целое, вплоть до порядка слов. Ранжирование при выдаче осуществляется по числу терминов запроса в документе, по числу фраз запроса за вычетом общих слов. Все эти факторы используются как вложенные процедуры. Подводя краткое резюме, можно сказать, что Infoseek относится к традиционным системам с элементом взвешивания терминов при поиске.
WAIS. WAIS является одной из наиболее изощренных поисковых систем Internet. В ней не реализованы лишь поиск по нечетким множествам и вероятностный поиск. В отличие от многих поисковых машин, система позволяет строить не только вложенные булевые запросы, считать формальную релевантность по различным мерам близости, взвешивать термины запроса и документа, но и осуществлять коррекцию запроса по релевантности. Система также позволяет использовать усечения терминов, разбиение документов на поля и ведение распределенных индексов. Не случайно именно эта система была выбрана в качестве основной поисковой машины для реализации энциклопедии "Британика" на Internet.
Список литературы
Г. Алешин " Спутниковые Интернет-сервисы: обзор возможностей использования"
Бурлаков М.Б. "Сервисы Интернет: практическое рассмотрение"
В. Тихонов "Поисковые системы в сети Интернет"