Інтернет-ресурси та бази даних

Міністерство освіти і науки України

Галицький інститут імені В’ячеслава Чорновола

Кафедра рекламної та редакторської майстерності

ІНДЗ на тему:

“Інтернет-ресурси та бази даних ”

Виконала:

студентка групи Р-41б

Дубова Інна

Науковий керівник:

Фурманкевич Н. М.

Тернопіль – 2009

План

Вступ

    Всесвітня павутина, її виникнення, основні принципи та поняття

    Поняття «бази даних»

    Пошукові машини в Інтернеті

Висновки

Список використаної літератури

Вступ

З розвитком сучасних технологій всесвітня мережа Інтернет відіграє все більшу роль у професійній діяльності журналістів. Тисячі людей щодня дізнаються із всесвітньої інформаційної мережі про останні новини, переглядають відеоматеріали, знаходять потрібну та актуальну інформацію для своєї роботи або навчання, спілкуються та розважаються. Більше того, для журналіста невміння користуватися комп’ютером та Інтернетом вже вважається справжньою непрофесійністю.

В останні декілька років в мережі з’явилося безліч інформаційних сайтів з величезною кількістю матеріалів, в яких важко розібратися навіть досвідченим користувачам.

Інтернет ввійшов в життя людей, і не лише за допомогою комп’ютера. Інформація, яка з'являється на сайтах в мережі, все частіше цитується з екранів телевізорів чи радіо і доходить до людей, які навіть ніколи не бачили комп'ютера. Тому для журналіста, перш за все, важливим є вміння працювати з Інтернетом та розуміти основні його принципи.

Мета даної роботи – ознайомитись з основними поняттями які використовуються у процесі щоденної діяльності в Інтернеті, зрозуміти принципи баз даних та різноманітних пошукових машин.

Під час виконання роботи були поставлені такі завдання:

- ознайомитись з особливостями та поняттями всесвітньої мережі Інтернет;

- розглянути особливості баз даних;

- ознайомитись з найрозповсюдженішими пошуковими машинами.

1. Всесвітня павутина, її виникнення, основні принципи та поняття

Інтерне́т (пишеться з великої літери, від англ. Internet, дослівно — «міжмережа») — Міжмережжя, всесвітня система об'єднаних комп'ютерних мереж, побудована на використанні протоколу IP і маршрутизації пакетів даних. Інтернет утворює глобальний інформаційний простір, слугує фізичною основою доступу до веб-сайтів і багатьох систем (протоколів) передачі даних. Часто згадується як «Всесвітня мережа» чи «Глобальна мережа». У побуті іноді говорять Нет, Іне́т, Тенета, Міжмережжя, Інтерне́трі або Не́трі.

Сьогодні при вживанні слова «Інтернет» найчастіше мається на увазі саме веб і доступна через нього інформація, а не сама фізична мережа, що призводить до різноманітних юридичних колізій та правових наслідків.

В англійській мові якщо слово «internet» написано з малої літери, воно означає просто об'єднання мереж (англ. interconnected networks) за допомогою маршрутизації пакетів даних. У такому разі не мається на увазі глобальний інформаційний простір. У вітчизняній технічній літературі також іноді роблять такий розподіл понять.

Історія мережі Інтернет

У 1969 році Міністерство оборони США започаткувало розробку проекту, котрий мав на меті створення надійної системи передачі інформації на випадок війни. Агентство передових досліджень США (англ. ARPA) запропонувало розробити для цього комп'ютерну мережу. Її розробка була доручена Каліфорнійському університетові Лос-Анджелеса, Стенфордському дослідному центрові, Університету штату Юта та Університету штату Каліфорнія в Санта-Барбарі. Ця мережа була названа ARPANET (англ. Advanced Research Projects Agency Network — Мережа Агентства передових досліджень). В рамках проекту мережа об'єднала названі заклади; всі роботи по її створенню фінансувались за рахунок Міністерства оборони США. Потім мережа ARPANET почала активно рости й розвиватись; її дедалі ширше почали використовувати вчені із різних галузей науки.

Отож, Всесві́тня павути́на (англ. World Wide Web, скорочено: WWW; також: веб або тене́та — найбільше багатомовне сховище інформації в електронному вигляді: мільйони пов'язаних між собою документів, що розташовані на комп'ютерах розміщених на всій земній кулі. Вважається найпопулярнішою і найцікавішою службою-мережею в Інтернет, яка дозволяє одержувати доступ до інформації незалежно від місця її розташування.

В наш час, найбільш бурхливо прогресуюча компонента мережі Інтернет. Користувачі автоматично переходять від однієї бази даних (сайту) до іншої за допомогою гіперпосилань. Кількість серверів WWW постійно зростає, а швидкість росту WWW навіть більша ніж у самої мережі Internet. WWW – найрозвиненіша технологія Internet, вона вже стала масовою. Перспективи розвитку – необмежені.

WWW – інформаційна система, якій не можна дати конкретного визначення. Наведемо лише деякі з епітетів, якими вона може бути позначена: гіпертекстова, гіпермедійна, розподілена, інтегруюча, глобальна. Нижче буде показано, що слід розуміти від кожною з цих властивостей у контексті WWW.

WWW працює по принципу клієнт-сервер, а точніше, клієнт-сервери: існує велика кількість серверів, які по запиту клієнта надають йому гіпермедійний документ — документ, що складається із частин з різними представленням інформації (текст, звук, графіка, тривимірні об’єкти тощо), в якому кожний елемент може бути посиланням на інший документ чи його частину. Такі посилання в WWW організовані таким чином, що кожний інформаційний ресурс в глобальній мережі Internet однозначно адресується, і документ, який зчитується в даний момент, може посилатися як на інші документи на цьому ж сервері, так і на документи, які (і взагалі ресурси Internet) на інших комп’ютерах Internet, причому користувач не помічає цього і працює з усім інформаційним простором Internet як з єдиним цілим. Посилання WWW вказують не тільки на документи, специфічні для самої WWW, але й на інші сервіси і інформаційні ресурси Internet Більш того, більшість програм клієнтів WWW (браузер) не просто розуміють такі посилання, а є програмами-клієнтами відповідних сервісів: FTP, Gopher, новин мережі Usenet, електронної пошти і т. і. Таким чином, програмні засоби WWW — універсальні для різних сервісів Internet, а сама інформаційна система WWW грає інтегруючу роль.

Інтернет складається з багатьох тисяч корпоративних, наукових, урядових та домашніх мереж. Об'єднання різнорідних по архітектурі мереж стало можливо завдяки протоколу IP (англ. Internet Protocol) і принципу маршрутизації пакетів даних. Протокол ІР був спеціально створений агностичним по відношенню до фізичних каналів зв'язку. Тобто будь-яка мережа передачі цифрових даних може передавати інтернет-трафік. На стиках мереж спеціальні маршрутизатори займаються сортуванням та перенаправленням пакетів даних, базуючись на ІР-адресах одержувачів цих пакетів. Протокол ІР утворює єдиний адресний простір у масштабах всього світу, але в кожній окремо взятій мережі може існувати свій власний адресний підпростір. Така організація ІР-адрес дозволяє маршрутизаторам однозначно визначати подальший напрямок для кожного, навіть найменшого, пакету даних. В результаті між різними мережами Інтернету не виникає конфліктів і дані точно і без перешкод передаються від мережі до мережі по всій планеті.

Сам протокол ІР був народжений в дискусіях всередині організації IETF (англ. Internet Engineering Task Force, Task force — група спеціалістів, покликана вирішити певну задачу), назву котрої можна перекласти як «Група для вирішення задач проектування Інтернету». IETF і її робочі групи досі займаються розвитком протоколів Всесвітньої мережі. Вона відкрита для публічної участі та обговорень. Комітети цієї організації публікують т.зв. документи RFC (англ. Request for Comments — запит коментарів). В цих документах даються технічні специфікації і точні пояснення багатьох питань. Деякі документи RFC організація IAB (англ. Internet Architecture Board — Рада по архітектурі Інтернету) оголошує Стандартами Інтернету. З 1992 року IETF, IAB та ряд інших організацій утворюють Товариство Інтернету (англ. Internet Society, ISOC) — організаційну основу для різноманітних дослідницьких та консультативних груп, що займаються розвитком Інтернету. На думку багатьох науковців Інтернет це початок нової ери і продуктивно займються розвитком і удосконаленням міжнародної системи Інтернет.

Наведемо роз’яснення деяких термінів, які використовуються в WWW —журналіст безперечно повинен знати їх, бо рано чи пізно зіткнеться з ними і вони не повинні викликати ускладнень. Перший термін — HTML (hyper text markup language, мова розмітки тексту). Це формат гіпермедійних документів, які використовують в WWW для представлення інформації. Цей формат не описує те, як документ повинен виглядати, а його структуру і зв’язки. Зовнішній вигляд документа на екрані користувача визначається навігатором — якщо користувач працює за графічним або текстовим терміналом, у кожному випадку документ на екрані матиме різний вигляд, але його структура залишиться незмінною, оскільки вона задана форматом html. Імена файлів у форматі html, як правило, закінчуються на html (або мають розширення htm у випадку, якщо сервер працює під Windows). Другий термін URL (uniform resource locator, універсальний вказівник на ресурс). Таку назву носять посилання на інформаційні ресурси Internet. Ще один термін – HTTP (hypertext transfer protocol, протокол передачі гіпертексту). Таку назву носить протокол, за яким взаємодіють клієнт та сервер WWW.

Домен (англ. Domain) — частина простору ієрархічних імен мережі Інтернет, що обслуговується групою серверів доменних імен (DNS-серверів) та централізовано адмініструється.

DNS-сервери зберігають інформацію про вузли, які належать домену і виконують перетворення їх імен в адреси. Кожний домен має унікальне ім'я, а кожен комп'ютер, підключений до Інтернет, обов'язково потрапляє в один із доменів. Домени взаємодіють між собою за ієрархічним принципом. Два домени, що знаходяться на сусідніх рівнях ієрархії, називаються відповідно доменом вищого та нижчого рівнів. Домени найвищого (верхнього) рівня можуть бути сформовані за організаційним або географічним ознаками. Домени, сформовані за географічним ознаками, об'єднують вузли, що належать конкретній державі. За географічними ознаками об'єднуються в основному комп'ютери, що містяться на території США [3].

2. Поняття «бази даних»

База даних (БД) — впорядкований набір логічно взаємопов'язаних даних, що використовується спільно, та призначений для задоволення інформаційних потреб користувачів. У технічному розумінні включно й система керування БД.

Головним завданням БД є гарантоване збереження значних обсягів інформації (т.зв. записи даних) та надання доступу до неї користувачеві або ж прикладній програмі. Таким чином БД складається з двох частин — збереженої інформації, та системи управління нею. З метою забезпечення ефективності доступу записи даних організовують як множину фактів (елемент даних).

2000-ні рр. головним нововведенням є підтримка та застосування XML у БД. Розробники комерційних БД, які панували на ринку у 1990-их рр., отримують все більшу конкуренцію зі сторони руху відкритого програмного забезпечення. Реакцією на це стає поява безкоштовних версій комерційних БД [3].

Інтернет-журналісти дістають більшу частину інформації за допомогою комп’ютерів, але не завжди це найліпше джерело інформації. Специфіка певного ЗМІ може «відіслати» вас до старомодних друкованих джерел.

Місцеві публічні та університетські бібліотеки також можуть надати велику допомогу з матеріалами, адже це своєрідні бази даних.

Більшість ЗМІ також мають різноманітні довідкові матеріали – адреси місцевих підприємств і державних установ, що містять найрізноманітнішу корисну інформацію місцевого і регіонального характеру.

Сьогодні більшість баз даних державних органів доволі сучасні і перенесені в Інтернет. До них часто мають доступ університетські бібліотеки, що забезпечують студентам, викладачам та науковцям умови для проведення досліджень. Також можна скористатись і центральною публічною науковою бібліотекою міста.

Проте, незважаючи на величезну кількість інформації в Інтернеті, якщо ви користуєтесь офіційними базами даних державних органів, то слід обов'язково зважати на авторські правата інші обмежувальні правові чинники [2].

3. Пошукові машини в Інтернеті

Пошукова системаонлайн-служба, яка надає можливість пошуку інформації на сайтах в інтернеті, а також (можливо) у групах обговорення та ftp-серверах.

Індексація в пошукових системах сайтів здійснюється пошуковим роботом.

Основними критеріями якості роботи пошукової системи є релевантність, повнота бази, врахування морфології мови [1].

Сьогодні найрозповсюдженішими та тими, які найчастіше використовуються є такі пошукові машини:

META

Український пошуковий портал в Інтернет. Використовує пошукову систему власної розробки з українською, російською та англійською мовами пошуку. Зона пошуку — українські сайти та сайти, що стосуються України.

Належність сайтів до українського сегменту мережі визначається наступним чином:

    сайти в домені UA та під доменах (com.ua kiev.ua тощо);

    українська мова сайту;

    хостинг на IP українських провайдерів;

    основна тематика сайту (будь-якою мовою) стосується України.

Внаслідок певних технічних складнощів з визначенням належності сайту до України, у випадках 3-4, тобто коли сайт знаходиться в доменах першого рівня (.com, .net, .org тощо) і використовує не українську мову, бажано додавати сайт до пошуку в ручному режимі. МЕТА підтримує українську, російську та англійську морфологію.

Google Inc.

Американська корпорація, заснована 7 вересня 1998 року як приватна компанія, що займається розробкою, розвитком і дизайном найпопулярнішого в Інтернет пошукового сервісу. В компанії, головний офіс якої розташованій в Маунтін В'ю, Каліфорнія, працюють близько 16 000 робітників.

Назва «Google» — спотворене написання слова «гугол» (англ. googol), яке придумав Мілтон Сіротта, племінник американського математика Едварда Кайзера. «Гугол» — це число 10100, десятковий запис його містить одиницю та сто нулів.

Лідер пошукових машин Інтернет, Google займає 65% світового ринку[1]. Наразі Гугл щоденно реєструє близько 50 млн. пошукових запитів та індексує більше 8 мільярдів веб-сторінок. Google може знаходити інформацію 101 мовою. Google наприкінці серпня 2004 року складалась з 132 тис. машин, розташованих в різних точках планети (джерело інформації — колишній високопоставлений співробітник компанії.

Інтерфейс Google містить досить складну мову запитів, що дозволяє обмежити область пошуку окремими доменами, мовами, типами файлів тощо. Наприклад, пошук «intitle:Google site:wikipedia.org» видасть всі статті Вікіпедії всіма мовами, в заголовку яких зустрічається слово «Google».

Я́ndex

Найбільша та найвідоміша російська пошукова система. За статистикою, кількість відвідувачів головної сторінки, у день складає біля 4—5 млн. Назва походить від англ. index (yandex — yet another indexer (рос. «еще один индексатор» або «Языковой иНдекс»).

Сайт компанії почав прюцювати восени 1997 року. Відмінністю Яндекса можна вважати алгоритм його пошуку — він сконструйований на морфологічній системі російської мови. Крім стандартних файлів HTML шукає також у файлах формату PDF (Adobe Acrobat), RTF (Rich Text Format), DOC (Microsoft Word), XLS (Microsoft Excel), PPT (Microsoft Power Point), SWF (Macromedia Flash), а також індексує формат RSS.

Висновки

Інтернет називають і всесвітнім сховищем, і світовим звалищем, універсальним довідником і навчальним посібником, безмежною бібліотекою і величезною тусовкою. Щодня в мережі з’являються тисячі нових веб-ресурсів, і знайти потрібну інформацію та спробувати визначити, наскільки вона є правдивою, надзвичайно важко. Мережа – це не лише безліч матеріалів, але й серйозний бізнес і чудовий засіб для дезінформації. Протее, щоб ми Мали змогу отримувати цю інформацію та щодня бути користувачами Інтернету, потрібна чітка система дій та програм, які створюють програмне забезпечення.

Бази даних – це впорядкований набір логічно взаємопов'язаних даних, що використовується спільно, та призначений для задоволення інформаційних потреб користувачів. Ними можуть бути як Інтернет ресурси та сайти, так і звичайні паперові носії зібрані в одному місці – бібліотеки. Тому не варто у всьому покладатись на Інтернет, а звертатись до звичайних «старомодних» баз даних.

Знайти потрібну інформацію в мережі можна як напрочуд швидко, так і втративши на це безліч часу. Тому сьогодні для зручності та оперативності ми користуємось пошуковими системами. Пошукова системаонлайн-служба, яка надає можливість пошуку інформації на сайтах в інтернеті, а також (можливо) у групах обговорення та ftp-серверах. Найзручнішими та найпоширенішими на сьогодні є такі пошукові машини: META, Google Inc., Я́ndex.

Список використаної літератури

    Інтернет в роботі журналіста / Упоряд. І. Шелудченко. – К. : «Інститут масової інформації», 2004. – 72 с.

    Крейг Р. Інтернет-журналістика: робота журналіста і редактора у нових ЗМІ / Пер. з англ. Іщенка. – К. : ВД «Києво-Могилянська академія», 2007. – 342 с.

    Основи інформатики та обчислювальної техніки: Навчальний посібник/ За заг. Ред. В.Г.Іванова. – К.: Юрінком Інтер, 2004. – 328с.