Základné pojmy

Čo je WWW, hypertext a hypermédiá ?

WWW (World Wide Web, niekedy označovaný aj ako W3) navrhol v roku 1989 Tim Berners-Lee. Projekt je založený na troch základných myšlienkach: navigácia pomocou hypertextu, podpora multimédií a integrácia už existujúcich služieb Internetu. Podstatou hypertextu je, že hociktoré slovo (resp. úsek textu) môže byť označené ako odkaz na iný hypertextový dokument, v ktorom sú uvedené podrobnejšie informácie, týkajúce sa tohoto slova. Aktiváciou daného odkazu (nastavím sa naň šípkami a stlačím kláves Enter, resp. kliknem naňho myšou) sa dostanem do zvoleného dokumentu. V ňom sú obvykle ďalšie odkazy, takže naznačený proces môžem reťaziť.

Obrázok na nasledujúcej stane ilustruje prepojenie niekoľkých dokumentov. Jedná sa o veľmi zjednodušenú podmnožinu dokumentov, tvoriacich WWW informácie o pracovisku autorov (Katedra kybernetiky a umelej inteligencie FEI Technickej univerzity v Košiciach). 

Pri navigácii po WWW sa nemusím zaujímať o to, kde sú jednotlivé dokumenty uložené: v skutočnosti sa často nachádzajú na rôznych počítačoch, resp. sú pod správou iných typov servrov (napr. Gopher, Ftp, a.p.). Naviac, nemusí vždy ísť o textové dokumenty, niektoré odkazy môžu ukazovať aj na obrazové, či zvukové informácie, prípadne na videosekvencie. Vzhľadom na naznačené multimediálne možnosti sa niekedy hovorí v súvislosti s týmito službami aj o hypermédiách.

Iné služby na Internete

WWW reprezentuje jeden typ služby dostupný na Internete, a to vyhľadávanie informácií. Okrem vyhľadávania poskytuje Internet aj druhý typ služieb, zameraných na komunikáciu: elektronickú poštu (e-mail), diskusné kluby (mailing lists), diskusné skupiny (USENET newsgroups), priamy rozhovor (talk), IRC (Internet Relay Chat), a ďalšie.

Čo sú klient a server ?

Prevažujúcou architektúrou aplikácií v rámci Internetu je technológia klient / server. Server umožňuje vykonávanie rôznych služieb a klienti sa na server obracajú so žiadosťami o poskytnutie týchto služieb. Klient a server sú v podstate programy, ale nakoľko v prípade Internetu spravidla bežia na rôznych (často dosť vzdialených) počítačoch, pojmy klient a server sa používajú aj k označeniu týchto počítačov.

V prípade WWW sú dokumenty zverejňované na WWW servroch. Ja ako používateľ prichádzam do styku s klientskou časťou programového vybavenia pre WWW s prehliadačom (browser-om). Prehliadače môžu byť textové (Lynx) alebo častejšie grafické (Netscape, Microsoft Explorer, HotJava), pričom môžu bežať na rôznych platformách (Unix, X-Windows, Windows 95/NT 4.0, ...). Keď zo svoj prehliadača vyžiadam nejaký dokument, prehliadač-klient odošle moju požiadavku na príslušný server, odkiaľ dokument získa a poskytne mi ho na obrazovke.

Čo sú cookies ?

Cookies sú krátke pomocné informácie v tvare reťazca meno=hodnota. Pomocou nich si môže server uchovať informácie o svojich predošlých kontaktoch s klientom, prípadne si ich klient ukladá a pozdejšie ich využíva. Boli navrhnuté s cieľom umožniť servru vytvoriť 'profil' klienta, tak aby server mohol reagovať individuálne na rôznych klientov. Mechanizmus cookies umožňuje servru získať mnohé informácie o návykoch používateľa klientského programu (prehliadača), ktoré môžu byť zneužité (reklama, narušenie súkromia - chceli by ste napríklad, aby sa vedelo, že 60% prístupov z vášho prehliadača smeruje do domény playboy.com ? :-) ). Cookies sú prístupné aj prostriedkami JavaScriptu.

Čo sú firewall a proxy ?

Niektoré inštitúcie sa snažia ochrániť servre svojej lokálnej siete pred nepovolanými a nekorektnými zásahmi zvonku. Za tým účelom oddeľujú lokálnu sieť od ostatného Internetu smerovačom, na ktorom beží špeciálny program - firewall (Na Slovensku sa ujal pomerne nevhodný preklad - ohňová stena; presnejšie by bolo: protipožiarna stena). Technológia firewallov nie je zatiaľ štandardizovaná ale obvykle spočíva v zákaze priamej komunikácie medzi lokálnou a globálnou sieťou. Cieľom je chrániť sieť nielen pred bezprostrednými útokmi, ale aj utajiť jej skutočnú štruktúru. Vedľajším efektom je možnosť použiť v chránenej sieti 'classeless' adresy, takže sa šetrí adresný priestor. Komunikácia prebieha potom cez proxy server, ktorý je súčasťou lokálnej siete. Komunikácia niektorých aplikácií smerom z chránenej siete do Internetu využíva Proxy (zástupca) servre, ale môžu byť použité aj tzv. brány (gateways). Proxy servre bývajú vybavené špeciálnymi cache pamäťami, v ktorých sa uchovávajú informácie stiahnuté z globálnej siete aj pre prípadných ďalších klientov, ktorí budú mať o ne záujem. Proxy servre sa práve kvôli tejto výhode používajú aj samostatne, mimo technológie firewallov. Keď chcem ich ponuku využiť, musím si vhodne nakonfigurovať svoj prehliadač.

Ako adresujem informačné zdroje na WWW ?

Čo to je URL a akú má štruktúru ?

URL (Uniform Resource Locator) je jednotné označenie pre internetovské informačné zdroje. Predstavuje vlastne adresu dokumentu, prípadne inej informácie (alebo aspoň adresu servra, ktorý túto informáciu obhospodaruje). URL môžem použiť pri práci s prehliadačom, keď manuálne zadávam adresu dokumentu, o ktorý mám záujem. Najčastejšie sa však URL používajú v hypertextových odkazoch v rámci dokumentov, vytvorených pomocou jazyka HTML (HyperText Markup Language).

V najjednoduchšom prípade má URL adresa všeobecný tvar:

protokol://specificka_cast

kde protokol označuje typ komunikačného protokolu (spôsobu, ktorým získam určitú informáciu), napr.:

http HyperText Transfer Protocol (WWW)

file súbory na disku lokálneho počítača

ftp File Transfer Protocol (prenos súborov zo vzdialeného počítača)

gopher služba Gopher

news elektronické časopisy z USENET-u

mailto odoslanie elektronickej pošty

pričom protokol určuje aj typ servra; specificka_cast má tvar závislý na použitom protokole, najČastejšie

//adresa_servra/cesta/subor.pripona

kde

adresa_servra je adresa počítača, poskytujúceho požadovanú informáciu

cesta je cesta do príslušného adresára

subor.pripona je kompletné meno požadovaného súboru.

URL adresa môže ďalej obsahovať aj číslo portu (keď nie je, použije sa implicitná hodnota), heslo a ďalšie doplnkové informácie, v závislosti na použitom protokole. URL nesmie obsahovať iné znaky ako písmená, číslice, pomlčky, bodky, lomítka a podčiarniky. Ostatné znaky musím zakódovať trojicou znakov, kde prvý je % a za ním je šestnástkový ASCII kód daného znaku (napr. %20 v prípade medzery).

Príklady URL:

http://www.ecrc.de/eclipse/eclipse.htm

ftp://ccsun.tuke.sk/pub/mirror/SimTel/

gopher://gopher.uakom.sk

http://www.ecrc.de

news:local.kkui.vyuka

mailto:csonto@ccsun.tuke.sk

Väčšina webovských prehliadačov vie automaticky doplniť protokolovú časť URL. Napriek tomu sa neodporúča spoliehať sa na túto skutočnosť. Výnimkou je relatívne adresovanie, kde je vynechanie protokolovej časti veľmi efektívne (pozri Aké sú najčastejšie sa vyskytujúce sa prípony súborov? a Aké je adresovanie na lokálnom počítači?).

Podľa prípony súborov zistí webovský prehliadač typ súboru a zvolí aj spôsob, ako s ním bude narábať (napr. či ho zobrazí, či ponúkne jeho uloženie na lokálny disk).

Aké sú najčastejšie sa vyskytujúce prípony súborov ?

Každý súbor, prenášaný v rámci WWW by mal mať príponu, jednoznačne charakterizujúcu jeho obsah. Prípony totiž môžu pomôcť webovskému prehliadaču zistiť (v prípade, keď sa mu to nepodarí určiť podľa obsahu súboru) o aký typ súboru sa jedná, a podľa toho zvoliť aj spôsob ako s ním narábať (napr. či ho zobraziť, či ho prehrať pomocou zvukovej karty, či ponúknuť jeho uloženie na lokálny disk).

V tabuľke sú uvedené najčastejšie používané prípony

Typ súboru 
Prípona 
HTML 
.htm, .htm 
ASCII text 
.txt 
zdrojový text Java 
.java 
bajtový kód Java 
.class 
JavaScript skript 
.js 
PostScript 
.ps 
obrázok vo formáte GIF 
.gif 
obrázok vo formáte JPEG 
.jpg, .jpeg 
zvukový záznam RealAudio 
.ra, .ram 
scéna virtuálnej reality v jazyku VRML 
.wrl, .wrz,. vrw 
MPEG video záznam 
.mpeg, .mpg