IT-legendák: Paul Flaherty

Mr. Altavista

Szükségünk van egy információra? Mi sem egyszerűbb… Csak beütjük az éppen egyeduralkodó kereső címét (ez most a Google), és máris özönlenek képernyőnkre a találatok. De vajon eszünkbe jut-e valaha, hogy kinek is köszönhetjük mindezt?


Paul Flaherty: neki köszönhetjük a mai webes keresőket

Szomorú aktualitás: tragikus hirtelenséggel elhunyt Paul Flaherty, az úttörő AltaVista keresőjének ötletgazdája és egyik fejlesztője. Flaherty 42 évesen távozott el, halálát szívinfarktus okozta, amely belmonti (Szilícium-völgy, Kalifornia) otthonában érte március 16-án. Jelen írásunk tehát, amellett hogy ebben a hónapban is bemutat egy IT-legendát, egyúttal tisztelgés is Mr. Flaherty emléke és életműve előtt.

Bármilyen meglepő, a szinte már mindennapossá vált Google vagy Yahoo és egyéb webes keresők röpke tizenkét évvel ezelőtt még nem léteztek. Pedig internet már akkor is volt, sőt weboldalak is voltak szép számmal… Hogyan is kerestünk kicsivel több mint tíz évvel ezelőtt? Nos, az élet nem volt ilyen egyszerű… A fiatalabb generáció tagjai valószínűleg már nem is emlékeznek az akkori megoldásokra, például a Gopherre – a 90-es években ez volt a legjobbnak tűnő eljárás a keresésre. A Gopher nem volt más, mint egyetemi és kormányzati adatbázisok „összekapcsolása”, egy mai szemmel már ósdinak tűnő, csak szövegek megmutatására szolgáló kliens (Gopher-szoftver) segítségével. Az egész eljárás, valamint a kliens felülete is erősen hasonlított a hírcsoportokon belüli keresgéléshez (hasonlóan kaotikus is volt). Az internet hőskorában tehát ha meg akartunk találni valamit, akkor vagy könyvjelzőinkre és innen-onnan kiderített webcímeinkre támaszkodhattunk, használhattuk a Gophert, a hírcsoportokat, illetve az ilyen-olyan kezdetleges (nem indexelésen alapuló) keresőket. Elvetemültebbek próbálkozhattak a Lynxen és telneten elérhető webcímadatbázisokkal… Hát tényleg nem volt rózsás a helyzet.

A Gopher szó, amelynek magyar megfelelője hörcsög vagy pocok, 1991 áprilisától új jelentést nyert. Így nevezték el a University of Minnesota programozói programcsomagjukat, amellyel belső egyetemi információs rendszerüket (CWIS-Campus Wide Information System) létrehozták. Később a GOPHER „elárasztotta" a világot, és az interneten keresztül ma már több ezer szerver adatai kérdezhetők le. A Gopher egy elosztott szöveges adatbáziskezelő, kliens-szerver elven működő rendszer. Az információk, többnyire szöveges dokumentumok, az internet legkülönbözőbb szerverein helyezkednek el. A kliens programot futtató felhasználó egy egységes menürendszert lát, a menüpontok között válogat, így különböző indexállományok segítségével egyszerre tud a szervereken keresni. A kiválasztott dokumentumokat azután a rendszer, a Gopher névhez híven, mint egy hörcsög begyűjtötte és letöltötte a megfelelő gépekről.

Kereső születik

Paul A. Flaherty Milwaukee-ban született, egy ötgyerekes családban. Minnesotában nőtt fel, és a Stanford Egyetemen szerzett elektromérnöki diplomát 1994-ben. Mint fiatal szoftvermérnök érkezett a Szilícium-völgybe, tele nagyravágyó tervekkel és elképzelésekkel – de hát ezzel mindenki így volt akkoriban. A számítástechnika és az internet a hőskorát élte, lehetett érezni, hogy valami készül, valami van a levegőben. Flaherty 1994-től kutatómérnökként dolgozott a Digital Equipment Corporation nevű cégnél Palo Altóban. A legenda szerint az ötlet éppen a Gopher kapcsán született: Paul és két kollégája ebéd közben buzgón vitatkozott arról, vajon mi is lesz a Gopher és egyáltalán az internetes keresés és adatgyűjtés jövője. Flaherty azon a véleményen volt, hogy az akkori eljárások zsákutcának fognak bizonyulni (főleg mivel a Gopher akkoriban már nem volt képes megbirkózni a hihetetlen sebességgel gyarapodó, a mai értelemben vett grafikus weboldalakkal).

Így született tehát az ötlet: mi lenne, ha az interneten található összes (vagy legalábbis majdnem összes) weboldalt egy hatalmas indexbe, azaz adatbázisba gyűjtenék össze, majd később ezen az indexen belül lehetne keresni. Az ötletet hamarosan tettek követték… Akkor még nagyon fiatal volt a világháló, hiszen azt mindössze négy évvel azelőtt alkotta meg Tim Berners-Lee, a svájci CERN munkatársa. A linkgyűjteményeken és a már emlegetett „hörcsögön” kívül még semmi sem segítette a netezők dolgát az online anyagok közötti eligazodásban. Az indexelés tehát forradalmi ötletnek tűnt, meg kellett azonban birkózni egy elég nagy problémával, nevezetesen azzal, hogy miként is jöjjön létre ez a bizonyos index?


Így nézett ki: az első AltaVista 1995-ben [+]

A megoldandó probléma igen nagy volt: hogyan gyűjtsék össze az interneten található több millió oldalt, azok tartalmát és címeit? Paul egy nagyon egyszerű, ám forradalmi ötlettel állt elő: mi lenne, ha írnának egy olyan szoftver, ami gyakorlatilag „végigjárja” az internetet, megnéz minden weboldalt, kigyűjti róluk az információkat, majd ezeket az adatokat elküldi a kereső-adatbázisba. Így született az első keresőrobot, amit Flahertyék egyszerűen csak botnak (a robot szóból) neveztek el.

A kereső

„Az alapötlet egyszerű: fogjuk az összes weboldalt, ezeket jegyzékbe veszzük, és tartalmukat kereshetővé tesszük… Csak még azt nem tudom, hogy hogyan.” – Paul Flaherty

A keresőbot meglátogatja a weblapokat, „elolvassa” őket, és követi a más oldalakra mutató linkek útját. Annak érdekében, hogy az adatbázis aktualizált legyen, bizonyos időközönként a robotok visszatérnek a weboldalakra, és megnézik, történt-e változás. A következő fázisban a robotok összegyűjtik, más szóval indexelik a találataikat, kereséseik eredményét. Összegyűjtik, besorolják egy hatalmas katalógusba (index), azaz „szövik a hálójukat". Ha egy oldal megváltozik, az automatikusan bekerül a katalógusba – így módosul folyamatosan és dinamikusan a tartalom.

Mindebből a felhasználó csak annyit lát, hogy amikor rákeres egy adott témára, akkor a szoftver átvizsgálja és megszűri a katalógusban lévő weboldalak millióit a találati lista felállításához, majd automatikusan rangsorolja a találatokat, a szerinte legrelevánsabb, leginkább a tárgyhoz tartozó szempontok alapján, és ennek eredményeként jelenik meg monitorunkon a találati lista. Egyszerű és nagyszerű… A Flaherty által kifejlesztett folyamat neve hivatalosan spidering (az angol spider, azaz pók szóból), és olyannyira jól működik, hogy manapság is ezt használja minden kereső: a Google például ugyanúgy indexel a robotjai segítségével, mint ahogyan azt tizenkét évvel ezelőtt az Altavista tette.


Az Altavista napjainkban: a Google egyeduralma miatt már alig használja valaki

Paul tehát megálmodta a hatalmas indexet, kitalálta a keresőrobotokat, majd pár hónappal később a Digital segítségével elindította az AltaVistát, a világ első internetes keresőjét. Az AltaVista 1995 decemberében vált nyilvánosan elérhetővé, pár hét múlva pedig már napi több millió keresést futtatott, ezzel is bizonyítva, hogy az internetezők már ki voltak éhezve az információkhoz jutás új módjára. Ekkoriban az AltaVista még a Digital kísérleti projektjeként működött az altavista.digital.com címen, ám hamarosan olyan népszerű lett (és persze üzleti vállalkozásnak sem volt utolsó), hogy 1999-ben önálló cégként szervezték újjá. (A Digitalból kiválva ekkor jött létre a mindenki által ismert AltaVista, az azóta már legendássá vált www.altavista.com cím alatt.) Az addig a technológiai stratégiáért felelős igazgatóként dolgozó Flaherty pedig 2000-ben vált meg a cégtől, és üzleti tanácsadással kezdett foglalkozni.

Halálakor a Menlo Park-i TalkPlus nevű telekommunikációs szoftvereket fejlesztő cég termékfejlesztési vezetője volt.


Weboldala túlélte: Flaherty website-ja létezik, bár egyes hivatkozások már nem élnek benne

Tragikus dolog, hogy az egyik leginnovatívabb elme ilyen korán távozott közülünk. A legkevesebb, amit tehetünk, hogy ha legközelebb bepötyögünk valamilyen kulcsszót a Google-ba vagy valamilyen más keresőbe, akkor megfordul a fejünkben, hogy mindezt Mr. Flahertynek köszönhetjük. És tényleg köszönjük, Paul!

Kazári Csaba

Azóta történt

Hirdetés