Zasoby Informacyjne InternetuSpis treści
Poszukiwanie informacji w Internecie - "bramy" (gateways) i "portale" (portals)Organizacja sieciNie ma nikogo, kto byłby odpowiedzialny za Internet; żadna z organizacji nie reguluje jego poziomu, nie decyduje, kto powinien umieszczać informacje na serwerach, jakie standardy jakości powinny być przestrzegane. Po prostu każdy ma możliwość zainstalowania określonych danych na serwerze połączonym z Internetem. Ostatnio w jednym z popularnych w Wielkiej Brytanii magazynów komputerowych podano np., że w pewnym wypadku serwerem był zwyczajny laptop "Libretto", podłączony do Internetu w czasie, gdy nie korzystano z niego w podróży. Innymi słowy - wyposażenie może być naprawdę minimalne; nauczenie się zaś, jak utworzyć źródło informacji na elementarnym poziomie, nie stanowi większego problemu. W konsekwencji więc wysoce prawdopodobnym jest, iż chaos, jaki panuje w Internecie, narastać będzie w miarę jak coraz to więcej krajów posiadać będzie mnóstwo serwerów i coraz to więcej ludzi ulegnie entuzjazmowi wynikającemu z możliwości ulokowania wszelkich informacji w Sieci. Pojawia się w związku z powyższym konieczność odpowiedniego filtrowania danych, aby poszukujący ich sprawnie znajdował właściwe. Przekonaliśmy się już, że wyszukiwarki (search engines) próbują uszeregować wylistowane strony stosownie do poszukiwanego hasła, jednak są to przeważnie metody raczej prymitywne. Dla przykładu proszę spróbować znaleźć jakąś stronę domową firmy, co do której macie Państwo pewność, że prezentowana jest w Internecie; następnie proszę zwrócić uwagę, która z wyszukiwarek umieściła ją na początku podanego wyniku. Mając na względzie wieloznaczność języka oraz rozmiary Sieci można stwierdzić, iż zawsze będą występowały problemy z selekcją odpowiedniego materiału; jego zasoby zaś prawdopodobnie stawać się będą coraz większe. Alternatywą jest stworzenie biblioteki - wirtualnej, zawierającej strony z Sieci, uznane co do swej autentyczności i jakości; a więc dokonanie tego, czym na co dzień zajmują się biblioteki - skatalogowanie, uporządkowanie powyższych stron; dzięki temu odszukanie odpowiednich danych będzie znacznie łatwiejsze. "Yahoo!" było, jeśli nie pierwszym przedsięwzięciem, to z pewnością pierwszym katalogiem, swego rodzaju przewodnikiem umożliwiającym szeroki dostęp do informacji, portalem do Sieci.
Wyszukiwarka i katalogZ pewnych względów, zestawienia czy katalogi dostarczane przez wyszukiwarki, czy inne źródła danych, tak jak np. Yahoo! stały się znane jako portale, podczas gdy katalogi tworzone przez innych, szczególnie te opracowywane przez biblioteki czy w ramach projektów R&D, określa się mianem "bram informacji". Służą one dokładnie tym samym celom i ich twórcy zapewniają o stosowaniu surowych kryteriów jakości dla umieszczenia danych w katalogu, lecz ponieważ określa się je różnie, możemy mieć z nimi do czynienia oddzielnie. Zacznijmy od przyjrzenia się zarysowi katalogu strony domowej Yahoo! UK's Proszę przejrzeć tę stronę i zwrócić uwagę na zastosowane tam główne kategorie, następnie zamknąć okno. Jeśli klikniemy na "Business and Economy", zaprezentowana zostanie następująca strona z takimi oto tematycznymi nagłówkami: Jeśli zdecydujemy, że interesuje nas "Electronic Commerce", zaprezentowana będzie kolejna lista: Gdy natomiast zainteresuje nas "Digital Money" znajdujemy ostatecznie różne połączenia (linki) ze stronami w Sieci - w tym przypadku z pięcioma:
By wrócić do bieżącej strony - należy zamknąć okno po przejrzeniu rezultatu Jednakże, jeśli poszukujemy tego samego pojęcia korzystając z szybkiej wyszukiwarki, otrzymujemy listę zawierającą 5.277 stron, a "Northern Light" podaje ich 436.520.
Na czym polega indeksacjaPrzekonajmy się o tym, przyglądając się jednemu z nagłówków na dowolnej stronie podającej rezultaty przeszukiwania przez Yahoo! Np. co do efektu poszukiwania "Japanese Products" zauważmy, że każda pozycja uzyskana z Yahoo! posiada rodzaj tematycznego nagłówka, który pokazuje tzw. drzewo klasyfikacji odnoszące się do niej. Proszę kliknąć poniżej, przyjrzeć się rezultatom, następnie zamknąć okno, by powrócić do bieżącej strony. A więc jedno "wejście" to taki oto nagłówek:
Regionalne > Kraje > Japonia > Biznes i ekonomia > Firmy > Zestawienia alfabetyczne
pokazujący, w jaki sposób pozycja jest skatalogowana w pliku; jednocześnie terminowi "Japanese Products" dodatkowo towarzyszą opisy, gdzie występuje.
Wszystkie "portale" i "bramy" wykorzystują pewien typ schematu klasyfikacyjnego jak zaprezentowany powyżej; posługują się technikami, które zostały wypracowane w bibliotekarstwie w ciągu przeszło 150 lat. Niemniej, aby podkreślić, że robi się coś innego, istnieje tendencja do nazywania ich taksonomiami.
Ćwiczenia.
Proszę przyjrzeć się zestawieniom danych oferowanych przez inne wyszukiwarki, tak jak na przykład
Lycos MSN Search Excite
czy też Alta Vista.
Jakie podobieństwa bądź różnice zauważacie Państwo? Czy podana klasyfikacja odpowiada przeciętnemu użytkownikowi, czy może specjaliście? Jak poszukalibyście Waszego obszaru zainteresowań? Zobaczycie Państwo, że portale czy katalogi proponują różne sposoby dokonywania poszukiwań; zamiast umieszczenia w wyszukiwarce terminu lub frazy, jak np. "Japanese products" (japońskie produkty), można przeglądać rozmaite poziomy schematu klasyfikacji, dopóki nie dotrzecie Państwo do zakresu Waszego zainteresowania i następnie odnajdziecie strony wartościowe z uwagi na temat poszukiwań.
Tematyczne "bramy" do zasobów informacyjnychJak przekonaliśmy się, wyszukiwarki umożliwiają przeszukiwanie znaczącej proporcjonalnie (nie znaczy że wszystkiego) części internetowych 800 milionów stron WWW. I to użytkownik musi dokonać wyboru, co rzeczywiście jest istotne. Zarówno tematyczne "bramy" do Internetu, tak jak "portale", dokonują dla Państwa selekcji w obrębie konkretnych dziedzin, np. medycyny, inżynierii czy nauk społecznych. Owe "bramy" katalogują źródła, posługując się specjalistycznymi kategoriami, w związku z czym można następnie poruszać się już w obrębie określonych zasobów tematycznych. Organizator "bramy" usiłować będzie zawrzeć tylko pozycje o podanej jakości; przy czym niektóre z "bram" publikują, jakie stosują kryteria selekcji. Oczywiście w rezultacie "brama" wylistuje znacznie mniej pozycji niż może być zindeksowanych przez wyszukiwarkę. Wiedząc, że jakość materiałów dostępnych w Sieci jest bardzo różna, powinniśmy zastanowić się, skąd można wiedzieć, że "brama" posiada uznawaną wartość. W tym przypadku w zasadzie odpowiedź zależy od reputacji oraz autorytetu organizacji opracowującej materiały. Stąd też szukamy profesjonalnych, naukowych stowarzyszeń, bibliotek uniwersyteckich oraz innych, zaangażowanych w opracowywanie przewodników po źródłach internetowych (obejmujących nie tylko strony Sieci), mających na uwadze przyniesienie bezpośrednich korzyści ich członkom i ogólnie - społeczności naukowej. Komercyjne organizacje także tworzą owe "bramy"; przy czym powinniśmy dokładnie wiedzieć, jakie są relacje pomiędzy nimi a miejscami w Sieci, których selekcji dokonują; szczególnie, jeśli dana firma otrzymuje profity z reklam. Ogólnie jednakże "brama" będzie przyciągać użytkowników, skoro tylko spełniać będzie wszelkie kryteria jakości, o których wspomniane zostało wcześniej. Informacyjne "bramy" można podzielić na 3 zasadnicze typy: ogólne - które, podobnie jak portale wyszukiwarek, próbują zawrzeć określoną dziedzinę wiedzy lub przynajmniej część znajdującą się na stronach Sieci; tematyczne - tak jak np. OMNI, dotycząca medycyny i opieki zdrowotnej; narodowe albo regionalne - jak np. Fińska Biblioteka Wirtualna (the Finnish Virtual Library). Jednocześnie proszę zauważyć, że określenia "biblioteka cyfrowa" (digital library) oraz "biblioteka wirtualna" (virtual library) bywają często używane niewłaściwie dla oznaczenia ni mniej ni więcej tylko właśnie "bramy". Co do informacji związanych z regionalnymi czy lokalnymi władzami, można się spodziewać, że użytkownicy Internetu poszukiwać będą wiadomości różnego typu, w zależności od zakresu funkcji sprawowanych przez określony organ rządzący. Typowym jest jednak możliwość wyszukania danych na temat zróżnicowanego stopnia odpowiedzialności za planowanie urbanistyczne, budownictwo mieszkaniowe, opiekę społeczną, zdrowotną edukację, transport, policję, straż pożarną, itd. I mimo że nie zawsze można będzie znaleźć "bramę", która dotyczyłaby bezpośrednio powyższej tematyki, w rozmaitych częściach świata są obecnie dostępne wystarczające "wejścia", dostarczające ewentualnych uzupełnień znalezionej wcześniej informacji, bez konieczności korzystania z wyszukiwarki (w zasadzie dotyczy to każdego tematu). Aby się o tym przekonać, poszukajmy tematycznej bramy, związanej z projektowaniem przestrzennym. Proszę to przećwiczyć w Google: Czy pamiętacie Państwo, by użyć cudzysłowu, podając pytanie? Proszę nacisnąć CLICK i zobaczyć, co się stanie, następnie zamknąć okno i powrócić do bieżącej lekcji
Czy próbowaliście Państwo skorzystać z GoogleScout? Podaje on listę połączeń z "linkiem", z którego korzystacie aktualnie i jaki może być użyteczny dla odszukania bardziej szczegółowych, odpowiednich miejsc w Sieci. Prawdopodobnie ostatnie poszukiwanie doprowadzi Państwa do wniosku, że istnieją setki miejsc, co do których można by zastosować określenie "bramy' i oczywiście niemożliwym jest przedyskutowanie ich wszystkich. Utworzyłem więc listę, jaka umożliwi przeanalizowanie kilku ważniejszych, byście mogli Państwo zidentyfikować ewentualnie istotne dla Was. Przy czym proszę pamiętać o możliwości znalezienia większej liczby informacji za sprawą użycia wyszukiwarki.
Problemy dotyczące klasyfikacjiDla dokonujących klasyfikacji istnieje powszechny problem związany z "portalami" oraz "bramami", tzn. czy zostały one utworzone przez komercyjne organizacje, jak np. Yahoo!, przez uniwersytety bądź inne niedochodowe jednostki. Uzmysławia to zarazem, że dana informacja może być rozpatrywana z różnych punktów widzenia. Na przykład strona z Sieci, dotycząca afrykańskiej gry o nazwie Mancala (lub Kalaha) może zostać zaklasyfikowana do "gier", "etnologii" lub też do dziedziny "afrykański folklor" albo do dwu bardziej zasadniczych. (W rzeczywistości zaś wspomniana strona znalazła się w miejscu poświęconym "etnograficznej matematyce"!) Jeśli klasyfikujemy książkę, jaka ma się znaleźć się na półce, wszystko, co możemy zrobić, to umieścić ją w określonym miejscu. Gdy natomiast tworzymy katalog stron internetowych, to przy określonej stronie w zasadzie musimy umieścić odsyłacz do możliwie wielu właściwych kategorii. A to oznacza, że największym zadaniem opracowującego katalog jest dbanie o to, by zestaw danych zawsze był aktualny, łącznie z połączeniami (linkami). Nawet jeśli sprawdzanie tego typu odbywa się za sprawą specjalnego narzędzia programowego (tzw. pająka), ludzka interwencja mimo wszystko jest niezbędna, by ewentualnie zmienić lub usunąć konkretny link. Kolejnym problemem jest fakt, że struktury klasyfikacji zmieniają się z biegiem czasu, podobnie jak relacje między tematami oraz terminologia. By przekonać się, do jakiego stopnia zmienia się ta ostatnia, możemy choćby przyjrzeć się bibliotecznej liście nagłówków tematycznych, np. opracowanej przez Bibliotekę Kongresu. Z powodu ogromu prac związanych z utrzymaniem całej listy oraz zależnościami pomiędzy terminami znajdziemy tam wiele przestarzałych rozwiązań. Jeśli więc tego rodzaju zestawienia nie są konsekwentnie rewidowane, szybko stają się nieaktualne. Struktury klasyfikacyjne mogą ulegać powolniejszym przeobrażeniom, lecz i one powinny być monitorowane. Ostatnia kwestia to taka, że sposób klasyfikacji w pewnym sensie jest wypadkową indywidualnych zadań oraz zainteresowań zajmujących się nią osób. Żaden ze schematów klasyfikacyjnych nie będzie odpowiadał każdemu z poszukujących informacji, ponieważ każdy posiada określony, nieco inny zasób wiedzy. W efekcie więc struktury klasyfikacyjne dostarczające wielu dróg w obszarze możliwych rozwiązań są najbardziej użyteczne.
Biblioteki cyfrowe czy wirtualneZapewne zauważyli Państwo, że niektóre "bramy" czy "portale" określane są jako biblioteki wirtualne lub cyfrowe. W pewnym sensie rzeczywiście są one bibliotekami Sieci. W ściślejszym jednak znaczeniu tak nie jest, ponieważ nie wszystkie spośród internetowych stron są pełnymi dokumentami, jak np. książki czy wszelkie sprawozdania. Najczęściej są one po prostu kolejnymi przewodnikami do źródeł informacji. Jednakże Afrykańska Biblioteka Cyfrowa (the African Digital Library On-Line) w pełnym słowa znaczeniu jest biblioteką cyfrową, gdyż zawiera (a przynajmniej taki ma cel) pełne teksty książek. Jak podaje się do publicznej wiadomości: "Mieszkańcy każdego z afrykańskich krajów mający dostęp do serwera z afrykańską domeną mają możliwość dostępu do biblioteki poprzez następujący adres: http://www.AfricaEducation.org/adl/ Jest to więc źródło, jakie służyć ma przezwyciężeniu problemów związanych z dostępem do książek na zdecydowanie ubogim afrykańskim kontynencie. Obecnie wspomniana biblioteka zawiera jedynie 3000 książek; jednakże za sprawą sponsorów można mieć nadzieje na jej szybkie poszerzenie. [Oto link do tego serwisu.] Mamy więc okazję przekonać się na większą skalę, co aktualnie jest możliwe w przypadku każdej organizacji pragnącej stworzyć dostęp do własnej dokumentacji, raportów, wszelkiego rodzaju podręczników, czy jakichkolwiek materiałów potrzebnych zatrudnionym w niej ludziom. Biblioteka cyfrowa obejmująca tego rodzaju dane jest dostępna poprzez stworzenie tzw. "intranetu' i przygotowanie niezbędnych "bram" tematycznych oraz wyszukiwarek dla umożliwienia dostępu do niej.
Dodatkowe źródła
Kurs przygotowany i przeprowadzony przez
Profesora Toma Wilsona
z Wydziału Studiów Informacyjnych Uniwersytetu w Shefffield w ramach projektu Tempus realizowanego we współpracy z
Międzynarodowym Centrum Zarządzania Informacją UMK w Toruniu oraz
Wydziałem Bibliotekoznawstwa i Studiów Informacyjnych University College w Dublinie.
|