pułapiki spidera

Niemal każda strona spotkana w sieci może stanowić zaplecze. Jako świadome lub podświadome działanie stanowi istotne wsparcie działań przedsiębiorstwa lub osoby prywatnej w zakresie:

  • promocyjnym – poprzez akcentowanie swojej  obecności w sieci
  • wizerunkowym – budowanie świadomości marki, zaufania i przyciągania konsumenta
  • edukacyjnym – poprzez przekazywanie wiedzy istotnej dla odbiorcy
  • informacyjnym – powiadamianie o nowościach, wspieranie wiedzy i edukacji
  • sprzedażowym – dokonywanie monetyzacji pracy poświęconej na budowę zaplecza, podnosząc wskaźnik zwrotu z poniesionych inwestycji

Budowa takiego wsparcia ujęciu empirycznym przy uwzględnieniu powyższych działań jest wpisane w długotrwały proces tworzenia strony WWW i może stanowić o sukcesie przedsięwzięcia. Od działań marketingowców zależy rozmach i szerokość dotarcia do użytkownika poprzez intensyfikację niektórych czynności, unikanie błędów, czy też dokonywanie działań niedozwolonych. Bazowanie na tzw. „ sprawdzonych działaniach” w procesie budowy zaplecza linków zazwyczaj nie przynosi pożądanych efektów,  ze względu na zmienność środowiska, w którym można budować zaplecze jak i zmienność sposobów prezentacji. Jest to paradoks technologiczny nieunikniony w tak ucywilizowanym społeczeństwie, w ramach którego nieustannie należy śledzić trendy i elastycznie do nich dostosowywać, tworząc zaplecze w wielu miejscach i dziedzinach życia. Ze względu na występowanie i pochodzenie odnośników wyróżniamy 2 rodzaje zapleczy: wewnętrzne, zewnętrzne.

1.1.1     Wewnętrzne (wewnątrz witryny online)

Pierwszym z etapów budowania zaplecza linków jest przygotowanie strony docelowej, dla której budujemy zaplecze, pod kątem optymalizacji dla crawlerów. Dokonuje się tego poprzez adaptację wytycznych SEO odnośnie budowy kodu źródłowego.

1.1.1.1    Śródlinkowanie

Zoptymalizowany kod serwisu do prawidłowego przechodzenia między stronami powinien mieć usystematyzowany system wewnętrznego linkowania. Na każdej z podstron w treści strony powinny znaleźć się odnośniki odwołujące się do fraz kluczowych, istotnych dla tworzenia zaplecza zewnętrznego. Najczęściej popełnianym błędem jest linkowanie wewnętrzne do stron mało istotnych z punku widzenia SEM. Warto od początku budowy zaplecza określić najistotniejsze, strategiczne podstrony, które wymagają działań promocyjnych i te zoptymalizować pod indeksację. Wewnątrz stronnicowe odnośniki zazwyczaj zyskują na znaczeniu w analizie przez indexer wyszukiwarki, gdyż znajdują się na stronie tematycznie powiązanej z odnośnikiem, co w strategii budowy zaplecza jest istotnym czynnikiem, pozwalającym osiągnąć wyższe pozycje w rankingach SERP[1]. Linki odwołujące się do konkretnych podstron, na których najbardziej nam zależy mając usystematyzowane odnośniki dają pewność crawlerom, iż za każdym razem odnośnik kieruje do tej samej strony. Z góry należy założyć wygląd odnośnika bezpośredniego do strony, stosując go konsekwentnie w linkowaniu wewnętrznym i zewnętrznym. Zagrożeniem w tym momencie jest różnorodna konstrukcja linku – np.:

http://www.strona.pl/podstrona.php

http://strona.pl/podstrona.php

http://strona.pl/podstrona.php&id=999

http://www.strona.pl/podstrona

Choć intencje osoby używającej takich zapisów były inne, powyższy, różny sposób odwoływania się do danej strony jest informacją dla indexerów, że powinny podążać do 4 różnych stron. Przez to strona docelowa nie zyskuje de facto wsparcia ze strony zaplecza wewnętrznego.

1.1.1.2    Menu

Obecność na stronie menu tekstowego wspartego atrybutami title lub menu obrazkowego, zawierającego atrybuty alt ułatwia crawlerom dotarcie do powiązanych ze sobą podstron serwisu.

1.1.1.3    Mapa strony

W strategii budowy wewnętrznego zaplecza istotną rolę odgrywa obecność mapy strony. Prawidłowo wykonana powinna pokazywać wszystkie podstrony serwisu, które powinny być odnalezione przez crawlery, w sposób hierarchiczny i usystematyzowany. Tego rodzaju zestawienia stron ułatwiają zagubionym w strukturze użytkownikom lub crawlerom dzięki krótkiemu kontaktowi ze stroną – zorientowanie się (jeszcze przed opuszczeniem strony) gdzie znajduje się strona docelowa[2]. Ze względu na ich funkcjonalność wyróżnia się ich dwa rodzaje : mapy strony i mapy w formacie strony XML.

Pierwsze przestawiają na jednej z podstron zhierarchizowaną strukturę witryny w postaci listy, która uwzględnia jedynie te podstrony, do których właściciel serwisu świadomie wpuszcza crawlery wyszukiwarek.

Mapy strony w formacie XML są stworzone jako usystematyzowane źródło informacji dla crawlerów, a ich przydatność dla użytkowników jest znikoma. Te mapy, podobnie jak poprzednie zawierają hierarchię struktury serwisu z rozszerzeniem informacji o dacie stworzenia, modyfikacji danej podstrony, a także sugestię dla crawlerów jak często konkretne podstrony powinny być odwiedzane, aby strona nie zużywała niepotrzebnego transferu, a crawler w tym czasie mógł odwiedzić inne strony.

W tym przypadku należy zadbać, aby crawler, a w późniejszym czasie spider pobrał do indexera wszystkie strony docelowe, które powinny zostać zaindeksowane. Jednak często występujące błędy 404, niespójny sposób śródlinkowania stron, cloacking, strony-sieroty, silnik systemu prezentujący treści oparty na sesji Cookie.

pułapiki spidera

Pułapki, na jakie może natrafić Spider przechodząc między stronami Serwisu

1.1.1.4    Nawigacja okruszkowa

Nawigacja okruszkowa (breadcrumbs) – uważana za drugą po menu głównym, lub trzecią po mapie strony – alternatywą do nawigacji po stronie. Znajduje się zazwyczaj nad tekstem strony ułatwia odnalezienie się użytkownika w witrynie. Jej zaletą jest możliwość szybkiego dostępu do nadrzędnych  stron w razie zabłądzenia przez użytkownika lub crawler.[4] Obok mapy strony stanowią istotny element poznawczy dla crawlerów, gdyż ukazują hierarchię serwisu i współzależności podstron między sobą.

1.1.2     Zewnętrzne

Budowanie zaplecza zewnętrznego jest czymś więcej niż tylko wstawianiem odnośników do strony docelowej we wszelkiego rodzaju materiałach dostępnych w sieci i poza nią. To także filozofia prowadzenia firmy, tygiel działań PR, marketingowych, identyfikacji wizualnej, utożsamiania się z marką, a także SEM. To najbardziej dynamicznie rozwijający się obszar, w którym brak pełnego zaangażowania i konsekwencji w działaniu, przy jednoczesnym unikaniu błędów, może przynieść nie tylko obniżenie zainteresowania stroną docelową, lecz jej całkowite wykluczenie.

  • strony informacyjne;
  • blogipresell pages,
  • katalogi (m.in. najpopularniejszy QlWeb, mini)
  • fora dyskusyjne;
  • kopie katalogu dmoz, opisów gg, tekstów piosenek, wiki itp.
  • Offline/btl/atl
  • Intranet
  • Pozostałe dziedziny życia

[1] Jeffrey Smith, 12 Października 2007, http://www.seodesignsolutions.com/blog/link-building/link-building-internal-link-architecture-building-external-links/; 18.11.2009

[2] Jakob Nielsen – Site Map Usability – http://www.useit.com/alertbox/sitemaps.html; 29.11.2009

[3] http://searchengineoptimization.elliance.com/search-marketing-resources/seo-infographics.aspx?title=The-Power-of-Link-Baiting&Category=; 28.11.2009

[4] Jakob Nielsen – Breadcrumb Navigation Increasingly Useful http://www.useit.com/alertbox/breadcrumbs.html; 25.11.2009

W tej strategii zdobywania linków można wykorzystać serwisy typu Squidoo.com, Knol, czy Wikipedia, Ithink.pl, elans.pl, które pozwalają na wprowadzenie treści wraz z linkami zewnętrznymi. Co prawda linki z tych stron do naszej strony docelowej mogą być ograniczane poprzez automatyczne dodawanie w kodzie HTML znacznika rel=”nofollow”, czy też ukrywanie za JavaScriptem, jednak ruch pozyskany z tych serwisów na niektóre hasła może być znaczący.

W działaniach promocyjnych coraz większą rolę odgrywają serwisy społecznościowe, które mogą być doskonałym źródłem ruchu do strony docelowej lub do zaplecza. Istnieje wiele zautomatyzowanych serwisów, które pomagają uzupełnić nasze profile[1] (facebook, blip, twitter), lub dodać promowany link do serwisu digg, wykop.

Można równie dobrze stworzyć własne serwisy społecznościowe, które po zautomatyzowaniu będą również tworzyły dobre zaplecze. Taki serwis społecznościowy typu Twitter, Digg itp. łatwo i za darmo można postawić na silniku Drupala[2], dzięki czemu indeksacja tego typu serwisu przez wyszukiwarki jest znacznie ułatwiona, choć z drugiej strony narażona na wykluczenie jeśli w stworzony serwis będzie nadużywany.

Założenie konta w serwisach mikroblogowych (Flaker, Blip, Twitter itp.) i połączenie ich wszystkich jednym serwisem do aktualizacji statusu jest również rozsądnym rozwiązaniem. Są one doskonałym źródłem trendów i łatwo poddają się indeksacji. Nawet jeśli po jakimś czasie nie zwiększa się ilość użytkowników śledzących dany profil, to jednak wszystkie statusy zostaną zaindeksowane przez wyszukiwarki i istnieje duże prawdopodobieństwo, że znajdą się wysoko w SERP.

W serwisach społecznościowych łatwiej jest o nawiązanie kontaktu z właścicielami  serwisów, z którymi chcielibyśmy albo wymienić się linkami, albo też pozyskać od nich linki, dzięki niesformalizowanym kontaktom. Następuje tu bezpośredni kontakt dwóch stron i tego typu próba nawiązania współpracy jest dużo bardziej prawdopodobna w realizacji niźli wszelkie kontakty mailowe (jeśli kontakt bezpośredni jest niemożliwy). Blogosfera jest silnie skorelowana z mikroblogami i serwisami społecznościowymi, co daje możliwość na tworzenie zaplecza pośród osób aktywnych, lubiących nowe technologie poprzez e-celebrytów, których blogi są czytane przez tysiące użytkowników, a krótkie wpisy w mikroblogach potrafią często wywołać burzę[3]. Producenci sprzętu poszukują często takich wpływowych osób (Trendsetterów), podarowując im sprzęt bądź oprogramowanie, które przez określony czas te osoby będą opisywały. W zamian te osoby są opłacane, bądź testowanych przez nich sprzęt pozostaje ich własnością. Dzięki temu informacja dociera do aktywnych osób, które pod wpływem opinii Celebryty decydują się na zakup przetestowanego produktu.



[1] dodajdo.com, ping.fm, notify.me; 03.11.2009r

[2] Drupal.pl; 04.11.2009r

[3] Michael Y. Park – Meghan McCain’s Racy Twitter Pic Scandal – http://www.people.com/people/article/0,,20313058,00.html; 03.11.2009r