Styczeń 2012
P W Ś C P S N
« lut    
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
Znalezione w RSSach

Od ponad 5 lat, prowadzę katalog stron katalog.mistrzu.com. W tym czasie znalazło się w nim 40’000 wpisów. Każdego miesiąca przybywa blisko 500 nowych. Nie dziwne – od długiego czasu strona utrzymuje page rank 4. Niestety, tylko mniej niż połowa dodawanych stron faktycznie trafia do katalogu. Dla wszystkich ciekawych jak to działa zamieszczam ten tekst.

Zasada katalogu jest prosta: wymiana link za link. Od osób dodających stronę do jednej z kilkudziesięciu kategorii wymagam, by podała mi adres (pod)strony, na której umieściła link do mojego katalogu. To proste, choć nie wszyscy niestety to rozumieją lub akceptują.

Dlatego od samego początku wpisy są weryfikowane. Dopóki było to kilka-kilkanaście wpisów tygodniowo, mogłem wejść i poszukać linku zwrotnego. Później pomagali mi w tym Redaktorzy. Obecnie brudną robotę wykonuje skrypt weryfikujący.  Strona, na której link zwrotny nie zostanie odnaleziony jest automatycznie odrzucana. Dopiero pozostałe wpisy (30-40%) są przeglądane i, jeśli nie zobaczę innych błędów – dodawane do katalogu.

katalog.mistrzu.comPo pięciu latach wiem doskonale, jakie błędy popełniają webmasterzy.

Najczęściej po prostu nie pamiętają, że wcześniej dodali już stronę do katalogu. Dlatego po skończeniu weryfikacji wyszukiwane i usuwane są duble. Tylko… jak odróżnić dubel od aktualizacji wpisu? Ja robię to prosto: jeśli opis się nie różni – kasuję nowy a pozostawiam stary wpis. W innym przypadku pierwszeństwo ma wpis najnowszy jako ten najbardziej aktualny.

Zdarzają się oczywiście także „cwani” pozycjonerzy. Ich sztuczki są jednak banalne. Na przykład robią aliasy typu prv.pl i w ramkach umieszczają właściwą stronę. Albo dodają witrynę dwa razy – raz z www, raz bez www na początku adresu. Niektórzy myślą, że jeśli wskażą zupełnie inną stronę, która już ma link do katalogu, nie będą musieli go umieszczać u siebie. Jest jeszcze kilka ciekawych praktyk, ale poprzestanę na tych najprostszych, żeby zasygnalizować problem i jednocześnie nic nikomu nie podpowiadać :)

Oczywiście większość takich „sztuczek” lub błędów można bez problemu wyłapać i nie zatwierdzić usunąć stronę z katalogu.

Po 2 latach działalności katalogu zauważyłem jeszcze jeden problem: znikające linki zwrotne lub całe strony. W katalogu zostawały wpisy odnoszące do nie istniejących już stron. Trzeba było przeciwdziałać. W ten sposób, prawie równo 2 lata temu, rozpoczęło się Wielkie sprzątanie. Kilka razy dziennie skrypty analizują po kilka wpisów i sprawdzają, czy wszystko gra. Jeśli nie – wpis jest blokowany a do webmastera wysyłany jest e-mail. Po upływie tygodnia następuje ponowna weryfikacja i przywrócenie albo definitywne skasowanie informacji o stronie.

5 lat prowadzenia katalogu, 40 tysięcy wpisów to ogromny balast. Zdaję sobie sprawę, że nie da się znaleźć wszystkiego, sprawdzić i porównać każdego z każdym. Dlatego na pewno w bazie wciąż znajdują się niedziałające strony i wpisy niespełniające zasad. W tym pierwszym przypadku pomocni są Użytkownicy. Proste kliknięcie w odnośni „link nie działa” powoduje, że strona trafia do specjalnego rejestru i jest ponownie weryfikowana przez redaktora. Nie jest blokowana, ale jeśli problemy się potwierdzą – zostaje usunięta.

Czy jednak nie można zrobić czegoś więcej? Z pewnością można. Dlatego postanowiłem na początku 2010 roku przygotować Wielkie sprzątanie 2 – przegląd wszystkich dodanych do katalogu stron. Przez kilka miesięcy skrypty będą sprawdzać i analizować, szukać i porównywać by usunąć wszystko co nie działa lub oszukuje. Ile stron pozostanie? Trudno powiedzieć, ale szacuję, że te złe mogą stanowić nawet 1/4 ogółu. Jeśli w połowie 2010 roku w katalogu będzie 30’000 wpisów, a wszystkie wątpliwości zostaną wyjaśnione, uznam, że nie zmarnowałem czasu.

Co będzie sprawdzane? Zaczynając od podstaw: czy strona nadal działa. Czy jest na niej link zwrotny. Do tego, dla niektórych wpisów po raz pierwszy, sprawdzone zostanie czy link zwrotny jest w tej samej domenie co wpisana strona. Później poszukam dubli (także wśród linków zwrotnych), aliasów, ramek i innych podobieństw. Na koniec zajmę się pojedynczymi przypadkami oszustw, których tu nie opisałem.

Będzie też bonus dla webmasterów. Na pewno łatwiej będzie dodać stronę. Poza tym już na etapie jej dodawania będzie można sprawdzić, czy wszystko jest OK. Kto wie, może nawet zrobimy automatyczne akceptowanie wpisów, co do których nie ma żadnych wątpliwości?

Dodam też kilka opcji, o które byłem proszony. Przede wszystkim możliwość edycji i aktualizacji wpisu. Poza tym jeśli do strony będzie pasować więcej niż jedna kategoria, będzie można ją umieścić w kilku. Poprawki wymagają też kategorie. Niektóre warto będzie ze sobą powiązać, gdzieniegdzie są braki.

Pozostaje mieć nadzieję, że efekt tych zmian zadowoli wszystkich a jednocześnie strona nie straci swojego przaśnego wręcz charakteru. Stawiam bowiem na prostotę.

Słówko techniczne: witryna katalog.mistrzu.com oparta została na skrypcie CNCat, w ostatniej chyba bezpłatnej wersji 2.1. Oryginalny katalog rozbudowano i zmieniono wprowadzając m.in. linki bezpośredni, stronę „szczegóły” oraz skrypty weryfikujące i inne ułatwienia dla redaktorów. Obecnie CNCat jest głównie bazą do prezentacji i wyszukiwania wyników, cała zaś „logika” działania katalogu napisana została od nowa.

Share on Facebook

Leave a Reply