Být na Seznamu znamená být

Nové fulltextové vyhledávání vyvolává nadšení, konstruktivní připomínky nebo odpor.

Právě se snažím z acess.logu vygrepovat jaké má jeden nejmenovaný web přístupy z nového fulltextu Seznamu. Výsledek mě hodně překvapil a rychlou kontrolou jsem zjistil, že podobná změna se udála i na tomto webu, viz níže. Omlouvám se, ale kódování výrazů neřeším.

Přístupy na tento web z search.seznam­.cz

140 [16/Mar/2005]
123 [17/Mar/2005]
 39 [15/Mar/2005]

Podělíte se v komentářích jak je to u vás?

Možná vám pomůže tento příkaz, kterým jsem údaje z logu získal:

cat access.log | grep 'search.seznam.cz' | cut -d " " -f 4 | cut -d ":" -f 1 | sort | uniq -ci | sort -nr

Přístupy na tento web z www.google.

94 [17/Mar/2005]
78 [16/Mar/2005]
57 [15/Mar/2005]

A opět příkaz:

cat access.log | grep 'www.google.' | cut -d " " -f 4 | cut -d ":" -f 1 | sort | uniq -ci | sort -nr

Přístupy – Shrnutí

Nárůst přístupů ze Seznamu, pro který jsem neudělal naprosto nic, mě hodně překvapil. Vysvětluji si to nasazením nového fulltextu a hlavně tím, že fulltext je nyní nasazen implicitně. I když samozřejmě míchá výsledky s katalogem, ale je to daleko příjemější a hlavně relevantnější než dříve.

Hledané výrazy na search.seznam.cz

66 letn%ed %e8as
35 turistick%e9 mapy
25 google.cz
24 p%f8evod mp3
23 mp3 do wav
20 www.google.cz
17 wav
12 pl%e1nov%e1n%ed trasy
12 netscape
11 konzumn%ed spole%e8nost
11 dom%e1c%ed pek%e1rna
10 p%f8evod mp3 na wav

Příkaz…

cat access.log | grep 'search.seznam.cz' |  cut -d " " -f 11 | tr '?&' 'n' | grep "w=" |cut -d "=" -f 2 |tr '[:upper:]' '[:lower:]' | sort | uniq -ci | sort -nr | tr "+" " "

Hledané výrazy na www.google.

58 rss kan%c3%a1ly
46 google.cz
22 turistick%c3%a9 mapy
19 mp3 p%c5%99ehr%c3%a1va%c4%8d
19 google cz
15 parazit
12 php fotogalerie
12 dom%c3%a1c%c3%ad pek%c3%a1rny
12 domaci pekarny
11 p%c5%99ipojen%c3%ad na internet
11 knedl%c3%adky
11 batoh notebook
10 prohl%c3%ad%c5%bee%c4%8d opera

Příkaz…

cat access.log | grep 'www.google.' |  cut -d " " -f 11 | tr '?&' 'n' | grep "q=" |cut -d "=" -f 2 |tr '[:upper:]' '[:lower:]' | sort | uniq -ci | sort -nr | tr "+" " "

Srovnání hledaných frází na Google a na Seznamu se budu ještě věnovat, stejně jako přístupům výše.

| | Články | Trvalý odkaz | Komentáře (8) | Štítky: , ,


Komentáře:

[1] Yuhů | 18.3. 2005, 16:26 | dusan@pc-slany.cz

Co dělá uniq -ci?
uniq -c znám.


[2] Jirka Ch | 18.3. 2005, 16:49 | jiri@chomat.net

Dušane I je: -i, –ignore-case (gnore differences in case when comparing).


[3] JersyWoo | 18.3. 2005, 22:27

U mě na doméně (globální statistiky domény) seznam si spíše pohoršil o polovinu méně návštěvníků.


[4] Milan Kryl | 19.3. 2005, 0:28 | milan@kryl.info

Chtěl bych jen poopravit příkaz pro Google, v cut má být za -f také 4 jako v případě seznamu.

Oba příkazy mi ještě nefungovaly úplně správně, protože berou v úvahu i přístupy robota. Upravil jsem následně:

cat access.log | grep ‚„http://search.seznam.cz‘ | cut -d " " -f 4 | cut -d ":“ -f 1 | sort | uniq -ci | sort -nr

cat access.log | grep ‚„http://www.google‘ | cut -d " " -f 4 | cut -d ":“ -f 1 | sort | uniq -ci | sort -nr


[5] Jirka Ch | 19.3. 2005, 0:45 | jiri@chomat.net

[4] Díky měl jsem tam překlep :-) Jinak to samozřejmě funguje.


[6] Vilém Málek | 19.3. 2005, 20:06

Psal jsem to už do konference SEO, jako reakci na příspěvek toho, jehož jméno budiž zamlčeno – na Interval.cz se nový fulltext Seznamu nijak neprojevil, ani v dobrém, ani ve špatném. Pořád je to 5:1 ve prospěch Google ;-)


[7] Kimberly | 1.4. 2006, 8:14 | rachel@yahoo.com

Great work!
[url=http://u­aczhmni.com/tcgn/br­wp.html]My homepage[/url] | [url=http://pzv­ccemn.com/kok­v/fuos.html]Co­ol site[/url]


[8] Jared | 1.4. 2006, 8:14 | ethan@fromru.net

Nice site!
My homepage | Please visit


Vložit komentář:

Přidávání komentářů bylo zastaveno, ale můžete mi napsat třeba email.
Děkuji za pochopení.
~Jirka Chomát~