SON DAKİKA >>>

 WEB SİTESİ İÇİN BİLGİLER

 Sitenin Pagerank'ını  Öğren

 Pagerank Göstergesi Ekleyin

 Google adres ekle

 Google aranan kelimeler

 Meta Tag Analizi  

 Robot.Txt Nedir?

 Google PageRank Checker

 Sitenizin Trafiğini Arttırın

 Meta tag Yapımı   

 Arama Motorlarında Üst Sıra

 Page Rank Nedir?
 Site Hazırlarken Dikkat
 KOMİKLER
 Komik Videolar
 Komik Fıkralar
 Komik Resimler
 Mike ve Peluş
 FAYDALI LİNKLER

 T.C. Kimlik No Sorgulama

Telefon Rehberi

 Sürücü Ceza Puanı Bulma

A.Ö.F. Sınav Sonuçları

 Memur Sınav Sonuçları

 İmei No Sorgulama

 DOST SİTELER
 baris_ates.sitemynet.com
 saripapatyama
 otoaltun.sitemynet.com
 meridyenn.sitemynet.com
 kocaksitesi.atspace.com

 yyatak.sitemynet.com

  On Line:  
  web host  

WEB SİTENE HAZIR HTML KODLAR HAZIRKOD HTMLKOD EKLE SON DAKİKA HABER WEB SİTE EKLE Tv İzle Aşk Testi AÖF Sınav Sonuçları
 

ROBOT TXT NEDİR? NASIL KULLANILIR

Arama motorları, belki de sitenizin ziyaretçilerinin büyük bir bölümü onlar sayesinde sizi buluyorlar ve takip etmeye başlıyorlar. Bazen arama motorlarına sitenizi siz kaydetmek için başvuruyorsunuz, bazen de arama motorları Robot veya Bot denilen uygulamalarla sizin sitenizi buluyorlar. Bu bulma işleminde ise sitenizde bulunan her linki özenle tarayıp kendi veritabanlarına kaydediyorlar. Bu sayede arama sonuçlarında sitenizde ne var ne yok ziyaretçileriniz öğrenebiliyor, bulabiliyor.

Ancak bazı durumlarda sitenizi indeksleyen bu robotlara hükmetmek isteyebilirsiniz:
 

  • Parola koruması olmayan fakat çoğu kişinin de görmesini istemeyeceğiniz bir sayfanız olabilir,
    Bazı sayfalarınızdaki programların ve içerik sayılamayacak bilgilerin (cgi-bin dizini gibi) taranmasını istemeyebilirsiniz,
     

  • Ya da sadece fazla bandwidth kaybetmek istemeyip taramanın yapılmamasını isteyebilirsiniz.

    Bu gibi durumlarda robotlara hükmetmek için elinizde bir fırsat bulunuyor: robots.txt dosyası. Bu dosya sitenizin ana dizininde bulunur ve arama motorlarının gönderdikleri robotlara bazı komutlar verir. Örneğin bu dosyadaki bir satır ile www.siteniz.com/gizli adresinin arama motorlarında çıkmamasını sağlayabilirsiniz. Sitenize ftp ile bağlandığınızda eğer robots.txt adında bir dosya yoksa bunu siz de oluşturabilirsiniz. Eğer böyle bir dosya yoksa her robot tüm site içeriğini indeksleyecektir.

    Basit olarak robots.txt dosyasının içinde şu iki satır bulunur:
    User-agent: *
    Disallow: /

    Burada User-agent: satırı ve sonrasında gelen * işareti "Tüm robotlara alttaki komutu uygula" anlamına gelmektedir. Disallow: ise Türkçe karşılığıyla "İzin verme" demek olup, akabinde gelen / işaretiyle "tüm site içeriğini indeksleme" komutuna karşılık gelir.
    Örnek olarak Google arama motorundan gelecek robotun, bizim sitemizdeki /gizli_bilgiler klasöründeki hiçbir içeriği taramamasını istiyoruz. Bunun için kullanmamız gereken komut satırı:
    User-agent: Googlebot
    Disallow: /gizli_bilgiler/

    olacaktır. /gizli_bilgiler/ yazmamızdaki neden ise baştaki / işareti kök dizini, sondaki / işaret ise "gizli_bilgiler"in bir dizin olduğunu vurgulamak içindir. Eğer siz sadece bir dosyayı indeksletmemek isterseniz, Disallow: /gizli_dosya.html satırını da kullanabilirsiniz.
    robots.txt dosyası hakkında daha fazla bilgiyi robotstxt.org adresinden alabilirsiniz. Burada ise şuan için bilinen tüm robotların isimlerine ulaşabilir, az önceki örnekte yaptığımız gibi sadece bazı robotların bazı sayfalara ulaşamamasını sağlayabilirsiniz. Özellikle şu sayfadaki mail robotlarının isimlerini toplayarak onların sizin sitenize gelip, yazılı email adreslerini toplamalarını engellemiş ve spam'i bi nebze de olsa azaltmış olursunuz

  • ROBOT.TXT NEDİR Robot txt NASIL KULLANILIR ROBOTTXT NE İŞE YARAR Robot txt örneği robots

     

     

    mavigezegenn.sitemynet.com  copyright 2007 ©