Web Analytics Made Easy - Statcounter

Tema düzenleyici

Robots.txt Nedir? Doğru Kullanımı Nasıl Olmalı?

Yönetici
Garfield

Garfield

WFN Admin
Katılım
9 Nis 2024
Mesajlar
3,195
Çözüm
36
Tepki Skoru
2,046
Ticaret Puanı
1
Üyelik
2 Yıl 1 Ay 3 Gün
Konum
Kocaeli
Web Sitesi
Var
Alanı
Forum Danışmanı
1/3
Konu sahibi
Robots.txt Nedir? Doğru Kullanımı Nasıl Olmalı? WFN AI
 
Robots.txt Nedir? Doğru Kullanımı Nasıl Olmalı?

Kısaca robots.txt nedir?
Robots.txt, sitenin kök dizininde (ör: siteadi.com/robots.txt) bulunan, arama motoru botlarına hangi dizin ve sayfaları tarayabileceklerini, hangilerini tarayamayacaklarını söyleyen basit bir metin dosyasıdır.

Temel amaçları:
  • Gereksiz sayfaların (admin, sepet, filtre url’leri vb.) taranmasını engellemek
  • Sunucu yükünü azaltmak
  • Bazı alanları botlardan gizlemek (tam gizlilik için yeterli değildir, sadece “rica” niteliğindedir)
  • Site haritasını (sitemap) botlara bildirmek

Robots.txt ile neler yapılabilir / neler yapılamaz?

Yapabileceklerin:
  • Belirli dizin veya URL’leri taramayı engellemek: Disallow
  • Belirli dizin veya URL’lere taramayı izin vermek: Allow
  • Sadece belirli botlara (ör: Googlebot, Bingbot) özel kurallar yazmak: User-agent
  • Site haritası yolunu bildirmek: Sitemap

Yapamayacakların (yanlış bilinenler):
  • Robots.txt ile indekslemeyi garanti şekilde engelleyemezsin; sadece taramayı kısıtlayabilirsin.
  • Robots.txt, sayfanın tamamen gizli kalmasını sağlamaz. URL bir yerde linkliyse yine görünebilir.
  • Güvenlik için (şifreli alanlar, gizli klasörler) robots.txt kullanmak yanlıştır.

Temel robots.txt söz dizimi (syntax)

En çok kullanılan komutlar:

  • User-agent: Kuralın hangi bota ait olduğunu belirtir.
  • Disallow: Bu yolu tarama.
  • Allow: Bu yolu tara (özellikle genel bir Disallow’u esnetmek için).
  • Sitemap: Site haritası adresini belirtir.

Basit bir örnek:

Kod:
 Kodları sadece üyelerimiz görebilir.

Anlamı:
  • Tüm botlar (*) için geçerli.
  • /wp-admin/ dizinini tarama.
  • Ama admin-ajax.php dosyasına izin ver.
  • Site haritam bu adreste.

Doğru robots.txt kullanımı nasıl olmalı?

1. Dosya mutlaka kök dizinde olmalı
Doğru: https://www.siteadi.com/robots.txt
Yanlış: https://www.siteadi.com/dosya/robots.txt (botlar bunu dikkate almaz)

2. Gereksiz yere agresif Disallow kullanma
Yanlış örnek (çok riskli):

Kod:
 Kodları sadece üyelerimiz görebilir.

Bu, sitenin tamamını taramayı kapatır. Canlı sitede kesinlikle kullanılmamalı.

3. Tarama kısıtlaması ile indeks kontrolünü karıştırma
Bir sayfanın arama sonuçlarında görünmesini engellemek için asıl tercih edilmesi gereken yöntem:
  • Sayfanın kendisine noindex meta etiketi eklemek

Örnek meta:
HTML:
 Kodları sadece üyelerimiz görebilir.

Eğer bir URL’yi robots.txt ile Disallow edersen:
  • Google o sayfayı taramayabilir
  • Ama başka sitelerden link alıyorsa veya daha önce keşfetmişse, URL yine sonuçlarda görünebilir (içerik olmadan)

4. Örnek: Standart bir WordPress robots.txt

Kod:
 Kodları sadece üyelerimiz görebilir.

5. Örnek: Basit bir kurumsal site robots.txt

Kod:
 Kodları sadece üyelerimiz görebilir.

6. Belirli botlar için özel kural yazma

Kod:
 Kodları sadece üyelerimiz görebilir.

Burada:
  • Googlebot için özel ek bir kural var.
  • Tüm diğer botlar için genel kural geçerli.

Robots.txt yazarken dikkat edilmesi gereken kritik noktalar

  • Canlı sitede değişiklik yapmadan önce mutlaka yedek robots.txt içeriğini sakla.
  • Geliştirme ortamında (test/stage) sitenin indekslenmesini istemiyorsan:

Kod:
 Kodları sadece üyelerimiz görebilir.

(bu sadece test ortamında kalmalı, canlıya taşınmamalı)

  • Google Search Console içindeki URL Denetleme ve eski “robots.txt tester” araçları ile kurallarını kontrol et.
  • Sitemap satırını mutlaka ekle; büyük sitelerde tarama verimliliğini artırır.
  • Dosya kodlaması UTF-8 (BOM’suz) düz metin olmalı.
  • Satır sonlarında fazladan karakter, Türkçe özel karakter kaynaklı bozulma olmamasına dikkat et.

En sade, çoğu site için yeterli bir örnek

Kod:
 Kodları sadece üyelerimiz görebilir.

Sonuç
Robots.txt, SEO ve tarama yönetimi için temel ama hassas bir dosya. Amacın:
  • Önemli sayfaların taranmasına izin vermek
  • Gereksiz / tekrar eden veya teknik sayfaların taranmasını azaltmak
  • Ama yanlış bir Disallow ile sitenin önemli bölümlerini kazara kapatmamak
 

Sende şimdi bize katılmak ister misin?

Kayıt ol

Bize katılım kolay ve ücretsizdir!

Giriş Yap

Zaten bir hesabınız var mı? Buradan giriş yapın.

← Önceki Konu

Canonical URL Nedir? Ne İşe Yarar?

Sonraki Konu →

Sitemap Nedir? Nasıl Oluşturulur ve Eklenir?

Foruma git ?

Bu konuyu görüntüleyen kullanıcılar

Haftanın Trendleri

Ayın Trendleri

İpuçları
Geri
Üst