Banyak pemilik laman web berhadapan dengan masalah melarang pengindeksan sumber dan penyingkirannya dari mesin pencari. Ini biasanya berlaku kerana laman web ini menjadi ketinggalan zaman dan tidak relevan, penerbit atau pelawat kehilangan minat terhadap laman web ini, atau laman web tersebut mengandungi maklumat peribadi dan bahkan sulit.
Arahan
Langkah 1
Terdapat banyak cara untuk membuang laman web dari enjin carian.
Cara pertama dan termudah untuk menghapus hasil pertanyaan dari mesin pencari adalah dengan menghapus halaman dari laman web itu sendiri atau menghapus sepenuhnya laman CMS melalui sambungan FTP. Dalam beberapa hari, mesin pencari akan mengemas kini pangkalan data dan membuang pautan ke sumber anda dari hasil carian.
Langkah 2
Cara yang paling popular di kalangan webmaster untuk melindungi laman web, bahagian atau halamannya dari pengindeksan, dan dengan itu membuang pautan dari hasil carian, adalah dengan menyunting fail robots.txt.
Anda boleh menutup halaman yang terpisah dari pengindeksan menggunakan kod:
Ejen Pengguna: *
Tidak dibenarkan: /page.html (menutup halaman halaman.html)
Terdapat banyak arahan pengarang mengenai cara menggunakan kod untuk fail robots.txt di Internet.
Langkah 3
Cara ketiga untuk membuang halaman laman dari enjin carian adalah dengan menggunakan tag meta robot di halamannya. Teg ditulis dalam kod HTML halaman tersembunyi di antara tag.
Oleh itu, setelah mengindeks semula laman PS, halaman dengan tag meta ini akan hilang dari carian. Kelemahan kaedah ini ialah banyak laman web moden menggunakan templat tpl, yang bermaksud bahawa anda perlu menukar kod secara manual dalam ratusan, mungkin beribu-ribu halaman.
Langkah 4
Cara keempat untuk membuang laman web dari enjin carian adalah dengan menggunakan tajuk X-Robots-Tag. Inti dari tajuk ini serupa dengan penggunaan tag meta sebelumnya, namun entri mesti berada di tajuk
X-Robots-Tag: noindex, nofollow
Langkah 5
Cara paling berkesan untuk membuang laman web (sepenuhnya) dari enjin carian adalah dengan membuangnya dari panel webmaster. Selepas kemas kini (3-7 hari), laman web ini tidak dapat diakses oleh enjin carian. Panel webmaster tersedia untuk enjin carian Yandex (https://webmaster.yandex.ru/delurl.xml) dan Google (https://webmaster.yandex.ru/delurl.xml).