robots.txt 是一個協議,而不是一個命令。 robots.txt 是搜索引擎中訪問網站的時候要查看的第一個文件。 robots.txt 文件告訴蜘蛛程序在服務器上什麼文件是可以被查看的。當一個搜索蜘蛛訪問一個站點時,它會首先檢查該站點根目錄下是否存在 robots.txt,如果存在,搜索機器人就會按照該文件中的內容來確定訪問的範圍; 如果該文件不存在,所有的搜索蜘蛛將能夠訪問網站上所有沒有被口令保護的頁面。百度官方建議,僅當您的網站包含不希望被搜索引擎收錄的內容時,才需要使用 robots.txt 文件。如果您希望搜索引擎收錄網站上所有內容,請勿建立 robots.txt 文件。
舉例:
如果將網站視為酒店裏的一個房間,robots.txt 就是主人在房間門口懸掛的 「請勿打擾」 或 「歡迎打掃」 的提示牌。這個文件告訴來訪的搜索引擎哪些房間可以進入和參觀,哪些房間因為存放貴重物品,或可能涉及住户及訪客的隱私而不對搜索引擎開放。但 robots.txt 不是命令,也不是防火牆,如同守門人無法阻止竊賊等惡意闖入者。
這裏不給時間大家看了,看完教程再仔細閲讀一下,很容易理解的,其實就是 SEO 中的環節,做 SEO 的人都知道,這個文件很常用,為了不讓百度蜘蛛抓取你的一些不重要的頁面,或是你想百度蜘蛛抓取你的什麼頁面,就靠這個文件來控制即可,所以就給了我們入侵者大大的方便,根據我的經驗
有的時候各種掃目錄,也找不到後台的時候,小心翼翼的訪問一下這個文件,蛋疼的你就發現這個文件裏面很多目錄,其中可愛的後台地址就赫赫的展現在上面,你訪問一下就獲得後台地址了!
下面來實戰一下,讓大家看看效果
看目錄,就知道是織夢程序 這個 ICO 也能看出。
User-agent: *
Disallow: /plus/ad_js.php
Disallow: /plus/advancedsearch.php
Disallow: /plus/car.php
Disallow: /plus/carbuyaction.php
Disallow: /plus/shops_buyaction.php
Disallow: /plus/erraddsave.php
Disallow: /plus/posttocar.php
Disallow: /plus/disdls.php
Disallow: /plus/feedback_js.php
Disallow: /plus/mytag_js.php
Disallow: /plus/rss.php
Disallow: /plus/search.php
Disallow: /plus/recommend.php
Disallow: /plus/stow.php
Disallow: /plus/count.php
Disallow: /include
Disallow: /templets
這個沒有後台地址,至少我沒看出可疑的文件,原來是默認後台地址 dede/
Disallow: /wp-admin/
Disallow: /wp-login.php
Disallow:不允許蜘蛛抓取的意思 一看就知道這是後台地址,試試,對吧
#
# robots.txt for Discuz! X3
#
User-agent: *
Disallow: /api/
Disallow: /data/
Disallow: /source/
Disallow: /install/
Disallow: /template/
Disallow: /config/
Disallow: /uc_client/
Disallow: /uc_server/
Disallow: /static/
Disallow: /admin.php
Disallow: /search.php
Disallow: /member.php
Disallow: /api.php
Disallow: /misc.php
Disallow: /connect.php
Disallow: /forum.php?mod=redirect*
Disallow: /forum.php?mod=post*
Disallow: /home.php?mod=spacecp*
Disallow: /userapp.php?mod=app&*
Disallow: /*?mod=misc*
Disallow: /*?mod=attachment*
通過這裏,可以看出這個是 Discuz! X3 程序 x3 版本的,是一個論壇
1. 可以獲取後台地址 效率不錯
2. 可以獲得網站程序名稱
入侵的時候,別忘了這個文件即可! 教程結束