Question 1

用 robots.txt Disallow 就不會被收錄嗎？

Accepted Answer

不一定。Disallow 只是禁止爬取，搜尋引擎仍可能透過外部連結知道 URL 並顯示（沒有內容摘要）。要禁止收錄請用 noindex。

Question 2

robots.txt 可以阻擋惡意爬蟲嗎？

Accepted Answer

不能。robots.txt 是「建議性」的，惡意爬蟲會忽略。真正的存取控制需要用認證、IP 封鎖或 WAF。

Question 3

Disallow 某個路徑但又想被索引怎麼辦？

Accepted Answer

這是矛盾的。如果 Disallow 了，爬蟲看不到內容就無法索引。移除 Disallow 或用 noindex 來控制是否顯示在搜尋結果。

Question 4

robots.txt 語法錯誤會怎樣？

Accepted Answer

可能造成整個檔案被忽略或規則誤判。使用 Google Search Console 的 robots.txt 測試工具驗證語法。

Question 5

可以用 robots.txt 保護敏感資料嗎？

Accepted Answer

絕對不行。robots.txt 是公開的，任何人都能看到。敏感資料應該用認證保護，不要只靠 robots.txt。

robots.txt

定義