Disallow 跟 noindex 有什麼差別？

Disallow（robots.txt）是禁止爬取；noindex（meta robots 或 X-Robots-Tag）是禁止出現在搜尋結果。要讓 noindex 生效，搜尋引擎必須能抓到頁面或回應才能看到 noindex 指令。

Search Console 顯示『已抓取 - 目前未建立索引』怎麼辦？

先排除技術面：狀態碼、noindex、canonical、robots.txt、內容是否可見（不需登入、JS 不會延遲到看不到）。再看內容面：是否薄內容、重複、或不符合意圖。

不要。sitemap 應該只放你希望被索引的 canonical URL。noindex 頁放進 sitemap 會增加混亂與資源浪費。

你想拿全球第一名，第一步永遠是「先讓搜尋引擎能抓、能理解、能索引」。這篇提供一套開發者可直接落地的排查流程，並串接本站工具與詞彙表。

搜尋引擎索引的基礎是可取得的內容：重要頁面應該回 200。長期的 3xx 鏈式轉址、或 4xx/5xx 都會讓收錄與排名不穩。

http

HTTP/1.1 200 OK
Content-Type: text/html; charset=utf-8

常見的「突然整站不見」都跟 robots/noindex 有關。記住三件事：

html

<!-- HTML meta robots -->
<meta name="robots" content="noindex, follow" />

http

# HTTP header (useful for PDFs/non-HTML)
X-Robots-Tag: noindex, nofollow

同一內容有多個 URL（參數、排序、追蹤碼、語言路徑）時，搜尋引擎可能選錯 URL 來排名。用 canonical 與一致的內鏈把訊號集中到主版本。

html

<link rel="canonical" href="https://seo.lucas-futures.com/tools/indexability-checker" />

你可以用 CSR 做產品，但要拿第一名，重要內容頁最好能在第一時間就有完整 HTML（SSR/SSG/prerender）。否則爬蟲必須執行 JS，收錄延遲與不確定性會上升。

關於索引與收錄問題的排查重點。