llms.txt 完整設定教學:讓 AI 更了解你的網站
Founder, AEO Pro
關鍵要點 Key Takeaways
- 1.檔案必須放在根目錄 /llms.txt,純 Markdown、絕對路徑,開頭 blockquote 是 AI 最常直接引用的一段。
- 2.2026 正式延伸出 llms-full.txt:Anthropic、Mintlify、Vercel 皆已採用,建議同步上線。
- 3.內容按重要性排序(產品 → 文件 → Blog),控制 500-3000 字最佳。
- 4.寫完用三步驗證:直接瀏覽、問 ChatGPT 能否正確摘要、掃 AEO Pro 檢查偵測率。
llms.txt 是什麼?
llms.txt 是放置在網站根目錄的純文字(Markdown)檔案,用途是為大型語言模型提供一份結構化的「站內導覽」。它的靈感來自 robots.txt,但目的完全不同:robots.txt 告訴爬蟲「能不能進來」,llms.txt 則告訴 LLM「這個網站是什麼、重點在哪裡、該怎麼理解」。
2024 年末由 Jeremy Howard 提出後,llms.txt 迅速被各大 AI 模型提供者納入內部抓取流程。目前 Anthropic、Perplexity、OpenAI 的爬蟲都會優先讀取 llms.txt,再決定是否深入抓取其他頁面。
為什麼要寫 llms.txt?
三個理由:
1. **提高被引用的準確度**:當 AI 理解你的業務範圍,它更有可能在正確的情境引用你,而不是誤引用或忽略。
2. **壓縮抓取成本**:AI 模型的抓取預算有限。一份好的 llms.txt 讓它用 1 次請求就能理解你整站,剩下的預算可以用來抓取更有價值的頁面。
3. **控制品牌敘事**:你親自寫下「我們是誰、做什麼、有哪些產品」,比讓 AI 從 100 篇文章拼湊出結論更精準。
標準格式
# 網站名稱
> 一句話描述這個網站是做什麼的
詳細的品牌敘述段落,說明你的定位、目標客群、核心價值。
主要產品
重要文件
聯絡方式
五個最佳實踐
1. **開頭的一句話描述要夠好**:這是 AI 模型最常直接引用的一段。花時間打磨它,要包含「你做什麼 + 為誰做 + 差異化」。
2. **連結要用絕對路徑**:使用完整 https:// URL,不要相對路徑。
3. **控制在 2000 字元以內**:超過這個長度,LLM 的摘要品質會明顯下降。
4. **按重要性排序**:越前面的段落權重越高,把最重要的產品與文件放上面。
5. **雙語版本並存**:同時提供中文與英文版本,方便國際 AI 模型理解。
進階:llms-full.txt
llms-full.txt 是 llms.txt 的延伸版本,裡面可以放更完整的內容——例如最重要的文章全文、產品規格表、API 參考。大型專案通常兩份檔案並存:llms.txt 給輕量索引,llms-full.txt 給深度抓取。
常見錯誤
1. **內容過於簡短**:只寫一行「We are a startup」完全沒有幫助。
2. **忘記更新**:產品改版後 llms.txt 還停留在舊版本。
3. **只放連結沒有描述**:AI 需要語意資訊才能理解連結的用途。
4. **把 llms.txt 放在子目錄**:必須放在根目錄,否則 AI 模型找不到。
5. **使用 HTML 標籤**:llms.txt 是純 Markdown,不要混入 HTML。
驗證工具
寫完 llms.txt 後,用這三個方式驗證:
1. 直接瀏覽 https://你的域名/llms.txt 確認可訪問
2. 在 ChatGPT 問「請簡述 [你的域名] 是什麼網站」,觀察回答是否符合你的 llms.txt
3. 使用 AEO Pro 掃描,檢查 llms.txt 是否被偵測到、格式是否正確
好的 llms.txt 是 AEO 的基礎工作。花 30 分鐘寫好它,是你能做的投資報酬率最高的優化之一。
常見問題
llms.txt 會取代 sitemap.xml 嗎?
不會。兩者並存:sitemap 給傳統搜尋引擎、llms.txt 給 AI 模型。
需要在 robots.txt 中引用 llms.txt 嗎?
不需要,AI 模型會自動去 /llms.txt 找。
多語言網站怎麼處理?
推薦做法是 /llms.txt 放英文主版本,/zh/llms.txt 放中文版本。
llms.txt 有標準規範嗎?
目前以 llmstxt.org 上的提案為事實標準,尚未成為正式 W3C 規範。
傳鑑數位創辦人,自 2023 年起累積 12,000+ 次 AEO/SEO 審計實戰經驗,專注 CJK 市場的 AI 搜尋優化。