← Back to writing
Writing · ai search

llms.txt cho Ecommerce: Đưa Gì Vào, Bỏ Gì Ra (Spec 2026)

By Leo Nguyen · Jun 17, 2026 · 8 min read
llms.txt cho Ecommerce: Đưa Gì Vào, Bỏ Gì Ra (Spec 2026)

Câu trả lời ngắn

llms.txt là file text dạng curated index đặt ở root domain, nói cho large language models biết trang nào đáng đọc nhất trên store của bạn. Không thay thế robots.txt hay sitemap.xml — stack chồng lên. Với ecommerce 2026, phiên bản leverage cao nhất là file ngắn (dưới 200 dòng), nhóm thành pillar guides, top collections, FAQ hubs, comparison content. Bỏ product riêng lẻ, promo hết hạn, mọi thứ sau login. Adoption từ AI engines chưa được xác nhận, nhưng cost ship thấp và file đã được Anthropic, Stripe, Cloudflare, Mintlify publish — chính các công ty có docs đang chiếm AI citations. Treat như một hedge, không phải silver bullet.

Diagnosis nhanh

  • Mở https://yourstore.com/llms.txt trên browser. Nếu 404, store bạn chưa có.
  • Mở của competitor: https://stripe.com/llms.txt hoặc https://docs.anthropic.com/llms.txt xem file working thực tế trông sao.
  • Đếm số pillar pages — long-form guides trên 1.500 từ, topic bền. Đó là input cho llms.txt. Nếu có dưới 5, fix content trước; file là downstream của content.

3 check. Dưới 5 phút.

Tại sao llms.txt nóng năm 2026

Spec do Jeremy Howard (fast.ai, Answer.AI) đề xuất tháng 9/2024 và publish công khai tại llmstxt.org. Pitch mang tính cấu trúc: large language models bị giới hạn token, prefer đọc curated index hơn crawl cả site. Một site đưa cho model bảng mục lục 100 dòng dạng markdown sẽ tiết kiệm crawl budget và bias model về phía các trang bạn thật sự muốn được quote.

Adoption chạy nhanh nhất ở công ty mà khách hàng là developer. Anthropic, Stripe, Cloudflare, Vercel, Mintlify, Astro đều publish llms.txt. Pattern các file này nhất quán: H1 brand name, một câu positioning blockquote, đoạn ngắn context, rồi H2 sections gom URLs quan trọng nhất theo mục đích.

Adoption phía ecommerce chậm hơn. Tính đến giữa 2026, phần lớn Shopify, Magento, BigCommerce store chưa publish file này. Một phần do deployment friction trên hosted platforms; một phần do uncertainty engine có đọc không. Cả hai objection đều yếu hơn vẻ ngoài. Deployment giải được trong dưới một buổi chiều trên mọi stack. Và cost publish file mà engine không đọc gần như bằng 0 — 5 KB markdown file ở URL cố định.

Framing thật: ship đi vì downside là không có gì và upside, nếu AI engines bắt đầu dùng llms.txt làm ranking signal, là lớn. Công ty publish trước sẽ có head start compound theo thời gian.

Spec thực tế trông sao

Spec llmstxt.org ngắn. File là markdown. Cấu trúc:

# Brand Name

> Một hoặc hai câu positioning dùng đúng từ ngữ khách hàng search.
> Giữ factual, không promotional.

Đoạn ngắn (dưới 200 từ) mô tả brand bán gì, phục vụ ai, context AI engine
cần để trả lời chính xác về bạn.

## Pillar guides

- [Tiêu đề guide](https://yourstore.com/guides/slug): Mô tả 1 dòng guide cover
  gì và cho ai.
- [Guide khác](https://yourstore.com/guides/other-slug): Cùng pattern.

## Top product collections

- [Tên collection](https://yourstore.com/collections/slug): Trong collection có
  gì, tồn tại vì sao, ai mua.

## Comparison và decision content

- [Trang comparison](https://yourstore.com/blog/comparison-slug): So sánh 2+
  option nào, framework dùng để compare.

## Optional

- [Secondary URL](https://yourstore.com/secondary): URLs chỉ surface khi
  được hỏi cụ thể.

Đó là toàn bộ spec. Phần còn lại là judgment về cái gì thuộc section nào.

Đưa gì vào llms.txt cho ecommerce

Nguyên tắc giống như cái governing FAQPage schema hay featured-snippet optimization: chỉ đưa trang nội dung bền, factual, self-contained đủ để AI lift vào câu trả lời mà không misrepresent offering.

5 category trang qua bar này cho ecommerce store:

Pillar guides. Long-form content trên 1.500 từ về topic bền. Buying guides, sizing guides, ingredient explainers, material comparisons, fit guides. Đây là trang AI engines đã prefer cite vì trả lời được loại câu hỏi underspecified user thật sự hỏi.

Top product collections. Không phải product riêng lẻ — collections. Trang collection mô tả một category (men's running shoes, organic cotton bedsheets, single-origin coffee) và cho AI engine đủ context để recommend đúng cái. Product page riêng lẻ quá nhiều để thuộc llms.txt; sitemap xử lý chúng.

FAQ hubs. Trang riêng aggregate câu hỏi khách hỏi nhiều nhất, với câu trả lời viết thành block self-contained 134-167 từ (sweet spot citation per nghiên cứu Frase GEO 2026). FAQPage schema trên các trang này stack với llms.txt — schema nói parser có gì, llms.txt nói model đáng đọc.

Comparison content. Trang so sánh 2+ option — brand bạn vs alternative, hai product line của bạn, category bạn vs category liền kề. AI engines cite comparison page aggressive vì user thường hỏi "khác nhau giữa X và Y là gì."

Bảng pricing hoặc sizing, nếu ổn định. Nếu pricing structure bền (tiered plans, fixed shipping, standard size charts), đưa bảng vào. Nếu pricing thay đổi tuần/mùa, bỏ ra.

KHÔNG đưa gì vào llms.txt cho ecommerce

Trang churn cao hoặc thông tin loãng sẽ tổn thương bạn nếu surface trong AI answers.

Product riêng lẻ. Một Shopify store điển hình có hàng trăm đến hàng ngàn. Đưa vào biến llms.txt từ curated index thành noisy mirror của sitemap. Model sẽ sample ngẫu nhiên và quote sai sản phẩm. Để sitemap.xml handle product URL discovery; collection page cung cấp framing context.

Trang promo, discount, seasonal hết hạn. Mọi thứ có deadline không nên nằm trong file AI engine có thể cache trong tuần.

Cart, checkout, account, admin URLs. Hiển nhiên, nhưng đáng nói: model sẽ thử follow và không thấy gì có ích.

Blog post internal viết để chase SEO traffic không depth. Listicle 500 từ mỏng publish để chase keyword là input llms.txt tệ nhất. Nếu bạn không tự hào khi thấy post mình bị quote trong ChatGPT answer, bỏ ra.

Trang sau login. Locker rooms, wholesale catalogs, B2B portals. Model không reach được và sẽ produce broken citation nếu cố.

Press release trên 12 tháng tuổi. Recency quan trọng với AI answers; press cũ = noise.

Stack với robots.txt, sitemap.xml, schema thế nào

4 file có nhiệm vụ riêng.

robots.txt set rules access: crawler nào được phép trên path nào.

sitemap.xml là inventory đầy đủ: mọi URL trên site, với lastmod timestamp, intend cho general-purpose crawler và search engine.

llms.txt là curated subset: trang bạn muốn language model đọc nhất, gom theo mục đích, với mô tả human-readable.

Schema per-page (Article, FAQPage, Product, Organization, BreadcrumbList) là structured payload: block machine-readable parser có thể lift vào câu trả lời.

Store publish cả 4 cho mọi loại crawler đúng cái nó cần. Store chỉ publish sitemap.xml để AI engines tự đoán trang nào quan trọng.

Deploy trên Shopify, Magento, headless

Friction khác nhau theo platform.

Shopify. Shopify admin không cho upload file lên root domain. Workarounds: (1) dùng third-party SEO hoặc "page doctor" app expose static-file route; (2) đặt Cloudflare trước storefront và thêm Worker serve /llms.txt; (3) nếu trên headless setup với Hydrogen hoặc Next.js custom layer, thêm static route /llms.txt và serve plain text. Option 2 portable nhất cho hosted Shopify store không muốn thêm app.

Magento Open Source / Adobe Commerce. Drop file vào directory pub/ và confirm webserver rule (nginx hoặc Apache) serve text/plain. Magento cho root access, friction thấp nhất.

BigCommerce. Tương tự Shopify — file root-level cần app hoặc CDN layer phía trước.

Headless (Next.js, Remix, Astro, Nuxt). Thêm static route. Next.js App Router: tạo app/llms.txt/route.ts return file content với header đúng. Astro: drop vào public/llms.txt. Remix: dùng resource route. Stack friction thấp nhất và là một lý do headless ecommerce ship llms.txt nhiều hơn hosted Shopify.

Ví dụ llms.txt tối thiểu cho Shopify

Cho một brand apparel Shopify Plus mid-market giả định, file working có thể trông sao:

# Acme Apparel

> Direct-to-consumer organic cotton apparel cho adult và kids,
> ship từ US từ 2018.

Acme Apparel bán tee, hoodie, basics organic cotton GOTS-certified cho
adult và children. Ship từ một warehouse US, source fabric từ hai mill
ở Bồ Đào Nha và Thổ Nhĩ Kỳ, publish report supply chain transparent
hàng năm. Wholesale program phục vụ boutique tại Bắc Mỹ và châu Âu.

## Pillar guides

- [Organic cotton vs conventional cotton](https://acmeapparel.com/guides/organic-vs-conventional): GOTS certification yêu cầu gì và đọc nhãn ra sao.
- [How to size adult tees](https://acmeapparel.com/guides/tee-sizing): Fit guide dựa measurement với size chart in được.

## Top product collections

- [Adult basics](https://acmeapparel.com/collections/adult-basics): Tee, hoodie, sweatpant cho người lớn.
- [Kids essentials](https://acmeapparel.com/collections/kids-essentials): Cùng fabric, kid-cut pattern, size 2T-14.

## Comparison và decision content

- [Acme vs Pact vs Tentree](https://acmeapparel.com/blog/acme-vs-pact-vs-tentree): 3 brand organic cotton so sánh certification, sourcing, price.

## FAQ

- [Sustainability FAQ](https://acmeapparel.com/sustainability-faq): Câu hỏi sourcing, certification, shipping, packaging.

## Optional

- [Wholesale program](https://acmeapparel.com/wholesale): Application và terms cho boutique buyer.
- [Annual supply chain report 2025](https://acmeapparel.com/reports/2025): PDF disclosure mills, factories, audit summary.

Tổng: rất dưới 100 dòng, quét nhanh, không content hết hạn, không product riêng lẻ. Đó là shape target.

Thay đổi 2026 và cái cần watch

3 thứ shift conversation về llms.txt năm nay.

Một, Anthropic, Stripe, Cloudflare, Vercel, Mintlify đều visibly publish file và documentation của họ disproportionately cited trong AI answer. File là causal hay chỉ correlative thì chưa rõ; cái rõ là công ty đầu tư vào AI-readable content cũng ship llms.txt.

Hai, Tinuiti Q1 2026 AI Citations Trends Report ghi nhận Reddit citation share peak trên 9% tháng 1/2026, confirm rằng AI engines aggressive weight curated, third-party indexed content. llms.txt operationalize cùng instinct đó trên first-party domain: đưa engine curated index và bias về phía trang bạn muốn được quote.

Ba, SEMrush September 2025 Mention-Source Divide study tìm thấy 61,7% AI citations là "ghost" citations — engine cite domain nhưng không nêu brand. llms.txt là một trong nhiều structural move (cùng named-author schema với sameAs link và Organization schema với founder/sameAs array) có thể pull brand name vào answer text. Cơ chế plausible — curated index frontload brand name trong H1 và positioning blockquote — nhưng data chưa conclusive.

Cái cần watch tiếp: OpenAI, Anthropic, Google, hoặc Perplexity có confirm crawler fetch llms.txt làm ranking signal không. Nếu một trong số confirm, file thành competitive baseline overnight.

Case ship file tuần này

Cost = 5 KB markdown file ở URL cố định. Deployment dưới một buổi chiều trên mọi stack. Upside, nếu AI engines adopt llms.txt làm ranking input, lớn và compound. Downside, nếu không bao giờ adopt, là thời gian viết file — đồng thời là audit pillar content của chính bạn.

Nếu store chưa có, thứ tự thao tác:

  1. List top 5 pillar guides, top 5 collections, top 5 FAQ pages, comparison content. Nếu không list được ít nhất 3 mỗi loại, depth content là bottleneck — fix trước.
  2. Viết một positioning blockquote dùng đúng từ ngữ khách hàng search.
  3. Draft markdown file theo spec tại llmstxt.org.
  4. Deploy tại https://yourstore.com/llms.txt, serve text/plain.
  5. Verify với curl -I https://yourstore.com/llms.txt return 200 và Content-Type: text/plain.

Rồi để yên 90 ngày và watch AI citation rate. Nếu chuyển động, có data point. Nếu không, đã audit pillar content và ship file nhỏ cost gần như 0 để maintain.

Đó là trade. Trông như win rõ ràng.

Frequently asked
llms.txt là gì và tại sao ecommerce nên quan tâm năm 2026?
llms.txt là file text đặt ở root domain (yourstore.com/llms.txt), nói cho large language models biết trang nào trên site bạn đáng đọc nhất. Spec do Jeremy Howard đề xuất cuối 2024, đã được Anthropic, Stripe, Cloudflare, Mintlify và nhiều công ty dev-tool publish. Với ecommerce, nó hoạt động như một curated index — trỏ AI crawlers vào pillar content, product collections, FAQ hub thay vì để chúng sample ngẫu nhiên. Không thay thế robots.txt hay sitemap.xml — bổ sung cho cả hai.
ChatGPT, Perplexity, Claude có thật sự đọc llms.txt năm 2026 không?
Adoption chưa đồng đều. Tính đến giữa 2026, chưa engine lớn nào xác nhận chính thức rằng họ fetch llms.txt làm ranking input — nhưng nhiều công ty publish file (Anthropic, Stripe, Cloudflare, Mintlify) đều có docs được cite nhiều hơn đối thủ. Treat như một hedge: cost ship gần như 0, không có downside nếu engine bỏ qua, có upside lớn nếu engine bắt đầu đọc. Tinuiti Q1 2026 report chưa đo impact của llms.txt riêng — claim 'tăng citation rate' nên skeptical đến khi có data peer-review.
Đưa gì vào file llms.txt cho ecommerce?
Tối đa 5 block. (1) H1 với brand name. (2) Blockquote 1-2 câu positioning dùng đúng từ ngữ khách hàng search. (3) Đoạn ngắn mô tả store bán gì, phục vụ ai. (4) H2 list URLs cao-leverage nhất gom theo category — pillar guides, top collections, FAQ pages, comparison content. (5) Optional H2 cho secondary URLs surface khi được hỏi. Mỗi item là markdown link với mô tả ngắn. Giữ file dưới 200 dòng, quét trong 30 giây là xong.
Không nên đưa gì vào llms.txt cho ecommerce?
Trang product riêng lẻ (bạn có hàng trăm đến hàng ngàn — để sitemap xử lý). Trang promo hết hạn. URL admin. Cart, checkout, account. Bất cứ thứ gì sau login. Bất cứ thứ gì không muốn bị quote công khai. Trang pricing thay đổi liên tục (trừ khi pricing thật sự ổn định). Nguyên tắc: chỉ đưa trang nội dung bền, factual, self-contained đủ để AI lift vào câu trả lời mà không misrepresent thương hiệu.
llms.txt có thay structured data hoặc sitemap.xml không?
Không — nó stack chồng. Sitemap.xml nói crawler URL nào tồn tại. Schema.org JSON-LD nói parser từng trang nói về gì. llms.txt nói language models trang nào quan trọng nhất và liên hệ ra sao. Stack tối ưu 2026 cho ecommerce: robots.txt (rules access), sitemap.xml (inventory đầy đủ), llms.txt (curated AI-facing index), và schema Article/FAQPage/Product per-page (block machine-readable). Bỏ bất kỳ cái nào = mất signal.
Deploy llms.txt ở đâu và làm sao trên Shopify hoặc headless?
File ở https://yourstore.com/llms.txt — root domain, plain text, Content-Type: text/plain. Trên Shopify, không thể đặt file ở root qua admin chuẩn — dùng app SEO Manager / Page Doctor, hoặc reverse-proxy static file qua Cloudflare Workers hay layer Next.js headless. Magento: drop vào pub/ và check webserver rule cho phép. Next.js hoặc framework custom: thêm static route hoặc handler server-rendered tại /llms.txt. Friction deploy trên Shopify là có thật và là một lý do hầu hết Shopify store chưa ship file này.