Tối ưu Ecom cho AI Search — Playbook 2026
TL;DR
Muốn được ChatGPT, Perplexity, Claude và Google AI Overviews trích cho query ecom: ship llms.txt và llms-full.txt ở root, gắn FAQPage và Product schema lên mọi product/service page, viết content cấu trúc dễ trích (TL;DR trước, fact có ngày, author bio có tên), mở robots.txt cho AI search crawler (PerplexityBot, OAI-SearchBot, Claude-SearchBot, Google-Extended), và signal độ mới qua dateModified cộng dấu "Cập nhật" hiển thị rõ.
AI search không còn là lý thuyết. ChatGPT vượt 900 triệu weekly active user vào tháng 2/2026, gấp đôi năm trước [TechCrunch, 2026]. Google AI Overviews hiện trigger trên khoảng 48% search query được track theo data tháng 3/2026 của BrightEdge, riêng query commercial dạng "best [product]" đạt khoảng 83% AI Overview presence [BrightEdge / Search Engine Journal, 2026]. AI search visit qua các engine lớn tăng khoảng 43% YoY giữa Q1 2025 và Q1 2026 [No Hacks, 2026].
Đây là playbook mình chạy trên client store ở LUMA-E — 10 tactic, production-grade, có template copy-paste. Cùng playbook site này (luma-e.com) đang ship. Lười thì chạy AI audit miễn phí của bên mình — chấm store của bạn trên đúng những signal này trong 5 phút.
Vì sao AI search quan trọng với ecom
Ba thứ đã thay đổi giữa 2024 và 2026.
Một, audience có thật. ChatGPT đang ở 900M+ weekly active user [OpenAI / TechCrunch, 2026]. Perplexity tầm 780M+ query/tháng và tăng nhanh [Business of Apps, 2026]. Google AI Mode vượt 75M user đầu 2026 [Digital Applied, 2026]. Không còn là kênh niche.
Hai, commercial query đã nằm trong AI Overviews. Suốt 2025, AIO chủ yếu là informational. Cuối 2025, share của commercial-intent trigger tăng đáng kể — query kiểu "best air fryer" chạm ~83% AIO presence, trong khi query transactional thuần ("buy X") vẫn thấp ~13% [BrightEdge via SQ Magazine, 2026]. Cái gap đó matter: AI Overviews đang ăn phần top-of-funnel của ecom discovery mà chưa đụng tới conversion.
Ba, citation share cộng dồn. Khi LLM cite product page của bạn một lần, câu trả lời đó được reinforce qua hàng triệu query tương tự. Brand sở hữu citation share cho "best mid-priced cashmere sweater for women" hay "Shopify subscription app for skincare" đang build SEO của thập kỷ tới — âm thầm, trong khi đa số store còn cãi nhau về title tag.
Thesis: brand tối ưu citation cho AI search ngay bây giờ sẽ sở hữu một kênh traffic 20-30% khi AI search trưởng thành 2027-2028. Chi phí build bây giờ tính bằng giờ. Chi phí đuổi theo sau tính bằng quý.
10 tactic
1. Ship llms.txt ở root
llms.txt là file markdown ở /llms.txt báo cho LLM agent biết site bạn là gì, bán gì, cho ai, và canonical content nằm đâu. Spec do Jeremy Howard đề xuất 2024, adoption khoảng 10% trên các domain lớn năm 2026 [Rankability, 2026]. Đa số LLM lớn chưa coi nó là authoritative cho ranking — nhưng IDE agent (Cursor, Claude Code), MCP server, và vài crawler nhỏ đã consume, adoption đang lên. Cứ ship.
# Your Brand
> One-line description: who you are, what you sell, who it's for.
## Products
- [Product line 1](https://yoursite.com/collections/line-1): One-line description.
- [Product line 2](https://yoursite.com/collections/line-2): One-line description.
## About
- [Our story](https://yoursite.com/pages/about): Founder, mission, year founded.
- [Reviews](https://yoursite.com/pages/reviews): Aggregated reviews and press.
## Policies
- [Shipping](https://yoursite.com/policies/shipping)
- [Returns](https://yoursite.com/policies/returns)
## Full content
- [llms-full.txt](https://yoursite.com/llms-full.txt): Concatenated markdown of all key pages.
Vì sao LLM thích: nó là canonical map chi phí thấp. Khi agent cần hiểu store của bạn, nó nhận summary có cấu trúc trước thay vì crawl 4,000 product page.
2. Generate llms-full.txt với content page nối lại
llms-full.txt là bản long-form: markdown sạch của homepage, about, top 10 collection page, top 20 PDP, và policy — nối lại trong một file. Nhắm dưới 1MB. Bỏ nav chrome, footer, content chạy bằng JS. Đa số platform ecom generate được bằng script 30 dòng — đi qua sitemap, mỗi URL pipe qua markdown converter.
Vì sao LLM thích: agent (đặc biệt trong retrieval-augmented) ingest được toàn bộ context catalog của bạn trong một fetch thay vì crawl. Đây là phiên bản dev tool đang thật sự dùng hôm nay.
3. Schema.org FAQPage trên mọi PDP và service page
FAQPage schema là schema đòn bẩy cao nhất cho AI search. LLM lấy nguyên cặp question/answer vào response. Mỗi product page nên trả lời 3-6 câu hỏi phổ biến về size, chất liệu, ship, return.
{
"@context": "https://schema.org",
"@type": "FAQPage",
"mainEntity": [{
"@type": "Question",
"name": "What size cashmere sweater should I order if I'm between sizes?",
"acceptedAnswer": {
"@type": "Answer",
"text": "Size down. Our cashmere relaxes about half a size after the first wash. If you're between a M and L, take the M."
}
}]
}
Vì sao LLM thích: FAQ schema là một trong những structured signal sạch nhất — Google, ChatGPT, Perplexity đều parse ổn. Câu trả lời viết cho FAQ schema kiêm luôn body copy đủ điều kiện làm snippet.
4. Product schema với review, availability, và lastReviewed
Product JSON-LD phải có aggregateRating, review, offers.availability, offers.price, offers.priceValidUntil, và dateModified. Store ship được ba cái đầu. Gần như không ai ship dateModified trên product — bỏ lỡ một recency signal.
{
"@context": "https://schema.org",
"@type": "Product",
"name": "Merino Crew Sweater — Charcoal",
"sku": "MCS-CHR-M",
"brand": {"@type": "Brand", "name": "Your Brand"},
"offers": {
"@type": "Offer",
"price": "189.00",
"priceCurrency": "USD",
"availability": "https://schema.org/InStock",
"priceValidUntil": "2026-12-31"
},
"aggregateRating": {
"@type": "AggregateRating",
"ratingValue": "4.7",
"reviewCount": "284"
},
"dateModified": "2026-06-01"
}
Vì sao LLM thích: khi LLM so sánh "best merino sweaters under $200", nó cần price, stock, rating, và độ mới — đúng payload này, có cấu trúc.
5. Article schema với author + datePublished + dateModified
Content blog chiếm tỉ trọng AI citation lớn bất cân xứng — vì LLM ưu tiên content editorial hơn page commercial khi cần justify câu trả lời. Mỗi bài blog cần Article schema với author là Person thật.
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "How to Optimize Ecommerce for AI Search (2026 Playbook)",
"datePublished": "2026-06-03",
"dateModified": "2026-06-03",
"author": {
"@type": "Person",
"name": "Leo Nguyen",
"jobTitle": "Founder, LUMA-E",
"url": "https://luma-e.com/about",
"sameAs": ["https://www.linkedin.com/in/leonguyen"]
},
"publisher": {
"@type": "Organization",
"name": "LUMA-E",
"logo": {"@type": "ImageObject", "url": "https://luma-e.com/logo.png"}
}
}
Bạn thấy pattern này live trên bài Shopify Plus cho fashion DTC — cùng Article + Person schema, cùng kiểu fact có ngày inline.
Vì sao LLM thích: author là người thật, có tên, sameAs link về LinkedIn — đây là E-E-A-T signal mạnh nhất một bài có thể mang. LLM ưu tiên cite expert có tên hơn content brand vô danh.
6. Content cấu trúc dễ trích
Đây là tactic đa số store bỏ qua, và là cái có impact cao nhất. LLM lấy content nào được cấu trúc sẵn để lấy. Cụ thể:
- TL;DR trước. Trả lời thẳng trong 100 chữ đầu. Đừng chôn lede.
- List đánh số và bảng có header. LLM cite list và table với tỉ lệ cao bất cân xứng vì dễ parse.
- Fact có ngày + có citation. "Tính đến tháng 3/2026 [Source]" thì trích được. "Recently" thì không.
- Subheading dạng câu hỏi. H2 kiểu "Sau bao lâu site mình rank được trên Perplexity?" khớp với natural language của AI query.
Before/after trên một category page:
Before: "Bộ sưu tập cashmere cao cấp của chúng tôi được thiết kế tỉ mỉ, sử dụng chất liệu tinh tuyển từ những đối tác uy tín trên toàn cầu."
After: "Tất cả sweater trong collection này là 100% cashmere Mongolia Grade-A, 2-ply, hoàn thiện tại Ý. Giá trung bình: $189. Rating trung bình: 4.7 (284 review, cập nhật 06/2026)."
Câu thứ hai trích được. Câu đầu chỉ là trang trí.
Vì sao LLM thích: extractive answer system thưởng cho content đã được người viết extract sẵn. Bạn đang làm việc parsing hộ LLM.
7. Author bio có credential (pattern E-E-A-T)
Mỗi bài cần author bio hiển thị rõ với tên, job title, credential thật, và link sang bio page đầy đủ có Person schema. LLM cite expert có tên với tỉ lệ cao hơn nhiều so với content brand vô danh.
Một author bio ecom chạy được nhìn như này:
Viết bởi Leo Nguyen — 10 năm trong nghề Shopify Plus và Magento 2, founder của LUMA-E. Đã build ecom cho OTB Group, Melissa, FarEast Flora, và 200+ brand khác. Bio đầy đủ →
Tên client là credibility. Một thập kỷ là experience. Link bio là schema target. Cả ba đều matter.
Vì sao LLM thích: khi LLM phải chọn giữa cite một bài brand không byline và một bài expert có tên, có tên thắng. Mình thấy pattern này lặp đi lặp lại khi audit client store — content vô danh bị bỏ qua, content có attribution được cite.
8. Recency signal ở mọi nơi
LLM phạt content cũ rất mạnh. Ba chỗ để signal độ mới:
- Dấu "Cập nhật: [ngày]" hiển thị rõ ở đầu mỗi bài và mỗi category page.
<lastmod>trên mọi URL trong sitemap.xml, update thật khi content đổi (không phải update mỗi lần build).- Ví dụ có ngày inline: "Trong audit tháng 6/2026 của bên mình trên 47 fashion DTC store…" ăn đứt "Trong một audit gần đây…".
Pattern sitemap:
<url>
<loc>https://yoursite.com/blog/ai-search-playbook</loc>
<lastmod>2026-06-03</lastmod>
<changefreq>monthly</changefreq>
</url>
Vì sao LLM thích: signal recency rõ và ngầm củng cố nhau. LLM rank hai bài về "best Shopify subscription app" sẽ ưu tiên bài ghi "Cập nhật 06/2026" với dateModified và lastmod khớp.
9. Mở robots.txt cho AI search crawler (có một phân biệt quan trọng)
Có một chia tách critical giữa training crawler và search/retrieval crawler. Retrieval bot mới là cái kéo AI citation — chặn nó là bạn vô hình. Training bot feed dữ liệu training cho model — quyết định riêng.
Default hợp lý 2026 cho store ecom:
# Allow AI search/retrieval crawlers — these drive citations
User-agent: OAI-SearchBot
Allow: /
User-agent: ChatGPT-User
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: Claude-SearchBot
Allow: /
User-agent: Claude-User
Allow: /
# Opt out of generative AI training (your choice — most brands allow it)
User-agent: GPTBot
Disallow: /
User-agent: ClaudeBot
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: Applebot-Extended
Disallow: /
# Default: everything else allowed
User-agent: *
Allow: /
Sitemap: https://yoursite.com/sitemap.xml
Trade-off: chặn training crawler (GPTBot, ClaudeBot, CCBot, Google-Extended) đồng nghĩa content không feed cho bản model tiếp theo. Vài brand muốn vậy. Đa số không quan tâm. Dù sao, luôn cho phép search/retrieval bot — đó là kênh citation.
Vì sao LLM thích: retrieval crawler là cách live answer được sourced. PerplexityBot không cite được page nó fetch không nổi. Đây là lỗi phổ biến nhất mình thấy khi audit store — Disallow đại trà từ 2024 vẫn chặn sạch mọi thứ liên quan AI.
10. Có mặt ở chỗ LLM đã crawl
LLM cite nhiều bất cân xứng từ source nó đã thấy được nhắc lặp đi lặp lại. Cách nhanh nhất để chế tạo điều đó là có mặt ở chỗ training và retrieval crawler của họ đã ngó:
- Wikipedia / Wikidata — nếu brand bạn đủ điều kiện có entry. Đa số không đủ, nhưng Wikidata entry (ngưỡng thấp hơn) khả thi với mọi store đã có chỗ đứng, và feed vào entity graph mọi LLM dùng.
- Reddit — sub niche theo category của bạn. Tham gia thật, không spam. ChatGPT và Perplexity đều cite thread Reddit nhiều.
- Transcript YouTube — một video review sản phẩm tử tế có transcript được cite xuyên qua nhiều query lân cận.
- G2 / Capterra / TrustRadius — nếu bán B2B hoặc sản phẩm gần SaaS.
- Bài roundup ngành trên publication có uy tín (Search Engine Land, Modern Retail, BoF cho fashion). Một link từ một chỗ này cộng dồn xuyên qua hàng trăm query.
Mình skeptical với mọi dịch vụ "submit to AI directory" thu tiền 2026 — phần lớn là noise. Năm chỗ trên là mấy chỗ mình thấy thật sự đẩy được citation share trên store thật.
Vì sao LLM thích: citation là bài toán graph. Càng nhiều source có thẩm quyền nhắc brand bạn trong context, model càng tự tin bạn là câu trả lời hợp lệ.
Template llms.txt copy-paste (riêng cho ecom)
Copy-paste. Sửa tên brand, URL, và năm bullet. Ship ở https://yoursite.com/llms.txt.
# [Your Brand]
> [One-sentence description: who you are, what you sell, who it's for.
> Example: "Premium merino sweaters for men and women, ethically made
> in Italy, founded 2018, shipping worldwide."]
## Products
- [Men's collection](https://yoursite.com/collections/mens): One-line summary.
- [Women's collection](https://yoursite.com/collections/womens): One-line summary.
- [Accessories](https://yoursite.com/collections/accessories): One-line summary.
- [New arrivals](https://yoursite.com/collections/new): Updated monthly.
- [Sale](https://yoursite.com/collections/sale): Current promotions.
## About the brand
- [Our story](https://yoursite.com/pages/about): Founder, year founded, mission.
- [Materials & sourcing](https://yoursite.com/pages/materials): Where products are made.
- [Press & reviews](https://yoursite.com/pages/press): Third-party coverage.
## Help & policies
- [Shipping](https://yoursite.com/policies/shipping): Destinations, costs, timelines.
- [Returns](https://yoursite.com/policies/returns): Window, conditions, process.
- [Size guide](https://yoursite.com/pages/size-guide): Measurements and fit notes.
- [Contact](https://yoursite.com/pages/contact): Support email, hours.
## Editorial
- [Blog](https://yoursite.com/blog): Buying guides, materials education, brand updates.
## Full content
- [llms-full.txt](https://yoursite.com/llms-full.txt): Concatenated markdown of all key pages.
## Updated
Last updated: 2026-06-03
Lưu ý khi customize: giữ file dưới 50 dòng, chỉ trỏ về canonical URL (không UTM tag), và update ngày Last updated khi ship thay đổi đáng kể.
Năm template schema.org sẵn paste cho ecom
FAQPage
{
"@context": "https://schema.org",
"@type": "FAQPage",
"mainEntity": [{
"@type": "Question",
"name": "Do you ship internationally?",
"acceptedAnswer": {"@type": "Answer", "text": "Yes — we ship to 47 countries. Free shipping over $150 in the US, $250 international."}
}]
}
Product
{
"@context": "https://schema.org",
"@type": "Product",
"name": "Merino Crew Sweater",
"image": "https://yoursite.com/img/sweater.jpg",
"brand": {"@type": "Brand", "name": "Your Brand"},
"offers": {
"@type": "Offer",
"price": "189.00",
"priceCurrency": "USD",
"availability": "https://schema.org/InStock"
},
"aggregateRating": {"@type": "AggregateRating", "ratingValue": "4.7", "reviewCount": "284"},
"dateModified": "2026-06-01"
}
Article
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "How to Optimize Ecommerce for AI Search",
"datePublished": "2026-06-03",
"dateModified": "2026-06-03",
"author": {"@type": "Person", "name": "Leo Nguyen", "url": "https://luma-e.com/about"}
}
Organization
{
"@context": "https://schema.org",
"@type": "Organization",
"name": "Your Brand",
"url": "https://yoursite.com",
"logo": "https://yoursite.com/logo.png",
"foundingDate": "2018",
"sameAs": [
"https://www.linkedin.com/company/yourbrand",
"https://www.instagram.com/yourbrand"
]
}
BreadcrumbList
{
"@context": "https://schema.org",
"@type": "BreadcrumbList",
"itemListElement": [
{"@type": "ListItem", "position": 1, "name": "Home", "item": "https://yoursite.com"},
{"@type": "ListItem", "position": 2, "name": "Men", "item": "https://yoursite.com/collections/mens"},
{"@type": "ListItem", "position": 3, "name": "Sweaters", "item": "https://yoursite.com/collections/mens-sweaters"}
]
}
Cả năm nên ship dưới dạng tag JSON-LD <script> trong <head> của page tương ứng. Validate bằng Google Rich Results Test trước khi deploy.
LUMA-E làm thế nào — meta proof
Bên mình chạy playbook này trên chính site của mình. Cụ thể:
- luma-e.com/llms.txt — site map có cấu trúc cho LLM agent, liệt kê mọi service và case study.
llms-full.txt— markdown nối của tất cả service page và case study, update mỗi lần deploy.- FAQPage schema trên mọi service page, bao gồm AI audit service — mọi câu hỏi phổ biến render vừa làm content hiển thị vừa làm JSON-LD.
- Article + Person schema trên mọi bài blog, bao gồm Pillar #1 về Shopify Plus cho fashion DTC. Author bio link sang Person page đầy đủ với
sameAsvề LinkedIn. robots.txtmở cho retrieval crawler (OAI-SearchBot, PerplexityBot, Claude-SearchBot) và một quyết định có chủ đích về training crawler.<lastmod>thật trong sitemap.xml, regenerate đúng khi content thay đổi.
Bên mình cũng build những signal này vào client work — bao gồm B2B portal multi-brand của OTB Group, nơi schema và content cấu trúc nằm trong launch checklist, không phải afterthought.
Mình không tuyên bố ranking nào không back up được. Bên mình ship đúng những gì khuyên client làm. Khi client hỏi "cái này có work không?", mình thà trỏ vào /llms.txt đang live còn hơn trỏ vào screenshot.
Muốn biết store của bạn đứng ở đâu trên 10 signal này, chạy AI audit miễn phí — 5 phút, chấm bạn về schema coverage, cấu trúc content, recency signal, và độ tiếp cận của AI crawler. Hoặc book strategy call, bên mình đi qua tình huống cụ thể của bạn.
Viết bởi Leo Nguyen — 10 năm trong nghề Shopify Plus và Magento 2, founder của LUMA-E. Đã build ecom cho OTB Group, Melissa, FarEast Flora, Kangarwear, và 200+ brand khác.
Nguồn
- ChatGPT 900M weekly active user (02/2026): TechCrunch
- Query volume của Perplexity: Business of Apps — Perplexity statistics
- Google AI Overviews 48% coverage / share commercial query: Search Engine Journal — BrightEdge data và SQ Magazine — AI Overviews statistics 2026
- Google AI Mode 75M user: Digital Applied
- AI search visit +43% YoY: No Hacks — AI user-agent landscape 2026
- llms.txt adoption ~10%: Rankability — llms.txt adoption research
- Taxonomy AI crawler (OAI-SearchBot, Claude-SearchBot, v.v.): Contently — AI crawlers explained