Playbook Agency Ecommerce AI-First (2026): Stack, Workflow, Trade-off

Câu trả lời ngắn
Agency ecommerce AI-first không phải solo shop bolt ChatGPT lên trên. Đây là delivery model được thiết kế lại quanh việc AI thực sự giỏi cái gì — synthesis nghiên cứu, draft content đầu tiên, chấm audit, sinh schema, scaffold code — và giữ thời gian con người cho phần judgment, taste, trust vẫn phải ship bằng người. Làm tốt, nó nén discovery từ 1 tuần xuống 1 tiếng, audit từ vài tiếng xuống vài phút, và cho phép một founder deliver công việc trước đây cần team 4 người. Trade-off rất thật: mental load tăng, quality gate thành bottleneck mới, và không có backup khi ốm.
Năm thứ thực sự hiệu quả:
- Discovery và scoping — 1 tiếng cuộc nói chuyện với khách cộng form intake structured, parse bởi Claude thành brief đã scope.
- Chấm audit — framework 12 query AI visibility chạy trên store trong vài phút, rồi founder review các issue hàng đầu.
- Schema và structured data — Article, FAQPage, Product, LocalBusiness ship dưới dạng JSON-LD trong 1 commit thay vì 3 ngày code tay.
- Draft content đầu tiên — pillar piece, comparison page, case study draft bởi Claude theo template brand-voice; founder sở hữu 30% cuối.
- Scaffold code — Claude Code draft component, route, test; founder review trước merge.
Bài này định tính, rút ra từ vận hành agency Shopify B2B và Magento 2 qua 10 năm delivery pre-AI và rebuild 90 ngày thành AI-first. Chỗ nào metric chính xác sẽ giúp, tụi mình flag là định tính; không cite số bịa.
2026 thay đổi gì. Hai cú shift làm delivery AI-first khả thi theo cách năm 2024 không khả thi. Thứ nhất, capability model trên task long-form structured (passage 200 từ answer-first, sinh schema, edit code đa file) vượt ngưỡng mà thời gian review của founder, không phải chất lượng model, trở thành bottleneck. Thứ hai, AI search visibility trở thành kênh distribution chính cho ecommerce — báo cáo Tinuiti Q1 2026 AI Citations Trends cho thấy share citation Reddit peak trên 9% tháng 1 năm 2026, và study SEMrush tháng 9 năm 2025 thấy 61.7% citation AI là "ghost" link (domain được cite, brand name không được mention). Agency ship được content AI-visibility-ready nhanh có lợi thế cấu trúc; agency không làm được đang mất share citation sẽ không lấy lại rẻ được.
Vì sao AI-first work được lúc này (3 lý do)
Lý do 1: Bottleneck đã dịch. Năm 2023 bottleneck của agency nhỏ là capacity generation — bạn phải viết brief, SOW, schema, copy, code, checklist QA, doc handoff. Năm 2026 bottleneck là review và judgment. Claude có thể draft pillar 2,000 từ trong 20 phút; nó không quyết định được angle có khớp positioning của khách không. Cú shift đó favor operator review nhanh, không phải team viết nhanh.
Lý do 2: AI search reward output structured. Schema markup, format answer-first, FAQ block, dateModified freshness — đây là tín hiệu AI engine weight, và là chính xác công việc AI giỏi generate. Agency coi AI search là kênh chính và ship content citation-ready thì compound; agency coi đó là "SEO thêm bước" thì tụt lại. Kinh tế của chuyện này vẫn đang dưới giá trị thực.
Lý do 3: Kỳ vọng khách hàng được re-anchor. Khách xem ChatGPT và Claude tốt lên rõ ràng trong 2025 giờ kỳ vọng turnaround agency khớp tốc độ AI. Timeline 2 tuần cho audit mà AI có thể rough out trong 1 tiếng đọc như padded hoặc chậm. Agency thắng deal mới trong 2026 là agency báo theo ngày, không phải tuần — và thực sự deliver trong window đó.
Stack (minh bạch, nhàm chán, thay được)
Stack giữ có chủ ý nhàm chán. Quan trọng không phải tool cụ thể; quan trọng là mọi layer phải (a) được document đủ tốt để LLM edit confidently và (b) thay được mà không phải viết lại phần còn lại.
Hosting và edge. Cloudflare Workers + Pages. Free tier đủ cho scale; pipeline pre-render MDX content giữ Worker bundle dưới 3 MiB. Deploy là git push.
Content layer. Next.js + MDX với schema frontmatter typed. Mọi blog post, case study, service page là file MDX có metadata cho SEO, sinh JSON-LD, và routing read-next. Static site generation tại build time. Sinh schema-org tập trung 1 module TypeScript nên Article, FAQPage, Organization, Person, Service, và LocalBusiness đều derive từ cùng source of truth.
Model layer. Claude API cho task structured (parse intake, draft content, sinh schema, chấm audit). Claude Code cho edit code và refactor đa file. Tụi mình không dùng nhiều vendor model; consistency của làm việc với 1 model family đáng giá hơn chạy theo benchmark per-task.
Automation glue. n8n self-hosted cho cron job, ping IndexNow, scraper citation log, và flow event CRM. Free, version-controlled, và editable bởi Claude khi cần flow mới.
CRM và email. Turso (libSQL) cho state, Resend cho email transactional. Cả hai có free tier rộng và API sạch mà LLM xử lý tốt.
Audit engine. Framework 12 query AI visibility custom — Perplexity, ChatGPT, Claude chạy 4 loại query (long-tail, mid-tail, local-intent, brand). Output là report được graded với mention rate, citation rate, entity surface area. Đây là lead magnet.
Cái tụi mình cố tình không dùng. Không customer data platform (premature), không marketing automation suite (overkill ở scale hiện tại), không enterprise CRM (table Turso đủ), không subscription design tool tới khi pipeline project justify. Free tier mặc định, tool trả phí chỉ khi ROI proven.
Workflow delivery (project Shopify B2B, đầu đến cuối)
Năm bước, split AI vs human nêu rõ mỗi bước.
Bước 1 — Discovery (1 tiếng vs 1 tuần pre-AI). Khách book call 30 phút qua Cal. Trước call, khách fill form intake structured. Claude parse form thành draft brief — pain point, stack hiện tại, revenue band, stakeholder map, success criteria. Tụi mình review recording call, edit brief, và ship lại cho khách trong 24 tiếng.
Vai AI: parse form, sinh draft brief, gợi ý câu hỏi follow-up. Vai con người: call thật, edit brief, đọc giữa dòng cho political risk.
Bước 2 — Scoping (nửa ngày vs 3 ngày). Claude generate draft SOW từ brief — milestone, deliverable, risk, timeline. Founder edit cho pricing, biên scope, và note quản khách AI không thấy được.
Vai AI: skeleton SOW, surface risk từ project tương tự trước, estimate timeline theo reference library. Vai con người: pricing, đàm phán scope, cú gọi political về cái gì cần đẩy lại.
Bước 3 — Build (nén khoảng 50%). Claude Code draft component, schema, copy, test song song theo SOW. Không gì ship lên staging mà chưa qua pass review của founder. Loop review chặt: draft, review, edit, ship, lặp. Việc trước đây tốn 3 ngày focus liên tục giờ tốn 1 ngày review và direction.
Vai AI: scaffold code, sinh schema, draft copy, test case, refactor. Vai con người: quyết định architecture, judgment call về UX, brand voice, gate trước merge.
Bước 4 — QA (1 tiếng vs nửa ngày). AI chấm theo checklist conversion B2B 50 điểm (pricing visibility, schema completeness, presence llms.txt, emit FAQPage, UX bulk-order mobile). Founder spot-check 10 item conversion-critical hàng đầu bằng tay.
Vai AI: chấm tự động theo rubric, kiểm tra regression schema và route. Vai con người: spot-check, judgment "feel có đúng không".
Bước 5 — Handoff (nén nhưng giữ hình dạng). Doc auto-generated từ codebase, 30 phút walkthrough với khách, recording loom cho flow edit thường gặp.
Vai AI: sinh documentation, FAQ cho doc handoff. Vai con người: walkthrough, đọc xem khách có đủ tự tin nhận bàn giao chưa.
Compression là thật, nhưng để ý cái dịch: bottleneck từ "làm xong việc không" sang "founder review đủ nhanh để giữ quality không". Đó là constraint mới, và là cái tụi mình under-resource khi mới bắt đầu.
Pricing (charge gì và vì sao)
Ba tier, giữ đơn giản.
Audit AI Visibility free. Baseline 12 query AI chấm trên domain khách. Output: report 1 trang với mention rate, citation rate, và 3 gap hàng đầu. Đây là lead magnet và qualifier. Cost deliver: phút, không phải giờ. Conversion sang trả phí: số duy nhất quan trọng, và nó định tính qua funnel của tụi mình.
Audit trả phí ($149 - $499). Deliverable structured có founder review — thiếu gì, fix theo thứ tự nào, trần AI visibility với content hiện tại trông thế nào. Size sao cho rẻ đủ để founder nói có không cần committee và đắt đủ để lọc tire-kicker. Margin tốt vì audit engine làm phần nặng; thời gian founder là review và call recommendation.
Project implementation ($5,000 - $30,000). Scope theo stack. Implementation Shopify B2B, build Magento 2, NextJS headless commerce, sprint content AI visibility. Fixed price khi scope rõ; T&M ($45-75/giờ) khi scope thật sự không chắc. Bẫy pricing cần tránh là anchor theo tốc độ delivery AI — work nhanh hơn nhưng outcome vẫn vậy. Pricing theo outcome.
Retainer ($2,000 - $5,000 / tháng). Duy trì AI visibility ongoing, cadence content, upkeep schema, audit re-run hàng tháng. Đây là layer revenue compound; mục tiêu là convert khách implementation sang retainer trong 60 ngày sau project close.
Cái tụi mình cố tình không charge: call discovery (sales, không phải delivery), audit free (lead magnet), hoặc "AI consulting" tách rời khỏi stack (commoditize nhanh).
AI thay được gì vs con người giữ phần nào
Cách nghĩ sạch nhất, rút ra từ vận hành cả hai mode.
AI thay được: synthesis nghiên cứu (gấp 10), draft content dài đầu tiên (gấp 3, founder edit 30% cuối), sinh schema markup (gấp 10, defect rate gần zero trên type standard), chấm audit theo rubric (gấp 5), scaffold code cho pattern đã biết (gấp 3-4), parse form intake (effectively free), báo cáo status định kỳ.
AI không thay được: cuộc nói chuyện với khách (trust vẫn ship in-person hoặc trên call), cú gọi "no" khi scope creeps (nói no cần human spine), taste về layout, tone copy, và brand voice (AI generate competent; 20% cuối là judgment), quality gate cho mọi output (mọi artifact AI cần pass người), quyết định chiến lược về positioning và pricing (đây là bet, và bet do người sở hữu).
Framing trung thực mất 1 quý tụi mình mới internalize: AI đưa bạn tới 70-80% ở phần lớn task. 20-30% cuối là chỗ margin nằm. Agency ship 80% thành bản cuối là agency bị đuổi việc.
Trade-off trung thực
Bốn cái tụi mình đã sống qua.
Mental load tăng, không giảm. Chạy 12 cuộc hội thoại AI song song khó hơn chạy team 4 người, dù ship nhiều output hơn. Mỗi thread cần context, direction, và gate review. Cost switching cognitive rất thật. Tool như prompt library và template structured giúp, nhưng load là cái thuế compound qua ngày.
Không backup. Số project concurrent cap bởi bandwidth review của founder, không phải bandwidth delivery. Bạn ốm, off 1 ngày, hay có việc gia đình thì công việc dừng. Đây là constraint cấu trúc AI không giải quyết.
Quality gate là bottleneck mới. Mọi output AI cần human pass. Việc đó không glamorous và không feel như progress — nhưng là khác biệt giữa agency AI-first ship work professional và agency ship slop AI-flavored. Budget thời gian review như line item bậc nhất, không phải overhead.
Tacit knowledge không compound. Trong team, junior staff xem senior staff ra call và hấp thụ vì sao. Solo + AI, lesson đó chỉ sống trong đầu founder — hoặc trong note viết tốt. Tụi mình bắt đầu coi documentation nội bộ là deliverable, không phải afterthought, chính vì lý do này.
Data 90 ngày (tới giờ, định tính)
Tụi mình bắt đầu rebuild AI-first ngày 29 tháng 5 năm 2026. Tới ngày 15 tháng 6:
- Portfolio depth: 50+ project ship pre-rebuild (Shopify Plus, Magento 2, NextJS, build ecommerce Việt Nam qua 10 năm).
- Output content: site v2 launch, 11 piece pillar và supporting tiếng Anh live, 11 piece parity tiếng Việt, 4 placement listicle đang chạy (GoodFirms, DesignRush, Clutch, Sortlist).
- Baseline AI Visibility Sprint: baseline 12 query đặt qua Perplexity, ChatGPT, và Claude cho 4 query ưu tiên cao. Tactic ship: listicle, restructure M1/M2 với format answer-first và FAQ schema, 2 landing page dedicated cho query thiếu cover.
- Distribution: cadence post LinkedIn thứ 2-4-6 từ Day 4. Flow DM inbound đã thiết lập nhưng volume nhỏ và lumpy.
Số tụi mình cố tình không cite: revenue, số lead, conversion rate. Có thật; share con số chính xác ở 90 ngày đọc như performance, không phải signal. Tụi mình sẽ public 1 piece data 180 ngày với số cứng khi sample size trung thực.
Tiếp theo (câu hỏi mở)
Ba câu tụi mình đang chạy thí nghiệm trong 60 ngày tới.
Câu 1: Audit engine scale tới đâu trước khi commoditize? Audit AI visibility có giá lúc này vì phần lớn agency chưa deliver được. Khi tooling democratize, gap đó đóng. Hedge là move lên stack — từ "tụi tôi chạy audit" sang "tụi tôi ship fix". Revenue implementation insulate khỏi audit commoditize.
Câu 2: Tỉ lệ content compound vs client work đúng là gì? Quá nhiều content thì đói revenue; quá nhiều client work thì đói distribution compound. Tụi mình chạy thí nghiệm khoảng 30% content / 70% client work và recalibrate tại Day 90.
Câu 3: Model solo AI-first đúng shape, hay shape đúng là agency AI-first 2-3 người? Solo có margin sạch nhất nhưng risk profile xấu nhất. Team nhỏ thêm review bandwidth và giảm vấn đề no-backup, đánh đổi margin. Câu trả lời trung thực là tụi mình chưa biết — và không hire để giải vấn đề chưa sống đủ lâu.
Kết
Delivery ecommerce AI-first không phải claim marketing hay lựa chọn stack — đây là operating model được thiết kế lại. Cái win là thật (cycle time, margin, lợi thế AI visibility), trade-off là thật (mental load, không backup, cost quality gate), và failure mode là ship 80% output AI thành bản cuối. Nếu bạn đang cân nhắc move, chuẩn bị trung thực là: budget thời gian review, document tacit knowledge khi đi, và pricing theo outcome — không phải tốc độ.
Nếu bạn muốn xem audit engine, framework, hay schema stack tụi mình dùng, audit AI visibility 12 query miễn phí là entry point sạch nhất. Không cần call — báo cáo async.