AI-First Delivery Stack: 5 task AI làm, 1 task vẫn cần con người (2026)

Trả lời ngắn
Sau 19 ngày vận hành một AI-first ecommerce agency 2026, phân chia thật là 5 task AI làm và 1 task vẫn cần con người.
AI làm: audit site lượt đầu, sinh JSON-LD schema, draft đầu content, theo dõi citation trên LLM, và dịch EN↔VI cho bilingual parity. Mỗi task có input có cấu trúc, output verify được, và pass review của con người rẻ cho 20-30% model sai.
AI không làm: cuộc trò chuyện với client khi data nói "việc này không work" còn client vẫn muốn. Cuộc đó vẫn cần trust capital và judgment mà không model nào extend được thay founder.
Bài này viết theo góc operational, từ việc chạy LUMA-E theo cách này 19 ngày. Số liệu trong bài là quan sát nội bộ (cycle time audit, tỉ lệ schema valid, tốc độ ship bilingual); chỗ nào tham chiếu data industry 2026, mình ghi source. Mình không cite stat bịa — chỗ nào số chính xác sẽ giúp nhưng không verify được, mình label là qualitative.
Cái gì đổi trong 2026. Hai shift làm phân chia delivery này viable. Một, capability model vượt ngưỡng nơi thời gian review của founder — không phải chất lượng model — là constraint trên hầu hết task có cấu trúc. Hai, AI search visibility trở thành kênh distribution chính cho ecommerce. Tinuiti AI Citations Trends Report Q1 2026 cho thấy Reddit citation share peak trên 9% trong tháng 1/2026, và SEMrush mention-source study tháng 9/2025 thấy 61.7% AI citation là "ghost" link (domain được cite, brand name không được nhắc). Agency nào ship được content có cấu trúc, citation-ready nhanh có lợi thế đo được; agency nào không thì mất share không lấy lại rẻ được.
1. Discovery: audit site lượt đầu
AI làm gì. Rubric có cấu trúc bao gồm tech performance (Core Web Vitals, JS bundle size, image strategy), schema coverage (Article, FAQPage, Product, Organization, LocalBusiness), AI visibility (llms.txt có không, robots.txt allow AI bots, recency markers, độ sâu author bio), và check UX liên quan conversion (sticky CTA, trust signal above fold, số bước checkout). Model chạy từng item với URL live, score theo rubric, và sinh report có cấu trúc.
Compression. Cái trước là cuộc discovery 2 tiếng cộng một ngày junior analyst check thủ công, bây giờ khoảng 8 phút AI chạy theo rubric cộng 20 phút founder review. Compression đến từ việc bỏ work checklist thủ công, không từ việc model làm strategic analysis giỏi hơn.
Bẫy. Coi pass đầu của AI là deliverable cuối. Mọi audit mình ship đều có founder review trên top 10 item theo revenue impact — đó là chỗ value sống. Model surface 30 issue; founder quyết 5 issue nào thật sự matter cho client này quý này.
Vị trí trong 2026. Audit-as-lead-magnet chỉ work như asset top-of-funnel nếu nó có cấu trúc và nhanh. Audit 30 phút cảm thấy modern; audit 5 ngày cảm thấy padded. Shift trong expectation của client là second-order effect của việc mỗi founder đều đã thấy ChatGPT sinh ra audit passable trong browser của họ rồi.
2. Schema generation: JSON-LD tại build time
AI làm gì. Article, FAQPage, Organization, Person và (cho service page ecommerce) Service + LocalBusiness JSON-LD block sinh từ MDX frontmatter có type tại build time. Mọi blog post trong content layer LUMA-E có faqs array và author field; schema helper render đúng shape tự động. Đóng góp của model nằm ở thiết kế helper code và bắt bẫy dedup — không phải sinh schema mỗi page.
Compression. Work schema từng là 3 ngày hand-coding trải dài một project; với build-time generation, work ongoing per page bằng không. Tuần qua chạy theo cách này, 13 page ship EN/VI parity với FAQPage validated trên Rich Results và 0 schema error tại deploy time.
Bẫy. Duplicate emission. Schema render cả trong <FAQSection> component lẫn page level cho ra 2× FAQPage trên cùng URL — Google Rich Results validator bắt, AI engine không nhất thiết bắt, và page có thể đọc như structured data chất lượng thấp với crawler. Fix: chọn một emission point (page level sạch nhất) và lint duplicate trong CI.
Vị trí trong 2026. Schema không còn optional cho AI search. FAQPage đặc biệt là một trong những structured signal leverage cao nhất cho answer-engine citation, và ship nó từ frontmatter có type thay vì hand-write JSON-LD mỗi page là khác biệt giữa agency ship AI-visibility-ready và agency không.
3. Content first-draft: pillar outline tới 2,000w
AI làm gì. Cho outline pillar, query target, audience, và brand-voice template, model sinh draft đầu 2,000 từ trong khoảng 30 phút. Output có cấu trúc, có section heading, block trả lời ngắn ở đầu (cho AI search citation), và FAQ array draft cho schema layer.
Compression. Hai ngày viết xuống còn nửa ngày, với founder spend hầu hết nửa ngày đó để rewrite thay vì bắt đầu từ blank page.
Bẫy. Ship draft đầu. Model sinh ra work đọc như agency intern competent: có cấu trúc, sạch grammar, có vẻ informed — và thiếu voice thật của founder, take contrarian, ví dụ client cụ thể làm pillar memorable. Mình rewrite 60-70% mỗi draft đầu, hầu hết là phần cần point of view thật. Draft đầu tiết kiệm thời gian typing, không tiết kiệm thời gian thinking.
Vị trí trong 2026. Velocity content matter hơn perfection content cho AI search citation, nhưng chỉ trên một quality floor. Dưới floor (listicle generic, summary ghost-written) AI engine deprioritize nhanh. Trên floor, freshness và structure compound. Split rewrite 70/30 là chỗ mình landed; ít hơn risk floor.
4. Citation tracking: 9 query × 3 engine, mỗi 5 ngày
AI làm gì. Sweep được script chạy cùng 9 query cluster-target với Perplexity, ChatGPT và Claude theo cadence 5 ngày. Cùng prompt mỗi lần, output log side-by-side, delta từ run trước compute. Model handle orchestration query và diff; founder đọc delta và quyết gap nào act on.
Compression. Check citation thủ công — mở 3 tab browser, chạy query, screenshot, log — từng tốn khoảng 90 phút mỗi sweep. Script với prompt có cấu trúc và log template, cùng 9-query sweep tốn khoảng 15 phút bao gồm review delta.
Bẫy. Coi citation rank là signal duy nhất. Framing useful hơn là citation share-of-voice mỗi cluster: trên 9 query, bao nhiêu phần trăm domain được cite là competitor, bao nhiêu là LUMA-E, bao nhiêu là listicle aggregator (GoodFirms, Clutch, Sortlist). Rank cho biết bạn đang ở đâu; share-of-voice cho biết next step là gì.
Vị trí trong 2026. Cadence matter hơn độ sâu. Nhịp 5 ngày bắt được chuyển động; deep audit mỗi tháng miss cửa sổ react. Theo rule [[citation-cadence]] đã lập, check mỗi 3 ngày là over-fit; mỗi tuần là sàn. Năm ngày là compromise của mình.
5. Dịch EN ↔ VI: bilingual parity mỗi post
AI làm gì. Mỗi post EN ship cùng file VI parity ở cùng slug. Model handle bulk dịch bao gồm term kỹ thuật (Shopify B2B, Magento 2, Cloudflare Workers — giữ tiếng Anh theo convention), section heading, FAQ array, và ví dụ inline. Frontmatter mirror với vài điều chỉnh field-level (title casing tiếng Việt, description VI-specific).
Compression. Cycle content bilingual 2 ngày của 2024 bây giờ thành cycle 1 ngày hơn. Suốt 19 ngày qua mình đã ship 13 post EN và 13 post VI parity (EN 13 / VI 13 theo progress tracker nội bộ), và marginal cost version VI gần 1.1× cost EN hơn là 2× từng có.
Bẫy. Ship VI đọc như dịch máy. Content ecommerce tiếng Việt có convention tone riêng — xưng hô trực tiếp, anglicism term kỹ thuật ở chỗ cụ thể, ví dụ thị trường relevant với reader VN (stack M2 Kidsplaza, Shopify B2B Vivian Glamour Luxe). Model sinh ra VI grammar đúng mặc định; pass edit của founder là cái làm nó đọc như viết cho thị trường VN.
Vị trí trong 2026. Cho một agency target SEA + global, bilingual parity bây giờ là moat kinh tế thay vì luxury. AI engine weight tín hiệu local entity (areaServed, language) khi match local intent — post VI parity rank cho query VN mà post EN-only không rank, và ở marginal cost.
Một task AI vẫn không thay được
Cuộc trò chuyện với client khi data nói "việc này không work" và client vẫn muốn.
Một pattern cụ thể quý vừa rồi: audit chỉ rõ một feature đã định không tăng conversion. Client gắn bó tình cảm với nó. CMO của họ đã hứa feature đó nội bộ rồi. Quyết đúng là push back, propose alternative, và absorb một chút friction relational bây giờ để tránh vấn đề relationship lớn hơn sau khi feature ship và không tăng metric.
Cuộc đó cần 3 thứ model không extend thay founder được:
- Trust capital kiếm được qua các cuộc gọi trước, calibrate theo risk appetite client cụ thể đó.
- Đọc political ai nội bộ cần được bring along, theo thứ tự nào, framing nào.
- Judgment long-game về việc spend trust capital cho issue này bây giờ hay save cho issue lớn hơn sau.
AI cho founder data nhanh hơn — không cho trust để spend trong khoảnh khắc đó. Mọi AI-first agency mình biết đều đồng ý point này, ngay cả khi disagree hầu hết mọi thứ khác về delivery.
Framing thật: agency win trong 2026 là agency mà founder spend 80% thời gian vào 20% AI không làm được. Agency fail là agency cố ship 80% AI làm như deliverable cuối.
Lấy gì từ bài này
Ba thứ, nếu bạn đang chạy hoặc design một model delivery AI-first:
- Map stack của bạn theo pattern 5 task. Nếu một task không có input có cấu trúc, output verify được, và pass review con người rẻ, nó chưa phải candidate cho AI handoff trong production work.
- Build review layer trước. Bottleneck shift từ generation sang review. Audit review workflow của chính bạn trước khi scale AI generation, không thì ship output chất lượng thấp nhanh.
- Để dành task trust-capital cho founder. Một task chỉ-con-người không glamorous, nhưng đó là chỗ kinh tế quan hệ của agency thật sự sống.
Mình tiếp tục refine split này khi ship. Nếu bạn chạy stack tương tự và landed một breakdown khác, pattern đáng so sánh là pattern nơi client mix của bạn khác cấu trúc với mình (nặng enterprise hơn, nặng marketplace hơn, tech stack khác). Split 5 task hold tốt cho work Shopify B2B và Magento 2 SMB-tới-mid-market; mình không generalize qua đó mà không test.
Xuất bản 2026-06-16. Một phần của series LUMA-E AI-First Ecommerce Agency. Companion với The AI-First Ecommerce Agency Playbook (2026) và Structured Data và Entity Authority.