Writing · ai first

AI-First Delivery Stack: 5 task AI làm, 1 task vẫn cần con người (2026)

By Leo Nguyen · Jun 16, 2026 · 10 min read

Jump to section›

#Trả lời ngắn

Sau 19 ngày vận hành một AI-first ecommerce agency 2026, phân chia thật là 5 task AI làm và 1 task vẫn cần con người.

AI làm: audit site lượt đầu, sinh JSON-LD schema, draft đầu content, theo dõi citation trên LLM, và dịch EN↔VI cho bilingual parity. Mỗi task có input có cấu trúc, output verify được, và pass review của con người rẻ cho 20-30% model sai.

AI không làm: cuộc trò chuyện với client khi data nói "việc này không work" còn client vẫn muốn. Cuộc đó vẫn cần trust capital và judgment mà không model nào extend được thay founder.

Bài này viết theo góc operational, từ việc chạy LUMAÂ·E theo cách này 19 ngày. Số liệu trong bài là quan sát nội bộ (cycle time audit, tỉ lệ schema valid, tốc độ ship bilingual); chỗ nào tham chiếu data industry 2026, mình ghi source. Mình không cite stat bịa — chỗ nào số chính xác sẽ giúp nhưng không verify được, mình label là qualitative.

Cái gì đổi trong 2026. Hai shift làm phân chia delivery này viable. Một, capability model vượt ngưỡng nơi thời gian review của founder — không phải chất lượng model — là constraint trên hầu hết task có cấu trúc. Hai, AI search visibility trở thành kênh distribution chính cho ecommerce. Tinuiti AI Citations Trends Report Q1 2026 cho thấy Reddit citation share peak trên 9% trong tháng 1/2026, và SEMrush mention-source study tháng 9/2025 thấy 61.7% AI citation là "ghost" link (domain được cite, brand name không được nhắc). Agency nào ship được content có cấu trúc, citation-ready nhanh có lợi thế đo được; agency nào không thì mất share không lấy lại rẻ được.

#1. Discovery: audit site lượt đầu

AI làm gì. Rubric có cấu trúc bao gồm tech performance (Core Web Vitals, JS bundle size, image strategy), schema coverage (Article, FAQPage, Product, Organization, LocalBusiness), AI visibility (llms.txt có không, robots.txt allow AI bots, recency markers, độ sâu author bio), và check UX liên quan conversion (sticky CTA, trust signal above fold, số bước checkout). Model chạy từng item với URL live, score theo rubric, và sinh report có cấu trúc.

Compression. Cái trước là cuộc discovery 2 tiếng cộng một ngày junior analyst check thủ công, bây giờ khoảng 8 phút AI chạy theo rubric cộng 20 phút founder review. Compression đến từ việc bỏ work checklist thủ công, không từ việc model làm strategic analysis giỏi hơn.

Bẫy. Coi pass đầu của AI là deliverable cuối. Mọi audit mình ship đều có founder review trên top 10 item theo revenue impact — đó là chỗ value sống. Model surface 30 issue; founder quyết 5 issue nào thật sự matter cho client này quý này.

Vị trí trong 2026. Audit-as-lead-magnet chỉ work như asset top-of-funnel nếu nó có cấu trúc và nhanh. Audit 30 phút cảm thấy modern; audit 5 ngày cảm thấy padded. Shift trong expectation của client là second-order effect của việc mỗi founder đều đã thấy ChatGPT sinh ra audit passable trong browser của họ rồi.

#2. Schema generation: JSON-LD tại build time

AI làm gì. Article, FAQPage, Organization, Person và (cho service page ecommerce) Service + LocalBusiness JSON-LD block sinh từ MDX frontmatter có type tại build time. Mọi blog post trong content layer LUMAÂ·E có faqs array và author field; schema helper render đúng shape tự động. Đóng góp của model nằm ở thiết kế helper code và bắt bẫy dedup — không phải sinh schema mỗi page.

Compression. Work schema từng là 3 ngày hand-coding trải dài một project; với build-time generation, work ongoing per page bằng không. Tuần qua chạy theo cách này, 13 page ship EN/VI parity với FAQPage validated trên Rich Results và 0 schema error tại deploy time.

Bẫy. Duplicate emission. Schema render cả trong <FAQSection> component lẫn page level cho ra 2× FAQPage trên cùng URL — Google Rich Results validator bắt, AI engine không nhất thiết bắt, và page có thể đọc như structured data chất lượng thấp với crawler. Fix: chọn một emission point (page level sạch nhất) và lint duplicate trong CI.

Vị trí trong 2026. Schema không còn optional cho AI search. FAQPage đặc biệt là một trong những structured signal leverage cao nhất cho answer-engine citation, và ship nó từ frontmatter có type thay vì hand-write JSON-LD mỗi page là khác biệt giữa agency ship AI-visibility-ready và agency không.

#3. Content first-draft: pillar outline tới 2,000w

AI làm gì. Cho outline pillar, query target, audience, và brand-voice template, model sinh draft đầu 2,000 từ trong khoảng 30 phút. Output có cấu trúc, có section heading, block trả lời ngắn ở đầu (cho AI search citation), và FAQ array draft cho schema layer.

Compression. Hai ngày viết xuống còn nửa ngày, với founder spend hầu hết nửa ngày đó để rewrite thay vì bắt đầu từ blank page.

Bẫy. Ship draft đầu. Model sinh ra work đọc như agency intern competent: có cấu trúc, sạch grammar, có vẻ informed — và thiếu voice thật của founder, take contrarian, ví dụ client cụ thể làm pillar memorable. Mình rewrite 60-70% mỗi draft đầu, hầu hết là phần cần point of view thật. Draft đầu tiết kiệm thời gian typing, không tiết kiệm thời gian thinking.

Vị trí trong 2026. Velocity content matter hơn perfection content cho AI search citation, nhưng chỉ trên một quality floor. Dưới floor (listicle generic, summary ghost-written) AI engine deprioritize nhanh. Trên floor, freshness và structure compound. Split rewrite 70/30 là chỗ mình landed; ít hơn risk floor.

#4. Citation tracking: 9 query × 3 engine, mỗi 5 ngày

AI làm gì. Sweep được script chạy cùng 9 query cluster-target với Perplexity, ChatGPT và Claude theo cadence 5 ngày. Cùng prompt mỗi lần, output log side-by-side, delta từ run trước compute. Model handle orchestration query và diff; founder đọc delta và quyết gap nào act on.

Compression. Check citation thủ công — mở 3 tab browser, chạy query, screenshot, log — từng tốn khoảng 90 phút mỗi sweep. Script với prompt có cấu trúc và log template, cùng 9-query sweep tốn khoảng 15 phút bao gồm review delta.

Bẫy. Coi citation rank là signal duy nhất. Framing useful hơn là citation share-of-voice mỗi cluster: trên 9 query, bao nhiêu phần trăm domain được cite là competitor, bao nhiêu là LUMAÂ·E, bao nhiêu là listicle aggregator (GoodFirms, Clutch, Sortlist). Rank cho biết bạn đang ở đâu; share-of-voice cho biết next step là gì.

Vị trí trong 2026. Cadence matter hơn độ sâu. Nhịp 5 ngày bắt được chuyển động; deep audit mỗi tháng miss cửa sổ react. Theo rule [[citation-cadence]] đã lập, check mỗi 3 ngày là over-fit; mỗi tuần là sàn. Năm ngày là compromise của mình.

#5. Dịch EN ↔ VI: bilingual parity mỗi post

AI làm gì. Mỗi post EN ship cùng file VI parity ở cùng slug. Model handle bulk dịch bao gồm term kỹ thuật (Shopify B2B, Magento 2, Cloudflare Workers — giữ tiếng Anh theo convention), section heading, FAQ array, và ví dụ inline. Frontmatter mirror với vài điều chỉnh field-level (title casing tiếng Việt, description VI-specific).

Compression. Cycle content bilingual 2 ngày của 2024 bây giờ thành cycle 1 ngày hơn. Suốt 19 ngày qua mình đã ship 13 post EN và 13 post VI parity (EN 13 / VI 13 theo progress tracker nội bộ), và marginal cost version VI gần 1.1× cost EN hơn là 2× từng có.

Bẫy. Ship VI đọc như dịch máy. Content ecommerce tiếng Việt có convention tone riêng — xưng hô trực tiếp, anglicism term kỹ thuật ở chỗ cụ thể, ví dụ thị trường relevant với reader VN (stack M2 Kidsplaza, Shopify B2B Vivian Glamour Luxe). Model sinh ra VI grammar đúng mặc định; pass edit của founder là cái làm nó đọc như viết cho thị trường VN.

Vị trí trong 2026. Cho một agency target SEA + global, bilingual parity bây giờ là moat kinh tế thay vì luxury. AI engine weight tín hiệu local entity (areaServed, language) khi match local intent — post VI parity rank cho query VN mà post EN-only không rank, và ở marginal cost.

#Một task AI vẫn không thay được

Cuộc trò chuyện với client khi data nói "việc này không work" và client vẫn muốn.

Một pattern cụ thể quý vừa rồi: audit chỉ rõ một feature đã định không tăng conversion. Client gắn bó tình cảm với nó. CMO của họ đã hứa feature đó nội bộ rồi. Quyết đúng là push back, propose alternative, và absorb một chút friction relational bây giờ để tránh vấn đề relationship lớn hơn sau khi feature ship và không tăng metric.

Cuộc đó cần 3 thứ model không extend thay founder được:

Trust capital kiếm được qua các cuộc gọi trước, calibrate theo risk appetite client cụ thể đó.
Đọc political ai nội bộ cần được bring along, theo thứ tự nào, framing nào.
Judgment long-game về việc spend trust capital cho issue này bây giờ hay save cho issue lớn hơn sau.

AI cho founder data nhanh hơn — không cho trust để spend trong khoảnh khắc đó. Mọi AI-first agency mình biết đều đồng ý point này, ngay cả khi disagree hầu hết mọi thứ khác về delivery.

Framing thật: agency win trong 2026 là agency mà founder spend 80% thời gian vào 20% AI không làm được. Agency fail là agency cố ship 80% AI làm như deliverable cuối.

#Lấy gì từ bài này

Ba thứ, nếu bạn đang chạy hoặc design một model delivery AI-first:

Map stack của bạn theo pattern 5 task. Nếu một task không có input có cấu trúc, output verify được, và pass review con người rẻ, nó chưa phải candidate cho AI handoff trong production work.
Build review layer trước. Bottleneck shift từ generation sang review. Audit review workflow của chính bạn trước khi scale AI generation, không thì ship output chất lượng thấp nhanh.
Để dành task trust-capital cho founder. Một task chỉ-con-người không glamorous, nhưng đó là chỗ kinh tế quan hệ của agency thật sự sống.

Mình tiếp tục refine split này khi ship. Nếu bạn chạy stack tương tự và landed một breakdown khác, pattern đáng so sánh là pattern nơi client mix của bạn khác cấu trúc với mình (nặng enterprise hơn, nặng marketplace hơn, tech stack khác). Split 5 task hold tốt cho work Shopify B2B và Magento 2 SMB-tới-mid-market; mình không generalize qua đó mà không test.

Xuất bản 2026-06-16. Một phần của series LUMAÂ·E AI-First Ecommerce Agency. Companion với The AI-First Ecommerce Agency Playbook (2026) và Structured Data và Entity Authority.

Frequently asked

Một AI-first ecommerce agency 2026 có thể giao những task delivery nào cho AI?›

Năm nhóm task chạy ổn định trong 2026: (1) audit site lượt đầu theo rubric có cấu trúc, (2) sinh JSON-LD schema từ MDX hoặc product data, (3) draft đầu cho pillar, comparison và FAQ pages, (4) theo dõi citation trên Perplexity, ChatGPT và Claude theo bộ prompt lặp lại, và (5) dịch EN↔VI cho bilingual parity. Mỗi task này có input rõ, output verify được, và pass review của founder để bắt 20-30% model làm sai. Task nào không có đủ 3 thuộc tính — input rõ, output có cấu trúc, review của con người rẻ — là chỗ AI-first delivery bắt đầu gãy.

AI không thể thay con người trong việc gì khi delivery ecommerce agency, ngay cả ở 2026?›

Cuộc trò chuyện với client khi data và mong muốn của client đi ngược nhau. Cụ thể: cuộc gọi khi audit chỉ rõ một feature client đã định không tăng conversion, nhưng client đang gắn bó với feature đó và một thành viên team đã hứa nội bộ rồi. Cuộc đó cần phán đoán con người về việc push back gì, defer gì, và giữ mối quan hệ thế nào trong khi vẫn làm đúng việc. Model cho mình data nhanh hơn — không cho mình trust capital để tiêu trong khoảnh khắc đó. Chỗ thứ hai AI yếu cấu trúc: các quyết định taste về layout, tinh tế copy và brand voice khi không có rubric, chỉ có cảm giác có landed hay không. Cả hai vẫn là việc con người.

Audit AI-first thực sự nhanh hơn audit agency truyền thống bao nhiêu?›

Pattern nội bộ sau 19 ngày chạy theo cách này: audit lượt đầu giảm từ một cuộc discovery 2 tiếng cộng một ngày junior analyst nghiên cứu xuống còn khoảng 8 phút AI chạy theo rubric cộng 20 phút founder review. Đây là compression có ý nghĩa — giúp mình báo giá audit theo ngày thay vì tuần — nhưng cách framing quan trọng. Model không làm việc giỏi hơn senior consultant; nó làm 70-80% việc đầu tiên đủ nhanh để founder spend thời gian vào judgment thay vì collect data. Pricing nên phản ánh outcome client nhận, không phản ánh tốc độ AI.

Làm sao giữ chất lượng schema markup cao khi AI sinh ra?›

Ba layer guardrail. Một, sinh schema tại build time từ frontmatter có type (MDX → JSON-LD qua schema helper có type), không sinh free-form từ LLM prompt — cách này loại bỏ failure mode phổ biến nhất là field bịa. Hai, validate mọi page qua Google Rich Results Test hoặc parity script server-side trước deploy; một build ship FAQPage invalid là regression bạn không muốn phát hiện từ khách. Ba, watch duplicate emission — schema render cả trong component lẫn page-level có thể ra 2× FAQPage trên cùng URL, AI engine có thể penalize. Fix là chọn một emission point và giữ duy nhất.

Founder solo có duy trì được bilingual EN/VI content parity với AI không?›

Có, với một caveat. AI handle khoảng 90% lift cho dịch EN↔VI ổn định, nhưng 10% còn lại là chỗ tone tiếng Việt, ví dụ thị trường, và lựa chọn term kỹ thuật (anglicism vs từ tiếng Việt tương đương) cần judgment của editor bản địa. Với một ecommerce agency target cả EN global và audience Việt Nam, parity hiện đã viable kinh tế theo cách 2024 chưa có: chênh lệch cost giữa English-only và bilingual gần 1.1× hơn là 2×. Risk là ship trang tiếng Việt đọc như dịch máy, không như viết — tệ hơn cả không có tiếng Việt, vì signal local authority thấp cho cả reader lẫn AI engine.