Skip to content

📕 PHASE 3: ARCHITECT — "Thiết Kế Bộ Não Cho AI" (Week 9-12)


"The real challenge in building multi-agent systems isn't making each agent smart. It's making them work together without chaos."
— Andrew Ng, DeepLearning.AI, 2025


MODULE 9: SINGLE AGENT DESIGN DEEP DIVE (Week 9)

📰 Case Study Mở Đầu: "Shopify: Sidekick Agent Và Bài Học $200M Từ Việc 'Nghĩ Quá Đơn Giản'"

Viết theo phong cách Bloomberg


Ottawa, Canada, Q4/2025. Tobi Lütke, CEO Shopify, thừa nhận trên podcast "Lenny's Podcast": Phiên bản đầu của Shopify Sidekick — AI Agent hỗ trợ merchant — đã fail spectacular vì team đã "underestimate the complexity of a single agent doing multiple things."

Ban đầu, Sidekick được thiết kế như 1 super-agent: vừa trả lời hỏi đáp, vừa phân tích data, vừa gợi ý marketing strategy, vừa viết product description. Kết quả: nó làm mọi thứ ở mức trung bình, và merchants nhanh chóng bỏ dùng.

Bước đột phá đến khi team chia Sidekick thành nhiều "micro-agents", mỗi agent chuyên 1 việc:

  • Analytics Agent: Chuyên phân tích doanh số
  • Copy Agent: Chuyên viết mô tả sản phẩm
  • Marketing Agent: Chuyên suggest chiến dịch
  • Support Agent: Chuyên hướng dẫn setup store

Một agent điều phối (Orchestrator) quyết định route user request đến đúng micro-agent.

"The key insight," Lütke nói, "was that a well-designed single-purpose agent beats a poorly-designed multi-purpose agent every time."

Bài học: Trước khi nghĩ đến multi-agent, phải master single agent design. Mỗi agent phải cực kỳ giỏi 1 việc.


📚 Nội Dung Bài Giảng

Bài 9.1: Single Agent Design Pattern

Thời lượng: 60 phút

  1. 3 Agent Archetypes:
ArchetypeMô tảVí dụComplexity
ReactiveNhận input → output ngayFAQ chatbot, classifierThấp
DeliberativeSuy nghĩ nhiều bước trước khi outputAnalyst, plannerTrung bình
AutonomousTự đặt sub-goals, tự thực thiPM Agent, Growth AgentCao
  1. Agent State Machine:
                    ┌──────────┐
                    │  IDLE    │
                    └────┬─────┘
                         │ Receive Input
                    ┌────▼─────┐
              ┌─────│ THINKING │─────┐
              │     └────┬─────┘     │
              │          │           │
         Need Tool    Have Answer   Uncertain
              │          │           │
         ┌────▼────┐ ┌───▼────┐ ┌───▼──────┐
         │ ACTING  │ │ OUTPUT │ │ ESCALATE │
         │(use tool)│ │        │ │(to human)│
         └────┬────┘ └───┬────┘ └──────────┘
              │          │
              └──────────┘
                Return to THINKING
  1. BA thiết kế State Machine:
    • Mỗi state → có tiêu chí rõ ràng để chuyển state
    • Mỗi transition → có condition + action
    • Mỗi dead-end → có fallback behavior

Bài 9.2: Agent Planning — Khi Agent Tự Lên Kế Hoạch

Thời lượng: 60 phút

  1. Task Decomposition:

    • Input: "Phân tích doanh thu Q4 và đề xuất chiến lược Q1"
    • Agent tự decompose:
      1. Query data từ Revenue DB
      2. Analyze trends (YoY, MoM)
      3. Identify top/bottom performers
      4. Cross-reference with market data
      5. Generate recommendations
      6. Format report
  2. BA thiết kế Planning Rules:

    • Max steps cho 1 task: Giới hạn để tránh infinite loop
    • Resource limits: Mỗi step được gọi bao nhiêu API calls?
    • Timeout: Bao lâu thì phải output dù chưa hoàn thành?
    • Quality gate: Ở step nào cần human check trước khi tiếp?

Bài 9.3: Error Handling & Recovery

Thời lượng: 45 phút

Error Handling Matrix:

Error TypeExampleAgent ResponseBA Design
Tool failureAPI timeoutRetry 3x, then fallbackRetry policy + fallback logic
Ambiguous input"Fix this"Hỏi lại clarificationClarification templates
Confidence lowNot sure about answerEscalate to humanConfidence threshold
Conflicting data2 sources say different thingsReport both, ask humanSource priority rules
Rate limitToo many requestsQueue + notify userRate limit design
Hallucination detectedSelf-check finds inconsistencyDiscard, retry with different promptSelf-check rules

Bài 9.4: Agent Performance Optimization

Thời lượng: 45 phút

Performance Dashboard Template:

MetricCurrentTargetStatus
Task completion rate87%95%🟡
Avg. response time4.2s< 3s🔴
Hallucination rate3.1%< 2%🟡
User satisfaction (CSAT)4.1/54.5/5🟡
Escalation rate28%15-25%🟡
Cost per interaction$0.12< $0.10🟡

🎮 QUIZ & GAME — Week 9

Quiz (20đ): Agent archetypes, state machine design, error handling

Game: "Agent Debugger" (15đ):

  • Nhận 1 agent design có 10 lỗi thiết kế ẩn
  • Tìm và fix càng nhiều lỗi càng tốt trong 60 phút
  • Mỗi lỗi tìm được + fix hợp lý = +1.5 điểm


MODULE 10: MULTI-AGENT ORCHESTRATION (Week 10)

📰 Case Study Mở Đầu: "Khi McKinsey Thay 30 Consultant Bằng 6 AI Agents"

Viết theo phong cách The Economist


Tháng 11/2025. Một dự án nội bộ tại McKinsey & Company — được gọi là "Project Lumen" — đã tạo ra chấn động trong giới tư vấn chiến lược. Thay vì assign 30 consultants junior cho một due diligence engagement, McKinsey triển khai 6 AI Agents phối hợp:

  1. Research Agent: Thu thập và tổng hợp industry data
  2. Financial Agent: Phân tích financial statements, build models
  3. Risk Agent: Đánh giá regulatory, market, operational risks
  4. Strategy Agent: Tổng hợp insights và đề xuất strategy
  5. QA Agent: Kiểm tra chéo output của 4 agents trên
  6. Report Agent: Biên soạn final report theo McKinsey format

Kết quả: Due diligence package — trước đây mất 6-8 tuần với 30 người — hoàn thành trong 4 ngày với 3 senior partners review.

Nhưng câu chuyện behind-the-scenes mới thú vị: 3 lần đầu thử nghiệm, hệ thống cho kết quả sai hoàn toàn vì agents mâu thuẫn nhau. Research Agent cung cấp data mà Financial Agent interpret sai. Risk Agent flag issues mà Strategy Agent ignore.

"Thiết kế mỗi agent hoàn hảo chưa đủ," Lead Partner dự án chia sẻ. "Thiết kế cách chúng giao tiếp, giải quyết mâu thuẫn, và escalate — đó mới là bài toán thực sự."

Và người giải bài toán đó? Không phải ML engineers. Là Business Architects — những người hiểu workflow, authority, và decision rights.


📚 Nội Dung Bài Giảng

Bài 10.1: Multi-Agent Orchestration Patterns

Thời lượng: 90 phút (Bài giảng quan trọng nhất khóa học)

Pattern 1: Centralized Controller

                    ┌──────────────┐
                    │ ORCHESTRATOR │
                    │   AGENT      │
                    └──────┬───────┘

              ┌────────────┼────────────┐
              │            │            │
         ┌────▼───┐  ┌────▼───┐  ┌────▼───┐
         │Agent A │  │Agent B │  │Agent C │
         │(Research)│ │(Analyze)│ │(Report)│
         └────────┘  └────────┘  └────────┘
  • Ưu: Kiểm soát rõ ràng, dễ debug
  • Nhược: Bottleneck ở orchestrator, single point of failure
  • Dùng khi: Task có quy trình rõ ràng, tuần tự

Pattern 2: Hierarchical Agent Tree

                    ┌──────────────┐
                    │  MANAGER     │
                    │  AGENT       │
                    └──────┬───────┘

              ┌────────────┼────────────┐
              │                         │
         ┌────▼───────┐           ┌────▼───────┐
         │ TEAM LEAD  │           │ TEAM LEAD  │
         │ Agent A    │           │ Agent B    │
         └─────┬──────┘           └─────┬──────┘
               │                        │
          ┌────┼────┐              ┌────┼────┐
          │         │              │         │
      ┌───▼──┐ ┌───▼──┐      ┌───▼──┐ ┌───▼──┐
      │Worker│ │Worker│      │Worker│ │Worker│
      │  1   │ │  2   │      │  3   │ │  4   │
      └──────┘ └──────┘      └──────┘ └──────┘
  • Ưu: Scalable, modular, giống tổ chức doanh nghiệp thực
  • Nhược: Phức tạp, latency cao
  • Dùng khi: Hệ thống lớn, nhiều domain khác nhau

Pattern 3: Negotiation-Based Agents

      ┌────────┐     negotiate     ┌────────┐
      │Agent A │◄──────────────────►│Agent B │
      │(Sales) │                    │(Finance)│
      └────┬───┘                    └────┬───┘
           │         negotiate           │
           └────────────┬────────────────┘

                   ┌────▼───┐
                   │Agent C │
                   │(Legal) │
                   └────────┘
  • Ưu: Flexible, tìm được giải pháp tối ưu cân bằng nhiều mục tiêu
  • Nhược: Khó predict, có thể deadlock
  • Dùng khi: Quyết định cần cân bằng nhiều stakeholder interests

Pattern 4: Event-Driven Agents

    ┌─────────────────────────────────────────┐
    │              EVENT BUS                   │
    └─────┬──────────┬──────────┬─────────────┘
          │          │          │
     ┌────▼───┐ ┌───▼────┐ ┌──▼─────┐
     │Agent A │ │Agent B │ │Agent C │
     │ Listen:│ │ Listen:│ │ Listen:│
     │"order" │ │"payment"││"ship"  │
     └────────┘ └────────┘ └────────┘
  • Ưu: Loosely coupled, dễ thêm agent mới
  • Nhược: Khó trace flow, debugging complex
  • Dùng khi: Hệ thống real-time, reactive, microservice architecture

Bài 10.2: Orchestration Design — The BA's Core Skill

Thời lượng: 60 phút

Orchestration Design Document Template:

markdown
# Multi-Agent System: [Tên hệ thống]
## Version: 1.0
## Pattern: [Centralized / Hierarchical / Negotiation / Event-driven / Hybrid]

### 1. Agent Registry
| ID | Agent Name | Role | Priority | Dependencies |
|----|-----------|------|----------|-------------|
| A01 | Research Agent | Data collection | High | None |
| A02 | Analysis Agent | Data analysis | High | A01 |
| A03 | QA Agent | Quality check | Medium | A02 |
| A04 | Report Agent | Output generation | Low | A03 |

### 2. Communication Protocol
- Message Format: JSON with fields: {from, to, type, payload, timestamp, priority}
- Async vs Sync: [Define per interaction]
- Timeout: [Per agent pair]
- Retry Policy: [Define]

### 3. Workflow Definition
Step 1: Orchestrator receives task
Step 2: Decompose into sub-tasks
Step 3: Assign to agents based on capability
Step 4: Agents execute in parallel/sequence
Step 5: QA Agent validates outputs
Step 6: Orchestrator compiles final output

### 4. Escalation Rules
| Trigger | From | To | Time Limit |
|---------|------|----|-----------| 
| Confidence < 60% | Any Agent | Orchestrator | Immediate |
| Conflict between agents | Conflicting Agents | Manager Agent | 30 seconds |
| Task timeout | Any Agent | Orchestrator | Per-task defined |
| 3 consecutive errors | Any Agent | Human Operator | Immediate |

### 5. Conflict Resolution
Priority order: Legal > Compliance > Financial > Customer > Efficiency
If same priority: Manager Agent decides
If Manager Agent uncertain: Escalate to Human

### 6. Performance SLA
| Metric | Target |
|--------|--------|
| End-to-end latency | < 30 seconds |
| Accuracy | > 95% |
| Agent disagreement rate | < 10% |
| Human escalation rate | < 15% |

Bài 10.3: Agent Communication Design

Thời lượng: 45 phút

  1. Message Types:
TypePurposeExample
REQUESTYêu cầu agent khác làm gì"Analyze this financial data"
RESPONSETrả kết quả"Here's the analysis: {...}"
INFORMChia sẻ thông tin, không cần action"FYI: New regulation effective March 1"
QUERYHỏi thông tin"What's the current inventory level?"
ESCALATEChuyển lên cấp trên"Can't resolve — need human input"
NEGOTIATEĐề xuất và điều chỉnh"I suggest 10% discount. Can you approve?"
  1. Shared Context:
    • Mỗi task có 1 shared context object
    • Agents đọc/ghi vào shared context
    • BA thiết kế: Fields nào trong shared context? Ai có quyền write?

Bài 10.4: Real-World Multi-Agent Architectures

Thời lượng: 60 phút

Case: AI Product Squad (6 agents phối hợp)

┌─────────────────────────────────────────────────────────┐
│                   AI PRODUCT SQUAD                        │
│                                                          │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐               │
│  │ PM Agent │→ │ BA Agent │→ │ Design   │               │
│  │ "Define  │  │ "Analyze │  │ Agent    │               │
│  │ what to  │  │ how to   │  │ "Design  │               │
│  │ build"   │  │ build"   │  │ the UX"  │               │
│  └──────────┘  └──────────┘  └────┬─────┘               │
│                                    │                     │
│                               ┌────▼─────┐               │
│                               │ Dev Agent │              │
│                               │ "Build it"│              │
│                               └────┬─────┘               │
│                                    │                     │
│  ┌──────────┐                 ┌────▼─────┐               │
│  │ Data     │←────────────────│ QA Agent │               │
│  │ Agent    │                 │ "Test it" │              │
│  │ "Measure │                 └──────────┘               │
│  │ it"      │                                            │
│  └──────────┘                                            │
│                                                          │
│  ORCHESTRATOR: Sprint Planning Agent                     │
│  ESCALATION: Product Owner (Human)                       │
└─────────────────────────────────────────────────────────┘

Câu hỏi BA phải trả lời cho mỗi agent:

  1. Input/output format giữa mỗi cặp agent?
  2. Khi PM Agent và BA Agent disagree → ai wins?
  3. QA Agent phát hiện bug → flow như thế nào?
  4. Data Agent cho thấy feature fail → PM Agent có tự quyết kill feature không?
  5. Timeline: mỗi agent có bao lâu để hoàn thành?

🎮 QUIZ & GAME — Week 10

Quiz (20đ): Orchestration patterns, communication design, conflict resolution

Game: "Orchestration Simulator" (15đ):

  1. Mỗi nhóm 6 người, mỗi người đóng vai 1 agent
  2. Nhận 1 business task phức tạp
  3. Phải "xử lý task" bằng cách trao đổi messages theo protocol đã thiết kế
  4. Moderator inject failures (agent timeout, conflicting data, ambiguous request)
  5. Nhóm hoàn thành task đúng, nhanh, ít escalation nhất = thắng

Trải nghiệm thực tế: Cảm nhận pain khi orchestration kém → appreciate design tốt



MODULE 11: GUARDRAILS & EVALUATION (Week 11)

📰 Case Study Mở Đầu: "Air Canada: Khi Chatbot Hứa Nhầm, Công Ty Phải Trả $800"

Viết theo phong cách Reuters/BBC


Vancouver, Tháng 2/2024. Một phán quyết pháp lý nhỏ tạo ra shockwave lớn: Tòa án British Columbia ra phán quyết Air Canada phải bồi thường khách hàng Jake Moffatt $812.02 vì chatbot AI của hãng đã cung cấp sai thông tin về chính sách hoàn tiền vé.

Chatbot nói Moffatt có thể đặt vé full-price, sau đó apply retroactively cho bereavement fare trong 90 ngày. Thực tế, chính sách Air Canada không cho phép điều này.

Air Canada argue: "Chatbot là một separate legal entity." Tòa reject: "You are responsible for the information your tools provide."

Phán quyết này thay đổi mọi thứ. Mỗi AI Agent output giờ đây là trách nhiệm pháp lý của doanh nghiệp.

Bài học: Guardrails không phải "nice-to-have." Đây là legal requirement và BA phải thiết kế chúng TRƯỚC KHI agent go live.


📚 Nội Dung Bài Giảng

Bài 11.1: Guardrail Architecture

Thời lượng: 60 phút

User Input → [Input Guardrail] → Agent Processing → [Output Guardrail] → User Output
                  │                                          │
                  ▼                                          ▼
           - Content filter                          - Fact checking
           - Prompt injection detect                 - Policy compliance
           - PII detection                          - Tone/brand check
           - Intent classification                  - Confidence threshold

4 Layers of Guardrails:

LayerKiểm tra gìKhi nàoTools
InputPrompt injection, PII, harmful contentTrước khi agent xử lýNeMo Guardrails, custom regex
ReasoningLogic consistency, boundary violationTrong khi agent suy nghĩChain-of-thought audit
OutputFact accuracy, policy compliance, toneTrước khi gửi userSecond LLM review, rule-based
SystemRate limits, cost caps, access controlLuôn luônInfrastructure level

Bài 11.2: Output Validation Framework

Thời lượng: 45 phút

Validation Pipeline:

python
# Pseudocode — BA thiết kế logic, developer implement
def validate_output(agent_output):
    # 1. Fact Check
    if contains_factual_claim(agent_output):
        verify_against_knowledge_base(agent_output)
    
    # 2. Policy Check
    if violates_company_policy(agent_output):
        reject_and_regenerate()
    
    # 3. Tone Check
    if sentiment_score < brand_threshold:
        adjust_tone(agent_output)
    
    # 4. Confidence Check
    if agent_confidence < 0.7:
        add_disclaimer("This information may need verification")
    
    # 5. PII Check
    if contains_pii(agent_output):
        redact_pii(agent_output)
    
    return validated_output

Bài 11.3: Bias Detection & Mitigation

Thời lượng: 45 phút

  1. Types of AI Bias BA cần biết:

    • Selection bias: Training data không đại diện
    • Confirmation bias: Agent ưu tiên info confirm existing belief
    • Recency bias: Gán weight quá lớn cho data gần nhất
    • Anchoring bias: Output bị ảnh hưởng bởi thông tin đầu tiên trong prompt
  2. Bias Audit Framework:

DimensionKiểm traMethodFrequency
GenderOutput khác nhau theo giới tính?A/B test with gendered inputsMonthly
AgeƯu tiên nhóm tuổi nào?Statistical analysisMonthly
RegionBias city vs rural?Cross-region comparisonQuarterly
LanguageChất lượng khác nhau theo ngôn ngữ?Multi-language test setMonthly

Bài 11.4: Evaluation Framework — Đánh Giá Agent Tổng Thể

Thời lượng: 60 phút

RACE Evaluation Framework (do khóa học đề xuất):

DimensionMetricCách đoTarget
ReliabilityUptime, consistency, error rateProduction monitoring> 99.5%
AccuracyFactual correctness, reasoning qualityHuman evaluation + auto tests> 95%
CompliancePolicy adherence, legal safetyCompliance audit100%
EfficiencySpeed, cost, resource usageSystem metricsBeat human baseline

Evaluation Cadence:

TypeFrequencyWhoOutput
Automated testsEvery deploymentCI/CD pipelinePass/Fail report
Spot checksDailyOperations teamException report
Deep evaluationWeeklyBA + QAPerformance dashboard
Full auditMonthlyBA + Compliance + LegalAudit report
User feedback analysisOngoingProduct teamImprovement backlog

🎮 QUIZ & GAME — Week 11

Quiz (20đ): Guardrail layers, bias types, RACE framework

Game: "Red Team Challenge" (15đ):

  1. Nhóm A design guardrails cho 1 AI Agent
  2. Nhóm B cố "break" agent (prompt injection, boundary violation, bias triggering)
  3. Mỗi breach thành công: +2đ cho Red Team, -1đ cho Blue Team
  4. Blue Team fix mỗi breach: +1đ recovery
  5. Swap roles sau 30 phút


MODULE 12: HUMAN-AI COLLABORATION DESIGN (Week 12)

📰 Case Study Mở Đầu: "Google DeepMind x NHS: Human-in-the-Loop Cứu 10,000 Mạng"

Viết theo phong cách The Lancet/Nature


London, 2025. Khi Google DeepMind triển khai AI system phát hiện bệnh thận cấp (Acute Kidney Injury) tại NHS hospitals, phiên bản đầu tiên cho kết quả controversial: accuracy 90% — nghe tốt, nhưng với 10% false positive, bác sĩ bị alert fatigue và bắt đầu ignore cả alerts thật.

Giải pháp không phải tăng accuracy (gần bất khả thi ở thời điểm đó). Giải pháp là redesign cách AI và bác sĩ phối hợp:

  • AI không alert trực tiếp bác sĩ. Alert đến nurse coordinator trước.
  • Nurse coordinator review context → chỉ escalate alert có clinical significance
  • Bác sĩ nhận pre-filtered alerts với AI confidence score + nurse assessment

Kết quả: False positive giảm 70%. Nhưng quan trọng hơn — bác sĩ tin tưởng hệ thống và phản ứng nhanh hơn.

Bài học: AI mạnh nhất khi được thiết kế để phối hợp với người, không thay thế người.


📚 Nội Dung Bài Giảng

Bài 12.1: Human-in-the-Loop (HITL) Design Patterns

Thời lượng: 60 phút

  1. 5 HITL Patterns:
PatternMô tảVí dụCostSafety
Full AutomationAI quyết định 100%Spam filter⭐⭐
Human ApprovalAI đề xuất, người duyệtLoan approval > 1B VND⭐⭐⭐⭐⭐⭐⭐⭐
Human OverrideAI auto, người can thiệp khi cầnSelf-driving car⭐⭐⭐⭐⭐⭐
AI CopilotAI suggest, người quyếtDoctor diagnosis support⭐⭐⭐⭐⭐⭐⭐
Human TrainingNgười feedback, AI họcContent moderation⭐⭐⭐⭐⭐⭐⭐
  1. BA Decision: Chọn Pattern Nào?
IF (risk of error > $10K) AND (reversibility = low)
    → Human Approval

IF (volume > 1000/day) AND (risk < $1K per error)
    → Full Automation with Human Override

IF (domain expertise required) AND (AI accuracy < 95%)
    → AI Copilot

IF (edge cases > 20% of volume)
    → Human Training loop

Bài 12.2: Trust Calibration — Không Quá Tin, Không Quá Nghi

Thời lượng: 45 phút

  1. Automation Bias: Người tin AI quá mức → bỏ qua lỗi rõ ràng
  2. Algorithm Aversion: Người không tin AI → không dùng dù AI đúng
  3. BA thiết kế Trust Calibration:
    • Show confidence score: User biết AI chắc chắn đến đâu
    • Explain reasoning: AI giải thích tại sao đề xuất X
    • Easy override: User có thể reject AI dễ dàng
    • Feedback loop: User feedback → AI improve → User trust tăng

Bài 12.3: Change Management cho AI Agent

Thời lượng: 45 phút

  1. Stakeholder Readiness Assessment:
StakeholderAttitudeConcernMitigation
End usersWorried about job loss"AI sẽ thay tôi?"Training + "AI assists you, doesn't replace you"
ManagersCautious optimism"Ai chịu trách nhiệm khi AI sai?"Clear accountability matrix
Legal/ComplianceConservative"Quy định chưa rõ"Phased rollout + legal review
C-suiteExcited"ROI bao nhiêu? Bao giờ có?"Realistic timeline + KPIs
  1. Rollout Strategy:
    • Phase 1 (Month 1-2): Shadow mode — AI chạy nhưng không output
    • Phase 2 (Month 3-4): Copilot mode — AI suggest, human decides
    • Phase 3 (Month 5-6): Assisted mode — AI decides simple, human decides complex
    • Phase 4 (Month 7+): Autonomous mode — AI decides most, human oversees

Bài 12.4: AI Ethics & Responsibility

Thời lượng: 45 phút

  1. AI Ethics Framework cho BA:
    • Transparency: User có biết đang tương tác với AI không?
    • Fairness: AI có treat mọi user bình đẳng không?
    • Privacy: Data user có được bảo vệ không?
    • Accountability: Khi AI sai, ai chịu trách nhiệm?
    • Consent: User có đồng ý cho AI xử lý data không?

🎮 QUIZ & GAME — Week 12

Quiz (20đ): HITL patterns, trust calibration, change management

Game: "The AI Ethics Tribunal" (15đ):

  1. Mỗi nhóm nhận 1 ethical dilemma thực (VD: AI hiring tool biased against women)
  2. Phải trình bày: Root cause analysis + Mitigation plan + Policy recommendation
  3. "Tribunal" (các nhóm khác) vote: Acceptable / Needs Improvement / Unacceptable

🏆 MILESTONE 3: Multi-Agent Architecture Blueprint (60 điểm)

Yêu cầu:

Dựa trên project từ Milestone 1 & 2, thiết kế hệ thống multi-agent hoàn chỉnh:

DeliverableĐiểmTiêu chí
Agent Registry (≥ 3 agents)10Complete profiles + tool authorization
Orchestration Design15Pattern chosen + justified, workflow defined
Communication Protocol10Message types, conflict resolution, escalation
Guardrail Architecture104-layer guardrails + validation pipeline
HITL Design10Pattern chosen, trust calibration, rollout plan
Evaluation Framework5RACE metrics + cadence defined

Presentation: 15-phút pitch + 10-phút Q&A trước panel