Skip to content

Lựa chọn Model — AI tạo đánh giá

Hạng mụcNội dung
Trạng thái🟡 Đang thảo luận
Liên quanAI tạo đánh giá

1. Tổng quan lựa chọn

Hệ thống sử dụng 2 model cho 2 mục đích khác nhau, cùng 1 API key duy nhất:

Mục đíchModelLý do chọn
Tạo đánh giá (generate)Claude Sonnet 4Chất lượng tiếng Nhật tốt nhất trong tầm giá
Kiểm tra chất lượng (quality check)Claude Haiku 4.5Nhanh, rẻ, đủ cho phán định JSON

2. So sánh chi tiết các model

2.1 Bảng so sánh

ModelProviderInputOutputChi phí/件Chất lượng JPLatencyKhuyến nghị
Claude Sonnet 4Anthropic$3.00/1M$15.00/1M~¥0.5◎ Xuất sắc~5-10sDùng cho generate
Claude Haiku 4.5Anthropic$0.80/1M$4.00/1M~¥0.1○ Tốt~1-2sDùng cho quality check
Claude Opus 4Anthropic$15.00/1M$75.00/1M~¥2.5◎ Xuất sắc~10-15sQuá đắt cho use case này
GPT-4oOpenAI$2.50/1M$10.00/1M~¥0.4◎ Xuất sắc~3-5sThay thế nếu cần đổi provider
GPT-4o miniOpenAI$0.15/1M$0.60/1M~¥0.03△ Trung bình~1sChất lượng JP không đủ
Gemini 2.5 FlashGoogle$0.15/1M$0.60/1M~¥0.03○ Tốt~1-2sThay thế Haiku nếu cần rẻ hơn

2.2 Tại sao chọn Claude Sonnet 4 cho generate?

Tiêu chíSonnet 4GPT-4oLý do chọn Sonnet
Chất lượng tiếng NhậtTương đương, nhưng Sonnet tốt hơn ở văn phong đa dạng
Kính ngữ (丁寧語)Chính xácĐôi khi lỗiQuan trọng cho tone 丁寧
Tuân thủ promptRất tốtTốtÍt bỏ qua ràng buộc (số ký tự, keyword)
Chi phí$3+$15/1M$2.5+$10/1MSonnet đắt hơn ~20% nhưng chất lượng ổn định hơn
Prompt cachingCó (giảm ~90% input cost)Cả hai đều hỗ trợ

Kết luận: Sonnet 4 được chọn vì chất lượng kính ngữ và tuân thủ prompt tốt hơn — hai yếu tố quan trọng nhất cho tạo đánh giá tiếng Nhật.

2.3 Tại sao chọn Claude Haiku 4.5 cho quality check?

Tiêu chíHaiku 4.5Sonnet 4Lý do chọn Haiku
Latency1-2s3-5sQuality check nằm trong flow đồng bộ, cần nhanh
Chi phí¥0.04/件¥0.2/件Check được gọi mỗi lần generate (kể cả retry)
Đủ cho phán địnhChỉ cần trả JSON điểm số, không cần văn xuôi

Kết luận: Haiku đủ cho "đánh giá đúng/sai" và trả JSON. Dùng Sonnet cho check sẽ tốn gấp 5x mà không cải thiện đáng kể.


3. Chi phí vận hành

3.1 Chi phí trên mỗi review

BướcModelTokens (ước tính)Chi phí
Generate reviewSonnetInput ~150 + Output 400~¥0.4
Quality check (LLM part)HaikuInput 500 + Output 150~¥0.04
Tổng (không retry)~¥0.44
Tổng (trung bình 1.2 retry)~¥0.55

Input ~150 tokens (tên mục + số sao + keyword + tone) — giảm mạnh so với thiết kế cũ (~800 tokens) nhờ prompt chỉ gửi 1 mục thay vì toàn bộ survey.

3.2 Chi phí hàng tháng

Quy môSố件/thángChi phí/thángGhi chú
Nhỏ50~¥281-2 cửa hàng
Trung bình200~¥1105-10 cửa hàng
Lớn1,000~¥55020+ cửa hàng

3.3 Tối ưu chi phí

Phương phápTiết kiệmĐã áp dụng?
Hybrid quality check (skip LLM khi rule-based fail)~20% chi phí check✅ Có
Prompt tối giản (chỉ 1 mục + keyword + tone, không gửi survey)~80% input cost generate✅ Có
Prompt caching (cùng system prompt)~90% input cost cho generate⬜ Sau này

4. Cấu hình theo môi trường

Môi trườngGenerateQuality CheckGhi chú
ProductionSonnet 4Haiku 4.5Chất lượng tối ưu
StagingHaiku 4.5Haiku 4.5Tiết kiệm, test flow
DevelopmentHaiku 4.5Haiku 4.5Nhanh, rẻ, lặp lại nhiều
php
// .env.production
REVIEW_GENERATE_MODEL=claude-sonnet-4-20250514
REVIEW_CHECK_MODEL=claude-haiku-4-5-20251001

// .env.staging / .env.development
REVIEW_GENERATE_MODEL=claude-haiku-4-5-20251001
REVIEW_CHECK_MODEL=claude-haiku-4-5-20251001

5. Khi nào cần đổi model?

Tình huốngHành động
Anthropic ra Sonnet mới (ví dụ Sonnet 4.5)Đổi REVIEW_GENERATE_MODEL, test chất lượng JP
Chi phí vượt budgetChuyển generate sang Haiku, chấp nhận giảm chất lượng
Chất lượng JP không đạtThử GPT-4o làm generate model
Cần đổi provider hoàn toànChỉ sửa AnthropicApiServiceOpenAIApiService, logic không đổi
Latency quá chậmChuyển check sang Gemini Flash

Thiết kế cho phép đổi model bằng config, không cần sửa code logic. Chỉ cần thay model ID trong .env.


6. API Key

MụcNội dung
Số key cần1 key duy nhất
Dùng choTất cả model (Sonnet, Haiku, Opus...)
ConfigANTHROPIC_API_KEY trong .env
Tạo tạiconsole.anthropic.com
BillingChung 1 account, tính theo usage từng model