Skip to content

Thiết kế hạ tầng

Tổng quan

Cấu trúc hạ tầng và thông tin môi trường của dịch vụ GMAC MEO. Hệ thống bao gồm 2 thành phần: ứng dụng GMAC (dịch vụ Web) và chương trình scraping (xử lý batch).

Danh sách môi trường

Môi trườngMục đíchGhi chú
Môi trường phát triển (dev)Phát triển & xác nhận hoạt độngLaradock (Docker)
Môi trường staging (staging)Kiểm tra & thử nghiệm
Môi trường production (prod)Vận hành
Môi trường mirror production (staging.prod-mirror)Kiểm tra với dữ liệu production

Môi trường OEM

Môi trườngMục đích
GCOR ProductionDịch vụ OEM cho GCOR
PIPIT ProductionDịch vụ OEM cho PIPIT
KUCHIKOMI-ONEPhiên bản chuyên đánh giá

Cấu trúc GMAC Server

MụcCông nghệ
Web ServerNginx
Ứng dụngPHP 7.1.3+ / Laravel 5.7
FrontendVue.js 2.6 SPA
Cơ sở dữ liệuMySQL 8+ (cấu hình Read/Write Replica)
Cache/SessionRedis
Lưu trữ fileAWS S3
ContainerDocker (Laradock)
Build toolLaravel Mix (Webpack)

Cấu trúc Scraping Server

MụcCông nghệ
Ngôn ngữPython 3.10
FrameworkDjango 5.0.2
Tự động hóa trình duyệtPlaywright 1.41.2 (Chromium)
Dự phòngSelenium 4.15.0 + undetected-chromedriver
Màn hình ảoXvfb
Quản lý processsupervisord
WSGI ServerGunicorn 21.2.0
ContainerDocker (Python 3.10-slim)

Cấu trúc AWS

Dịch vụMục đích
S3Lưu trữ ảnh chụp màn hình và file (bucket riêng cho mỗi hệ thống)
LambdaKhởi động job scraping theo lịch
BatchThực thi job scraping (56 job: 28 normal + 28 reverse)

Liên kết dịch vụ bên ngoài

Dịch vụMục đích
Google Business Profile APIQuản lý location, đánh giá, bài đăng
Google OAuthXác thực người dùng
Google SearchĐối tượng scraping thứ hạng MEO
Instagram APILiên kết mạng xã hội
Slack WebhookThông báo lỗi, thông báo tóm tắt thực hiện
OpenAI APITự động tạo tóm tắt bài đăng

Sơ đồ cấu trúc hệ thống