Asset 15

Cách tính chi phí AI trên Google Cloud

Asset 15

Việc đầu tư vào AI không chỉ là một bước tiến công nghệ mà còn là một quyết định tài chính quan trọng. Để đảm bảo doanh nghiệp khai thác tối đa giá trị từ AI, người dùng cần hiểu rõ và quản lý hiệu quả chi phí trên Google Cloud. Hãy cùng Cloud Ace tìm hiểu nhé.

Google Cloud cung cấp một hệ sinh thái AI phong phú với nhiều mô hình giá khác nhau. Nếu không có chiến lược quản lý phù hợp, doanh nghiệp có thể gặp phải tình trạng vượt ngân sách hoặc dự án bị trì hoãn. Chính vì vậy, Google CloudCloud Ace giúp người dùng tiếp cận AI một cách toàn diện, từ việc dự đoán chi phí đến tối ưu hóa hiệu suất, nhằm đảm bảo việc đầu tư AI mang lại hiệu quả tối đa.

Phân tích Tổng chi phí sở hữu (TCO) cho AI trên Google Cloud

Loại

Mô tả

Google Cloud Service (ví dụ)

Model serving cost

 

Chi phí vận hành mô hình AI đã được training để đưa ra các dự đoán (suy luận). Thường tính theo số yêu cầu hoặc theo đơn vị thời gian.

Các mô hình có sẵn trong Vertex AI, Vertex AI Prediction, GKE (nếu tự quản lý), Cloud Run Functions (cho suy luận không cần máy chủ).

Training & tuning costs

Chi phí huấn luyện mô hình AI trên dữ liệu và tinh chỉnh để đạt hiệu suất tối ưu. Gồm tài nguyên tính toán (GPU/TPU) và có thể cả chi phí của chính dữ liệu training.

Vertex AI Training, Compute Engine (với GPU/TPU), GKE hoặc Cloud Run (với GPU/TPU).

Cloud hosting costs

Chi phí hạ tầng cơ bản để vận hành ứng dụng AI, bao gồm tính toán, networking và lưu trữ.

Compute Engine, GKE or Cloud Run, Cloud Storage, Cloud SQL (nếu ứng dụng sử dụng cơ sở dữ liệu)

Training data storage & adapter layers costs

Chi phí lưu trữ dữ liệu training và các "layer thích ứng" (biểu diễn trung gian hoặc thành phần mô hình được tinh chỉnh) trong quá trình training.

Cloud Storage, BigQuery

 

Application layer and setup costs

Chi phí cho các dịch vụ đám mây bổ sung hỗ trợ ứng dụng AI, như API gateways, cân bằng tải, công cụ giám sát, etc.

Cloud Load Balancing, Cloud Monitoring, Cloud Logging, API Gateway, Cloud Functions (để hỗ trợ logic)

Operational support cost

Chi phí duy trì và hỗ trợ mô hình AI, gồm giám sát hiệu suất, khắc phục sự cố và có thể phải training lại mô hình theo thời gian.

Google Cloud Support, thời gian nhân sự nội bộ, các công cụ giám sát của bên thứ ba

Làm thế nào để ước lượng chi phí?

Ví dụ: 

  • 🔹 Model: Tinh chỉnh một mô hình ngôn ngữ có độ trễ thấp (trong trường hợp này, sử dụng Gemini 1.5 Flash).
  • 🔹 Training Data: 1 triệu cuộc hội thoại hỗ trợ khách hàng (dữ liệu văn bản).
  • 🔹 Traffic: 100.000 lượt tương tác chatbot mỗi ngày.
  • 🔹 Lưu trữ & triển khai: Sử dụng Vertex AI Prediction để phục vụ mô hình.
  • 🔹 Tần suất chỉnh: Hàng tháng.

1. Xác định chi phí triển khai mô hình

Dịch vụ Vertex AI Prediction (Gemini 1.5 Flash for Chat) áp dụng mô hình giá theo từng loại dữ liệu. Trong trường hợp này, cả đầu vào và đầu ra đều là văn bản, nên đơn vị tính sẽ là số ký tự.

Ví dụ: Trung bình 1.000 ký tự đầu vào và 500 ký tự đầu ra mỗi lần tương tác.

  • Chi phí đầu vào: $0.0375/1 triệu ký tự.
  • Chi phí đầu ra: $0.15/1 triệu ký tự.

➡️ Chi phí:

  • Chi phí đầu vào: 100.000 lượt tương tác * 1.000 ký tự * $0.0375 / 1.000.000 = $3.75/ngày
  • Chi phí đầu ra: 100.000 lượt tương tác * 500 ký tự * $0.15 / 1.000.000 = $7.5/ngày
  • Tổng chi phí triển khai mô hình mỗi ngày: $11.25
  • Tổng chi phí triển khai mô hình mỗi tháng (~30 ngày): ~$337
Servicing cost of Gemini Flash 1.5 LLM model

2. Xác định chi phí đào tạo và tinh chỉnh

Quá trình training và tinh chỉnh sử dụng 1 triệu cuộc hội thoại trước đây để giúp mô hình tạo ra các phản hồi chính xác và tùy chỉnh hơn.

Chi phí tinh chỉnh:

  • Chi phí huấn luyện trên mỗi triệu token: $8
  • Chi phí huấn luyện trên mỗi triệu ký tự: $2 (vì mỗi token tương đương khoảng 4 ký tự)

➡️ Chi phí:

  • Tháng đầu tiên (tinh chỉnh ban đầu với 1 triệu cuộc hội thoại):
    1.000.000 cuộc hội thoại * 1.500 ký tự (đầu vào + đầu ra) * $2 / 1.000.000 = $3.000
  • Các tháng tiếp theo (tinh chỉnh với dữ liệu mới - 100.000 cuộc hội thoại):
    100.000 cuộc hội thoại * 1.500 ký tự (đầu vào + đầu ra) * $2 / 1.000.000 = $300

3. Chi phí lưu trữ trên cloud

Vì sử dụng Vertex AI Prediction, nên cơ sở hạ tầng được Google Cloud quản lý và chi phí đã được tính vào giá theo yêu cầu.

Nếu doanh nghiệp tự quản lý mô hình trên GKE hoặc Compute Engine, cần tính thêm chi phí máy ảo (VM), GPU/TPU (nếu sử dụng) và chi phí mạng.

Tuy nhiên, trong ví dụ này, ta giả định chi phí này bằng $0, vì đã bao gồm trong giá của Vertex AI.

4. Chi phí lưu trữ dữ liệu và các layer thích ứng

Chi phí lưu trữ dữ liệu thường không đáng kể ở quy mô trung bình. Trong hệ thống conversation AI, việc lưu trữ dữ liệu training và các tầng adapter cho mô hình tinh chỉnh chỉ chiếm một phần nhỏ trong tổng chi phí.

Chi phí lưu trữ dữ liệu huấn luyện:

  • 1 triệu cuộc hội thoại, mỗi cuộc trung bình 5KB → tổng dữ liệu khoảng 5GB.
  • Chi phí Cloud Storage cho 5GB: $0.1/tháng

Chi phí lưu trữ mô hình tinh chỉnh (adapter layers):

  • Trọng số mô hình tinh chỉnh chiếm thêm khoảng 1GB.
  • Chi phí Cloud Storage cho 1GB: $0.02/tháng
  • ➡️ Tổng chi phí lưu trữ mỗi tháng: < $1/tháng

5. Chi phí thiết lập và application layer

Chi phí này phụ thuộc vào ứng dụng cụ thể. Trong trường hợp này, chúng ta sử dụng Cloud Run Functions và Logging để xử lý trước và sau các yêu cầu chatbot (ví dụ: định dạng dữ liệu, truy vấn cơ sở dữ liệu). Với mô hình tính phí theo số lượng yêu cầu, doanh nghiệp chỉ bị tính phí khi có yêu cầu được xử lý.

➡️ Chi phí Cloud Run:

  • Số lượng yêu cầu: 100.000 lượt/ngày * 30 ngày = 3 triệu yêu cầu/tháng
  • Thời gian xử lý trung bình: 1 giây/yêu cầu
  • Chi phí ước tính: $14.30/tháng

Để theo dõi hiệu suất chatbot và xử lý lỗi, ta sử dụng Cloud Logging & Monitoring.

➡️ Chi phí Cloud Logging & Monitoring:

  • Dung lượng log: 100GB/tháng (mức cao)
  • Thời gian lưu trữ log: 3 tháng
  • Chi phí ước tính: $28/tháng

➡️ Tổng chi phí application layer mỗi tháng: $40

Cloud Run function cost for request-based billing
Cloud Logging costs for storage and retention

6. Chi phí vận hành

Phụ thuộc vào quy mô và trách nhiệm của đội ngũ nội bộ. Giả sử ước tính là một kỹ sư dành 5 giờ mỗi tuần để giám sát và bảo trì chatbot, với mức lương theo giờ là $100.

  • Tổng chi phí hỗ trợ vận hành hàng tháng:
    5 giờ/tuần * 4 tuần/tháng * $100/giờ = $2,000

Loại

Tháng đầu tiên ($)

Tháng tiếp theo ($)

Chi phí phục vụ

340

340

Chi phí đào tạo

3,000

300

Chi phí lưu trữ

1

1

Chi phí ứng dụng

40

40

Chi phí vận hành

2,000

2,000

Tổng

5,381

2,681

  •  

Cloud Ace - Managed Service Partner của Google Cloud

  • Trụ sở: Tòa Nhà H3, Lầu 1, 384 Hoàng Diệu, Phường 6, Quận 4, TP. HCM.
  • Văn phòng đại diện: Tầng 2, 25t2 Hoàng Đạo Thúy, Phường Trung Hoà, Quận Cầu Giấy, Thành phố Hà Nội.
  • Email: sales.vn@cloud-ace.com
  • Hotline: 028 6686 3323
  • Website: https://vn.cloud-ace.com/

Tin tức liên quan

Shopping Basket
viVietnamese