Với khối lượng dữ liệu không ngừng tăng lên, nhiều công ty gặp khó khăn trong việc sử dụng dữ liệu một cách hiệu quả và có được những hiểu biết sâu sắc từ nó. Thông thường các tổ chức này phải chịu gánh nặng với các kiến trúc dữ liệu cồng kềnh và khó bảo trì. Đó là lý do tại sao Google công bố giải pháp DataStream cho BigQuery, hiện đã có sẵn trong bản preview trên Google Cloud Platform. Cùng Cloud Ace tìm hiểu ngay nhé.
Được phát triển với sự hợp tác chặt chẽ với BigQuery của Google Cloud, Datastream mang đến trải nghiệm độc đáo, thực sự liền mạch và dễ sử dụng, cho phép hiểu rõ thời gian thực trong BigQuery chỉ với một vài bước.
Datastream sẽ chèn lấp dữ liệu lịch sử và liên tục sao chép các thay đổi mới khi chúng xảy ra. Và khi các lược đồ cơ sở dữ liệu thay đổi, Datastream xử lý liền mạch các thay đổi trong lược đồ và tự động thêm các bảng và cột mới vào BigQuery.
Doanh nghiệp không phải lãng phí tài nguyên để xây dựng và quản lý các pipeline dữ liệu phức tạp, logic hợp nhất DML phức tạp hoặc chuyển đổi thủ công từ các loại dữ liệu dành riêng cho cơ sở dữ liệu thành các loại dữ liệu BigQuery.
Khai thác sức mạnh của các luồng dữ liệu để phân tích, sao chép cơ sở dữ liệu, di chuyển đám mây và event-driven architectures (kiến trúc hướng sự kiện) trên các môi trường kết hợp. Người dùng có thể đồng bộ hóa trên các cơ sở dữ liệu và ứng dụng một cách đáng tin cậy, với độ trễ thấp và tác động tối thiểu đến hiệu suất nguồn.
Thiết lập, vận hành nhanh chóng và dễ sử dụng với dịch vụ không máy chủ của Google Cloud khi khối lượng dữ liệu thay đổi. Tập trung vào việc thu thập thông tin chi tiết cập nhật từ dữ liệu của doanh nghiệp và phản hồi các vấn đề có mức độ ưu tiên cao.
Kết nối dữ liệu của người dùng với các sản phẩm tích hợp dữ liệu đám mây của Google. Datastream tận dụng các mẫu Dataflow để tải dữ liệu vào BigQuery, Cloud Spanner và Cloud SQL; nó cũng hỗ trợ các đầu nối CDC Replicator của Cloud Data Fusion để tổng hợp dữ liệu dễ dàng hơn bao giờ hết.
Datastream hỗ trợ nhiều phương thức kết nối riêng tư, an toàn để bảo vệ dữ liệu trong quá trình truyền. Dữ liệu cũng được mã hóa khi ở trạng thái nghỉ.
Klook - một nền tảng thương mại điện tử du lịch và giải trí hàng đầu cho trải nghiệm và dịch vụ, xử lý lượng lớn dữ liệu trên nhiều ứng dụng và cơ sở dữ liệu.
Sử dụng BigQuery, nhóm kỹ sư dữ liệu của Klook tạo báo cáo và phân tích hàng ngày cho nhóm quản lý của họ để giúp đưa ra các quyết định kinh doanh tốt hơn.
Trước khi áp dụng Datastream, chúng tôi đã có một nhóm kỹ sư dữ liệu dành riêng cho nhiệm vụ nhập dữ liệu vào BigQuery và chúng tôi đã dành rất nhiều thời gian và nỗ lực để đảm bảo rằng dữ liệu là chính xác. Với Datastream, các nhà phân tích dữ liệu của chúng tôi có thể có sẵn dữ liệu chính xác cho họ trong BigQuery chỉ bằng một cú nhấp chuột đơn giản.
Stacy Zhu, Giám đốc cấp cao về Dữ liệu tại Klook
Cloud Ace - Managed Service Partner của Google Cloud