Khả năng lập kế hoạch chiến lược dựa trên phân tích dữ liệu do đào tạo về GCP mang lại

DWABGO.Ci.,
Ông Masahiro Kiura, thành viên Nhóm xây dựng nền tảng số, Bộ phận dịch vụ quản lý dữ liệu Dwango, Phòng phát triển dịch vụ của công ty DWANGO Co., Ltd.
Ông Masahiro Kiura, thành viên Nhóm xây dựng nền tảng số, Bộ phận dịch vụ quản lý dữ liệu Dwango, Phòng phát triển dịch vụ của công ty DWANGO Co., Ltd.

Nhắm đến việc xây dựng chiến lược cho các cơ sở phân tích, DWANGO Co., Ltd. đã tham dự khóa học “Theo dõi và kỹ thuật hóa dữ liệu” (Kỹ thuật hóa dữ liệu trên nền tảng đám mây của Google, Google Cloud Platform, gọi tắt là GCP) - đây là một trong những khóa đào tạo chuyên đề được chứng nhận bởi Google Cloud do công ty Cloud Ace cung cấp.

Chuyên đề đào tạo này cung cấp những chỉ dẫn về thiết kế hệ thống xử lý dữ liệu bằng GCP, xây dựng đường ống dữ liệu đầu cuối, phân tích dữ liệu và tìm hiểu các phương thức thực hành Máy học.

Chúng tôi đã có buổi trao đổi với ông Masahiro Kiura, thuộc nhóm xây dựng nền tảng số, thuộc Bộ phận dịch vụ quản lý dữ liệu Dwango của Phòng phát triển dịch vụ.

Xin anh cho biết đôi nét về DWANGO Co., Ltd.

Anh Kiura: DWANGO là công ty cung cấp dịch vụ có tên gọi “niconico” cho khách hàng cá nhân, khởi đầu với “niconico douga” (chuyên về phim ảnh) và “niconico live” (các chương trình phát sóng trực tiếp"). Đồng thời, vào tháng 11 năm 2018, chúng tôi đã cho ra mắt game Tekutekutekuteku cho điện thoại thông minh, sử dụng định vị và AR.

Nhóm xây dựng nền tảng số mà tôi đang làm việc nhắm đến việc cung cấp dịch vụ “niconico douga” và “niconico live” như là một cơ sở lưu trữ và phân tích các bản ghi được tập hợp từ các dịch vụ cho gia đình, giúp nhà chiến lược và nhà điều hành của mọi lĩnh vực ngành nghề có thể tiếp cận và tận dụng dữ liệu để đưa ra những dự đoán thị trường và kế hoạch đúng đắn.

Các bản ghi như đề cập ở trên bắt nguồn từ nhiều trang web và có đến hơn 100 loại, nên khối lượng dữ liệu tích lũy được là rất đáng kể. Nhưng chúng tôi cần xâu chuỗi và xem xét làm thế nào để tăng tốc độ tải và tổng hợp dữ liệu, giúp nhân viên phụ trách nội bộ có thể truy cập kết quả phân tích nhanh hơn. Hơn nữa, hằng ngày có một số lượng khổng lồ dữ liệu bản ghi đi tích lũy, vì thế việc xử lý hàng loạt cũng mất khá nhiều thời gian. Nhiệm vụ của chúng tôi vì vậy bao gồm cả việc lên kế hoạch thực hiện một cách hiệu quả với chi phí thấp.

Vì sao công ty anh quyết định sử dụng GCP

Anh Masahiro Kiura chụp hình với áp phích của Đại hội niconico năm 2018
Anh Masahiro Kiura chụp hình với áp phích của Đại hội niconico năm 2018

Anh Kiura: Thật ra thì chúng tôi chưa sử dụng GCP. Cơ sở phân tích của chúng tôi đang trong giai đoạn xây dựng chiến lược phát triển. Ngoài GCP, các dịch vụ đám mây khác như AWS hay Azure v.v. đều có thể trở thành “nguyên liệu" cho cơ sở phân tích của chúng tôi trong tương lai.

Do đó, có nhiều phương án được đưa ra, và khả năng tiếp tục vận hành theo giải pháp cục bộ On-premise cũng không hẳn là bằng 0. Nếu sử dụng dịch vụ đám mây thì cấu hình như thế nào là phù hợp? GCP hay AWS, Azure? Nếu sử dụng GCP thì kiến trúc nào là tốt nhất? Kể từ tháng 8 năm 2018, chúng tôi vẫn đang nỗ lực thực hiện các phương án khác nhau để quyết định hướng đi trong tương lai.

Tuy nhiên, tôi cho rằng GCP dễ sử dụng với những BigQuery đơn giản và có khả năng phân tích nhanh, cũng như với các yếu tố cấu thành xung quanh. Khi tham dự khóa đào tạo, tôi nhận thấy điểm mạnh áp đảo của GCP là cho dù dữ liệu lớn ở cấp độ Terabyte hay Petabyte thì quá trình xử lý và truy xuất kết quả cũng chỉ mất vài giây.

Ngoài ra, có thêm một phương án nữa đó là kết hợp sử dụng On-premise và đám mây, nhưng cá nhân tôi thấy rằng, so với việc sử dụng cấu hình lai tạo như vậy, việc đưa toàn bộ cơ sở phân tích lên GCP có thể hạn chế được những lỗi sai do người thao tác cũng như tiết kiệm chi phí hơn.

Tại sao anh quyết định tham dự khóa đào tạo?

Tôi quyết định tham gia khóa đào tạo kéo dài bốn ngày không chỉ để thu thập thông tin mà còn để tiếp cận những thông tin chuyên ngành. Hiện nay, việc đào tạo qua Internet đã trở nên khả dĩ. Tuy nhiên, đào tạo trực tiếp có lợi thế lớn là giảng viên hướng dẫn có thể trả lời các câu hỏi của học viên một cách trực quan và dễ hiểu hơn.

Trong số các công ty đào tạo hiện nay, tôi chọn Cloud Ace vì quá trình học hoàn toàn bằng tiếng Nhật, đồng thời các giảng viên đào tạo cũng như các nhân viên khác của Cloud Ace đã đạt được trình độ GCP, tích lũy nhiều kiến ​​thức và kỹ năng nâng cao. Vì vậy tôi cảm thấy an tâm khi bắt đầu học tại Cloud Ace.

Trên thực tế, tôi đã có được những thông tin hữu ích phù hợp với trình độ kiến thức và kỹ năng của tôi thông qua khóa đào tạo này. Ví dụ, khi tôi đặt câu hỏi về cách tối ưu để chuyển cơ sở phân tích của công ty chúng tôi lên GCP, thì tôi đã nhận được câu trả lời rất chi tiết và chính xác. Vì vậy, tôi cảm thấy đây là khóa học rất hữu ích!

Đặc biệt là trong lần này, mục đích tham gia của tôi không đơn thuần là nghe "hướng dẫn sử dụng", mà chủ yếu là thu thập thông tin nên làm thế nào khi ứng dụng GCP vào nghiệp vụ thực tiễn, và khóa học của Cloud Ace đã đáp ứng được yêu cầu của tôi. Tôi đã từng tham dự những khóa đào tạo của các công ty khác, nhưng khóa đào tạo của Cloud Ace có ý nghĩa hơn cả vì tôi đã có được những lời giải đáp thấu đáo hơn sau khi tham gia khóa học.

Ví dụ, trong trường hợp ban chiến lược và ban điều hành muốn tiến hành phân tích dữ liệu, chúng tôi sẽ sử dụng phần mềm trung gian nguồn mở "Hadoop" như một cơ sở tích lũy và phân tích đối với những dữ liệu quy mô lớn. Vì vậy tôi đã thử hỏi trường hợp nếu tôi đưa lên GCP thì nên tiến hành quản lý quyền truy cập như thế nào. Với câu hỏi đi vào chi tiết như thế, tôi vẫn nhận được câu trả lời đầy đủ và sát thực tiễn.

Khóa đào tạo chỉ kéo dài bốn ngày, nhưng tôi nghĩ thời gian như vậy là vừa đủ. Sẽ là quá ngắn nếu chỉ gói gọn trong một ngày, và nếu dài hơn bốn ngày thì không phù hợp. Có một số học viên đã đặt câu hỏi và được trả lời vào ngày hôm đó, nhưng cũng có những câu hỏi được hẹn trả lời vào hôm sau vì cần được điều tra thêm. Bằng cách này mà tôi cảm thấy hoàn toàn tin tưởng vào những câu trả lời từ giảng viên. Ngoài ra, giờ thực hành tại chỗ cũng rất hữu ích vì tôi có thể kiểm tra ngay những kiến thức mà tôi vừa thu thập được.

Xin hãy chia sẻ về phát triển sau đào tạo và các vấn đề cũng như kỳ vọng trong tương lai của công ty anh

Anh Kiura: Một trong những mục đích của khóa đào tạo này là có thể ước tính chi phí phát sinh nếu chúng tôi chuyển cơ sở phân tích dữ liệu sang GCP. Hiện tại, có thể mất vài ngày để cung cấp một bản ghi trên cơ sở phân tích. Nếu nó được giảm xuống một ngày hoặc một giờ bằng cách đưa nó vào GCP, thời giờ làm việc của chúng tôi cũng được rút ngắn. Đó là điều chúng tôi đang nhắm đến điều đó trong tương lai.

Ví dụ, bằng cách sử dụng GCP, nếu kết quả xử lý của BigQuery được trả về sau vài giây, thì không chỉ mang lại lợi ích lớn cho nguồn nhân lực phụ trách phân tích dữ liệu của chúng tôi mà có lợi trong trường hợp ban chiến lược và ban điều hành muốn phân tích và nghiên cứu.

Ngoài ra, đào tạo về kỹ thuật hóa dữ liệu rất hữu ích cho việc sử dụng GCP, nhưng tôi nghĩ sẽ dễ dàng hơn, nếu có thể sử dụng các thành phần và thiết bị trung gian ngoại vi khi sử dụng các thành phần liên quan đến kỹ thuật hóa dữ liệu.

Do đó, trong tương lai, chúng tôi cũng sẽ tham gia các khóa đào tạo không thuộc phạm vi kỹ thuật hóa dữ liệu, và chúng tôi muốn tạo ra một cơ sở phân tích dữ liệu mượt mà hơn, mạnh mẽ hơn và hiệu quả chi phí hơn.

Lần này chỉ có mình tôi tham gia, nhưng tôi muốn các thành viên khác thuộc nhóm phụ trách cơ sở phân tích cũng được tham gia khóa đào tạo. Tôi hy vọng rằng những gì họ học được sẽ giúp tăng hiệu quả làm việc cho cả nhóm.

Ngoài ra, nếu nhân viên các phòng ban khác muốn sử dụng GCP trong tương lai, tôi có thể giới thiệu viên cho họ về khóa học của Cloud Ace. Trên thực tế, tôi đã từng nghe các phòng ban khác đưa ra phản hồi và gợi ý về các khóa đào tạo.

Công nghệ đám mây đang phát triển từng ngày, vì vậy cần tiếp tục chọn lựa và đào thải công nghệ một cách linh hoạt, nhưng không quên cân bằng chi phí dành cho việc thay đổi vận hành và cân nhắc lợi ích. Thông qua khóa học này, tôi nhận ra nhiều cánh cửa được hé mở, đem đến nhiều chọn lựa khả dĩ hơn.

Đây là bản dịch của một bài báo được xuất bản bởi Cloud Ace, Inc.Có sẵn trực tuyến: GCP トレーニングによってもたらされた、データ分析基盤の戦略立案における可能性