Asset 15

Giới Thiệu Gemini: Mô Hình AI Lớn Nhất Của Google Cloud

Asset 15

Đứng trước làn sóng mạnh mẽ của Generative AI trong việc ứng dụng vào các hoạt động trong cuộc sống, từ đầu năm nay Google đã tiến hành hợp nhất hai nhóm phát triển AI riêng biệt dưới sự chỉ đạo của CEO Sundar Pichai, nhằm đẩy nhanh quá trình phát triển các mô hình ngôn ngữ lớn như Gemini nhằm bắt kịp với ChatGPT của OpenAI do Microsoft hậu thuẫn, vốn đã trở thành hiện tượng đình đám trong giới công nghê trong năm 2022. Hãy cùng Cloud Ace tìm hiểu về mô hình Gemini này nhé.

Gemini Là Gì?

Theo CEO Sundar Pichai cho biết: Gemini là sự khởi đầu cho một kỷ nguyên AI mới ở Google. Gemini là mô hình ngôn ngữ lớn (LLM) mới nhất, được Sundar Pichai giới thiệu lần đầu tại hội nghị nhà phát triển I/O vào tháng 6 vừa qua và hiện đang ra mắt công chúng.

Gemini được xây dựng từ đầu để trở thành đa phương thức, nghĩa là nó có thể lý luận, vận hành và kết hợp các loại thông tin khác nhau bao gồm văn bản, code, âm thanh, hình ảnh và video.

Gemini về cơ bản là sự kết hợp những ưu điểm của các hệ thống tự học như AlphaGo, với khả năng ngôn ngữ của những chatbot dựa trên các mô hình LLM. Nói theo cách dễ hiểu, Gemini kết hợp khả năng tạo văn bản tương tự như GPT-4 với khả năng tạo hình ảnh từ mô tả văn bản. Điều này sẽ cho phép Google xây dựng các sản phẩm AI đàm thoại như chatbot, phân tích dữ liệu như biểu đồ, tạo đồ họa và thậm chí điều khiển phần mềm bằng các lệnh ngôn ngữ tự nhiên.

Google đã tối ưu hóa phiên bản đầu tiên Gemini 1.0 cho ba kích cỡ khác nhau:

  • - Gemini Ultra: mô hình lớn nhất và năng lực nhất dành cho các tác vụ có độ phức tạp cao.
  • - Gemini Pro: mô hình tốt nhất để mở rộng quy mô trên nhiều loại tác vụ.
  • - Gemini Nano: mô hình hiệu quả nhất dành cho các tác vụ thực hiện trên thiết bị.

Hiệu Suất Gemini

Google cho biết đã thử nghiệm nghiêm ngặt các mô hình Gemini và đánh giá hiệu suất của chúng trên nhiều tác vụ khác nhau. Từ việc nhận biết hình ảnh tự nhiên, âm thanh và video cho đến khả năng tư duy toán học, hiệu suất của Gemini Ultra vượt qua các kết quả hiện đại nhất là 30 trong số 32 tiêu chuẩn học thuật được sử dụng rộng rãi để nghiên cứu và phát triển mô hình ngôn ngữ lớn (LLM).

Với số điểm 90%, Gemini Ultra là mô hình đầu tiên vượt trội hơn các chuyên gia con người về tiêu chuẩn MMLU (Massive Multitask Language Understanding; tạm dịch: Hiểu ngôn ngữ đa nhiệm lớn), bằng cách sử dụng tổ hợp 57 môn học như toán, vật lý, lịch sử, luật, y học và đạo đức để kiểm tra cả kiến ​​thức thế giới và khả năng giải quyết vấn đề.

Gemini Ultra cũng đạt được số điểm cao nhất là 59,4% trên tiêu chuẩn MMMU mới (Massive Multi-discipline Multimodal Understanding, tạm dịch: Hiểu biết lớn về đa phương thức trên đa ngành), bao gồm các tác vụ đa phương thức trải rộng trên các lĩnh vực khác nhau đòi hỏi suy luận có chủ ý.

Ứng dụng thực tế

Google hiện đang ra mắt mô hình này theo một số cách: Bard hiện được cung cấp sức mạnh bởi Gemini Pro. Người dùng điện thoại Pixel 8 Pro sẽ được bổ sung thêm một vài tính năng nhờ Gemini Nano. Còn Gemini Ultra sẽ ra mắt vào năm tới. Các nhà phát triển và khách hàng doanh nghiệp sẽ có thể truy cập Gemini Pro thông qua Google Generative AI Studio hoặc Vertex AI trong Google Cloud bắt đầu từ ngày 13 tháng 12 năm nay.

Gemini hiện chỉ có sẵn bằng tiếng Anh và các ngôn ngữ khác chắc chắn sẽ sớm ra mắt. Giám đốc điều hành Google Sundar Pichai cho biết mô hình này sẽ được tích hợp vào Search Engine của hãng, các công cụ quảng cáo, trình duyệt Chrome cũng như các ứng dụng khác của Google, sử dụng trên toàn thế giới. Đây chính là tương lai của Google.

Tìm hiểu thêm về chương trình ưu đãi Google Cloud Platform tại Cloud Ace's Promotion

Cloud Ace - Managed Service Partner của Google Cloud

  • Trụ sở: Tòa Nhà H3, Lầu 1, 384 Hoàng Diệu, Phường 6, Quận 4, TP. HCM.
  • Văn phòng đại diện: Tầng 2, 25t2 Hoàng Đạo Thúy, Phường Trung Hoà, Quận Cầu Giấy, Thành phố Hà Nội.
  • Email: sales.vn@cloud-ace.com
  • Hotline: 028 6686 3323
  • Website: https://vn.cloud-ace.com/

Tin tức liên quan

Shopping Basket
viVietnamese