Nhanh hơn, rẻ hơn: Google đang muốn gì với Gemini 3 Flash?

08:00 | 20/12/2025 Lê Minh

Gemini 3 Flash được Google định vị là mô hình cân bằng giữa hiệu suất suy luận và chi phí, hướng tới việc triển khai AI ở quy mô lớn.

Gemini Live lột xác với giọng nói AI linh hoạt như người thật Google công bố Gemini 3 với khả năng tự lên kế hoạch và xử lý tác vụ đa bước

Google vừa công bố Gemini 3 Flash, phiên bản mới của mô hình trí tuệ nhân tạo Gemini, được thiết kế để tối ưu tốc độ xử lý và chi phí sử dụng. Theo hãng, mô hình này hoạt động nhanh gấp ba lần Gemini 2.5 Pro và sử dụng ít hơn khoảng 30% lượng token trong các tác vụ suy luận, giúp giảm đáng kể chi phí tổng thể.

Nhanh hơn, rẻ hơn: Google đang muốn gì với Gemini 3 Flash?

Gemini 3 Flash được phát triển dựa trên nền tảng Gemini 3 ra mắt trước đó và hiện đã trở thành mô hình mặc định trong ứng dụng Gemini trên toàn cầu, đồng thời được triển khai trong chế độ AI Mode của Google Tìm kiếm, thay thế phiên bản Gemini 2.5 Flash. Google định vị Flash là lựa chọn phù hợp cho các quy trình làm việc cần phản hồi nhanh và lặp lại, bao gồm phân tích video, trích xuất dữ liệu, hỏi đáp trực quan và xử lý thông tin đa phương thức.

Theo công bố từ Google, Gemini 3 Flash kế thừa năng lực suy luận của dòng Pro nhưng được tinh chỉnh để phục vụ các tác vụ có độ trễ thấp. Trong các bài kiểm tra hiệu năng, mô hình đạt kết quả cao trên nhiều thang đo chuyên sâu, cho thấy khả năng xử lý các bài toán phức tạp tương đương những hệ thống AI hàng đầu hiện nay.

Về tốc độ, các đánh giá độc lập cho thấy Gemini 3 Flash nhanh gấp ba lần so với Gemini 2.5 Pro. Nhờ khả năng điều chỉnh mức độ “tư duy” linh hoạt theo từng nhiệm vụ, mô hình này cũng tiêu thụ ít hơn trung bình 30% token trong các tác vụ hàng ngày. Trên SWE-bench Verified – bộ kiểm thử đo lường khả năng viết phần mềm của AI – Gemini 3 Flash đạt 78%, vượt qua Gemini 3 Pro và Gemini 2.5 Flash, chỉ xếp sau GPT-5.2.

Đối với các nhà phát triển, Google áp dụng mức giá 0,50 USD cho một triệu token đầu vào và 3 USD cho một triệu token đầu ra. Theo bà Tulsee Doshi, Giám đốc cấp cao phụ trách các mô hình Gemini tại Google, Flash được định vị là mô hình “mạnh mẽ và đáng tin cậy”, đặc biệt phù hợp với những doanh nghiệp cần xử lý khối lượng công việc lớn với chi phí thấp hơn.

Với người dùng phổ thông, Gemini 3 Flash được nâng cấp mạnh về khả năng nhận diện và phản hồi nội dung đa phương thức. Người dùng có thể tải lên hình ảnh, video ngắn hoặc bản ghi âm để hệ thống phân tích và đưa ra gợi ý phù hợp. Mô hình cũng hiểu rõ hơn ý định trong các truy vấn phức tạp và trình bày kết quả dưới dạng trực quan, kết hợp hình ảnh và bảng biểu.

Một điểm nhấn khác là khả năng hỗ trợ thiết kế nguyên mẫu ứng dụng trực tiếp trong ứng dụng Gemini. Thông qua các câu lệnh mô tả bằng văn bản hoặc giọng nói, người dùng có thể nhanh chóng tạo ra bản mẫu thử nghiệm mà không cần kiến thức lập trình chuyên sâu.

Việc Google phát hành Gemini 3 Flash diễn ra trong bối cảnh cuộc cạnh tranh AI ngày càng gay gắt. Trước đó, OpenAI cũng công bố GPT Image 1.5 – mô hình tạo ảnh mới với tốc độ nhanh hơn và khả năng chỉnh sửa chính xác hơn. Động thái liên tiếp từ các “ông lớn” cho thấy nỗ lực đẩy nhanh quá trình phổ cập AI thế hệ mới, đồng thời cạnh tranh trực diện về hiệu suất và chi phí trên thị trường trí tuệ nhân tạo tạo sinh.

Đường dẫn bài viết: https://thoibaonganhang.vn/nhanh-hon-re-hon-google-dang-muon-gi-voi-gemini-3-flash-175420.htmlIn bài viết