Trải nghiệm Gemini trong Chrome: bước đi nhỏ cho người dùng, nhưng là tín hiệu lớn từ Google

Đây là lần đầu tiên một AI của Google có thể quan sát trực tiếp nội dung trên trình duyệt và phản hồi theo thời gian thực ngay bên trong môi trường web.

Cách hoạt động của Gemini trong Chrome

Thay vì phải truy cập website riêng biệt của Gemini, người dùng giờ đây chỉ cần nhấn vào biểu tượng Gemini nằm ở góc trên bên phải của Chrome để bắt đầu cuộc trò chuyện. Tính năng này cho phép chat trực tiếp mà không cần rời khỏi tab đang mở. Đặc biệt, Gemini có thể “nhìn thấy” nội dung hiển thị trên màn hình trình duyệt, từ đó đưa ra phản hồi dựa trên những gì đang diễn ra. Tuy nhiên, hiện tính năng chỉ khả dụng với người dùng gói AI Pro hoặc Ultra và cần sử dụng Chrome ở phiên bản Beta, Dev hoặc Canary.

Một trong những điểm mạnh của Gemini trên Chrome là khả năng xử lý nội dung đang hiển thị. Người dùng có thể yêu cầu tóm tắt một trang web, nhận dạng vật dụng trong video YouTube hoặc trích xuất công thức nấu ăn từ một đoạn clip đang phát. Tính năng này còn hỗ trợ truy vấn sản phẩm liên quan trong các kết quả tìm kiếm mua sắm như trên Amazon, giúp mang lại sự tiện lợi lớn khi vừa duyệt web vừa cần thông tin bổ sung.

Trải nghiệm Gemini trong Chrome: Bước đi nhỏ cho người dùng, nhưng là tín hiệu lớn từ Google

Ví dụ, khi đang xem một video hướng dẫn sửa chữa, người dùng có thể hỏi “Anh ấy đang dùng công cụ gì vậy?” và nhận được câu trả lời cụ thể như “đó là súng bắn đinh” hoặc “anh ấy đang dùng nhíp để tháo tụ điện.” Trong một tình huống khác, nếu xem video nấu ăn, Gemini có thể tự động tóm tắt công thức mà không cần người dùng phải tìm đường dẫn mô tả hay ghi chú thủ công.

Dù tiềm năng rõ rệt, Gemini trong Chrome hiện vẫn gặp một số hạn chế kỹ thuật. Trợ lý này chỉ có thể xử lý nội dung đang được hiển thị trên màn hình, đồng nghĩa với việc nếu người dùng muốn tóm tắt phần bình luận dưới một bài viết, họ buộc phải cuộn trang xuống để phần đó xuất hiện. Ngoài ra, Gemini chỉ hoạt động trong một tab tại một thời điểm và chưa thể tổng hợp dữ liệu từ nhiều tab cùng lúc.

Trải nghiệm Gemini trong Chrome: Bước đi nhỏ cho người dùng, nhưng là tín hiệu lớn từ Google - hình 1

Các bản tóm tắt của Gemini đôi khi có thể hơi dài so với một cửa sổ nhỏ như vậy. Ảnh chụp màn hình: The Verge

Một vấn đề khác là khả năng truy cập dữ liệu thời gian thực còn hạn chế. Gemini không thể định vị chính xác vị trí, không truy cập vào thông tin kho hàng, và nếu video hoặc trang web không cung cấp đường link rõ ràng, AI này cũng không thể tìm ra sản phẩm tương ứng. Giao diện trò chuyện trong Chrome cũng chưa tối ưu cho các màn hình nhỏ.

Trên các thiết bị như MacBook Air 13 inches, cửa sổ chat chiếm diện tích đáng kể và thường cung cấp phản hồi dài dòng nếu người dùng không yêu cầu rút gọn. Các câu hỏi gợi ý phụ như “Bạn có muốn biết thêm không?” tuy hữu ích nhưng đôi khi tạo cảm giác phiền toái.

Trải nghiệm Gemini trong Chrome: Bước đi nhỏ cho người dùng, nhưng là tín hiệu lớn từ Google - hình 2

Gemini trong Chrome cũng có thể trích xuất công thức nấu ăn từ các video trên YouTube. Và đúng vậy, nó đã khớp với công thức thực tế. Ảnh chụp màn hình: The Verge

Một điểm đáng chú ý khác là sự xuất hiện của chế độ Live, cho phép người dùng giao tiếp bằng giọng nói và nhận phản hồi cũng bằng giọng nói từ Gemini. Khi đang xem một video, người dùng có thể bật tính năng này và đặt câu hỏi như “Cô ấy đang làm gì vậy?” mà không cần gõ bàn phím. Trợ lý sẽ trả lời bằng giọng nói ngay trong giao diện, tạo nên trải nghiệm mượt mà, gần gũi như đang trò chuyện với một người thật.

Nguồn: The Verge

Trải nghiệm Gemini trong Chrome: Bước đi nhỏ cho người dùng, nhưng là tín hiệu lớn từ Google

Cách hoạt động của Gemini trong Chrome