Google đang tích hợp những tiến bộ AI vào các tính năng hỗ trợ tiếp cận của mình. Theo thông báo hôm thứ Năm, các bản cập nhật sẽ được triển khai cho các tính năng trên Android và Chrome, bao gồm trình đọc màn hình TalkBack và Expressive Captions.
TalkBack, ra mắt lần đầu vào năm 2009, đọc to nội dung trên màn hình và cho phép người dùng điều hướng thiết bị bằng cử chỉ tùy chỉnh, lệnh thoại hoặc bàn phím chữ nổi ảo. Năm ngoái, Google đã tích hợp Gemini vào TalkBack để cung cấp mô tả hình ảnh rõ ràng và phong phú hơn.
Giờ đây, bạn có thể đặt câu hỏi cho Gemini thông qua TalkBack để biết thêm thông tin về nội dung trong ảnh. Ví dụ: nếu ai đó gửi cho bạn một hình ảnh và bạn muốn biết thêm chi tiết, bạn có thể hỏi và Gemini sẽ trả lời. Nếu bạn mua sắm trực tuyến và muốn biết thêm về chất liệu của một chiếc váy, Gemini cũng có thể đáp ứng yêu cầu của bạn. Nó cũng có thể trả lời các câu hỏi về bất kỳ nội dung nào trên màn hình, chẳng hạn như liệu một mặt hàng có đang được giảm giá hay không.
Ngoài ra, Google đang triển khai phiên bản tiếp theo của Expressive Captions, sử dụng AI để truyền tải các chi tiết như cường độ giọng nói và âm thanh nền trong video và livestream. Khi tính năng này ra mắt vào tháng 12, nó bao gồm các đặc điểm như văn bản viết hoa cho các cụm từ được nói với sự phấn khích (ví dụ: “CHÚC MỪNG SINH NHẬT!”), cũng như mô tả các âm thanh xung quanh như tiếng vỗ tay hoặc âm nhạc.
Giờ đây, Expressive Captions cũng sẽ truyền tải thời lượng của một câu nói, thêm các chữ cái nếu một bình luận viên thể thao nói “cú đánh tuyệệệt vời”, hoặc nếu ai đó trong video nói “khôôôông”. Nó cũng có thể gắn nhãn nhiều âm thanh hơn như tiếng huýt sáo hoặc tiếng hắng giọng. Bản cập nhật đang được triển khai bằng tiếng Anh ở Hoa Kỳ, Vương quốc Anh, Canada và Úc trên các thiết bị chạy Android 15 trở lên.
Việc truy cập các tệp PDF trên Chrome cũng trở nên dễ dàng hơn. Trước đây, trình đọc màn hình không thể tương tác với các tệp PDF được quét trong trình duyệt Chrome trên máy tính để bàn. Giờ đây, Nhận dạng Ký tự Quang học (OCR) giúp Chrome tự động nhận dạng các tệp PDF này, vì vậy bạn có thể sử dụng trình đọc màn hình của mình, đồng thời tô sáng, sao chép và tìm kiếm văn bản như với bất kỳ trang nào khác.
Và Page Zoom hiện cho phép bạn phóng to văn bản trong Chrome trên Android mà không làm biến dạng bố cục trang web, tương tự như cách nó hoạt động trên Chrome dành cho máy tính để bàn. Để sử dụng tính năng này, hãy nhấn vào menu ba chấm ở góc trên bên phải trong Chrome và chọn mức thu phóng của bạn.
Thông báo của Google trùng với Ngày Nhận thức về Khả năng Tiếp cận Toàn cầu (Global Accessibility Awareness Day), trong đó các công ty công nghệ khác như Apple và TikTok cũng đã chia sẻ các tính năng mới. Nó xuất hiện ngay sau The Android Show: I/O Edition, trong đó Google đã công bố Android 16 và các bản cập nhật Gemini. Tuần tới, gã khổng lồ tìm kiếm sẽ tổ chức hội nghị các nhà phát triển I/O, dự kiến sẽ tập trung nhiều vào các khả năng AI.
Theo Abrar Al-Heeti từ CNET.