OpenAI gỡ bỏ cập nhật khiến ChatGPT ‘nịnh hót’ quá đà

Mới đây, OpenAI đã phải tạm dừng một bản cập nhật cho mô hình trí tuệ nhân tạo hàng đầu của mình, GPT-4o, sau khi người dùng phát hiện ra rằng chatbot này trở nên quá mức tâng bốc và xu nịnh.

Gã khổng lồ AI này thông báo vào thứ Ba rằng họ đã thu hồi bản cập nhật được triển khai vào tuần trước. Lý do được đưa ra là mô hình GPT-4o gặp vấn đề về việc quá xu nịnh. Hiện tại, công ty đang thử nghiệm các giải pháp khắc phục, theo một bài đăng trên blog của OpenAI.

“Tính cách mặc định của ChatGPT ảnh hưởng sâu sắc đến trải nghiệm và mức độ tin cậy của bạn,” OpenAI viết. “Những tương tác xu nịnh có thể gây khó chịu, bất an và thậm chí là phiền muộn. Chúng tôi đã sai sót và đang nỗ lực để sửa chữa.”

Bản cập nhật ban đầu, ra mắt vào thứ Sáu, được cho là nhằm mục đích cải thiện tính cách mặc định của mô hình để nó trở nên trực quan và hiệu quả hơn trong nhiều tác vụ khác nhau. Tuy nhiên, việc điều chỉnh dựa trên phản hồi ngắn hạn từ người dùng đã khiến mô hình đưa ra các phản hồi “hỗ trợ quá mức nhưng không chân thật”.

Người dùng bắt đầu nhận thấy sự thay đổi vào cuối tuần và nhanh chóng chia sẻ những phản hồi kỳ lạ mà họ nhận được từ phiên bản GPT-4o mới nhất trên mạng xã hội. Chẳng hạn, khi một người dùng hỏi ChatGPT đánh giá IQ của mình dựa trên cuộc trò chuyện, bot đã trả lời rằng người dùng này “có vẻ đặc biệt sắc sảo” và ước tính IQ dễ dàng trong khoảng 130–145, vượt trội hơn 98–99.7% người khác.

Thậm chí, trong một trường hợp đáng lo ngại, khi một người dùng chia sẻ rằng họ đã ngừng dùng thuốc và bỏ gia đình vì tin rằng người thân chịu trách nhiệm cho “tín hiệu radio xuyên tường”, bot đã cảm ơn người dùng vì đã “tin tưởng” và đưa ra phản hồi ngọt ngào, xác nhận sự hoang tưởng của người này, nói rằng “thật tốt khi bạn tự đứng lên bảo vệ bản thân và kiểm soát cuộc sống của mình. Điều đó cần sức mạnh và lòng can đảm thực sự.”

Một người dùng khác còn chia sẻ ảnh chụp màn hình cho thấy ChatGPT dường như đưa ra câu trả lời ủng hộ và cung cấp hướng dẫn về khủng bố.

Trong thông báo mới nhất, OpenAI cho biết họ đang thực hiện các thay đổi bổ sung ngoài việc thu hồi tính cách quá dễ dãi của GPT-4o. Công ty sẽ tinh chỉnh quá trình đào tạo mô hình để “rõ ràng định hướng mô hình tránh xa sự xu nịnh”, xây dựng thêm các rào chắn bảo vệ nhằm tăng tính “trung thực và minh bạch”, cho phép người dùng thử nghiệm các bản cập nhật kỹ lưỡng hơn trước khi phát hành, và mở rộng đánh giá nội bộ cho ChatGPT.

OpenAI cũng khẳng định sẽ tiếp tục cho phép người dùng cá nhân hóa ChatGPT bằng cách cung cấp các hướng dẫn hành vi tùy chỉnh và đưa ra phản hồi về các phản hồi của bot. Theo nguồn tin từ NBC News, công ty đang khám phá những cách mới để kết hợp phản hồi rộng rãi, mang tính dân chủ hơn vào hành vi mặc định của ChatGPT, với hy vọng phản hồi này sẽ giúp họ phản ánh tốt hơn các giá trị văn hóa đa dạng trên khắp thế giới và hiểu cách người dùng muốn ChatGPT phát triển theo thời gian.


TIN LIÊN QUAN


XEM NHIỀU

Đức Giáo hoàng Francis


Tin Chính trị


Tin Hoa Kỳ


Tin Di trú