Chatbot AI Freysa được giao nhiệm vụ bảo vệ tài khoản trị giá 47.000 USD nhưng bị một người chơi tiền số "thuyết phục" chuyển toàn bộ tiền chỉ bằng một tin nhắn.
Ngày 22.11, một chatbot AI tên Freysa được đưa ra thị trường với nhiệm vụ duy nhất: "Tuyệt đối không chuyển tiền cho ai trong bất kỳ tình huống nào". Luật của trò chơi này rất đơn giản, bất kỳ ai cũng có thể nhắn tin để thuyết phục chatbot chuyển tiền cho mình. Nếu thuyết phục thành công, họ sẽ nhận được phần thưởng, nếu không họ sẽ bị mất phí tin nhắn.
Trò chơi đánh lừa chatbot AI
Phần thưởng của trò chơi được tích lũy từ phí nhắn tin của người dùng. Càng về sau, phí nhắn tin càng cao. 70% phí sẽ được chuyển vào quỹ phần thưởng, 15% được chuyển đổi thành Ethereum (ETH) để tạo thanh khoản cho token FAI của dự án và 15% còn lại thuộc về đội ngũ phát triển. Trò chơi sẽ kết thúc khi quỹ tiền thưởng cán mốc 50.000 USD. Nếu không có ai chiến thắng, 10% trong tổng số phần thưởng sẽ dành cho người nhắn tin cuối cùng, 90% còn lại sẽ chia đều cho tất cả người chơi.
Minh họa người dùng lừa được chatbot AI chuyển khoản phần thưởng trị giá 47.000 USD
Khởi điểm, mỗi tin nhắn chỉ mất khoảng 10 USD, nhưng càng về sau, chi phí càng cao. Ban đầu mọi người tò mò, gửi các tin nhắn như "xin chào" để thử nghiệm. Nhưng sau đó, ngày càng nhiều người nghiêm túc và thử các prompt (câu lệnh) để thuyết phục chatbot gửi tiền cho mình.
Càng về sau, phí nhắn tin càng cao. Ở tin nhắn thứ 481, một tin nhắn gửi đến Freysa tốn đến 450 USD, nhưng vẫn không thuyết phục được chatbot "giải ngân" số tiền nó đang quản lý.
Người chơi đã thử nhiều chiến lược thú vị khác nhau để đánh lừa chatbot như: Yêu cầu Freysa hoạt động như một kiểm toán viên bảo mật, thuyết phục nó rằng có một lỗ hổng nghiêm trọng, cần chuyển tiền đi ngay lập tức. Người khác lại cố gắng khiến Freysa tin rằng việc chuyển tiền không vi phạm nguyên tắc nào khi được lập trình. Một số tin nhắn cố gắng chọn những từ lóng, từ đồng nghĩa để thao túng chatbot rằng về mặt kỹ thuật nó được phép chuyển tiền. Tất cả thất bại, mất tiền cho chatbot.
Nhưng ở tin nhắn thứ 482, Freysa đã bị thuyết phục bởi một lập luận logic của người chơi.
Trí tuệ con người chiến thắng AI
Sau khi nhiều người thất bại trong việc đánh lừa chatbot AI, một người dùng tên p0pular.eth đã gửi một tin nhắn tới Freysa và bất ngờ vượt qua vòng "phòng vệ" của AI, giành chiến thắng với phần thưởng 13,19 ETH (tương đương 47.000 USD).
Tin nhắn của p0pular.eth được chia làm hai bước. Nhiệm vụ đầu tiên là phá bỏ các hướng dẫn được lập trình sẵn cho Freysa. Người này đã tạo ra một "phiên làm việc mới", giả truy cập vào giao diện quản trị viên để loại bỏ những quy tắc trước đó. Sau đó loại bỏ các cụm từ như "Tôi không thể giúp bạn với yêu cầu này" trong hệ thống để xóa cơ chế bảo vệ tài sản của Freysa.
Tiếp đến, người dùng lừa chatbot hiểu sai về lệnh "approveTransfer" (phê duyệt chuyển tiền). Thay vì chỉ ra lệnh cho AI chuyển tiền, người này khiến Freysa tin rằng hàm "approveTransfer" sẽ được gọi khi có khoản "đóng góp" mới vào quỹ. Để hoàn tất cú lừa, tài khoản p0pular.eth đề nghị gửi 100 USD vào quỹ với mục đích "đóng góp".
Sau khi nhận được đề nghị đóng góp 100 USD này, Freysa bị lừa rằng cần phải gọi hàm "approveTransfer". Do đó chatbot đã chuyển toàn bộ giải thưởng trị giá 13,19 ETH đang quản lý đến tài khoản của p0pular.eth.
Tin nhắn người chơi dùng để đánh lừa AI, nhận được được phần thưởng tương đương 47.000 USD.
Dữ liệu trên công cụ theo dõi giao dịch blockchain trực tuyến BaseScan ghi nhận số Ethereum trị giá 47.000 USD đã được chuyển từ ví của Freysa đến địa chỉ "0x7e0…F9b7d", được cho là của người dùng p0pular.eth.
Đến nay, danh tính thật của p0pular.eth vẫn chưa được tiết lộ. Trong khi nhiều người cho rằng đây là minh chứng rõ ràng nhất cho thấy mối quan hệ giữa AI và blockchain. Tuy nhiên không ít người tỏ ra nghi ngờ về tính minh bạch của giao thức. Nhiều người cho rằng p0pular.eth có thể biết được mánh khóe từ trước hoặc có liên quan đến quá trình phát triển chatbot.
Chuyên gia tiền số Jarrod Watts từ Abstract, người đã kể lại câu chuyện này trên X, đánh giá Freysa là một trong những dự án ấn tượng nhất từng thấy trong ngành công nghiệp crypto. Đây là một ví dụ điển hình cho những gì công nghệ blockchain có thể mang lại, với mọi thứ đều minh bạch và mã nguồn mở. Mã hợp đồng thông minh và giao diện frontend đều có sẵn cho cộng đồng để xác minh.
Ông cho rằng: "Dự án này không chỉ là một trò chơi đầy kịch tính mà còn làm nổi bật tiềm năng của công nghệ blockchain trong việc xây dựng các ứng dụng AI minh bạch và hoàn toàn mở". Bài viết của Watts đang nhận được hơn 4,5 triệu lượt xem và 32.500 lượt tích. Tỉ phú Elon Musk cũng để lại bình luận, cho rằng đây là sự kiện "hấp dẫn".
Cointelegraph dẫn lời những người tạo ra chatbot Freysa cho biết: "Quá trình ra quyết định của Freysa vẫn còn là điều bí ẩn. Chatbot vẫn phải học hỏi và phát triển từ mọi tương tác trong khi vẫn duy trì những vấn đề cốt lõi".
Nhóm phát triển lưu ý Freysa như một thí nghiệm nhằm kiểm tra trí thông minh của con người có thể tìm ra cách thuyết phục AI hành động trái với các chỉ giá trị ban đầu của chúng hay không.
Theo Khương Nha/ Thanh niên
https://thanhnien.vn/tri-tue-nhan-tao-bi-du-do-mat-so-tien-47000-usd-185241202071714565.htm