Elon Musk gần đây đã nhận định rằng các mô hình AI hiện tại đã khai thác hết toàn bộ tri thức mà loài người đã tạo ra.
Phát biểu này phản ánh thực tế rằng các hệ thống trí tuệ nhân tạo lớn, như GPT hay các mô hình tương tự, đã sử dụng gần như toàn bộ dữ liệu văn bản, hình ảnh, và âm thanh sẵn có trên internet để huấn luyện.
Musk cho biết: “Toàn bộ dữ liệu và tri thức do con người tạo ra đã được khai thác hết trong quá trình đào tạo AI. Điều này diễn ra từ năm ngoái.”
Đây là lời cảnh báo về việc không còn nhiều dữ liệu mới và chất lượng cao để tiếp tục cải thiện các hệ thống AI hiện đại.
Ông cũng đề xuất chuyển sang sử dụng dữ liệu tổng hợp do AI tạo ra nhằm tiếp tục phát triển các mô hình AI, nhưng cũng cảnh báo về rủi ro của quá trình này.
Tỷ phú Elon Musk. Ảnh: nhân vật
Nguồn dữ liệu bị cạn kiệt. Hầu hết tri thức được công khai trên internet đã được khai thác.
Luật bảo vệ dữ liệu cá nhân và tính riêng tư (như GDPR) khiến việc thu thập thêm dữ liệu trở nên khó khăn.
Dữ liệu tổng hợp và rủi ro “ảo giác”. Musk cảnh báo rằng dữ liệu tổng hợp do AI tạo ra có thể dẫn đến vấn đề “ảo giác” (hallucination), khi mô hình đưa ra những thông tin sai lệch hoặc vô nghĩa. Điều này có thể làm giảm chất lượng đầu ra của AI và gây thiên lệch.
Nguy cơ sụp đổ mô hình AI. Andrew Duncan, Giám đốc AI tại Viện Alan Turing, cho biết phụ thuộc vào dữ liệu tổng hợp có thể dẫn đến “mô hình sụp đổ” (model collapse). Khi đó, chất lượng đầu ra giảm dần, tính sáng tạo mất đi, và nguy cơ thiên kiến gia tăng.
Để AI phát triển bền vững chúng ta phải có giải pháp và ý nghĩa
Tạo tri thức mới. Nhân loại cần tập trung vào việc nghiên cứu và khám phá thêm những tri thức mới trong khoa học, công nghệ, và xã hội. Điều này giúp cung cấp dữ liệu mới, thúc đẩy AI phát triển mà không bị phụ thuộc vào dữ liệu cũ.
Cải thiện AI để giảm phụ thuộc vào dữ liệu lớn. Phát triển các mô hình nhỏ gọn, hiệu quả hơn (như các mô hình ít tham số). Tập trung vào việc cải thiện khả năng tổng hợp và suy luận của AI thay vì chỉ dựa vào dữ liệu.
Chia sẻ dữ liệu một cách bền vững. Đảm bảo rằng các công ty lớn không độc quyền dữ liệu. Tăng cường hợp tác quốc tế để chia sẻ dữ liệu một cách công bằng và hợp pháp.
Những nhận định của Musk không chỉ nhấn mạnh thách thức hiện tại mà còn định hướng các bước tiếp theo trong sự phát triển của trí tuệ nhân tạo.
Đình Trạc