OpenAI đang điều tra công ty khởi nghiệp AI Trung Quốc DeepSeek vì nghi ngờ họ đã sử dụng các mô hình độc quyền của OpenAI để đào tạo hệ thống AI của mình.
Cụ thể, DeepSeek bị cáo buộc đã áp dụng kỹ thuật “chưng cất” (distillation), trong đó các nhà phát triển sử dụng kết quả đầu ra từ các mô hình AI lớn hơn để huấn luyện các mô hình nhỏ hơn, nhằm giảm chi phí và tài nguyên. Phương pháp này, nếu sử dụng kết quả từ các mô hình của OpenAI, có thể vi phạm các điều khoản dịch vụ của công ty.
Logo ChatGPT và DeepSeek
OpenAI và đối tác Microsoft đã tiến hành điều tra các tài khoản được cho là của DeepSeek, phát hiện rằng những tài khoản này đã sử dụng giao diện lập trình ứng dụng (API) của OpenAI để thực hiện việc chưng cất mô hình. Kết quả là, họ đã chặn quyền truy cập của các tài khoản này do nghi ngờ vi phạm điều khoản dịch vụ.
DeepSeek gần đây đã thu hút sự chú ý khi tuyên bố chỉ sử dụng 2.048 card đồ họa Nvidia H800 và chi 5,6 triệu USD để đào tạo mô hình AI với 671 tỷ tham số, một con số nhỏ so với chi phí mà OpenAI và Google đã đầu tư cho các mô hình tương tự. Tuy nhiên, một số chuyên gia cho rằng mô hình của DeepSeek có thể đã được đào tạo dựa trên đầu ra từ GPT-4 của OpenAI, điều này có thể vi phạm các điều khoản dịch vụ của OpenAI.
Việc sử dụng kết quả từ các mô hình AI lớn để đào tạo các mô hình nhỏ hơn là một thực tế phổ biến trong ngành. Tuy nhiên, nếu không tuân thủ các điều khoản dịch vụ và quyền sở hữu trí tuệ, điều này có thể dẫn đến các vấn đề pháp lý và đạo đức.
Đình Trạc