Các nhà khoa học đột phá khi chuyển từ mô hình lặp đi lặp lại sang phương pháp xác suất thông minh, giúp AI học nhanh gấp nhiều lần và tiết kiệm năng lượng đáng kể - mở ra kỷ nguyên mới cho công nghệ thông minh bền vững.
AI và các mô hình ngôn ngữ khổng lồ (LLM) đang thay đổi cuộc sống chúng ta, nhưng ẩn sau sự tiện lợi này là một thực tế đáng báo động: “Cơn khát” điện năng không ngừng tăng. Tại Đức, các trung tâm dữ liệu nuôi dưỡng AI đã ngốn 16 tỷ kWh trong năm 2020 – tương đương 1% tổng điện năng tiêu thụ toàn quốc. Đáng lo ngại hơn, con số này được dự báo sẽ bùng nổ lên 22 tỷ kWh vào năm 2025, đặt ra câu hỏi lớn về tính bền vững của cuộc cách mạng AI khi hành tinh đang phải đối mặt với khủng hoảng khí hậu.
Cuộc đua AI đang đẩy nhu cầu năng lượng lên mức chưa từng thấy, đặc biệt trong giai đoạn huấn luyện các mạng thần kinh khổng lồ. Trước thách thức này, Giáo sư Felix Dietrich từ Đại học Kỹ thuật Munich đã tạo ra bước ngoặt đáng kinh ngạc: phương pháp đào tạo mới vượt trội gấp 100 lần về tốc độ mà không đánh đổi độ chính xác.
Theo SciTechDaily đưa tin ngày 10/3, công nghệ đột phá này hứa hẹn làm giảm mạnh dấu chân carbon của AI, mở ra kỷ nguyên mới cho trí tuệ nhân tạo bền vững trong bối cảnh khủng hoảng khí hậu toàn cầu ngày càng trở nên cấp bách.
Mạng thần kinh nhân tạo chính là nền tảng cho nhiều mô hình AI hiện đại, chẳng hạn như các hệ thống nhận dạng hình ảnh hay xử lý ngôn ngữ, và chúng được lấy cảm hứng từ cách não bộ con người hoạt động. Cấu trúc của mạng thần kinh nhân tạo bao gồm nhiều nút thần kinh (neuron nhân tạo) liên kết chặt chẽ với nhau. Mỗi nút sẽ gán giá trị cho dữ liệu đầu vào, và khi giá trị đó vượt quá một ngưỡng nhất định, tín hiệu sẽ được chuyển tiếp sang lớp nút kế tiếp.
Quá trình huấn luyện AI hiện đang “ngốn” điện với tốc độ báo động. Truyền thống, các mô hình bắt đầu với các tham số ngẫu nhiên, sau đó trải qua hàng nghìn vòng lặp tốn kém để “học” – tương tự như một học sinh giải đi giải lại cùng một bài toán hàng trăm lần.
GS Felix Dietrich và nhóm nghiên cứu tại Đại học Kỹ thuật Munich đã phá vỡ mô hình này với phương pháp đột phá dựa trên xác suất. Thay vì điều chỉnh tham số qua vô số vòng lặp, họ tập trung vào những “điểm nóng” trong dữ liệu – nơi các giá trị thay đổi đột ngột và mạnh mẽ. Phương pháp thông minh này nhắm trúng các “thời điểm quyết định” trong quá trình học, giống như cách não người ưu tiên xử lý thông tin quan trọng.
“Phương pháp của chúng tôi xác định chính xác những tham số thiết yếu với năng lượng tính toán tối thiểu,” GS Dietrich nhấn mạnh. “Điều này không chỉ tăng tốc đào tạo lên gấp 100 lần mà còn đạt độ chính xác tương đương với phương pháp truyền thống.”
Đột phá này mở ra tiềm năng ứng dụng rộng rãi cho các hệ thống động phức tạp như mô hình khí hậu và thị trường tài chính – những lĩnh vực đòi hỏi dự đoán chính xác với nguồn lực hiệu quả.
Hoàng Hà (Theo SciTechDaily)