Trong một cuộc phỏng vấn gần đây với hãng tin
Reuters vào ngày 26 tháng 1/2024, Bộ trưởng Bộ Thương mại Hoa Kỳ, bà Gina Raimondo, đã tiết lộ một kế hoạch mới có thể tạo ra những biến động lớn trong lĩnh vực trí tuệ nhân tạo (
AI). Theo đó, Bộ trưởng Raimondo đã công bố kế hoạch nhằm hạn chế khách hàng nước ngoài, đặc biệt là khách hàng TQ, sử dụng dịch vụ đám mây của Hoa Kỳ để đào tạo các mô hình AI lớn.
Bộ trưởng Bộ Thương Mại Hoa Kỳ Gina Raimondo
Lời phát ngôn ban đầu của bà Bộ trưởng Raimondo đã làm nổi bật tâm điểm của cuộc phỏng vấn:
"Chúng tôi không thể cho phép TQ hoặc các đối tác khác sử dụng dịch vụ đám mây của chúng tôi cho việc huấn luyện đào tạo mô hình AI. Chúng tôi đã áp đặt lệnh cấm xuất khẩu chip, nhưng những con chip đó đang được sử dụng bởi các trung tâm dữ liệu đám mây ở Hoa Kỳ. Do đó, chúng ta cần xem xét việc cho đóng cửa các kênh này để ngăn chặn những hành vi tiềm ẩn nguy hiểm".
Không thể phủ nhận rằng những biện pháp này đã đẩy mức độ trừng phạt kỹ thuật của Hoa Kỳ đối với TQ lên một tầm cao mới, có thể giáng lên những thiệt hại đáng kể cho ngành trí tuệ nhân tạo của đại lục.
Tuy không phải là chuyên gia về chip hay trí tuệ nhân tạo, người ta cũng có thể nhanh chóng tìm thấy nhiều ý kiến của các chuyên gia trong ngành về vấn đề này và nhìn chung, họ tin rằng các biện pháp mới của Bộ Thương mại Hoa Kỳ có thể hiểu được từ góc độ vĩ mô. Tuy nhiên, có vẻ như có một số điều khó hiểu về lý do mà chúng lại được đưa ra ở thời điểm này.
Cách đây chưa đầy một năm, các đại diện của các công ty Internet và các công ty kỹ nghệ lớn của TQ tự tin tuyên bố đã
"bắt kịp" với các mô hình AI cỡ lớn, đôi khi chỉ cần từ nửa năm đến một năm so với mô hình đầu tiên OpenAI. Vào vài ngày trước đây, tỷ phú kỹ nghệ TQ Chu Hongyi của Qihoo 360 Technology thậm chí còn tuyên bố rằng,
"Năm ngoái, chúng ta nhìn vào những mô hình lớn như bom nguyên tử, năm nay chúng ta nhìn vào những mô hình lớn như trứng gà"(??). Tuy nhiên, một số chuyên gia cho rằng điều này chỉ có lợi cho các cổ đông lớn và không phản ánh thực tế nghiên cứu và sản xuất kỹ thuật mới mẻ nào.
Theo họ, để "bắt kịp" với OpenAI, ngành kỹ nghệ TQ đã sử dụng ba yếu tố quan trọng. Đầu tiên, việc học hỏi và tiếp thu từ các mô hình nguồn mở lớn ở nước ngoài, ví dụ như
LlaMA do
Meta phát hành. Mặc dù phiên bản GPT-3 không phải là mã nguồn mở, nhưng vẫn có nhiều mô hình mã nguồn mở lớn ngoài kia để tham khảo.
LLaMA2, được phát hành tiếp sau đó, đã thu hút sự chú ý với 3 phiên bản công khai, với số lượng tham số lên đến 70 tỷ. Mặc dù không sánh kịp với
GPT-4, nhưng đó là một sự khởi đầu để tham khảo.
Thứ hai, việc thuê giao diện GPT để
"chắt lọc" các tham số của mô hình. Cuối năm ngoái, có tin đồn về sản phẩm của ByteDance bị chặn vì sử dụng giao diện GPT để đào tạo mô hình của họ. Điều này là một xu hướng chung trong ngành, được gọi là
"chưng cất". Điều này bao gồm việc liên tục tương tác với GPT để giúp điều chỉnh các tham số trong mô hình của mình, giúp đào tạo mô hình tự phát triển lên.
Cuối cùng, việc TQ đi thuê các dịch vụ điện toán đám mây ở Mỹ như
Azure và
AWS để giải quyết tình trạng bị tắc nghẽn về năng lực tính toán. Do lệnh cấm xuất khẩu chip của Hoa Kỳ, việc thuê dịch vụ đám mây từ các đối tác lớn như Microsoft và Amazon đã trở thành lựa chọn phổ biến cho các công ty TQ.
Trong bối cảnh này, quyết định của Bộ Thương mại Hoa Kỳ có thể khiến cho cho ngành trí tuệ nhân tạo của TQ gặp nhiều khó khăn trong việc tiếp tục phát triển nhanh chóng. Các chuyên gia cũng lưu ý rằng, trong khi các biện pháp như vậy có thể có tác động ngắn hạn, nhưng chúng cũng có thể đẩy TQ tìm kiếm các giải pháp hầu tự chủ hóa nhanh hơn và tăng cường năng lực nghiên cứu và phát triển kỹ thuật trong nước. Điều này có thể dẫn đến sự đối mặt với một đối thủ ngày càng mạnh mẽ trong lĩnh vực trí tuệ nhân tạo trong tương lai.