Khi dữ liệu “chảy” ra ngoài biên giới
Đằng sau mỗi mô hình AI lớn là khối dữ liệu khổng lồ được thu thập từ hàng tỷ người dùng trên toàn thế giới. Khi Việt Nam sử dụng chủ yếu các mô hình AI nước ngoài, nguy cơ đầu tiên và nghiêm trọng nhất là dữ liệu người dân, doanh nghiệp, cơ quan Nhà nước bị thu thập, phân tích và sử dụng cho mục đích ngoài tầm kiểm soát. Điều đáng lo ngại nằm ở ba điểm: Một là, dữ liệu hành vi bị lộ dẫn tới thao túng thông tin. AI ngoại nắm được hành vi, thói quen, cảm xúc của người dùng Việt Nam. Chỉ cần thay đổi thuật toán gợi ý, chúng có thể điều hướng dư luận, kích hoạt khủng hoảng niềm tin hoặc khuếch tán quan điểm lệch lạc với quy mô lớn. Hai là, dữ liệu chiến lược có thể bị thu thập gián tiếp. Các cuộc trò chuyện liên quan đến quản lý Nhà nước, quốc phòng, an ninh, thậm chí các tài liệu làm việc… nếu được xử lý qua AI ngoại, đều có khả năng trở thành dữ liệu huấn luyện cho mô hình, bị phân tích để rút ra quy luật hoạt động. Ba là, dữ liệu trở thành “con tin” khi nhà cung cấp có thể đơn phương thay đổi điều kiện dịch vụ. Khi phụ thuộc vào mô hình ngoại, mọi hoạt động từ khai thác, vận hành đến mở rộng đều bị chi phối bởi điều khoản quốc tế, bởi luật pháp nước sở tại và bởi lợi ích chiến lược của doanh nghiệp cung cấp mô hình.
 |
| Ảnh minh họa: dantri.com.vn |
Chuyên gia an ninh mạng nhận định: “Dữ liệu chính là khoáng sản chiến lược của thời đại số. Để mất dữ liệu là để kẻ khác sở hữu quyền lực mềm trên lãnh thổ của mình”.
Mất chủ quyền số - mất khả năng bảo vệ
Chủ quyền số không chỉ là kiểm soát hạ tầng mạng. Chủ quyền số là khả năng tự quyết định, tự vận hành và tự bảo vệ hệ thống dữ liệu - thuật toán - mô hình AI cốt lõi của quốc gia. Khi phụ thuộc mô hình ngoại, ba nguy cơ lớn xuất hiện: (1) Không thể kiểm chứng “hộp đen thuật toán”. Không ai biết rõ mô hình được huấn luyện bằng gì, có ẩn cài thiên kiến chính trị hay không, có bị điều chỉnh theo lợi ích địa chính trị hay không. Chỉ cần một thay đổi nhỏ trong thuật toán, nội dung phản hồi có thể vô tình hoặc cố ý làm lệch lạc nhận thức của người dùng. (2) Không thể chủ động phản ứng với khủng hoảng thông tin. Trong tình huống khẩn cấp liên quan đến an ninh quốc gia, các mô hình AI ngoại có thể từ chối trả lời, hoặc trả lời theo quan điểm của họ, gây ra nguy cơ hiểu sai, mất phương hướng trong dư luận. (3) Không thể đảm bảo an toàn cho dữ liệu trọng yếu của Đảng, Nhà nước, Quân đội. Ngay cả khi không “cố ý”, việc dữ liệu bị đẩy ra ngoài hệ sinh thái nội địa đã đặt cơ quan nhà nước vào thế bị động trước các rủi ro tấn công, khai thác hoặc xâm nhập từ xa.
Mất “bầu trời riêng”
Trong chiến lược an ninh mạng của nhiều quốc gia, “bầu trời số” (digital airspace) được hiểu như không gian chủ quyền trên mạng, nơi quốc gia có quyền xác lập luật chơi, tiêu chuẩn đạo đức, chuẩn an toàn và quyền lực quản trị. Khi phụ thuộc hoàn toàn vào AI ngoại, Việt Nam đối mặt nguy cơ: Không kiểm soát được tầng ứng dụng (nội dung, dịch vụ, thuật toán; không kiểm soát được tầng dữ liệu (đang chảy ngược ra nước ngoài); không kiểm soát được tầng hạ tầng AI (phần lớn mô hình chạy trên máy chủ quốc tế). Điều này tương tự việc bầu trời quốc gia bị điều khiển bởi hệ thống radar và trạm thông tin của nước khác. Chúng ta vẫn bay, nhưng bay trong “quy tắc” do họ đặt ra. Trong bối cảnh chiến lược, đây không chỉ là rủi ro công nghệ, mà là rủi ro mất quyền kiểm soát tương lai số của dân tộc.
Vì sao các nước lớn đặt mục tiêu tự chủ AI bằng mọi giá?
Không phải ngẫu nhiên Mỹ, Trung Quốc, EU, Ấn Độ, Nhật Bản, Hàn Quốc đều thúc đẩy mô hình AI nội địa. Bốn nguyên nhân chung:
1. Đảm bảo an ninh dữ liệu không chia sẻ cho bên ngoài.
2. Tuân thủ luật pháp và tiêu chuẩn quốc gia, không bị chi phối bởi quốc tế.
3. Giảm thiểu rủi ro thao túng thông tin, can thiệp từ bên ngoài.
4. Tận dụng AI để phát triển kinh tế - quốc phòng theo chiến lược riêng. Nếu họ đã quyết tâm như vậy, Việt Nam càng không thể đi theo con đường “đơn giản hóa rủi ro”, giao phó tương lai số cho doanh nghiệp nước ngoài.
Để không đánh mất chủ quyền số, Việt Nam phải thực hiện 3 trụ cột tự chủ AI: Một là, xây dựng mô hình AI quốc gia, huấn luyện bằng dữ liệu Việt Nam, một mô hình AI “thuần Việt” không chỉ nói đúng tiếng Việt mà còn hiểu văn hóa Việt, lịch sử Việt, hệ thống chính trị Việt, pháp luật Việt, chuẩn mực xã hội Việt… Đây là điều không mô hình ngoại nào có thể đảm bảo.
Hai là, hình thành hạ tầng điện toán và trung tâm dữ liệu đạt chuẩn quốc phòng, an ninh. Đối với cơ quan Đảng, Nhà nước, Quân đội… dữ liệu phải lưu trữ nội địa trên hạ tầng được quản lý bởi Việt Nam.
Ba là, xây dựng hệ sinh thái AI “an toàn - tin cậy - có kiểm chứng”: Chuẩn an toàn thuật toán; chuẩn kiểm định dữ liệu; chuẩn ứng xử AI theo giá trị Việt Nam; cơ chế kiểm tra, giám sát nền tảng ngoại hoạt động tại Việt Nam. Đây là lá chắn bảo vệ chủ quyền số trong dài hạn.
Tự chủ AI không chỉ là công nghệ, mà là độc lập dân tộc trong thời đại mới. Trong chiến tranh truyền thống, mất chủ quyền lãnh thổ là mất nước. Trong chiến tranh thông tin và trí tuệ nhân tạo, mất chủ quyền số là mất khả năng quyết định tương lai của chính dân tộc mình. Lệ thuộc AI ngoại có thể dẫn đến: mất kiểm soát dữ liệu, mất an ninh thông tin, mất khả năng phản ứng khủng hoảng, mất định hướng dư luận và cuối cùng là mất “bầu trời riêng” trên không gian mạng.
Vì vậy, tự chủ AI là mệnh lệnh chiến lược, không chỉ của ngành công nghệ, mà của toàn hệ thống chính trị, trong đó lực lượng chuyên trách phải là tuyến đầu trong cuộc chiến bảo vệ chủ quyền số của Tổ quốc.