Dữ liệu: Tài sản quý giá của thế kỷ 21
April 10, 2023

Dữ liệu: Tài sản quý giá của thế kỷ 21

April 10, 2023

Ngày 31/3 vừa qua, diễn giả Ashok Kumar, Giám đốc Chương trình Đào tạo Cấp cao Chính phủ số, Đại học Carnegie Mellon đã trình bày seminar chính sách có tựa đề Dữ liệu: Tài sản quý giá của thế kỷ 21. Buổi nói chuyện đã thảo luận và khám phá các cơ hội do sự bùng nổ dữ liệu tạo ra, đặc biệt là với sự ra đời và phát triển mạnh mẽ của các công nghệ như 5G và IoT, các mối đe dọa tiềm ẩn và sự cần thiết của các chính sách công mạnh mẽ và hiệu quả để kiểm soát và giảm thiểu các mối đe dọa này.

Mở đầu bài thuyết trình, Ông đặt ra câu hỏi: Đưa ra quyết định là gì? Bất kỳ sự lựa chọn nào cũng sẽ dẫn đến một kết quả, và dữ liệu giúp chúng ta tối ưu hóa kết quả cho các quyết định của mình ở trong một bối cảnh nhất định. Chúng ta ứng dụng dữ liệu cho bất kì quyết định hằng ngày với mục tiêu cải thiện chất lượng cuộc sống. Dữ liệu không chỉ đơn giản là văn bản mà có thể là âm thanh, hình ảnh,....

Dữ liệu có thể ở nhiều dạng bao gồm một số loại chính thường gặp như bảng số liệu, văn bản, âm thanh, và hình ảnh. Việc có được dữ liệu hoàn hảo để phục vụ một cách trực tiếp cho việc ra quyết định là không thể. Trong điều kiện không thể tiếp cận hoặc thu thập đầy đủ dữ liệu cần thiết cho một mục đích cụ thể, chúng ta có thể dựa vào dữ liệu thay thế (alternative data). Sự ra đời của 5G là một ví dụ điển hình của dữ liệu thay thế. 5G thay đổi hoàn toàn cách thu thập dữ liệu và số lượng dữ liệu hiện có. 5G có thế giúp tăng băng thông cao hơn 10 – 20 lần so với 4G (từ 1 lên 10 -20 Gpbs), số lượng thiết bị có thể truy cập cùng lúc là 1 triệu/km2 trong khi 4G chỉ có thể giới hạn khoảng 100,000/km2. Singapore có kế hoạch ứng dụng 5G với nhiều mục đích khác nhau, tiêu biểu là việc xây dựng dự án thành phố thông minh của họ với hệ thống bản đồ 3D bao gồm cả hệ thống cánh quạt điện tử.

Nổi bật trong phần trình bày của mình, diễn giả đề cập đến khái niệm tảng băng trôi dữ liệu - “databerg” và hiểm họa của nguồn dữ liệu ngầm - “darkdata”, tồn tại với nhiều hình thức khác nhau: ở các trung tâm dữ liệu, ở trong các tệp dữ liệu cá nhân hoặc văn bản hiện hữu,... (ngoại trừ 12% lượng data thực tế được sử dụng một cách hiệu quả và đúng mục đích) và đó là vấn đề mà khoa học phân tích dữ liệu chưa đề cập đến. Chúng ta cần hiểu rõ loại dữ liệu mình cần tìm cho mục đích sử dụng nó. Ông nhấn mạnh tầm quan trọng của dữ liệu vì trí tuệ nhân tạo sẽ không thể hữu dụng nếu không có dữ liệu.

Một ví dụ nổi bật về việc trí thông minh nhân tạo cần có dữ liệu đúng, đầy đủ và cập nhật để phát huy tiềm năng là ý tưởng thiết bị chẩn đoán của công ty Watson, áp dụng AI vào việc chẩn đoán và điều trị ung thư. Ban đầu, đây được xem là một giải pháp vượt trội khi robot AI này có thể thu thập hàng triệu trang thông tin (lịch sử bệnh nhân, nghiên cứu khoa học liên quan) chỉ trong 1 giờ. Tuy nhiên, khi đưa vào thực tế lại là một bước đi sai khi áp dụng dữ liệu được thu thập từ các nước phương tây cho việc điều trị cho 1 bệnh nhân Trung Quốc, dẫn đến việc đưa ra các chẩn đoán thiếu chính xác khi không có một cơ sở dữ liệu đại diện nào cho nhóm bệnh nhân này, và chứng minh việc áp dụng dữ liệu thu thập được từ New York cho tất cả bệnh nhân trên toàn thế giới là điều bất hợp lý. Bài học rút ra ở đây cho thấy tầm quan trọng của việc sử dụng dữ liệu một cách hiệu quả nằm ở chất lượng của dữ liệu.

Liên quan đến khái niệm trên và các vấn đề pháp lí về bảo mật và an toàn dữ liệu, Tiến sĩ Huỳnh Nhật Nam – Giảng viên Trường Chính sách công và Quản lý Fulbright đã đặt câu hỏi cho diễn giả rằng “Liệu dữ liệu có nên được chia sẻ giữa các tổ chức, doanh nghiệp để tối ưu hóa hiệu quả sử dụng và liệu có vấn đề nào phát sinh khi chia sẻ dữ liệu lẫn nhau hay không?”

Diễn giả phản hồi: “Theo góc nhìn lịch sử, dữ liệu tương đương với năng lực cá nhân, việc chia sẻ dữ liệu cá nhân được xem là không nên. Tuy nhiên, thực tế cho thấy, khi những dữ liệu quan trọng không được chia sẻ, chúng ta sẽ tìm nguồn dữ liệu thay thế. Vấn đề của thế giới hiện tại không chỉ là phát triển công nghệ mà còn là giá trị nhân đạo. Tầm quan trọng của việc chia sẻ dữ liệu nằm ở việc đưa ra những dữ liệu chính xác và có giá trị, đưa vào cộng đồng hay vào doanh nghiệp. Dữ liệu chỉ nên được chia sẻ bằng bất kỳ hình thức nào nếu mang đến 3 giá trị cốt lõi: phát triển kinh tế, cải thiện chất lượng cuộc sống và bảo vệ môi trường.”

Cũng liên quan đến nội dung này, khi được hỏi “làm thế nào để luật pháp có thể kiểm soát song song với sự phát triển của công nghệ hiện nay?”. Ông nhấn mạnh chúng ta không thể phủ nhận sự phát triển công nghệ mang lại giá trị lớn cho xã hội và nên được đẩy mạnh. Tuy nhiên, rất nhiều người đặt ra câu hỏi làm thế nào để kiểm soát các vấn đề phát sinh bên cạnh đó. Đơn cử, vấn đề đạo đức và ứng dụng hợp lý của trí tuệ nhân tạo là một vấn đề khó mà chúng ta phải đối mặt, trăn trở và vẫn là một câu hỏi chưa có đáp án. Chúng ta chỉ có thể nỗ lực kiểm soát bằng một số quy định để hạn chế và kiểm soát giới hạn, đặc biệt khía cạnh nhân đạo. Ví dụ như ở Singapore, AI không được phép ứng dụng trong việc chăm sóc trẻ em.

Như vậy làm thế nào để sử dụng và quản trị dữ liệu một cách hiệu quả? Câu trả lời có thể sẽ rất dài nhưng nhìn vào mục đích mà chúng ta sử dụng dữ liệu để trả lời sự hiệu quả dựa trên 3 yếu tố cốt lõi: chất lượng của dữ liệu hiện có, tính xác thực và ứng dụng thực tế của dữ liệu.

  • Diểm My

Những bài viết liên quan

Trang web này sử dụng cookies để cung cấp trải nghiệm người dùng tốt hơn.

Các cookies cần thiết (Essential Cookies) được mặc định và là cơ sở để trang web hoạt động chính xác. Cookies phân tích (Analytics cookies) thu thập dữ liệu ẩn danh để cải thiện và theo dõi website. Cookies hiệu suất (Performance cookies) được sử dụng bởi bên thứ ba để tối ưu hóa các ứng dụng (như video và bản đồ) được tích hợp trong trang web của chúng tôi. Để chấp nhận tất cả cookies, vui lòng bấm vào 'Tôi chấp nhận.'