Chuyển đổi số và 98 triệu hồ sơ y tế: Bài toán khó
"Số hoá giáo dục thời Covid-19" - giải pháp facebook cho ngành giáo dục |
Từ trường ĐH Télécom Paris, Institut Polytechnique de Paris (Pháp), GS Phan Dương Hiệu đã đưa ra các ý kiến chuyên môn đáng chú ý cho bài toán này.
"Đừng vì cái này mà để mất cái kia"
Chúng ta đang quyết liệt bước vào chuyển đổi số, đặc biệt nhấn mạnh lĩnh vực y tế. Tại Hội nghị Chuyển đổi số Y tế quốc gia 2020 diễn ra mới đây, Bộ trưởng Bộ TTTT Nguyễn Mạnh Hùng đã nêu quyết tâm "hình thành con người số y học”. Mục tiêu này theo giáo sư có khả thi?
- Chuyển đổi số theo tôi có hai bước chính: Thu thập, số hoá dữ liệu và sau đó là xử lý dữ liệu. Tùy từng loại dữ liệu có thể xử lý thống kê, tìm kiếm thông thường hay thông qua các phương pháp tiên tiến trong Big Data và đặc biệt là AI (trí tuệ nhân tạo). Những tác dụng của Big Data và các phương pháp AI là có ý nghĩa lớn và cần phát triển. Tôi rất ủng hộ việc phát triển các công cụ mạnh của tin học nhằm đem lại những lợi ích thật sự cho người dân.
Tuy nhiên, việc phát triển cần phải đồng bộ để không vì được cái này mà mất đi cái khác không kém quan trọng. Nếu như trong lĩnh vực giáo dục, môi trường, hành chính công về căn cước công dân, hộ khẩu..., nhà nước có thể quản lý thông tin công dân thì trong lĩnh vực y tế, vấn đề lại hoàn toàn khác. Đừng chỉ vì thấy những ích lợi nhiều khi rất ấn tượng mà quên đi những mặt trái của nó, vì nếu không cẩn thận, "cái được sẽ không tày cái mất".
Do vậy, nếu ở mức cho một công ty tin học vào tất cả các bệnh viện và số hoá dữ liệu mọi bệnh nhân và sau đó tự phát triển công cụ xử lý dữ liệu thì có thể khả thi. Nhưng làm sao đảm bảo an toàn thông tin cho mọi cá nhân, cấu trúc rõ quyền phân cấp truy cập thông tin, áp dụng các kỹ thuật phân tán để có thể kiểm soát không cho phép công ty đó tuỳ ý truy cập thao túng dữ liệu thì theo tôi chưa khả thi trong thời gian ngắn, trong bối cảnh các chính sách bảo vệ quyền riêng tư còn chưa rõ ràng.
Cái được ở đây - theo người được giao trọng trách - thì kho dữ liệu khám chữa bệnh của mọi người một khi được lưu trữ, phân tích sẽ hỗ trợ rất nhiều cho bác sĩ mỗi lần thăm khám, trong khi AI có thể tư vấn trong sinh hoạt, giữ gìn sức khoẻ; đồng thời giúp cho người dân nông thôn, vùng sâu vùng xa có thể tiếp cận được hàng nghìn bác sĩ giỏi trên toàn quốc để được tư vấn 24/24h... Đó rõ ràng là những hiệu quả sát sườn đấy chứ?
- Như tôi nói, không khó để kể ra các mặt tích cực. Điểm đầu tiên tôi hoàn toàn đồng ý là dữ liệu số, AI có thể trợ giúp bác sỹ phân tích, chẩn đoán, giảm tải công việc và từ đó giúp tăng hiệu suất làm việc hơn. Nhưng từ kinh nghiệm khám chữa bệnh từ xa ở các nước, tôi không nghĩ việc phát triển các phần mềm khám chữa bệnh từ xa sẽ đem lại thay đổi đột phá về chất lượng khám chữa bệnh. Tất nhiên việc kết nối rõ ràng là thuận tiện hơn và người miền xa sẽ có nhiều cơ hội, đó là điểm tích cực. Nhưng mặt khác, nếu số bác sỹ vẫn như vậy và thời gian làm việc của bác sỹ không đổi (hiện tại đã quá tải) thì số bệnh nhân được bác sỹ khám cũng sẽ không tăng thêm (thậm chí khám cho một bệnh nhân từ xa có thể còn mất thời gian hơn là trực tiếp). Khi bác sỹ mất thời gian cho khám bệnh từ xa thì nhiều bệnh nhân trực tiếp lại sẽ bị giảm cơ hội, và không loại trừ những người “quan trọng" từ xa sẽ lạm dụng yêu cầu được khám những bác sỹ giỏi nhất để khám những bệnh không cần thiết ở mức độ đó, dẫn đến mất cơ hội cho nhiều người khác cần gấp hơn.
Sự bất cập nào theo giáo sư là đáng ngại hơn cả?
- Thông tin y tế được xếp vào thông tin nhạy cảm, có những thông tin được xếp mức độ bảo mật rất cao. Không ngoại trừ, những thông tin cá nhân nhạy cảm nếu không được bảo vệ có thể dẫn đến những hệ lụy nghiêm trọng.
Với từng cá nhân, không đảm bảo quyền riêng tư trong một số trường hợp có thể gây khá nhiều phiền nhiễu và thậm chí là nguy hiểm cho người dân. Chẳng hạn, trong hội nghị chuyển đổi số y tế quốc gia vừa qua có nêu quyết tâm số hóa 98 triệu hồ sơ y tế, bấm một nút là biết có bao nhiêu người bị bệnh gì. Nhưng đặt vấn đề ngược lại, nếu dữ liệu được truy cập dễ và không được bảo mật tốt, một người nào đó cần ghép thận, có thể “mua” dữ liệu (qua hacker hay người quản lý dữ liệu) để biết được những ai khoẻ mạnh có nhóm máu, chỉ số phù hợp với người đó, nhất là trong những người dân nghèo, họ có thể cho người tìm đến ép bán. Trừ phi, nếu phát triển công cụ tuyệt đối bảo mật danh tính để ghép nối những người cần và tự nguyện cho thì lại là tích cực, an toàn. Dữ liệu y tế không được bảo vệ tốt có thể làm bùng nổ thị trường buôn bán nội tạng, kẻ xấu nếu biết được thông tin y tế của người dân sẽ rất nguy hiểm...
Thông tin y tế có mức độ cần bảo mật cao so với các loại thông tin cá nhân khác. Chẳng hạn, nếu kẻ xấu phá mã đọc được thư từ, tài khoản riêng của bạn thì tác hại đó là tức thời và sau đó có thể khắc phục. Nhưng nếu kẻ xấu nắm bắt được thông tin y tế, về gene, nhóm máu... của bạn thì không có cách gì khắc phục bởi những thông tin đó là đặc trưng cho suốt cuộc đời ta. Chính bởi vậy, quản lý dữ liệu y tế cần làm hết sức cẩn thận, không thể vì nhanh đạt mục tiêu mà bỏ qua những chuẩn mực.
"Lợi bất cập hại" của AI, không riêng gì lĩnh vực y tế?
- Tất nhiên rồi, cái gì cũng có mặt trái nhưng quan trọng là mức độ đến đâu. Như tôi nói, có những lĩnh vực như trong giáo dục đào tạo thì các phương pháp AI hầu như không có mặt trái, còn nhiều lĩnh vực như y tế, an ninh, quân đội thì cần cẩn trọng. Chẳng hạn việc thu thập dữ liệu về công dân để phát triển các hệ thống AI giám sát, nhận dạng, tính điểm công dân như bên Trung Quốc, mà tôi đã có dịp phân tích kỹ, là rất bất cập, không nhân văn, biến con người hành xử như robot. Hay một rủi ro khác ở bình diện quốc tế là việc ứng dụng AI vào hiện đại hoá quân đội. Nhìn vào cuộc chiến mới đây giữa Armenia với Azerbaijan, chúng ta có thể giật mình khi vai trò của các máy bay không người lái, các drone có sức mạnh huỷ diệt đến thế nào. Nếu tất cả đều chạy đua thì nguy cơ thế giới bị hủy diệt sẽ không xa khi những sức mạnh khủng khiếp có thể ở trong tầm tay của bất kỳ ai. Cũng như việc phát triển vũ khí hạt nhân, tôi nghĩ các nước cần phải ngồi lại thống nhất với nhau xem giới hạn nào của AI là không thể vượt qua bởi nó sẽ ảnh hưởng đến sự tồn vong của thế giới. Chúng ta rất cần nghiên cứu AI trong quân đội để không đi sau các nước, nhưng cũng cần tham gia và tôn trọng các giới hạn quốc tế.
Tôn trọng quyền riêng tư để đảm bảo an toàn
Giáo sư nghĩ sao về việc phát triển cơ sở dữ liệu chung để nghiên cứu gene người Việt?
- Dữ liệu gene là dữ liệu nhạy cảm nhất trong các dữ liệu y tế, nó cho ta hiểu rất nhiều về một con người, gắn chặt suốt đời với một con người, do vậy mức độ bảo mật phải ở mức cao nhất. Tất nhiên việc nghiên cứu là rất cần thiết, và để nghiên cứu được thì cần phải thu thập, chia sẻ dữ liệu. Bài toán khó là làm sao vừa chia sẻ nhưng vừa bảo mật được ở mức cao.
Đã có nhiều nước như Mỹ khi ban đầu công bố dữ liệu gene nhiều năm trước, dù đã được bảo mật (bỏ danh tính, thông tin người bệnh...) nhưng vẫn bị tấn công. Kẻ tấn công có thể sử dụng so sánh dữ liệu bên ngoài, chẳng hạn như dữ liệu bầu cử để đối chiếu và dẫn tới khớp gene với người cụ thể. Từ những điểm yếu đó mà Mỹ và nhiều nước đã ra những chính sách, yêu cầu bảo mật rất cao và họ mở những không gian để thu hút hacker mũ trắng tìm ra các điểm yếu của hệ thống, thưởng lớn cho mỗi lỗi tìm ra. Chúng ta cũng cần áp dụng những cách làm tương tự, phải thật đảm bảo an toàn, được kiểm soát độc lập bởi các công ty kiểm định và bởi cộng đồng, trước khi triển khai dữ liệu quy mô lớn.
Vấn đề nghiên cứu gene để hiểu đặc tính người Việt cũng cần thận trọng bởi nếu dữ liệu công bố hoặc bị lấy, bị hack đủ lớn thì có thể các nước khác sẽ hiểu ta còn hơn ta (do một số nước đã có những công cụ AI mạnh hơn).
Với dữ liệu y tế, sự cẩn trọng cần có ở đây là gì?
- Cần có chiến lược phát triển công cụ khai thác dữ liệu đồng bộ với đảm bảo bảo mật, quyền riêng tư. Trước hết, cần phải có luật, chính sách về bảo mật/quyền riêng tư; sau đó các nền tảng dữ liệu cần tuân thủ đúng các yêu cầu đó. Một chính sách phân cấp mức độ nhạy cảm của thông tin, đồng thời tương ứng mức độ bảo mật, kiểm soát chặt chẽ độ an toàn dữ liệu là cần thiết. Thông tin về lợi ích đem lại cần đặt trong tổng thể, song hành với thông tin về những rủi ro có thể bị khai thác. Hy vọng đã có những nghiên cứu kỹ càng về kinh nghiệm của các nước tiên tiến đi trước để có luật, quy định, chính sách phù hợp.
Các chính sách này cũng phụ thuộc rất lớn vào đặc trưng của dữ liệu. Chẳng hạn, với dữ liệu về hành chính, rõ ràng nhà nước có thể quản lý một số thông tin công dân như trên sổ hộ khẩu, việc an toàn chỉ là phát triển bảo mật dữ liệu lưu trữ và hệ thống nội bộ trong chính phủ mà không cần nối mạng trực tiếp ra ngoài. Tôi cho rằng việc này có thể làm tốt vì chúng ta cũng đã có những cơ sở quy định bảo mật dữ liệu.
Với dữ liệu quan trọng như y tế không phải chỉ cần bảo mật đơn thuần mà cần có sự phân cấp rõ ràng ai có quyền truy cập dữ liệu và truy cập đến mức độ nào. Chẳng hạn, chính phủ không thể có quyền tuỳ tiện truy cập dữ liệu của người dân. Khi chưa có chính sách, nền tảng kỹ thuật đảm bảo yêu cầu thì không biết 98 triệu hồ sơ y tế của dân/100% dữ liệu của cán bộ sẽ lưu vào đâu, thế nào; có gì đảm bảo sẽ không bị hack, hay bị truy cập tuỳ tiện? Việc phát triển một hệ thống phân cấp bảo mật, quy định ai có quyền truy cập dữ liệu đến đâu, là không hề đơn giản và cần phải làm tốt trước khi lưu trữ dữ liệu nhạy cảm.
Với những dữ liệu vừa quan trọng lại vừa là đầu vào cho các thuật toán xử lý như AI thì cần kiểm soát rất chặt chẽ để những công ty triển khai khai thác không thể lạm dụng dữ liệu cho những việc ngoài mục đích. Tất cả chúng ta đều đã thống nhất coi dữ liệu là nguồn tài nguyên rất giá trị, việc thao túng dữ liệu sẽ tạo lợi thế cho các tập đoàn lớn và sẽ rủi ro cho người dân nếu bị sử dụng không đúng mục đích. Các nền tảng cần phải được kiểm soát và được kiểm định cẩn thận trước khi triển khai lưu trữ, xử lý dữ liệu quan trọng.
Tất nhiên là ở bất kỳ đâu cũng có rủi ro và đều có thể trở thành mục tiêu của hacker, nhưng nếu chuẩn bị nền tảng vững, cộng với luật, chính sách rõ ràng; phân cấp, phân tán quyền truy cập, thì sẽ hạn chế được nhiều rủi ro và tránh bị hack trên quy mô rộng.
Cân nhắc lợi hại, có thể hiểu, không hẳn lĩnh vực nào cũng nên số hoá nhanh?
- Vâng, cần xác định rõ cái gì cần làm và cần đảm bảo an toàn ở mức độ nào. Một trong các nguyên tắc rất quan trọng trong chuyển đổi số là phải đồng thời vừa tăng sự minh bạch lại vừa bảo đảm bí mật. Cần minh bạch tất cả những gì dính đến công (chi tiêu, quyết định công về kinh tế, xã hội, giáo dục; các dịch vụ công như giấy tờ, chứng minh thư, hộ khẩu...).
Và bảo đảm bí mật tất cả những gì là riêng (riêng theo nghĩa rộng: Thông tin riêng tư của cá nhân, doanh nghiệp; thông tin bí mật quốc gia...). Việc thực hiện, phát triển các phương pháp xử lý dữ liệu, thông tin (chính phủ hay doanh nghiệp chạy các thuật toán trên dữ liệu lớn được số hoá) đồng thời đảm bảo đạt được nguyên tắc trên (thông qua cam kết và giám sát, kiểm định độc lập) phải được coi là một trọng tâm trong chuyển đổi số.
Vậy theo giáo sư, những vấn đề nào nên ưu tiên số hoá?
- Tất nhiên là cần phát triển trong mọi lĩnh vực, nhưng lĩnh vực nào dữ liệu nhạy cảm cần cơ chế bảo mật cao thì cần nghiên cứu chính sách rõ ràng, có sự chuẩn bị nền tảng vững vàng trước khi triển khai trên diện rộng. Còn có những lĩnh vực mà độ bảo mật không quá cao thì có thể triển khai mạnh mẽ, tôi nêu vài lĩnh vực sau đây.
Tôi cho rằng cần đẩy mạnh số hoá các thông tin liên quan đến giáo dục, môi trường, giao thông, hành chính công và các hoạt động công. Mới đây, tôi cũng thấy những bước tiến lớn như việc làm thẻ căn cước công dân điện tử. Số hoá hành chính sẽ giúp người dân tiết kiệm được thời gian và nâng cao hiệu suất lao động khi không cần phải ra phường, lên quận làm đủ thứ giấy tờ. Hoặc ưu tiên số hoá các hoạt động liên quan đến giáo dục, đưa kiến thức hiện đại tới người học nhanh hơn, chẳng hạn dịch tự động sang tiếng Việt các bài giảng, khoá học chuẩn của thế giới sẽ giúp việc tiếp cận kiến thức dễ dàng hơn. Thu thập dữ liệu về giao thông để phân tích tìm phương án tối ưu trong việc xây, sửa nâng cấp đường sá. Phát triển các công cụ phân tích và xử lý dữ liệu để tìm ra phương án tối ưu trong bảo vệ môi trường, giảm tải tác hại của thiên tai...
Mảng thứ hai là số hoá minh bạch toàn bộ những hoạt động công (chi tiêu, quyết định công về kinh tế, xã hội, giáo dục). Gần đây tôi cũng rất mừng khi chính phủ đã có chủ trương cho việc này. Chúng ta biết là khi thông tin càng mù mờ thì càng có nhiều không gian cho những hành động tham nhũng, khuất tất. Do vậy, cần có sự quyết tâm cao để vượt trên những lợi ích nhóm. Đã đến lúc chúng ta không chỉ thuyết phục người dân tin tưởng bằng quyết tâm, bằng những lời hứa. Cách làm chuẩn mực là chúng ta tham gia các cam kết quốc tế về các tiêu chuẩn minh bạch, chính phủ mở. Hiện tại đã có rất nhiều nước tham gia và được đánh giá theo chuẩn quốc tế. Chỉ khi tham gia các tiêu chuẩn quốc tế về minh bạch, được đánh giá cao một cách khách quan thì chúng ta mới có thể tự hào cho rằng mình tiên tiến.
Những việc trên đều là những việc cơ bản cho một chính phủ điện tử mà chúng ta đã nghĩ tới từ 30-40 năm trước. Hiện nay, lực lượng làm IT của ta đã lớn mạnh hơn, hy vọng sẽ làm được tốt những việc cơ bản đó, song song với việc phát triển những ứng dụng phức hợp một cách thực chất, an toàn và hiệu quả.
Xin cảm ơn giáo sư!
"Tất nhiên là ở bất kỳ đâu cũng có rủi ro và đều có thể trở thành mục tiêu của hacker, nhưng nếu chuẩn bị nền tảng vững, cộng với luật, chính sách rõ ràng; phân cấp, phân tán quyền truy cập, thì sẽ hạn chế được nhiều rủi ro và tránh bị hack trên quy mô rộng". |