Xây dựng cơ sở dữ liệu về an sinh quốc gia - Những thách thức

|

Xây dựng cơ sở dữ liệu về an sinh quốc gia - Những thách thức

An sinh quốc gia là khái niệm được nghiê;n cứu, tiếp cận dưới các góc độ khác nhau. Trong bài viết này*, khái niệm an sinh quốc gia được tiếp cận dưới góc độ là khái niệm bao trùm. Một quốc gia để đảm bảo an sinh quốc gia cần đảm bảo được các tiê;u chí về đảm bảo an ninh kinh tế, chính trị, văn hóa, xã hội và môi trường. Trê;n cơ sở bộ chỉ số về an sinh quốc gia đã được đề xuất với 554 chỉ tiê;u tương ứng với 09 trụ cột phản ánh khái niệm bao trùm về an sinh quốc gia, nhóm nghiê;n cứu đã tiến hành rà soát số liệu của từng chỉ tiê;u cho giai đoạn 2015 - 2020 và chỉ ra những thách thức liê;n quan đến việc thu thập, xử lý, chuẩn hoá số liệu này trong quá trình xây dựng cơ sở dữ liệu về an sinh quốc gia.

Từ khóa: An sinh quốc gia, cơ sở dữ liệu, chỉ số

Khái niệm an sinh quốc gia

Cho đến nay đã có nhiều tổ chức quốc tế, các nhà nghiê;n cứu cả trong và ngoài nước thông qua các công trình nghiê;n cứu khác nhau, ở một góc độ nào đó đã bàn đến khái niệm an sinh quốc gia, tuy nhiê;n các công trình nhìn nhận và đánh giá an sinh quốc gia từ những khía cạnh và ở các góc độ khác nhau, ví dụ từ khía cạnh an ninh quốc gia, an ninh lương thực, an ninh con người hay an sinh xã hội … Ở các góc độ này, khái niệm an sinh quốc gia cũng như nội hàm của khái niệm này vẫn chưa được hiểu một cách đầy đủ và thống nhất. Tuy nhiê;n, nội hàm các khái niệm an ninh quốc gia, an ninh lương thực, an ninh con người hay an sinh xã hội…đã cho thấy về bản chất một quốc gia đảm bảo được vấn đề an ninh/an sinh quốc gia chỉ khi người dân được đảm bảo các yếu tố như: Đảm bảo về an ninh kinh tế; an ninh lương thực, năng lượng; an ninh môi trường; an ninh y tế; an ninh việc làm; an ninh thông tin; an ninh chính trị; an ninh cá nhân và đảm bảo an ninh cho nhóm yếu thế như phụ nữ và nhóm dân tộc thiểu số.

Trong phạm vi bài viết, nhóm tác giả nghiê;n cứu, tiếp cận khái niệm an sinh quốc gia là một khái niệm bao trùm. Một quốc gia để đảm bảo an sinh quốc gia cần đảm bảo được các tiê;u chí về đảm bảo an ninh kinh tế, chính trị, văn hóa, xã hội và môi trường. Nội hàm của an sinh quốc gia bao gồm: (i) Phát triển kinh tế bền vững; (ii) Dân số, lao động và việc làm; (iii) Phát triển y tế và chăm sóc sức khỏe, (iv) Phát triển giáo dục và đào tạo; (v) Phát triển văn hóa tinh thần và đạo đức xã hội; (vi) Đảm bảo an ninh, trật tự an toàn xã hội; (vii) Bình đẳng giới; (viii) Bảo vệ các nhóm xã hội dễ bị tổn thương; (ix) Bảo vệ môi trường và ứng phó với biến đổi khí hậu.

Xác định các nguồn dữ liệu sẵn có

Để tiến hành rà soát số liệu của từng chỉ tiê;u đã được đề xuất trong bộ chỉ số về an sinh quốc gia cần căn cứ vào các nguồn dữ liệu hiện hành, sẵn có sau:

Niê;n giám Thống kê của Tổng cục Thống kê, Cục Thống kê tỉnh/thành phố trực thuộc Trung ương.

Niê;n giám Thống kê của các bộ, ngành: Bộ Giáo dục và Đào tạo, Bộ Y tế, Bộ Lao động, Thương binh và Xã hội…

Kết quả các cuộc Tổng điều tra, điều tra thống kê do Tổng cục Thống kê công bố, bao gồm Tổng điều tra kinh tế; Tổng điều tra Dân số và Nhà ở, Tổng điều tra Nông thôn,

nông nghiệp và thủy sản, Điều tra lao động và việc làm, Điều tra biến động dân số và kế hoạch hóa gia đình, Khảo sát mức sống dân cư,...Các ấn phẩm thống kê do Tổng cục Thống kê và bộ, ngành công bố: Báo cáo SDG, Sách Trắng doanh nghiệp Việt Nam, Thông tin thống kê giới 2020, Điều tra các mục tiê;u phát triển bền vững về trẻ em và phụ nữ, PAPI, PCI…

Thông tin thống kê từ website của Tổng cục Thống kê, Bộ Tài Nguyê;n và Môi trường, Bộ Lao động, Thương binh và Xã hội, Bộ Giáo dục và Đào tạo, Ngân hàng Nhà nước….

Kết quả rà soát cụ thể

Trê;n cơ sở bộ chỉ số về an sinh quốc gia đã được đề xuất với 554 chỉ tiê;u tương ứng với 09 trụ cột và căn cứ vào các nguồn dữ liệu sẵn có, mhóm nghiê;n cứu đã tiến hành rà soát số liệu của từng chỉ tiê;u cho giai đoạn 2015 - 2020, kết quả rà soát cụ thể như sau:

Bảng 1: Kết quả rà soát dữ liệu của Việt Nam đối với các trụ cột an sinh quốc gia

Theo Bảng 1, 397 chỉ tiê;u đã có số liệu; 157 chỉ tiê;u chưa có số liệu. 397 chỉ tiê;u đã thu thập được số liệu nhưng mức độ sẵn có của số liệu khác nhau, cụ thể: 76 chỉ tiê;u chỉ có số liệu trong 1 năm; 37 chỉ tiê;u có số liệu trong 2 năm; 50 chỉ tiê;u có số liệu trong 3 năm; 38 chỉ tiê;u có số liệu trong 4 năm; 49 chỉ tiê;u có số liệu trong 5 năm; 147 chỉ tiê;u có số liệu trong 6 năm.

Trong đó, những chỉ tiê;u chỉ có số liệu trong 1 năm hoặc 2 năm là những chỉ tiê;u thu thập qua Tổng điều tra hoặc có chu kỳ công bố số liệu dài (5 năm, 10 năm) hoặc thực hiện vào năm có tổng điều tra.

Những chỉ tiê;u có số liệu từ 3-5 năm là những chỉ tiê;u có kỳ công bố năm, tuy nhiê;n hiện mới thu thập được số liệu trong những năm gần đây.

Trong số 397 chỉ tiê;u đã thu thập được số liệu, có 318 chỉ tiê;u có số liệu theo phân tổ (giới tính, thành thị/nông thôn, ngành kinh tế…), những chỉ tiê;u còn lại chỉ có số liệu chung cả nước.

Một số thách thức trong xây dựng cơ sở dữ liệu an sinh quốc gia

Một là, thách thức liê;n quan đến thiếu số liệu, dữ liệu đối với từng trụ cột trong quá trình xây dựng cơ sở dữ liệu.

Theo như phần đánh giá thực trạng số liệu của bộ chỉ số an sinh quốc gia đề xuất, một số trụ cột đã có nguồn số liệu tương đối đầy đủ, thường xuyê;n như: Trụ cột 1. Phát triển kinh tế bền vững; Trụ cột 2. Dân số, lao động và việc làm; Trụ cột 3. Phát triển y tế và chăm sóc sức khỏe; Trụ cột 4. Phát triển giáo dục và Đào tạo.

Tuy nhiê;n, bê;n cạnh đó, các trụ cột còn lại rất hạn chế về tính sẵn có của số liệu để có thể phục vụ tính toán, đánh giá việc thực hiện những trụ cột này: Trụ cột 5. Văn hóa tinh thần và đạo đức xã hội; Trụ cột 6. Bảo đảm an ninh trật tự; Trụ cột 8. Bảo vệ các nhóm xã hội dễ bị tổn thương; Trụ cột 9. Bảo vệ môi trường và ứng phó với biến đổi khí hậu.

Khoảng trống về dữ liệu chủ yếu do những trụ cột này số liệu cần được thu thập qua điều tra thống kê, cần nguồn lực cả về tài chính lẫn con người rất lớn, nhưng ngân sách quốc gia không bảo đảm được do những ưu tiê;n trong từng giai đoạn, không bảo đảm đầy đủ nguồn lực để thu thập cho tất cả các lĩnh vực; hoặc số liệu chỉ được thu thập qua các cuộc Tổng điều tra với chu kỳ 10 năm một lần; không bảo đảm số liệu thường xuyê;n để giám sát việc thực hiện các mục tiê;u an sinh quốc gia của các trụ cột nê;u trê;n.

Ngoài ra, cơ chế phối hợp, chia sẻ dữ liệu giữa các Bộ, ngành còn nhiều hạn chế dẫn đến việc thiếu số liệu, dữ liệu của các chỉ tiê;u/chỉ số, trong khi đó các trụ cột an sinh quốc gia thuộc nhiều lĩnh vực khác nhau, chỉ tiê;u lại do nhiều Bộ, ngành thu thập, tổng hợp. Kết quả tham vấn tại Thành phố Đà Nẵng và Thành phố Hồ Chí Minh cho thấy, đối với trụ cột dân số, lao động và việc làm, hệ thống chỉ tiê;u cấp tỉnh chưa có các chỉ số về lao động bền vững, việc làm bền vững (lao động phi chính thức - lao động chính thức trong hệ số cấp tỉnh); tỷ lệ tham gia bảo hiểm xã hội bóc tách giữa lao động chính thức và phi chính thức, thu nhập nhân khẩu bình quân (thay thế cho GDP bình quân đầu người), đánh giá hiệu quả vốn đầu tư (tỷ trọng vốn đầu tư/GDP thay thế bằng hệ số ICOR…Trụ cột văn hóa tinh thần và đạo đức xã hội, Việt Nam hiện chưa đánh giá được thực tế sức khỏe tinh thần và đạo đức xã hội do số liệu chưa được lượng hóa. Phương pháp thu thập chưa thống nhất (tỷ lệ bạo lực học đường có đánh giá được không? Bạo lực gia đình có phải 1 chỉ tiê;u không?). Chỉ tiê;u cấp tỉnh để đánh giá những chỉ số này còn quá ít. Một số chỉ tiê;u mà cỡ mẫu ở cấp tỉnh còn nhỏ (đảm bảo độ tin cậy 95%) nhưng lệ thuộc hoàn toàn vào mức độ trung thực của người cung cấp thông tin và kinh phí (ví dụ, điều tra khảo sát mức sống)…

Các chỉ tiê;u đo hiện nay đều dựa vào cuộc khảo sát hàng năm, theo giai đoạn, do đó phụ thuộc nhiều vào ngân sách và thiếu tính ổn định. Đại diện Sở Lao động, Thương binh và Xã hội Thành phố Hồ Chí Minh cho rằng các chỉ tiê;u đều dựa vào khảo sát hàng năm, theo giai đoạn nê;n khá tốn kém, lệ thuộc vào ngân sách hàng năm. Đồng thời mỗi một địa phương hiện nay đang xây dựng chỉ tiê;u dựa trê;n một tiê;u chuẩn khác nhau, chưa theo chuẩn quốc gia. Ví dụ như chỉ số giảm nghèo, hiện nay Thành phố Hồ Chí Minh đang áp dụng đo lường nghèo đa chiều với 10 chỉ số khác với chỉ số giảm nghèo quốc gia.

Phương thức thực hiện để thống kê dữ liệu đối với một số chỉ tiê;u còn lạc hậu, sai số lớn. Ví dụ đối với các dữ liệu về nguồn cung lao động và cầu lao động, UBND cấp tỉnh thu thập theo sổ hộ khẩu từ các tổ dân phố…, sau đó Sở Lao động, Thương binh và Xã hội cập nhật vào phần mềm của Bộ Lao động, Thương binh và xã hội để xây dựng hệ thống dữ liệu. Tuy nhiê;n, phần mềm mà Bộ Lao động, Thương binh và Xã hội xây dựng lại chưa ổn định nê;n chưa có phần mềm thu thập nguồn cung lao động. Thu thập cầu lao động thông qua doanh nghiệp nhưng chưa có quy định pháp lý xử lý doanh nghiệp không khai báo, công bố thông tin.

Hai là, thách thức liê;n quan đến chuẩn hóa dữ liệu

Số liệu được xác định lựa chọn trong cơ sở dữ liệu an sinh quốc gia phải có sự thống nhất về Metadata. Metadata là khái niệm chỉ ra tính chất, đặc điểm nhận diện của chỉ tiê;u, chỉ số nào đó và được xác định theo các tiê;u thức như: Khái niệm chỉ tiê;u; nội dung của chỉ tiê;u; phương pháp tính của chỉ tiê;u; sự phân chia chỉ tiê;u thành các chỉ tiê;u thành phần (phân tổ chỉ tiê;u); kỳ công bố; thời kỳ, thời điểm thu thập số liệu…Trong cơ sở dữ liệu an sinh quốc gia, các chỉ tiê;u có thể được sử dụng lặp lại ở các trụ cột khác nhau, theo các mốc thời gian khác nhau… Do đó, một chỉ tiê;u phải thống nhất về metadata theo chuỗi thời gian nghiê;n cứu. Trong trường hợp có sự thay đổi theo thời gian thì phải bảo đảm có sự giải thích và công cụ chuyển đổi số liệu (các bảng mã, mã liê;n kết…) để bảo đảm số liệu có thể so sánh được theo thời gian…

Chính vì vậy, chuẩn hóa dữ liệu cũng là một trong những thách thức lớn, cụ thể: Chuẩn hóa nội dung (đặc tính) của từng chỉ tiê;u trong cơ sở dữ liệu; Định dạng dữ liệu theo các cấu trúc thống nhất; Đối chiếu và ánh xạ theo nội dung dữ liệu bảo đảm tương thích theo thời gian; Phân tách dữ liệu theo các chiều khác nhau: Thành thị/nông thôn, Tỉnh/thành phố, Dân tộc, Trình độ học vấn, Ngành kinh tế, Thành phần kinh tế, Trình độ đào tạo…

Vấn đề chuẩn hóa dữ liệu là một thách thức rất lớn, không chỉ đối với việc xây dựng cơ sở dữ liệu cho bộ chỉ số an sinh quốc gia mà là thách thức cho tất cả các cơ sở dữ liệu khác của Việt Nam hiện hành. Việc chuẩn hóa dữ liệu đang bước đầu được thực hiện ở cấp độ toàn cầu, với mục đích cuối cùng là có thể trao đổi, so sánh dữ liệu theo thời gian, không gian.

Ba là, thách thức liê;n quan đến nguồn số liệu

Hiện tại, các chỉ tiê;u thuộc các cơ sở dữ liệu trụ cột được thu thập chủ yếu qua: Điều tra thống kê; chế độ báo cáo thống kê và sử dụng dữ liệu hành chính cho hoạt động thống kê nhà nước. Những số liệu này chưa được sắp xếp, tổ chức khoa học, cập nhật và khai thác thường xuyê;n mà các thông tin đang nằm rải rác trong các nguồn thông tin chủ yếu như:

Niê;n giám Thống kê hàng năm của Tổng cục Thống kê; Niê;n giám Thống kê của các Bộ, ngành; Ấn phẩm từ các cuộc điều tra thống kê.

Số liệu trong Niê;n giám thống kê được xem là số liệu chính thống nhưng thời điểm công bố còn chậm, trong khi số liệu của các Sở cập nhật hơn nhưng lại chỉ được dùng để nghiê;n cứu chính sách. Hơn nữa, nhiều thông tin chỉ tiê;u quan trọng có thể tính toán được từ các nguồn số liệu hiện tại nhưng chưa được tính toán và công bố.

Ngoài ra, trong bối cảnh CMCN 4.0, cơ sở dữ liệu của các trụ cột phải được tích hợp thông tin từ các nguồn dữ liệu mới như các nguồn dữ liệu mở, dữ liệu lớn, dữ liệu viễn thám, vệ tinh… Đây là thách thức rất lớn trong việc xây dựng các cơ sở dữ liệu này.

Tóm lại, với nguồn dữ liệu hiện có liê;n quan đến 554 chỉ tiê;u được đề xuất trong bộ chỉ số an sinh quốc gia, việc xây dựng cơ sở dữ liệu về an sinh quốc gia sẽ gặp những thách thức lớn như thách thức về khoảng trống số liệu, nguồn dữ liệu và chuẩn hóa dữ liệu./.
Nguyễn Đình Khuyến

Nguyễn Đình Khuyến
Vụ trưởng Vụ Phương pháp chế độ và Quản lý chất lượng thống kê - TCTK

TS. Nguyễn Đình Hòa 
Viện Kinh tế Việt Nam
 
____________________________
* Bài viết là một phần sản phẩm của nhiệm vụ khoa học cấp Bộ “Thu thập, tổng hợp và đánh giá cơ sở dữ liệu thứ cấp phục vụ xây dựng bộ chỉ số an sinh quốc gia” thuộc Chương trình trọng điểm cấp Bộ “Xây dựng Bộ chỉ số đảm bảo an sinh quốc gia”.
Giải trí điện tử Futong Link