Quản trị dữ liệu, kiến thức dữ liệu và quản lý chất lượng dữ liệu – Phần III


Rõ ràng là các dịch vụ dữ liệu nghiên cứu được cung cấp bởi các thư viện đại học có thể đóng vai trò quan trọng như là các trung tâm dữ liệu chất lượng trong trường đại học, bằng cách cung cấp các dịch vụ kiểm tra và kiểm định chất lượng dữ liệu cho các cộng đồng nghiên cứu. Mặc dù mối quan tâm tới tính sẵn có của dữ liệu là một yêu cầu rõ ràng, không cần giải thích thêm, song việc hướng đến các thủ thư dữ liệu, hiểu biết về cách đánh giá tính xác thực, tính toàn vẹn và tính chính xác của các đối tượng số theo thời gian cũng sẽ có ích. Gần đây, Zilinski và Nelson (2014) đã xác định một số yếu tố khác của chất lượng dữ liệu như phạm vi và sự liên quan đến câu hỏi và định dạng nghiên cứu, bao gồm các trường và các đơn vị được sử dụng, các quy ước đặt tên, ngày tạo và cập nhật. Chúng cũng hướng sự chú ý của chúng ta đến một tập hợp các thuộc tính kiểm soát chất lượng tương tự như quản trị dữ liệu để trả lời câu hỏi xem kiểm soát chất lượng được nêu rõ hay không bằng cách tìm hiểu xem ai có trách nhiệm kiểm tra chất lượng và những quy trình nào họ sử dụng.

Quản trị dữ liệu thành công không chỉ phụ thuộc vào các quy định liên quan đến vai trò nói chung, mà còn các trách nhiệm liên quan đến các tiêu chuẩn dữ liệu thích hợp và các môi trường siêu dữ liệu được quản lý. Do đó, quản lý siêu dữ liệu là một trong những quá trình quản trị dữ liệu quan trọng liên quan đến chất lượng vì nó cho phép – trong số những thứ khác – ghi lại nguồn gốc dữ liệu đảm bảo chất lượng được đảm bảo.

Quản trị dữ liệu, chất lượng dữ liệu và kiến thức dữ liệu

Để minh chứng tầm quan trọng của quản trị dữ liệu, chúng ta có thể xem xét nghiên cứu tình huống của Soares (2012) về những sự kiện không may xung quanh tàu thăm dò sao Hỏa (Mars Climate Orbiter). Năm 1999, một lỗi định hướng dẫn Orbiter vào quỹ đạo thấp hơn 170 km so với độ cao dự kiến trên sao Hỏa bởi vì các kỹ sư của NASA đã sử dụng các đơn vị Anh (pound) thay vì các đơn vị được chỉ định của NASA (newtons). Sai lầm tương đối nhỏ này dẫn đến sự tính toán sai lầm lớn về độ cao quỹ đạo và tổn thất 328 triệu USD. Với sự chú ý đặc biệt đến các nguyên tắc quản trị dữ liệu và các chi tiết thực tế, và nếu các kỹ năng kiến thức dữ liệu được huy động thì tai nạn này có thể tránh được.

Mặc dù kiến thức dữ liệu đang trải qua giai đoạn phát triển, song kiến thức dữ liệu bắt đầu được chấp nhận rộng rãi như là một khả năng quan trọng cho các chuyên gia thông tin tham gia và việc hỗ trợ nghiên cứu chuyên sâu về dữ liệu. Mặt khác, các thuật ngữ trong lĩnh vực kiến thức dữ liệu vẫn chưa được chuẩn hóa. Ở đây có kiến thức dữ liệu khoa học kiến thức dữ liệu nghiên cứu. Carlson (2011) tranh luận về kiến thức dữ liệu thông tin vì – theo cách tiếp cận của học – nó khác với ý nghĩa hạn chế của kiến thức dữ liệu, tức là khả năng đọc đồ thị và biểu đồ thích hợp, rút ra kết luận chính xác từ dữ liệu và nhận dạng khi dữ liệu được sử dụng theo cách thức gây hiểu nhầm hoặc không thích hợp. Sau đây, sự khác biệt về đặt tên sẽ không được xem xét, và chúng tôi sẽ bỏ phiếu cho thuật ngữ kiến thức dữ liệu trước bởi vì thuật ngữ này đơn giản và dễ hiểu, mặc dù nó có vẻ không có giới hạn mà Carlson đề cập. Bên cạnh đó, mặc dù các thuật ngữ khác nhau, song định nghĩa và danh sách năng lực cho thấy sự hội tụ. Nếu chúng ta nhìn vào sự phát triển của các định nghĩa về kiến thức dữ liệu, chúng ta có thể thấy rằng Fosmire và Miller (2008) đã nói đơn giản về kiến thức thông tin trong thế giới dữ liệu. Hai năm sau, kiến thức dữ liệu được định nghĩa rõ ràng là khả năng hiểu, sử dụng và quản lý dữ liệu. Theo định nghĩa của Calzada Prado và Marzal (2013), kiến thức dữ liệu cho phép các cá nhân truy cập, diễn giải, đánh giá, quản lý, xử lý và sử dụng dữ liệu hợp lý.

Như đã đề cập ở trên, Johnson (2012) mô tả kiến thức dữ liệu chi tiết hơn, xác định nó như là khả năng xử lý, sắp xếp và lọc số lượng lớn thông tin, việc này đòi hỏi phải biết cách tìm kiếm, lọc và xử lý để sản xuất và tổng hợp thông tin. Rõ ràng rằng các thuộc tính này về cơ bản giống với các đặc điểm của kiến thức thông tin khi chúng xuất hiện trong định nghĩa phổ biến và được thừa nhận rộng rãi về kiến thức thông tin, bao gồm khả năng nhận biết nhu cầu thông tin, xác định, định vị, đánh giá và sử dụng thông tin để giải quyết một vấn đề cụ thể. Tuy nhiên, cần nói thêm rằng – mặc dù kiến thức thông tin dường như chủ yếu cho phép chúng ta xử lý hiệu quả tất cả các loại nội dung thông tin – cộng đồng hoạt động đối với thủ thư dữ liệu khác với kiến thức thông tin.

Về những điểm tương đồng với kiến thức thông tin, cần nói thêm rằng một số tác giả nhấn mạnh điều đó. Khung kiến thức thông tin của Australia và New Zealand, do Alan Bundy (2004) biên soạn, cho biết những người có kiến thức thông tin có thể thu thập, lưu trữ và phổ biến không chỉ văn bản mà cả dữ liệu nữa. Andretta (2008) đã xác định việc trình bày, đánh giá và diễn giải các dữ liệu định tính và định lượng như là một kết quả học tập của kiến thúc thông tin. Theo Hunt (2004), việc đào tạo kiến thức dữ liệu cần phải vay mượn từ đào tạo kiến thức thông tin, ngay cả khi lĩnh vực kiến thức dữ liệu phân tán hơn lĩnh vực kiến thức thông tin. Schneider (2013) cũng xác định kiến thức dữ liệu như là một phần của kiến thức thông tin.

Cả mô hình Bảy trụ cột của kiến thức thông tin SCONUL (2011) và thấu kính kiến thức thông tin về Khung phát triển của các nhà nghiên cứu Vitae (Vitae, 2011) đều nhấn mạnh rằng để xác định thông tin nào có thể cung cấp tư liệu tốt nhất nhằm đáp ứng nhu cầu tin, tìm kiếm, tạo ra và xử lý với dữ liệu nghiên cứu là rất quan trọng, vì kiến thức thông tin hiện nay không chỉ bao gồm các thông tin được công bố và các dữ liệu cơ bản. Điều này phù hợp với cách giải thích rộng hơn về kiến thức thông tin, trong đó thừa nhận rằng khái niệm thông tin bao gồm dữ liệu nghiên cứu. Carlson (2011) nhấn mạnh rằng việc mở rộng phạm vi kiến thức thông tin bao gồm quản lý dữ liệu là một sự phát triển hợp lý. Si (2013) cho rằng các dịch vụ liên quan đến dữ liệu cần được các chuyên gia giỏi về kiến thức thông tin hỗ trợ.

Mặc dù không đề cập đến kiến thức dữ liệu, Wang (2013) đề cập đến các cán bộ tra cứu thường xuyên tổ chức các buổi học kiến thức thông tin để đào tạo người dùng tin về các nguồn dữ liệu hiện có cho các lĩnh vực nghiên cứu cụ thể của họ.

Calzada Prado và Marzal (2013) cho biết rằng kiến thức thông tin và kiến thức dữ liệu là một phần của sự liên tục giáo dục về khoa học, một quá trình đào tạo dần dần bắt đầu ở trường học được hoàn thiện và trở nên chuyên sâu trong đào tạo đại học và trở thành một phần của quá trình học tập suốt đời. Khi đề xuất một khuôn khổ mới cho đào tạo kiến thức dữ liệu, Maybee và Zilinski (2015) cũng chỉ ra mối quan hệ chặt chẽ giữa kiến thức thông tin và kiến thức dữ liệu.

Ngoài các định nghĩa, việc áp dụng và phân tích một số tiêu chuẩn kiến thức thông tin, Calzada Prado và Marzal (2013: 126) đã xác định được một số khả năng, một số đã chỉ rõ nguồn gốc của họ trong định nghĩa phổ biến nhất về kiến thức thông tin và Tiêu chuẩn năng lực kiến thức thông tin cho giáo dục đại học.

+ Xác định khi dữ liệu là cần thiết;

+ Truy cập các nguồn dữ liệu phù hợp với các thông tin cần thiết;

+ Nhận biết giá trị, loại và định dạng dữ liệu nguồn;

+ Đánh giá dữ liệu và nguồn của nó;

+ Biết cách lựa chọn và tổng hợp dữ liệu và kết hợp dữ liệu với các nguồn thông tin khác và kiến thức sẵn có;

+ Sử dụng dữ liệu một cách đạo đức;

+ Áp dụng kết quả để học tập, ra quyết định hoặc giải quyết vấn đề.

Họ cũng nhấn mạnh đến khả năng xác định bối cảnh trong đó dữ liệu được tạo ra và tái sử dụng. Bằng cách đề cập đến hai thành phần chính trong vòng đời dữ liệu, chúng phù hợp với quan điểm hiện tại về kiến thức thông tin kết hợp sự hiểu biết về cách thức tạo ra thông tin.

Mandinach và Gummer (2013) xác định kiến thức dữ liệu là khả năng hiểu và sử dụng dữ liệu hiệu quả để đưa ra quyết định. Với điều này, họ mang lại trọng lượng cho vai trò của kiến thức dữ liệu trong việc hỗ trợ việc ra quyết định Do đó, chúng mang kiến thức dữ liệu đến quản trị dữ liệu, thừa nhận rằng nó có thể được gắn liền với thế giới kinh doanh.

(còn tiếp)

Người dịch: Phương Hoài

Nguồn: Tibor Koltay – Data governance, data literacy and the management of data quality – IFLA Journal, Vol. 2, Issue 4, 2016.

TN 2017 – 91 & 92.

Advertisements

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất /  Thay đổi )

Google photo

Bạn đang bình luận bằng tài khoản Google Đăng xuất /  Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất /  Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất /  Thay đổi )

Connecting to %s