Tiến hóa của kỹ thuật cơ sở dữ liệu – Phần VII


4.3/ Các cơ sở dữ liệu dùng cho phân xưởng

Thuật ngữ “phân xưởng” nhằm vào đơn vị chức năng trong tổ chức. Thí dụ điển hình về đơn vị này là phòng nhân sự, phòng kế toán tài chính, phân xưởng sản xuất. Nhìn chung phân xưởng có quy mô lớn hơn nhóm công tác, giới hạn trong vòng 25 đến 100 người, liên quan đến nhiều loại chức năng.

Các cơ sở dữ liệu quy mô phân xưởng được thiết kế để phục vụ nhiều chức năng và hoạt động của phân xưởng, phòng ban. Loại cơ sở dữ liệu này là loại phổ biến nhất trong số bốn loại cơ sở dữ liệu đang kể ra. Chẳng hạn người ta thiết kế cơ sở dữ liệu về nhân sự liên quan đến nhân viên, công việc, khả năng làm việc và phân công công tác. Sơ đồ đơn giản hóa về cơ sở dữ liệu này có thể được thể hiện qua các hình, gồm các thực thể và các mối quan hệ. Người dùng cơ sở dữ liệu có thể đặt các câu hỏi đại loại như (i) Có cơ hội làm việc nào không trong cơ quan này vào thời điểm hiện tại?; (ii) Với công việc lựa chọn thì đòi hỏi kỹ năng nghề nghiệp ra sao?; (iii) Nếu biết một nhân viên, liệu có thể biết những công tác mà họ được phân công không? hay có thể biết những nhân viên nào đã từng làm công việc đang quân tâm không?…

Các vấn đề đặt ra khi thiết kế cơ sở dữ liệu dùng cho ứng dụng quy mô nhỏ như phân xưởng là:

+ Trên các nhiệm vụ đặt ra và với số người sử dụng đã biết, thiết kế nào cho phép xây dựng môi trường cơ sở dữ liệu phù hợp?

+ Biện pháp đảm bảo an toàn dữ liệu trong điều kiện có thể có người dùng không hợp pháp và luôn muốn truy cập các dữ liệu nhạy cảm, quan trọng;

+ Khi môi trường sản xuất trở nên phức tạp, người ta có các công cụ phát triển hệ thống cơ sở dữ liệu nào?

+ Khi đơn vị quy mô phân xưởng cũng cần các dữ liệu như cơ sở dữ liệu đang có, người ta quản lý siêu dữ liệu, quản lý tính dư thừa dữ liệu và tính tương hợp giữa các dữ liệu như thế nào thì tốt nhất?

+ Cơ sở dữ liệu phân tán có cần thiết không, khi kích thước cơ sở dữ liệu đang dùng trở nên quá lớn?

4.4/ Cơ sở dữ liệu dùng cho toàn xí nghiệp

Cơ sở dữ liệu loại này dùng cho toàn tổ chức hay toàn xí nghiệp, chí ít cũng cho nhiều phân xưởng khác nhau. Nó được dùng cho các hoạt động quy mô toàn xí nghiệp và đặc biệt là trợ giúp ra quyết định. Do một tổ chức có nhiều cơ sở dữ liệu loại này, nên không nhất thiết mỗi cơ sở dữ liệu đều lưu trữ tất cả các dữ liệu về tổ chức. Việc thiết kế một cơ sở dữ liệu cho toàn xí nghiệp là không thực tế, bởi lẽ (i) khó có thể quản lý một cơ sở dữ liệu cực lớn; (ii) độ phức tạp tăng cao khi có nhiều người dùng cơ sở dữ liệu, với những yêu cầu khác nhau, tức là siêu dữ liệu khác nhau; (iii) cần thiết sử dụng những thông tin từ các cơ sở dữ liệu phân xưởng. Một giải pháp cho tổ chức lớn là kho dữ liệu, cho phép truy cập dữ liệu từ nhiều cơ sở dữ liệu phân xưởng.

Định nghĩa: Kho dữ liệu (datawarehouse) là cơ sở dữ liệu tích hợp trợ giúp quyết định, bao gồm thông tin trích từ các cơ sở dữ liệu khác.

Kho dữ liệu sẽ dùng nhiều công cụ để trích dữ liệu, tổng hợp dữ liệu từ các cơ sở dữ liệu đang phục vụ công tác hàng ngày, tức các cơ sở dữ liệu tác nghiệp. Tổ chức sử dụng mô hình dữ liệu xí nghiệp để thiết kế cơ sở dữ liệu xí nghiệp, kho dữ liệu.

Định nghĩa: Mô hình dữ liệu xí nghiệp (enterprise data model) là mô hình đồ họa, cho biết các thực thể ở mức cao trong tổ chức, xí nghiệp và mối quan hệ giữa các thực thể đó.

Một số vấn đề đặt ra khi thiết kế loại cơ sở dữ liệu quy mô xí nghiệp là:

+ Các dữ liệu được phân bố ra sao trên các vị trí khác nhau của tổ chức?

+ Liên quan đến chuẩn hóa dữ liệu, khuôn dạng riêng của tổ chức, cách xác định dữ liệu,… người ta cần đưa ra công cụ phát triển và bảo trì phù hợp.

4.5/ Những ưu điểm tiếp cận cơ sở dữ liệu

Tiếp cận sử dụng các nguyên lý của cơ sở dữ liệu đảm bảo nhiều ưu điểm tiềm tàng so với các hệ thống xử lý tệp truyền thống. Trước tiên là các ứng dụng đa dạng, được liệt kê trong bảng, theo thống kê năm 1995 của White.

Bảng 2: Tổng quan về các ứng dụng của cơ sở dữ liệu

Loại cơ sở dữ liệuSố lượng người dùng điển hìnhKiến trúc điển hìnhKích cỡ điển hình
Máy tính cá nhân1Máy tính đặt bànMegabyte
Nhóm công tác5 – 25Khách/chủ (hai phần ba)Megabyte, Gigabyte
Phân xưởng25 – 100Khách/chủ (ba phần ba)Gigabyte
Xí nghiệpTrên 100Khách/chủ (máy chủ song song hoặc phân tán)Gigabyte đến Terabyte

Các ưu điểm của tiếp cận cơ sở dữ liệu gồm có:

1/ Độc lập giữa dữ liệu và chương trình. Việc tách mô tả dữ liệu, tức là siêu dữ liệu, ra khỏi chương trình ứng dụng sử dụng dữ liệu đó gọi là độc lập dữ liệu. Theo cách làm của cơ sở dữ liệu, người ta lưu trữ siêu dữ liệu tại nơi khác, gọi là từ điển dữ liệu. Người ta có thể thay đổi dữ liệu về tổ chức mà không cần thay đổi chương trình ứng dụng;

Định nghĩa: Độc lập dữ liệu (program-data independence) là việc tách các mô tả dữ liệu ra khỏi các chương trình ứng dụng sử dụng dữ liệu đó;

2/ Giảm thiểu dư thừa dữ liệu. Khác với các hệ thống xử lý tệp, các dữ liệu trong cơ sở dữ liệu được tổ chức theo cấu trúc thống nhất, hợp lý nên hạn chế được việc lưu trữ dữ liệu tại nhiều nơi khác nhau. Tuy nhiên việc dư thừa dữ liệu không thể hết được; chẳng hạn như các dữ liệu liên kết các tệp dữ liệu khác nhau vẫn được lưu trữ trên nhiều tệp;

3/ Tăng tính nhất quán dữ liệu. Tính nhất quán của dữ liệu là tính chất phù hợp của dữ liệu dưới các điều kiện mà nó phải tuân theo. Đôi khi do sơ suất mà giá trị của dữ liệu thay đổi ngoài ý muốn, tức là mất sự nhất quán. Cơ sở dữ liệu đã giảm được dư thừa thì khả năng rủi ro do thay đổi giá trị đó cũng giảm đi.

4/ Tăng tính dùng chung dữ liệu. Một cơ sở dữ liệu được thiết kế để phục vụ chung; mỗi nhóm người dùng nhìn nhận cơ sở dữ liệu như chỉ có một mình họ sử dụng dữ liệu. Khái niệm “khung nhìn”, hay “khung nhìn người dùng” được giới thiệu như mô tả logic về một phần của cơ sở dữ liệu, dùng cho một nhóm công việc;

Định nghĩa: Khung nhìn (user view) là mô tả logic của một phần cơ sở dữ liệu, do đòi hỏi của người dùng khi cần thực hiện công việc nào đó;

(còn tiếp)

TH: T.Giang – CSCI

Nguồn tham khảo: Đỗ Trung Tuấn – An toàn cơ sở dữ liệu – NXB ĐHQGHN 2018

Bình luận về bài viết này