Cách mình quản lý tài liệu công ty

Quản lý tài liệu là 1 phần quan trọng trong năng lực dữ liệu (Data Capabilities), là một trong 3 năng lực cốt cõi (Core Capabilities) giúp hiện thực chiến lược của công ty mình.

Các vấn đề đối với tài liệu trong công ty

Mọi người trong công ty đều dùng Dropbox, khi dùng thư mục chia sẽ, do có nhiều thư mục nên mỗi người lưu trữ 1 kiểu. Dẫn đến mất thời gian để lưu trữ đồng bộ. Sau đó, rất mất thời gian cho khâu tìm kiếm.
Vấn đề về quản lý: Mình không biết là folder dữ liệu nào đang trong quá trình làm, dữ liệu nào vừa tạo, dữ liệu nào cần xóa. Cũng không biết quy mô và chất lượng dữ liệu.
Quản lý sự chồng chéo, trùng lập: 1 file có thể vừa thuộc thư mục này, vừa thuộc thư mục kia.
Cùng 1 File, nhiều người chỉnh sửa, tạo ra nhiều Version.

Phương pháp Data Warehouse

Phân loại file và sàng lọc trước khi lưu trữ. Lưu trữ vào những vùng xác định và đồng bộ. Có nhân sự phụ trách quản lý kho dữ liệu: Data Warehouse Manager (tại công ty mình thì gọi là Mega Library Manager)

Cấu trúc cây thư mục (Root)

Cây thư mục không được quá 4 tầng
Tầng 0: Tầng Dropbox
Tầng 1: Phân quyền cá nhân, phòng ban (Thư mục tổng + File Catalog)
Tầng 2: Các phân hệ chính
Tầng 3: Sub phân hệ
Nhóm file rác lẻ (tầng 4) – Ngang tầng với các files

Cách đặt tên (Thư mục và Files)

Đặt tên Folders:
Meta 1: Tên nội dung chính/ Ứng dụng/ Ngành/ Loại máy
Meta 2: Nguồn
Meta 3: Thương hiệu
Meta 4: Tên khách hàng
Các Thư mục cùng cấp, chung Folder, cùng nhóm nội dung (Metadata) thì đặt Meta Name cho nó. => Mục đích: Giảm số tầng Folders.

Đặt tên files:
Meta 1, 2, 3 + Nội dung file + tên người tạo/nguồn tải + ngày tạo
Các Files cùng cấp, chung Folder, cùng nhóm nội dung (Metadata) thì đặt Meta Name cho nó. => Mục đích: Giảm số tầng Folders.

Data Catalog

Catalog: Mỗi nhóm thư mục cha sẽ có Catalog mô tả cấu trúc, rules of file management, nội dung của Folder con và các files.
Mình dùng Excel để tạo ra Catalog cho thư mục tổng.

List of Meta: Meta để tìm kiếm và nhóm thư mục lại

Quản lý

Định kỳ hàng tuần, dành thời gian dọn dẹp file của từng thư mục (Kiểm tra bằng tool Excel, list of file name). Phân loại, đặt tên, sàng lọc rồi mới để vào.

Dữ liệu đa thuộc tính

1 File có thể vừa đúng khi thuộc Folder 1 và cũng đúng khi thuộc Folder 2. Do đó cần Rule để xếp thứ tự ưu tiên.
Dựa trên mức độ liên quan của file.
Dựa trên nội dung chính, phụ
Cùng độ liên quan và chính/ phụ, thì Folder nào được ưu tiên hơn.

1 File nằm ở nhiều vị trí

Đặt cùng tên, khác ngày (Khác Version). Về Sau chọn Delete những Version cũ hơn.

Dùng Kutools Excel để thu thập danh sách tên file. Quản lý định kỳ.

Tham khảo

https://www.salesforce.com/ap/hub/analytics/why-data-strategy-is-critical/