Bạn phụ thuộc vào chất lượng dữ liệu và thông tin để có nền tảng đưa ra quyết định. Ra quyết định thường liên quan đến việc trả lời một cái gì đó, vì vậy bạn cần dữ liệu để mô tả một cách hợp lý những điều bạn làm, từ đó đưa ra phản ứng đúng.
Cho dù dữ liệu của bạn là định lượng (dựa trên con số) hay định tính (dựa trên nhận thức), tính toàn vẹn của nó phụ thuộc vào 5 đặc điểm được công nhận rộng rãi.
Relevant – Liên quan, thích hợp
Đảm bảo dữ liệu bạn đã chọn phù hợp trực tiếp với mục đích đo lường hiệu suất mà bạn đã chọn. Hãy cẩn thận với những dữ liệu có vẻ thú vị: không có nghĩa nó liên quan.
Cố gắng thu thập nhiều dữ liệu hơn mức bạn thực sự cần, đặc biệt là trong các cuộc khảo sát, có thể tác động tiêu cực đến các khía cạnh khác của tính toàn vẹn dữ liệu (bên dưới).
=> chỉ thu thập dữ liệu bạn có sử dụng để theo dõi và chẩn đoán hiệu suất.
Reliable – Đáng tin cậy
Thu thập đủ dữ liệu và thu thập cẩn thận nhằm đảm bảo nó đủ chính xác (đặc biệt nếu đó là ước tính dựa trên mẫu) và tiếp tục đủ chính xác khi bạn thu thập dữ liệu theo thời gian.
Bạn có dựa vào lượng mưa một ngày để đưa ra kết luận về lượng mưa hàng năm? Thế còn năm ngày mưa thì sao? Bạn cần lượng mưa trong bao nhiêu ngày để có được ước tính chính xác lượng mưa hàng năm? Và điều này sẽ phụ thuộc vào cái gì?
=> Thiết kế kích thước mẫu để có độ tin cậy bạn cần. Đừng dự đoán.
Representative – Đại diện
Điều quan trọng là dữ liệu bạn thu thập là các sự kiện hoặc đặc điểm có thể quan sát được, mô tả toàn bộ phạm vi những gì thước đo KPI của bạn được cho là đo lường. Điều này có nghĩa, nó không thiên vị hay đủ chính xác. Điều cuối cùng bạn cần là dữ liệu đó cho bạn biết những điều bạn muốn. Khảo sát tự nguyện là ví dụ về nguồn dữ liệu không thể cung cấp cho bạn dữ liệu đủ chính xác.
=> Xác định dân số một cách cẩn thận và chọn các mẫu ngẫu nhiên để tránh sai lệch.
Readable – Có thể đọc được
Trừ khi dữ liệu bạn thu thập được xác định rõ ràng, được trình bày rõ ràng, dễ sắp xếp cho các phân tích, có ý nghĩa với người dùng và có thể dễ dàng giải thích và hiểu được chúng, thì mối liên quan, mức độ tin cậy hay mẫu đại diện không quan trọng. Nó chỉ đơn giản là không sử dụng được. Các con số cần ở định dạng bạn có thể sử dụng.
=> Thiết kế các biểu mẫu và bảng câu hỏi thu thập dữ liệu một cách cẩn thận để cung cấp cho bạn dữ liệu theo định dạng mà bạn cần phân tích.
Realistic – Thực tế
Quy đổi xem dữ liệu nào của bạn có liên quan, đại diện, đáng tin cậy và có thể đọc được với mức độ tài nguyên bạn sẽ cần đầu tư vào nó. Đảm bảo giá trị bạn nhận được từ việc sử dụng dữ liệu lớn hơn nỗ lực bạn đã đầu tư để có được nó. Cảnh giác với sự cám dỗ đầu tư vào các hệ thống thu thập dữ liệu tự động tinh vi (như phần mềm mã hóa và nhận dạng giọng nói) – nếu bạn không có một hệ thống thủ công đơn giản hoạt động tốt trước tiên, thì những hệ thống này có thể sẽ khiến bạn phải trả giá đắt hơn nhiều so với khoản tiết kiệm mà chúng hứa hẹn.
=> Thử nghiệm quy trình thu thập dữ liệu, đảm bảo chúng sẽ cung cấp dữ liệu hiệu quả về chi phí.