Data, trong ngữ cảnh nhất định, sẽ trở thành Information. Information với context cụ thể sẽ trở thành Knowledge. Knowledge với những hiểu biết được đưa ra, sẽ trở thành Wisdom.
Kim tự tháp dữ liệu là một khái niệm hình dung hệ thống phân cấp Dữ liệu – Thông tin – Tri thức – Trí tuệ.
Information là một tập hợp các Data được xử lý từ nhiều nguồn khác nhau. Data được tổng hợp liên tục và không hữu ích cho đến khi nó đã được xử lý và được trình bày ở dạng có thể sử dụng được. Data bao gồm các dữ liệu thô hoặc các quan sát.
Khi dữ liệu được sắp xếp, thông tin có thể được đưa ra. Các câu hỏi tại sao, ai, cái gì, ở đâu và bằng cách nào cho phép chúng ta sử dụng dữ liệu một cách có ý nghĩa và hỗ trợ đưa ra các quyết định.
Information có thể có cấu trúc hoặc không có cấu trúc và thuật ngữ quan trọng gắn liền với ý nghĩa – Meaning của nó.
Kiến thức là sự kết hợp năng động của kinh nghiệm, giá trị, thông tin theo ngữ cảnh, hiểu biết chuyên môn, và trực giác cung cấp môi trường và khuôn khổ cho việc đánh giá và kết hợp những trải nghiệm và thông tin mới. Nó bắt nguồn và được áp dụng trong tâm trí của người biết. Trong các tổ chức, nó thường không chỉ được nhúng trong các tài liệu và kho lưu trữ mà còn trong các thói quen, quy trình, thực hành và chuẩn mực của tổ chức.
Thuật ngữ quan trọng gắn liền với Knowledge là ngữ cảnh – Context.
Wisdom là biết điều gì phải làm.
Biểu đồ sau đây mô tả con đường dẫn chúng ta từ dữ liệu đến thông tin, thông tin đến kiến thức và kiến thức đến trí tuệ.
Trí tuệ kết nối về cơ bản là “con đường dẫn đến sự hiểu biết được kết nối” khi diễn giải dữ liệu. Đó là yếu tố con người tận dụng một phần công nghệ thông minh khi cố gắng đưa ra các quyết định dựa trên thực tế.
Dữ liệu thu thập từ các quan sát hoặc từ đồng hồ đo thời gian là các ví dụ về dữ liệu.
Ví dụ: khi đồng hồ chỉ “18:30”, nó đang cung cấp dữ liệu. Tương tự như vậy, khi quan sát thứ gì đó đang “on” hoặc “off”, chúng ta đang quan sát dữ liệu. Khi đặt trong ngữ cảnh, dữ liệu này cung cấp thông tin, rằng “18:30” là tham chiếu thời gian cho 6:30 chiều và khi quan sát thấy nút là “on”, nó cung cấp cho chúng ta trạng thái cho biết thiết bị hoặc mục đã được bật.
Nhìn xung quanh căn phòng bạn đang ở và đặt thông tin vào ngữ cảnh. Theo ngữ cảnh, một câu nói có kiến thức có thể như sau: “Căn phòng tôi đang làm việc đang tối dần” sẽ biết bây giờ cần bật đèn do kết quả của dữ liệu mà chúng tôi đã quan sát được.
Trong một tổ chức, chúng ta có thể đang thu thập thông tin của khách hàng về thói quen mua hàng. Chúng ta thu thập dữ liệu ghi lại sản phẩm mà khách đã mua, số tiền họ đã trả, phương thức thanh toán và địa chỉ của họ.
Chúng ta lưu trữ dữ liệu này ở đâu đó, thường là trong trung tâm dữ liệu của tổ chức hoặc trên đám mây. Dữ liệu được liên kết với các thuộc tính của một đợt bán hàng. Thông tin đến từ việc biết dữ liệu nào là tên khách hàng và phương thức thanh toán nào,…
Ở cấp độ thông tin, chúng ta có thể áp dụng nhiều công cụ khác nhau để giúp hỗ trợ việc đưa ra quyết định và chúng liên quan đến quá khứ.
Chúng ta có thể tính số tiền trung bình mà khách hàng đã chi tiêu hoặc tạo danh sách những người thường xuyên mua sắm với tổ chức. Thông tin này có thể được sử dụng để tìm ra hành vi khách hàng và cung cấp cho chúng ta biết cần bổ sung trước các kho hàng để có thể đáp ứng nhu cầu dự kiến của khách.
Chúng ta chắc chắn không muốn có quá nhiều vì hàng tồn kho đắt đỏ, cũng như không được kiểm soát vì điều đó ảnh hưởng tiêu cực đến việc duy trì và trải nghiệm của khách hàng.
Big Data và Data Science cho chúng ta từ cách nhìn và học hỏi từ quá khứ và hiện tại để nhìn về tương lai.
Chúng ta thường làm việc trong kim tự tháp khi biết về các động lực có thể có trong doanh nghiệp và cố gắng khám phá các thông số của động lực mà chúng ta nhận thức. Với Data Science, chúng ta tìm ra các liên kết tưởng như không tồn tại.
Ví dụ, bạn có bao giờ tự hỏi tại sao các tạp chí chơi gôn chứa đầy quảng cáo cho các dịch vụ đầu tư không? Việc quan sát các đặc điểm và hành vi của khách hàng đã phát hiện ra mối liên hệ giữa chơi gôn và sự giàu có. Người càng giàu càng có có xu hướng chơi gôn.
Bài viết gốc được đăng tải tại duypt.dev
Xem thêm:
- So sánh RDBMS và NoSQL. Nên sử dụng loại CSDL nào cho dự án của bạn?
- MySQL so găng MariaDB, điểm khác biệt chính, ưu và nhược điểm
- Data scientist vs data analyst
Xem thêm các tin tuyển dụng IT mới nhất trên TopDev