Những đặc trưng 5V của Big data
20/02/2022 17:07
Big data là gì? Những đặc trưng 5V của big data gồm những gì? Đây là những câu hỏi thường thấy khi bắt đầu tìm hiểu về big data. Big data hiện đang phủ sóng và chiếm nhiều sự quan tâm từ mọi người, vậy nó có khái niệm như nào, bao gồm những gì?
Big data là gì?

Big data là gì?
Big data hay Dữ liệu lớn là tập dữ liệu lưu trữ lớn nhất và phức tạp nhất từ trước đến giờ. Độ lớn của nó lớn đến mức các phần mềm truyền thống đơn giản không có khả năng thu thâp xử lí nó tỏng một thời gian thông thường. Các dữ liệu này có cấu trúc, không có cấu trúc và phi cấu trúc. Do không cs một số lượng hạn chế nhất định, và cũng không có ai dám chắc big data lớn đến đâu, nên không ai dám chắc mức độ lớn của nó là đến đâu.
Có thể nói rằng, big data được hình thành từ nguồn đa dạng, đó có thể bao gồm dữ liệu từ các trang web, dữ liệu quản lý của tập đoàn, công ty, các dữ liệu chung miễn phí, các thí nghiệm khoa học…
Do đó, big data là một tài nguyên vô cùng quý giá trong thời đại hiện nay, một công ty có thể làm chủ big data được coi như thực hiện được phân tích, thu thập và lưu trữ được dữ liệu của big data đó.
Tuy nhiên, vì độ lớn của nó, nên big data cũng không dễ để có thể quản lý, thậm chí là còn gặp khó khăn khi làm việc, trong đó nhiều khó khăn lớn có thể kể đến như:
- Chất lượng phân tích không đảm bảo
- Kết quả triển khai nhiều khi không được như mong muốn
- Hiện nay, big data được ứng dụng trong rất nhiều lĩnh vực với những lợi ích to lớn như trong Ngành ngân hàng, ngành y tế, bán lẻ, thương mại điện tử, digital marketing. Chẳng hạn, các sản phẩm và thông tin về sản phẩm trên sàn thương mại điện tử Shopee chính là những ứng dụng của big data.
Big data là sự kết hợp của dữ liệu phi cấu trúc, bán cấu trúc hoặc dữ liệu có cấu trúc được các tổ chức thu thập. Big data có thể được khai thác để có được thông tin chi tiết và được sử dụng trong các dự án máy học, mô hình dự đoán và các ứng dụng phân tích nâng cao khác.
Big data có thể được sử dụng để cải thiện hoạt động, cung cấp dịch vụ khách hàng tốt hơn và tạo các chiến dịch tiếp thị được cá nhân hóa – tất cả đều làm tăng giá trị. Ví dụ: dữ liệu lớn có thể cung cấp cho các công ty thông tin chi tiết có giá trị về khách hàng của họ, sau đó có thể được sử dụng để tinh chỉnh các kỹ thuật tiếp thị nhằm tăng tỷ lệ tương tác và chuyển đổi của khách hàng.
Ví dụ, big data có thể được sử dụng bởi các tổ chức như trong lĩnh vực y tế hoặc năng lượng. Các lĩnh vực y tế có thể sử dụng big data để xác định các yếu tố nguy cơ bệnh tật hoặc nó có thể được các bác sĩ sử dụng để giúp chẩn đoán bệnh cho bệnh nhân. Các ngành năng lượng có thể sử dụng dữ liệu lớn để theo dõi lưới điện, ban hành quản lý rủi ro hoặc để phân tích dữ liệu thị trường theo thời gian thực.
Các tổ chức sử dụng dữ liệu lớn có lợi thế cạnh tranh tiềm năng so với các tổ chức không sử dụng vì họ có thể đưa ra các quyết định kinh doanh nhanh hơn và sáng suốt hơn – như dữ liệu cung cấp.
Vậy, 5V của big data là gì? Nó bao gồm những yếu tố nào?

Volume trong 5V của big data
Volume- Âm lượng
Âm lượng, phần đầu tiên trong 5V của big data, đề cập đến lượng dữ liệu tồn tại. Âm lượng giống như cơ sở của big data, vì nó là kích thước và lượng dữ liệu ban đầu được thu thập. Nếu khối lượng dữ liệu đủ lớn, nó có thể được coi là big data. Tuy nhiên, những gì được coi là dữ liệu lớn là tương đối và sẽ thay đổi tùy thuộc vào sức mạnh tính toán hiện có trên thị trường.
Một ví dụ cụ thể cho Âm lượng trong 5V của big data là vào năm 2016, lượng truy cập toàn cầu chỉ là 6.2 exabytes/tháng, tuy nhiên, đến năm 2020, con số này đã lên đến 40000 exabytes/tháng. Điều đó có thể giải thích được, big data phát triển nhanh đến mức nào
Velocity- Vận tốc

Velocity trong 5V của big data
Chữ V tiếp theo trong 5V của big data là vận tốc. Nó đề cập đến tốc độ big data được tạo ra và dữ liệu đó di chuyển nhanh như thế nào. Đây là một khía cạnh quan trọng đối với các công ty cần dữ liệu của họ lưu chuyển nhanh chóng, vì vậy nó luôn sẵn sàng vào đúng thời điểm để đưa ra các quyết định kinh doanh tốt nhất có thể.
Một tổ chức sử dụng dữ liệu lớn sẽ có một luồng dữ liệu lớn và liên tục được tạo và gửi đến đích cuối cùng của nó. Big data có thể đến từ các nguồn như máy móc, mạng, điện thoại thông minh hoặc phương tiện truyền thông xã hội. Những big data này cần được tiêu hóa và phân tích nhanh chóng, và đôi khi trong thời gian gần thực tế. Do đó, vận tốc trong 5V của big data khá quan trọng.
Ví dụ, trong lĩnh vực chăm sóc sức khỏe, ngày nay có rất nhiều thiết bị y tế được sản xuất để theo dõi bệnh nhân và thu thập dữ liệu. Từ thiết bị y tế trong bệnh viện đến thiết bị đeo được, dữ liệu thu thập được chính là big data, và những big data này cần được gửi đến chuyên gia và phân tích nhanh chóng.
Tuy nhiên, trong một số trường hợp, có thể tốt hơn nếu có một bộ dữ liệu được thu thập hạn chế hơn là thu thập nhiều dữ liệu hơn mức mà một tổ chức có thể xử lý – vì điều này có thể dẫn đến tốc độ dữ liệu chậm hơn.
Variety- Tính đa dạng
Đây là đặc điểm của Big data để nắm bắt mọi thứ và và những thứ này có giá trị trong kinh doanh. Nó bao gồm dữ liệu không có giá trị ngay lập tức nhưng có thể được xử lý thêm bằng các công cụ nâng cao để hiểu rõ hơn về việc xây dựng trí thông minh vào hệ thống. Bên cạnh những dữ liệu có cấu trúc nó còn bao gồm các dữ liệu phi cấu trúc như hình ảnh, video, âm thanh, email,…
Veracity- Tính xác thực
Veracity là chữ V thứ 4 trong 5V của big data. Nó đề cập đến chất lượng và độ chính xác của big data. Dữ liệu thu thập được có thể thiếu các phần, có thể không chính xác hoặc không thể cung cấp thông tin chi tiết thực sự có giá trị. Tính xác thực, về tổng thể, đề cập đến mức độ tin cậy có trong dữ liệu được thu thập. Do đó, nó là 1 trong các yếu tố cấu thành nên 5V của big data.
Value- Giá trị
V cuối cùng trong 5V của big data và cũng là chữ V quan trọng nhất chính là giá trị. Nó đề cập đến giá trị mà big data có thể cung cấp và nó liên quan trực tiếp đến những gì tổ chức có thể làm với dữ liệu được thu thập đó. Có thể lấy giá trị từ big data là một yêu cầu, vì giá trị của big data tăng lên đáng kể tùy thuộc vào những hiểu biết sâu sắc có thể thu được từ chúng.
Các tổ chức có thể sử dụng cùng một công cụ dữ liệu lớn để thu thập và phân tích dữ liệu, nhưng cách họ thu được giá trị từ dữ liệu đó phải là duy nhất đối với họ.
Các đặc điểm 5V của Big data ban đầu chỉ gồm có 3 lõi V là Vận tốc, Khối lượng và Sự đa dạng. Hai yếu tố còn lại là Tính xác thực và Giá trị đã được thêm vào sau đó cùng với sự phát triển và phổ biến của Big data trong các ngành để hình thành nên 5V của Big data như hiện nay. Tất cả những kiến thức về 5V của Big data mà Lifeweb cung cấp trên đây đều rất quan trọng đối với sự hiểu biết về kiến trúc của big data.