Trong thời đại bây giờ lượng thông tin, dữ liệu, kiến thức trên internet được sinh ra với tốc độ nhanh, lượng dữ liệu lớn kinh khủng. Điều này tạo ra thông tin loãng, thông tin chưa được xác thực nhiều, khiến bạn mất phương hướng tiếp cận những thông tin, kiến thức, dữ liệu.
Mình có đọc ở đâu đó "Hồi xưa đọc báo để nâng cao kiến thức, còn bây giờ cần kiến thức mới đọc báo"
Kiến thức cần có ở câu trên chính là kỹ năng phân tích dữ liệu hay như tiêu đề bài viết này "Tư duy dựa trên dữ liệu" mà mình muốn chia sẻ.
Nếu bạn làm trong mảng liên quan đến làm việc với dữ liệu như phân tích dữ liệu, marketer, product manager, CEO,...thì bạn quá quen thuộc với tư duy dựa trên dữ liệu (Data - driven mindset) rồi. Nhưng ở bài này mình chia sẻ ở khía cạnh là một tư duy, kỹ năng chung trong thời đại mới này mà tất cả mọi người đều cần trang bị.
Trước khi vào nội dung chính, mình muốn nói về một vài ví dụ thực tế phổ biến trong cuộc sống, trên mạng xã hội.
---Bạn A kể với với bạn về một người C khác theo chiều hướng không tốt, hoặc có người "mách lẽo" với bạn những điều không tốt về bạn thân của bạn. Bạn có xác thực lại thông tin này không?
---Mình nhớ có lần một bài báo đăng hình ảnh buổi tiệc sinh nhật của một bé gái tầm 10 tuổi, trong hình ảnh đó, bé gái đang ăn một miếng đùi gà và buổi tiệc đó chỉ có mỗi bé đó, không có người nào nữa. Và tiêu đề của bài báo, đại loại là "Thương người mẹ, mời bạn bè đến dự tiệc nhưng không ai đến, bé đói quá nên ăn một mình".
Có rất nhiều người vào bình luận theo chiều hướng mà bài báo cung cấp thông tin, góc nhìn. Nhưng liệu bạn có đặt câu hỏi để xác thực thông tin bức ảnh này không?
---Bạn thường nghe câu chuyện quả táo rớt trúng đầu Newton, hoặc những câu quote của những người nổi tiếng, hoặc những bài báo trên facebook. Có khi nào bạn sử dụng một ngôn ngữ khác (Tiếng Anh) để xác thực lại thông tin này không?
Với những câu chuyện thực tế trên, bạn thường nghe câu "Đừng phán xét khi chưa hiểu rõ mọi chuyện" hoặc câu "Nên nhìn đa chiều".
Hai câu trên chính là tư duy dựa trên dữ liệu.
Vậy, dữ liệu là gì?
Dữ liệu là những thông tin mà chúng ta tiếp cận qua nhiều dạng khác nhau, phổ biến như bài viết bằng chữ (ví dụ như đọc status trên mạng xã hội, đọc báo vnexpress,...), bằng video (ví dụ như xem video trên tiktok, facebook, youtube,...), bằng âm thanh (ví dụ như nghe podcast, nghe nhạc,...), bằng hình ảnh (facebook, google image,...)
Hiểu nhanh về quy trình xử lý dữ liệu.
Mình chia sẻ ngắn gọn về quy trình xử lý dữ liệu, để ở phần sau mình nói tiếp về "Tư duy dựa trên dữ liệu" dễ hiểu hơn.
Phân tích dữ liệu qua 04 bước cơ bản.
Bước 1: Thu thập dữ liệu thô từ các nguồn. (Input Data)
Bước 2: Có dữ liệu rồi thì bạn xử lý dữ liệu trên qua nhiều bước nhỏ như: làm sạch dữ liệu, sắp xếp, phân nhóm, phân loại. (Process)
Bước 3: Phân tích mô tả cơ bản về dữ liệu đó. (Output Data)
Bước 4: Khi hiểu về thông tin ý nghĩa của dữ liệu ở bước 3 rồi thì bạn trực quan hóa bằng các biểu đồ trực quan, dễ hiểu. Từ những hiểu biết về data này, bạn sẽ đưa ra các quyết định kế hoạch đúng đắn hơn, và sẽ nhân về kết quả (Outcome)
Trong 04 bước trên, bước 1 là bước quan trọng giúp bạn đưa ra quyết định đúng hay chưa đúng, kết luận đúng hay chưa đúng,...Đây được xem là bước đầu tiên bạn nhập nguyên liệu, nếu nguồn nguyên liệu không tốt cho sức khỏe, thì kết quả đầu ra có khả năng cao là một sản phẩm ảnh hưởng đến sức khỏe con người.
Vậy, tất cả dữ liệu thông tin kiến thức đưa vào đầu bạn sẽ quyết định bạn là ai.
Cùng một chuyên môn, tại sao có người giỏi, có người chưa giỏi hay cùng học môn toán tại sao có người giỏi có người không giỏi. Thêm nữa, cùng một bài viết sẽ có những phản biện khác nhau.
Những điều trên khác nhau vì mỗi người nhập liệu vào não khác nhau, nên góc nhìn, kiến thức, tri thức sẽ khác nhau.
Cho nên, bước nhập liệu này cực kì quan trọng. Và đó là lý do mình chia sẻ bài viết này. (có thể sẽ có nhiều bài khác nữa về chuỗi bài này, ở bài này mình tạm chia sẻ ở bước Nhập dữ liệu)
Vậy, Làm thế nào để luyện tập tư duy dựa trên dữ liệu?
Tùy mục đích, tùy nhu cầu, tùy mức độ tiếp cận thông tin, dữ liệu mà bạn áp dụng nhé. Ví dụ đọc để vui, đọc lướt, đọc giải trí, bản thân bạn không muốn sử dụng tư duy này cũng được. Tóm lại, đây cũng chỉ là góc nhìn mà bản thân thấy hữu ích, muốn chia sẻ thêm cho bạn đọc góc nhìn.
Luôn luôn xác thực nguồn dữ liệu, nguồn thông tin. Độ tin cậy của dữ liệu, thông tin.
Khi bạn biết xác thực thông tin thì bạn sẽ giảm đi những quan điểm, góc nhìn theo cảm tính. Như ví dụ ở trên, nếu như bạn nghe thông tin của A nói xấu C, bạn không xác thực thì toi đời mối quan hệ.
Hoặc những bài viết trên facebook, thậm chí của những chuyên gia hay KOLs, bạn cũng nên xác thực.
Việc xác thực này giúp bạn hiểu rõ vấn đề, thông tin bạn đang tiếp cận, tránh bị định hướng theo những người người cung cấp thông tin mong muốn. Đây là cách giúp bạn luyện tư duy độc lập.
Bạn có thể sử dụng google, sử dụng tiếng Anh để tìm đến tận gốc bài, kiến thức gốc. Và, bạn luôn sử dụng kỹ thuật 5W1H, 5-WHYs để mổ xể một vấn đề.
Ví dụ 1: Dạo gần đây có nhiều vụ mất tiền từ tài khoản do người dùng click vào đường link được gửi qua tin nhắn SMS từ các ngân hàng. Vì người gửi đến là tên ngân hàng, và đường link cũng gần giống với link chính thống của ngân hàng, nên người dùng chưa biết xác thực sẽ click vào.
Vậy ở tình huống này, bạn có thể lên google gõ tên ngân hàng để ra website chính thống của ngân hàng và so sánh đường link. Nếu khác, thì đừng click.
Một thao tác đơn giản và nhanh.
Ví dụ 3:
Là các video quảng cáo dược, thuốc đông y, thuốc viêm xoang,...Đa phần trong video sẽ có những bệnh nhân sẽ chia sẻ cảm nhận dùng thuốc theo chiều hướng tốt. Ở trường hợp này bạn xác thực thông tin về tên thương hiệu thuốc, về tên Dược sĩ, hoặc có thể xem giấy chứng nhận thuốc,...Bạn có thể thao tác nhanh chóng trên google.
Nhìn đa chiều, đa góc nhìn, tránh thiếu sót dữ liệu (Missing data).
Để tránh thiếu sót dữ liệu, bạn tìm hiểu thêm "Survivorship bias" tạm dịch là Thiên vị kẻ sống sót (bạn có thể google thêm nha). Tức là khi phân tích một vấn đề, sự kiện, sự kiện hay dữ liệu, chúng ta không nên hoàn toàn tin tưởng vào một dữ liệu đang tồn tại, mà chúng ta phải nghi vấn dữ liệu ở chiều ngược lại, dữ liệu chìm, dữ liệu ẩn.
Ví dụ: Uống thuốc A này bệnh nhân ung thư đã khỏe mạnh trở lại, khi có những dữ liệu này bạn chưa vội tin, vì còn một phần dữ liệu nữa "những người cũng uống thuốc A không khỏi bệnh".
Chúng ta luôn "thiên vị" với những gì "đang sống sót/ đang tồn tại/ đang thành công" mà chúng ta ít quan tâm đến phía ngược lại.
Để tránh thiếu sót dữ liệu, tránh thiên vị kẻ sống sót. Bạn nên nhìn đa chiều, nên đặt câu hỏi chiều ngược lại, để không bỏ sót nhóm dữ liệu nào. Bởi nhóm dữ liệu này rất có ích, cho chúng ta đầy đủ hơn về dữ liệu input (trong data science, điều này rất quan trọng để thực hiện đến bước modeling).
Ví dụ:
---Chúng ta nhìn vào phía khách hàng tải app, khách hàng active. Vậy khách hàng gỡ app, bỏ đi thì sao?
---Những tỷ phú thế giới thường bỏ học. Vậy những người cũng bỏ học thì họ đang làm gì?
---Hay, bạn đã đọc các cuốn sách đại loại "7 thói quen của người thành công", vậy những người thực hiện đầy đủ những thói quen này chưa thành công đang ở đâu.
Hay là một câu chuyện về Thiên vị kẻ sống sót trong chiến tranh thế giới thứ II.
Khi các máy bay bay về căn cứ thành công, trên máy bay có những chỗ bị thủng do đạn bắn, và những chỗ không bị thủng.
Khi nhìn chiếc máy bay này, phần đông tập trung vào sửa những chỗ bị thủng. Tức là tập trung vào phần dữ liệu đang có, đang tồn tại.
Nhưng lúc ấy, một góc nhìn khác của nhà toán học Abraham Wald suy nghĩ về dữ liệu đã tồn tại (hay được hiểu là dữ liệu chìm). Tức là, những máy bay không quay về được có thể bị bắn vào những chổ mà máy bay đã quay về chưa bị thủng.
Và kết luận đưa ra: Thay vì tập trung sửa chữa những chỗ thủng, thì chúng ta tập trung vào những chỗ chưa bị thủng. Vì đó mới là chỗ quyết định sống còn của máy bay.
Tóm lại, trong thời đại dữ liệu lớn, bạn cần trang bị tư duy dựa trên dữ liệu để bạn đưa ra những góc nhìn đúng đắn, giảm rủi ro khi đưa ra một quyết định nào đó.
Luôn xác thực nguồn dữ liệu bằng kỹ năng tìm kiếm google.
Luôn đặt câu hỏi 5W1H, 5-WHYs
Tránh thiếu sót dữ liệu bằng cách quan tâm phía ngược lại của nhóm dữ liệu đang tồn tại. (Tránh thiên vị kẻ sống sót/ survivorship bias)
Phân tích những gì chúng ta thấy và những gì chúng ta chưa thấy.
Tái bút: Bài viết được viết qua sự trải nghiệm, quan điểm, góc nhìn cá nhân, tổng hợp kiến thức có dẫn nguồn. Kiến thức mỗi người luôn có những giới hạn nhất định, vì vậy bài viết có thể còn hạn chế trong khuôn khổ hiểu biết, trải nghiệm cá nhân và có thể không phù hợp với các góc nhìn của một nhóm người đọc. Rất mong, các bạn đọc hãy tiếp thu một cách có chọn lọc và xem đây là một góc nhìn khác trong hành trình thu thập thông tin, kiến thức.
Cuối cùng, trên tinh thần chia sẻ là một phương pháp học hiệu, như slogan website này - Learning by sharing, rất mong nhận được sự góp ý của quý bạn đọc để mình cải thiện và trau dồi thêm, cũng như thêm góc nhìn.Các bạn có thể chat với mình trên website này để góp ý.
Xin cảm ơn quý bạn đọc!
Comments