STRATEGY DATA CHIEN LUOC DU LIEU › › PHAN TÍCH DU LIEU & IoT ˛ LOI THE VUOT TROI TU BIG DATA, › › › › BERNARD MARR Huỳnh Hữu Tài dịch NHÀ XUẤT BẢN TỔNG HỢP THÀNH PHỐ HỒ CHÍ MINH
STRATEGY DATA CHIEN LUOC DU LIEU › › PHAN TÍCH DU LIEU & IoT ˛ LOI THE VUOT TROI TU BIG DATA, › › › › BERNARD MARR Huỳnh Hữu Tài dịch NHÀ XUẤT BẢN TỔNG HỢP THÀNH PHỐ HỒ CHÍ MINH
4 LỜI KHEN TẶNG DÀNH CHO CUỐN CHIẾN LƯỢC DỮ LIỆU “Các thuật toán sẽ kiểm soát tất cả các khía cạnh cuộc sống của chúng ta. Cuốn sách này là phiên bản hướng dẫn của năm 2017 về cách tận dụng lợi thế của dữ liệu để nâng tầm lối tư duy, khả năng cạnh tranh và cách thức thực hiện.” - Henrik vin Scheel, thành viên ban tư vấn, Google “Chiến lược Dữ liệu không chỉ dành cho những người làm về dữ liệu. Bernard Marr đã chứng minh rằng chiến lược dữ liệu xứng đáng nhận được mức độ quan tâm ngang bằng với chiến lược marketing, khách hàng, sản phẩm, và thu hút nhân tài của công ty. Theo kinh nghiệm của tôi, một chiến lược dữ liệu là vô cùng quan trọng đối với sự thành công của tất cả các nỗ lực trên. Tôi tin rằng cuốn sách của Marr là một điểm khởi đầu rất có giá trị cho việc phát triển chiến lược dữ liệu. Tôi thấy rằng nó hội tụ những bài học mà tôi đã học được. Nếu bạn chưa từng phát triển chiến lược dữ liệu, thì cuốn sách này xứng đáng được đọc 2 lần.” - David Purdy, Nhà nghiên cứu dữ liệu, Uber “Nếu bạn là người chịu trách nhiệm về mảng chiến lược dữ liệu cho công ty, nhưng vẫn chật vật với việc xác định quy mô công việc, cũng như những lợi ích có được mà việc xây dựng nền tảng định hướng dữ liệu mang lại, thì cuốn sách này có thể cung cấp nhịp điệu bao quát về những thay đổi đang diễn ra trên thị trường và trang bị cho bạn nền tảng ban đầu để có thể giải quyết vấn đề đó.” - Jake Williams, Nhà nghiên cứu chiến lược về bán lẻ, Amazon “Một chủ đề phức tạp với những mắt xích được đơn giản hóa – với nhiều ví dụ dễ tiếp cận từ các thương hiệu đồ gia dụng toàn cầu đến những chuỗi cửa hàng nhỏ hơn. Cuốn sách mới nhất của Bernard Marr về chiến lược dữ
CHIẾN LƯỢC DỮ LIỆU 5 liệu đã bao hàm rất nhiều yếu tố quan trọng cho những ai đang cố gắng nắm bắt nền kinh tế theo định hướng dữ liệu theo một lối viết dễ tiếp cận và gần gũi nhất, điều đó có nghĩa là cuốn sách này sẽ rất thú vị với những ai mong muốn hiểu biết thêm về việc làm thế nào mà các công cụ và dữ liệu có thể hỗ trợ nhân loại phát triển, và những gì họ cần phải suy nghĩ trong chính tổ chức của mình để phù hợp với chủ đề này.” - Gareth Mitchell-Jones, Hệ thống nhận thức, IBM “Một tấm bản đồ chỉ đường rõ ràng, súc tích và thú vị nhằm tối đa hóa giá trị của dữ liệu trong bối cảnh thị trường cạnh tranh khốc liệt ngày nay.” - Ralph Blore, Lãnh đạo, Trung tâm phân tích, Visa “Khi bước vào cuộc Cách mạng Công nghiệp lần thứ tư, Bernard Marr đã cho chúng ta thấy rằng chỉ những doanh nghiệp nhìn nhận dữ liệu như là tài sản chiến lược mới có thể tồn tại và phát triển. Ông đã giúp chúng ta hiểu cách thức dữ liệu có thể cải thiện việc đưa ra quyết định, cải thiện hoạt động và thu về lợi nhuận từ những sản phẩm hay dịch vụ. Cuốn sách mới nhất của ông vừa là tài liệu tham khảo cho mọi khía cạnh của việc hiểu về dữ liệu lớn, vừa là một bản hướng dẫn cách sử dụng nó để tạo nên giá trị trong bất kỳ tổ chức nào. Dù quan điểm của bạn về việc tăng cường sử dụng dữ liệu, cũng như tự động hóa là gì, thì kinh nghiệm của Marr vẫn sẽ giúp bạn định hình tương lai của chính mình nhờ vào việc sử dụng dữ liệu.” - Andy Rubin, Chủ tịch, Pentland Brands “Bernard Marr sở hữu một khả năng hiếm có trong việc biến những đề tài phức tạp trở nên dễ hiểu với cả những người không am hiểu về công nghệ. Những hiểu biết sâu sắc về chiến lược dữ liệu của Bernard là vô giá bởi ông ấy thật sự hiểu cách thức tạo nên một chiến lược dữ liệu toàn diện, và quan trọng hơn, làm thế nào để giải thích nó cho người khác. Tôi thật sự khuyên những ai đang tìm kiếm những chỉ dẫn thực tế để đến với thế giới của dữ liệu lớn nên tham khảo cuốn sách này.” - Stuart B Frankel, CEO, Narrative Science
DATA STRATEGY 6 “Việc tận dụng dữ liệu để thúc đẩy lợi thế cạnh tranh đã dịch chuyển từ việc là một sự lựa chọn trở thành một yêu cầu cần thiết, và Bernard Marr đã cung cấp một lộ trình toàn diện để những nhà lãnh đạo tập trung vào việc hoạch định và đánh giá tiến trình của họ. Phạm vi những trường hợp ví dụ của ông, trải rộng từ những người của kỷ nguyên số đến những doanh nghiệp nhỏ, rất gắn kết và cung cấp nhiều thông tin, làm tăng tầm quan trọng của việc khởi đầu từ định hướng kinh doanh. Điều này có thể giúp độc giả đẩy nhanh giá trị doanh nghiệp cũng như định hướng rõ ràng trong bối cảnh có quá nhiều sự lựa chọn về công nghệ, hỗ trợ và dữ liệu.” - Andrew Salesky, SVP, Giám đốc Dữ liệu Toàn cầu, Charles Schwab “Bernard Marr cung cấp cái nhìn tổng quan toàn diện về những yếu tố then chốt hình thành nên chiến lược dữ liệu, và ông ấy đã dệt nên những ví dụ thực tế hấp dẫn nhằm nhấn mạnh tầm quan trọng của việc xây dựng một doanh nghiệp theo định hướng dữ liệu để nổi bật trong nền kinh tế dữ liệu ngày nay.” - Brent Dykes, Giám đốc, Data Strategy, Domo “Bernard chỉ ra chính xác một trong những thay đổi lớn nhất, ảnh hưởng đến tất cả các doanh nghiệp trong cuốn sách này. Việc có một chiến lược dữ liệu mạnh và lộ trình khoa học dữ liệu đã trở thành một phần tất yếu trong ADN của mỗi tổ chức. Cuốn sách này cung cấp một lộ trình để đạt được điều đó với những hiểu biết quan trọng từ những nhà lãnh đạo trong các lĩnh vực.” - William Merchan, Giám đốc chiến lược, DataScience “Bernard Marr đã chỉ ra nhu cầu về những vấn đề kinh doanh rõ ràng trong khi hầu như bất cứ điều gì đều có thể được đo lường và phân tích.” - Dan Morris, Giám đốc cấp cao, Data Platform tại Viacom
7 LỜI CẢM ƠN Tôi cảm thấy vô cùng may mắn khi được làm việc trong một lĩnh vực rất sáng tạo và phát triển nhanh chóng. Tôi cảm thấy vinh dự khi có thể làm việc với các công ty và tổ chức chính phủ ở tất cả mọi lĩnh vực, các ngành công nghiệp trong việc sử dụng dữ liệu theo những cách thức mới mẻ và tốt hơn để mang lại giá trị thực tế. Công việc này cho phép tôi học hỏi mỗi ngày và một cuốn sách như thế này sẽ không thể được xuất bản nếu như không có những cơ hội đó. Tôi muốn cảm ơn những người đã giúp tôi có được ngày hôm nay; tất cả các cá nhân tuyệt vời trong những công ty nơi tôi từng làm việc, với những người đã đặt niềm tin của họ vào tôi để giúp đỡ họ, họ cũng đã cho tôi rất nhiều kiến thức và kinh nghiệm mới. Tôi cũng phải cảm ơn tất cả những người đã chia sẻ suy nghĩ của họ với tôi, dù là trực tiếp, thông qua các bài viết đăng trên blog, thông qua những cuốn sách hoặc dưới bất kỳ hình thức nào khác. Cảm ơn các bạn đã chia sẻ tất cả những tài liệu mà tôi đọc mỗi ngày! Tôi cũng may mắn khi biết được nhiều nhà tư tưởng, nhà lãnh đạo trong lĩnh vực này. Tôi hy vọng tất cả các bạn biết rằng tôi đánh giá cao đóng góp của các bạn và những trao đổi giữa chúng ta nhiều như thế nào. Cuối cùng, tôi phải cảm ơn đội ngũ biên tập và xuất bản của tôi vì tất cả sự giúp đỡ và hỗ trợ của các bạn. Để đưa bất kỳ cuốn sách nào từ ý tưởng đến xuất bản phẩm là một quá trình đầy thử thách và tôi thật sự trân trọng sự đóng góp, sự giúp đỡ của các bạn – cảm ơn Claire, David, Amy và Lucy.
8 TẠI SAO MỖI DOANH NGHIỆP HIỆN TẠI LÀ MỘT DOANH NGHIỆP DỮ LIỆU? 11 XÁC ĐỊNH CÁC NHU CẦU VỀ CHIẾN LƯỢC DỮ LIỆU 41 SỬ DỤNG DỮ LIỆU ĐỂ CẢI THIỆN CÁC QUYẾT ĐỊNH KINH DOANH 65 SỬ DỤNG DỮ LIỆU ĐỂ CẢI THIỆN HOẠT ĐỘNG KINH DOANH 93 TẠO RA DOANH THU TỪ DỮ LIỆU 115 TÌM NGUỒN CUNG ỨNG VÀ THU THẬP DỮ LIỆU 131 01 02 03 04 05 06 MỤC LỤC
CHIẾN LƯỢC DỮ LIỆU 9 BIẾN DỮ LIỆU THÀNH NHỮNG HIỂU BIẾT SÂU SẮC 155 HÌNH THÀNH CÔNG NGHỆ VÀ CƠ SỞ HẠ TẦNG DỮ LIỆU 181 XÂY DỰNG NĂNG LỰC VỀ DỮ LIỆU TRONG TỔ CHỨC 207 ĐẢM BẢO CHO DỮ LIỆU KHÔNG VI PHẠM VẤN ĐỀ VỀ PHÁP LÝ: QUẢN TRỊ DỮ LIỆU 229 THỰC THI VÀ XEM XÉT LẠI CHIẾN LƯỢC DỮ LIỆU 253 07 08 09 10 11
11 TẠI SAO MỖI DOANH NGHIỆP HIỆN TẠI LÀ MỘT DOANH NGHIỆP DỮ LIỆU? Dữ liệu đang làm thay đổi thế giới của chúng ta, cũng như cách chúng ta sống và làm việc, với tốc độ chưa từng có. Tùy thuộc vào quan điểm của bạn, chúng ta hoặc là đang bắt đầu một thứ gì đó hứng thú đến kinh ngạc, hoặc là đang bước vào một kỷ nguyên của Kẻ độc tài (Big Brother), nơi mà nhất cử nhất động của chúng ta đều có thể bị theo dõi – và thậm chí bị dự đoán (cả hai quan điểm đều có lý lẽ riêng). Tuy nhiên, các nhà lãnh đạo và các nhà quản lý doanh nghiệp có khá ít thời gian cho sự hoài nghi về dữ liệu. Dữ liệu đang cách mạng hóa cách thức hoạt động của các công ty và nó sẽ trở nên ngày càng quan trọng đối với các tổ chức trong những năm tới. Những công ty nhìn nhận dữ liệu như là một tài sản chiến lược là những công ty sẽ tồn tại và phát triển mạnh. Với sự tăng trưởng mạnh mẽ về dữ liệu lớn và Internet kết nối vạn vật (IoT), cộng với việc phát triển nhanh chóng của các phương thức phân tích dữ liệu, tầm quan trọng của dữ liệu đối với mọi mặt của doanh nghiệp sẽ chỉ tăng lên. 01
DATA STRATEGY 12 Sự tăng trưởng đáng kinh ngạc của dữ liệu lớn và Internet kết nối vạn vật Cứ mỗi hai ngày chúng ta lại tạo ra được lượng dữ liệu tương đương với lượng dữ liệu được tạo ra từ những ngày đầu cho đến năm 2003. Vâng, là mỗi-hai-ngày. Và với việc lượng dữ liệu chúng ta đang tạo ra tiếp tục tăng nhanh, đến năm 2020, lượng thông tin số sẽ tăng từ khoảng 5 zettabyte hiện nay lên tới 50 zettabyte. Hầu hết ở mỗi hoạt động, chúng ta đều để lại một dấu vết về dữ liệu số – lướt web trực tuyến, mua hàng trong một cửa hàng trực tiếp với thẻ tín dụng, gửi e-mail, chụp một bức ảnh, đọc một bài báo trực tuyến, thậm chí cả việc dạo phố nếu bạn đang mang theo điện thoại di động hoặc có hệ thống camera giám sát CCTV trong vùng lân cận. Thuật ngữ “dữ liệu lớn” đề cập đến việc thu thập tất cả dữ liệu đó và khả năng của chúng ta trong việc tận dụng nó để mang lại lợi thế của mình trên nhiều lĩnh vực, bao gồm cả việc kinh doanh. Bản thân dữ liệu không phải là một phát minh mới. Quay lại thời điểm trước khi có máy tính và các cơ sở dữ liệu, chúng ta vẫn sử dụng dữ liệu để theo dõi những hoạt động và đơn giản hóa các quy trình – hãy nghĩ đến các bản ghi giao dịch bằng văn bản và các hồ sơ lưu trữ bằng giấy. Máy tính, đặc biệt là các bảng tính và cơ sở dữ liệu, đã mang đến cho chúng ta một phương pháp lưu trữ và tổ chức dữ liệu trên quy mô lớn, theo một cách dễ dàng tiếp cận. Đột nhiên, thông tin đã có sẵn chỉ với một cú nhấp chuột. Cho đến gần đây, mặc dù dữ liệu đã được giới hạn trong bảng tính hoặc cơ sở dữ liệu – tất cả đều rất trật tự và rõ ràng. Bất kỳ dữ liệu nào không được sắp xếp thành hàng và cột một cách dễ dàng sẽ gây khó khăn cho việc xử lý và bị bỏ qua. Tuy nhiên, giờ đây, những tiến bộ trong việc lưu trữ và phân tích đã cho thấy chúng ta có thể thu thập, lưu trữ và làm việc với nhiều, rất nhiều loại dữ liệu khác nhau. Kết quả là, dữ liệu ngày nay có thể bao gồm mọi thứ từ bảng tính đến những hình ảnh, video, bản ghi âm, văn bản và dữ liệu cảm biến.
CHIẾN LƯỢC DỮ LIỆU 13 Không còn nghi ngờ gì nữa khi cho rằng lượng dữ liệu tuyệt vời mà chúng ta đang tạo ra là rất lớn. Nhưng thành thật mà nói, tôi chưa bao giờ cảm thấy hoàn toàn dễ chịu với thuật ngữ “dữ liệu lớn”. Nó tạo ra cảm giác quá đơn giản đối với tôi, thuật ngữ này chỉ tập trung vào khối lượng của dữ liệu hơn là những cơ hội đáng kinh ngạc mà dữ liệu này tạo ra. Tôi ước gì có một thuật ngữ tốt hơn để mô tả sự dịch chuyển lớn lao này trong công nghệ, văn hóa và thế giới của chúng ta. Đó là lý do tại sao, trong cuốn sách này, tôi gọi nó là “dữ liệu” ở mọi ý nghĩa, dù lớn hay nhỏ – bởi vì không quan trọng là bạn có bao nhiêu dữ liệu, mà quan trọng là liệu bạn có sử dụng nó thành công hay không. Một thế giới mới đầy thử thách (theo định hướng dữ liệu) Dữ liệu lớn biết rất nhiều điều về bạn. Nó vượt xa việc Google biết những gì bạn đã tìm kiếm trực tuyến, và việc Facebook biết ai là bạn bè của bạn. Nhà cung cấp dịch vụ Internet của bạn biết mọi trang web mà bạn đã từng truy cập. Đã từng. Ngay cả khi bạn duyệt web ở chế độ riêng tư. Google biết tuổi tác và giới tính của bạn (ngay cả khi bạn chưa bao giờ tiết lộ với họ về điều này) và bạn có thể chắc rằng họ có một hồ sơ toàn diện về bạn, cũng như những sở thích của bạn, để họ có thể quyết định hiển thị quảng cáo nào cho bạn. Facebook rõ ràng biết những người bạn của bạn là ai và bạn đang ở trong mối quan hệ với người nào. Nhưng bạn có biết rằng Facebook cũng có thể dự đoán mối quan hệ của bạn sẽ kéo dài trong bao lâu hay không, hoặc nếu bạn đang độc thân thì khi nào bạn sẽ có một mối quan hệ tình cảm (và với ai)? Facebook cũng có thể cho biết mức độ thông minh của bạn, dựa trên phân tích về những lần ấn “thích” của bạn (Trong trường hợp bạn đang băn khoăn, thì việc “thích” chương trình Curly Fries, Science, Mozart, Thunderstorms hoặc The Daily Show được dự đoán là có trí thông minh cao, trong khi việc “thích” Harley Davidson, Lady Antebellum và I Love Being a Mom được dự đoán là có trí thông minh thấp).
DATA STRATEGY 14 Cảnh sát biết bạn đang lái xe ở đâu, điều này dĩ nhiên là ở nước Anh, nơi họ có thể truy cập hàng nghìn camera giám sát CCTV được kết nối mạng trên toàn quốc để quét biển số xe cũng như chụp lại hình ảnh của những chiếc xe hơi và tài xế của nó. Tại Mỹ, nhiều thành phố cũng sử dụng camera giao thông. Điện thoại của bạn cũng cho biết tốc độ khi bạn đang lái xe. Hiện tại, thông tin đó không được chia sẻ với cảnh sát, nhưng ngày càng có nhiều công ty bảo hiểm bắt đầu sử dụng dữ liệu điện thoại thông minh để suy đoán ai là người lái xe an toàn và ai là khách hàng tiềm năng với nhiều rủi ro hơn. Thẻ khách hàng thân thiết từ cửa hàng tạp hóa của bạn theo dõi các thương hiệu mà bạn ưa thích và thu thập rất nhiều thông tin về các thói quen, sở thích mua hàng của bạn. Các nhà bán lẻ không những sử dụng dữ liệu này để cá nhân hóa trải nghiệm mua sắm của bạn, mà nó còn được sử dụng để dự đoán những sản phẩm mà bạn có thể muốn mua trong tương lai. Trong một trường hợp nổi tiếng, nhà bán lẻ Target tại Mỹ đã dự đoán một thiếu nữ đang mang thai (dựa trên thói quen mua hàng của cô gái này) và bắt đầu gửi cho cô ấy những lời chào hàng liên quan đến em bé sắp ra đời của cô ấy – vấn đề duy nhất trong trường hợp này là cha mẹ cô ấy vẫn chưa biết cô ấy đang mang thai. Tuy nhiên, dữ liệu lớn lại có quyền lực hơn nhiều so với mạng truyền thông xã hội và phiếu giảm giá. Ảnh hưởng của nó lan rộng đến hầu như mọi khía cạnh của cuộc sống hiện đại, từ chăm sóc sức khỏe đến khám phá không gian vũ trụ, thậm chí đến các cuộc bầu cử chính trị của chúng ta. Lấy ví dụ, trong một chiến dịch bầu cử theo định hướng phân tích, thì trọng tâm là nhắm đến các Swing Voters – những cử tri có khả năng bỏ phiếu cho bất kỳ ứng viên nào, hoặc những cử tri chưa có quyết định dứt khoát. Xét cho cùng, tại sao lại phải lãng phí thời gian vận động những người chắc chắn sẽ bỏ phiếu cho bạn, hay những người sẽ không bao giờ có ý định bỏ phiếu cho bạn dù trong một triệu năm? Kỹ thuật này được sử dụng lần đầu tiên trong chiến dịch vận động của Obama vào năm 2012 khi một nhóm gồm hơn 100 nhà
CHIẾN LƯỢC DỮ LIỆU 15 phân tích dữ liệu được giao nhiệm vụ chạy hơn 66.000 mô phỏng máy tính mỗi ngày. Đầu tiên, những nhà phân tích của Obama đã thu thập và hợp nhất tất cả dữ liệu họ có thể thu thập được từ dữ liệu đăng ký cử tri, các khoản đóng góp, những hồ sơ công khai và mua dữ liệu thương mại của bên thứ ba (bao gồm cả dữ liệu được khai thác từ truyền thông xã hội). Sau đó, tất cả những người đã được xác định được đánh giá về khả năng bỏ phiếu cho Obama, dựa trên hồ sơ dữ liệu của họ tương thích như thế nào với những người ủng hộ đã được biết đến trước đó. Với việc được trang bị thông tin nhân khẩu học phức tạp, nhóm nghiên cứu sau đó khởi chạy các chiến dịch vận động đã được nhắm mục tiêu. Những chiến dịch này nhắm vào việc tăng số cử tri đi bầu cử, cũng như số lượng đăng ký ở các khu vực mà khả năng bỏ phiếu ủng hộ cho ứng cử viên của họ là cao, đồng thời gây ảnh hưởng đến sự lựa chọn của cử tri thuộc các khu vực mà chỉ số ủng hộ ứng viên của họ cho thấy cử tri ở đây có thể bỏ phiếu cho bất kỳ ai. Điều này có nghĩa là các tin nhắn có chủ đích có thể được gửi đi – thông qua e-mail, các bài viết đăng trên phương tiện truyền thông xã hội và quảng cáo hiển thị hình ảnh trên trình duyệt – tùy thuộc vào việc một cá nhân có cần thiết phải được thuyết phục để đăng ký, bỏ phiếu, hoặc chọn ứng cử viên chính xác hay không. Trong những năm sau đó, tất cả các đảng và hầu hết các ứng cử viên đều đã hăng hái đưa ra những chiến lược phân tích của riêng mình. Dữ liệu lớn cũng giúp trả lời câu hỏi: “Liệu có tồn tại sự sống trên sao Hỏa hay không”. Phòng thí nghiệm Jet Propulsion của NASA, nơi điều hành việc lập kế hoạch nhiệm vụ hàng ngày cho tàu vũ trụ Mars Rover, hiện đang sử dụng công nghệ Elasticsearch (cũng được sử dụng bởi các công ty như Netflix và Goldman Sachs) để xử lý tất cả dữ liệu được truyền về hàng ngày từ tàu vũ trụ Rover trong suốt bốn lần cập nhật định kỳ của nó. Trong khi các quyết định lập kế hoạch nhiệm vụ từng được đưa ra dựa trên dữ liệu của ngày hôm trước, thì việc chuyển sang phân tích theo thời gian thực giúp tăng tốc thời
DATA STRATEGY 16 gian cực nhanh, nhờ đó các quyết định có thể được thực hiện bằng việc kiểm soát nhiệm vụ. Các mô hình kiểu mẫu và bất thường trong các tập dữ liệu có thể được phát hiện nhanh hơn nhiều, và các mối tương quan mà có thể cung cấp những hiểu biết sâu sắc về những nhiệm vụ trọng yếu sẽ có khả năng trở nên rõ ràng hơn, dẫn đến tỷ lệ phát hiện có tính chính xác cao hơn, giảm thiểu nguy cơ trục trặc hoặc hỏng hóc. Ngay cả việc chăm sóc sức khỏe đã không thoát khỏi sự liên quan đến dữ liệu lớn. Trong nhiều năm, cơ sở của hầu hết các nghiên cứu và phát minh y khoa đã được thu thập và phân tích dựa trên dữ liệu: người nào bị bệnh, họ bị bệnh như thế nào và lý do tại sao. Nhưng bây giờ, với các cảm biến trong điện thoại thông minh và việc các bác sĩ có thể chia sẻ thông tin giữa các chuyên khoa với nhau, số lượng và chất lượng dữ liệu có sẵn đã trở nên lớn hơn bao giờ hết, điều này có nghĩa là khả năng đột phá và thay đổi đang tăng lên theo cấp số nhân. Điện thoại thông minh và các thiết bị thông minh phổ biến khác (bao gồm Jawbone, Fitbit và những thiết bị khác) giờ đây có khả năng giúp mọi người theo dõi tiến trình của họ khi hướng đến một lối sống lành mạnh hơn. Các ứng dụng, thiết bị giúp theo dõi và giám sát các bệnh mãn tính (như tiểu đường, bệnh Parkinson hay bệnh tim) cũng đang được phát triển. Ngành y tế đã thu thập một lượng lớn dữ liệu, nhưng nó thường được lưu giữ riêng biệt trong các văn phòng, bệnh viện và phòng khám của cá nhân các bác sĩ. Việc thống nhất dữ liệu đó – và kết hợp nó với dữ liệu được thu thập từ bệnh nhân thông qua các thiết bị thông minh – là rào cản lớn tiếp theo của ngành cần phải vượt qua. Các nhà cung cấp dịch vụ chăm sóc sức khỏe đang tập trung vào việc số hóa những hồ sơ bệnh án và đảm bảo quyền truy cập vào một bộ hồ sơ trong toàn hệ thống chăm sóc sức khỏe. Phần mềm nhận dạng các mô hình kiểu mẫu đã được sử dụng để hỗ trợ chẩn đoán. Cho đến nay, một số thuật toán đã được chứng minh là mang lại hiệu quả ngang bằng hoặc hiệu quả hơn cả những chẩn đoán của con người trong việc phát hiện ung thư. Từ đây đã tạo nên một tiềm năng đáng kinh ngạc trong việc nắm bắt nhiều căn bệnh hơn ở những giai đoạn
CHIẾN LƯỢC DỮ LIỆU 17 sớm hơn, và nhờ đó làm tăng khả năng thành công trong việc điều trị. Dữ liệu lớn cũng được sử dụng để theo dõi, phân tích và điều trị những dịch bệnh trên toàn thế giới, bao gồm Ebola và Zika. Tất cả điều này chỉ là phần nổi của tảng băng trôi, và khối lượng dữ liệu sẽ chỉ tiếp tục tăng lên. Thông thường, khi chúng ta đăng ký một sản phẩm hoặc dịch vụ mới, cho dù đó là một chiếc đồng hồ thể thao hay thẻ khách hàng thân thiết, chúng ta đều đã vui vẻ cấp quyền truy cập vào dữ liệu cá nhân của mình – để đổi lấy các lợi ích như cải thiện thể hình hoặc tích điểm cho một ly cà phê miễn phí. Khi càng nhiều công ty khai thác các khả năng của dữ liệu, và khi công nghệ dần cải tiến để thu thập được ngày càng nhiều thông tin, lượng dữ liệu có sẵn được dự đoán sẽ tăng theo cấp số nhân. Chúng ta cũng sẽ hoàn thiện hơn trong việc phân tích khối dữ liệu này, với các công cụ mới được các công ty tung ra thị trường mỗi tuần. Thực tế, cả Microsoft và Salesforce gần đây đã công bố những công cụ cho phép những người không phải là dân lập trình tạo ra các phần mềm ứng dụng để theo dõi và phân tích dữ liệu kinh doanh. Và khi chúng ta đang dần cải thiện việc phân tích dữ liệu, khả năng của chúng ta khiến cho những dự đoán cũng được cải thiện. Công ty thông minh thị trường (market intelligence) International Data Corporation dự đoán rằng một nửa số phần mềm phân tích kinh doanh sẽ bao gồm khả năng phân tích dự đoán trước năm 2020 – điều này có nghĩa là các phần mềm không chỉ có thể dự đoán hành động của khách hàng hoặc người dùng, mà chúng còn có thể đưa ra các khuyến nghị cụ thể dựa trên những dự đoán đó. Chúng ta đang ở một giai đoạn rất thú vị trong thời kỳ dữ liệu và phân tích, và công nghệ có sẵn sau khoảng năm hoặc mười năm tới có thể cung cấp những khả năng mà chúng ta thậm chí chưa thể tưởng tượng ra được. Một phần lý do cho sự bùng nổ dữ liệu này là mạng Internet kết nối vạn vật – Internet of Things (IoT), đôi khi được gọi là Internet of Everything (IoE). IoT đề cập đến các thiết bị thu thập và truyền dữ liệu thông qua Internet, bao gồm mọi thứ từ điện thoại thông minh, đồng hồ thông minh, vòng đeo tay theo dõi sức khỏe Fitbit, ngay cả tivi và
DATA STRATEGY 18 tủ lạnh của bạn. IoT đã đạt được sự tăng trưởng rất lớn trong những năm gần đây và nó chỉ vừa mới bắt đầu. Ngày nay, có khoảng 13 tỷ thiết bị kết nối với Internet. Đến năm 2020, con số này được dự đoán sẽ tăng lên tới 50 – 70 tỷ. Riêng số lượng người dùng điện thoại thông minh được dự đoán sẽ vượt con số 6 tỷ vào năm 2020. Các thiết bị thông minh đang biến đổi thế giới, xe hơi, nhà cửa và các doanh nghiệp của chúng ta. Đến năm 2020, 1/4 tỷ ô tô sẽ được kết nối với Internet, kích hoạt phạm vi cho toàn bộ các dịch vụ bên trong xe và việc điều khiển tự động. Điều trước kia đã từng là khoa học viễn tưởng nay đã trở thành hiện thực – xe tự lái của Google đã di chuyển được vài ngàn dặm một tuần. Công nghệ thiết bị đeo, “Wearable”, là một phần quan trọng của IoT; và thị trường toàn cầu đối với thiết bị đeo (những thứ như điện thoại thông minh, Fitbit,…) đã tăng 223% trong năm 2015. Hiện cứ trong sáu người tiêu dùng lại có một người sở hữu và sử dụng công nghệ đeo bằng cách này hoặc cách khác. Tất cả các thiết bị này tạo ra một nguồn dữ liệu dồi dào và chúng ta chỉ vừa mới bắt đầu nhận ra được những tác động của điều này. Các thiết bị được kết nối không chỉ có thể kết nối với Internet, chúng còn có thể kết nối và chia sẻ thông tin với nhau. Trong thực tế, các kết nối giữa máy móc với máy móc sẽ tăng lên 27 tỷ vào năm 2024. Vì vậy, trong tương lai gần, không có gì vô lý với viễn cảnh tủ lạnh của bạn sẽ biết được khi nào thì sữa trong tủ hết hạn sử dụng và tự động yêu cầu điện thoại thông minh của bạn đặt hàng nhiều hơn trong lần mua sắm trực tuyến tiếp theo. Chúng ta đang tiến gần đến Trí tuệ Nhân tạo? Trong thuật ngữ điện toán, Trí tuệ Nhân tạo (AI) là mục tiêu cuối cùng kể từ khi máy tính đầu tiên được phát minh. Nó cũng là một viễn cảnh hứa hẹn đầy triển vọng cho các nhà văn khoa học viễn tưởng! Nhưng cuối cùng chúng ta cũng đang từng bước tiến gần hơn đến việc nhận thức rõ về AI, đúng không? Điện toán biết nhận thức
CHIẾN LƯỢC DỮ LIỆU 19 (Cognitive Computing) chắc chắn giúp chúng ta tiến một bước dài để đến gần hơn với điều đó. Kết hợp giữa khoa học nhận thức (nghiên cứu bộ não con người) và khoa học máy tính, điện toán biết nhận thức được mong đợi sẽ tác động đến hầu hết mọi lĩnh vực trong cuộc sống, từ kinh doanh đến chăm sóc sức khỏe và thậm chí cả cuộc sống riêng tư. Mục đích là để cho phép máy tính mô phỏng suy nghĩ của con người và bắt chước cách thức hoạt động của bộ não chúng ta. Điều này cho phép máy tính thực hiện những việc mà con người có thể dễ dàng làm được, như việc hiểu ngôn ngữ tự nhiên hay nhận ra các đối tượng trong một bức tranh. Hệ thống Watson của IBM là một ví dụ điển hình về điện toán biết nhận thức. Hệ thống này “học” trong khi nó xử lý thông tin, vì vậy khi càng có nhiều dữ liệu cung cấp cho hệ thống, nó sẽ học được càng nhiều và càng trở nên chính xác hơn. Trên thực tế, công nghệ này có thể được sử dụng trong bất kỳ lĩnh vực nào sở hữu một lượng lớn dữ liệu phức tạp cần được xử lý và phân tích để giải quyết các vấn đề, bao gồm chăm sóc sức khỏe, pháp luật, giáo dục, tài chính, và tất nhiên là cả kinh doanh. Công nghệ này đã và đang được sử dụng trong ngành khách sạn. Khách sạn Hilton gần đây đã cho ra mắt người máy quản gia đầu tiên, Connie, “người quản gia” này có thể hiểu ngôn ngữ tự nhiên và trả lời các câu hỏi của khách hàng về khách sạn, các điểm tham quan địa phương, nhà hàng,… Khi máy tính có nhiều khả năng suy nghĩ như con người hơn, chúng nâng cao kiến thức và những khả năng của chúng ta. Cũng giống như khi những anh hùng trong các bộ phim khoa học viễn tưởng chuyển sang dùng máy tính của họ để phân tích, dự đoán và kết luận về những việc cần làm tiếp theo, trong đời thực chúng ta đang chuyển sang một kỷ nguyên mà máy tính có thể nâng cao kiến thức của con người theo những cách hoàn toàn mới. Điện toán nhận thức được củng cố bằng công nghệ học máy (machine learning) và học sâu (deep learning), cho phép các máy tính tự động học hỏi từ dữ liệu. Công nghệ này có nghĩa là máy tính có thể
DATA STRATEGY 20 tự thay đổi và cải thiện thuật toán của mình, mà không cần phải được lập trình một cách rõ ràng bởi con người. Vậy thì nó hoạt động như thế nào? Nói một cách đơn giản, nếu chúng ta cung cấp cho máy tính hình ảnh của một con mèo và hình ảnh của một quả bóng, và cho biết đâu là hình ảnh của một con mèo, thì sau đó chúng ta có thể yêu cầu máy tính lựa chọn những bức ảnh nào tiếp theo có chứa hình ảnh con mèo. Máy tính so sánh các hình ảnh đầu vào với tập dữ liệu huấn luyện của nó (tức là hình ảnh con mèo ban đầu) và đưa ra câu trả lời. Các thuật toán học máy ngày nay có thể làm điều này mà không cần giám sát, có nghĩa là chúng không cần được lập trình trước các quyết định của chúng. Nguyên tắc tương tự cũng áp dụng cho các nhiệm vụ thậm chí phức tạp hơn, dẫu với một tập dữ liệu huấn luyện lớn hơn nhiều. Ví dụ, các thuật toán nhận dạng giọng nói của Google hoạt động dựa trên một tập dữ liệu huấn luyện đồ sộ, nhưng như thế vẫn chưa đủ lớn để dự đoán được mọi từ, cụm từ hoặc câu hỏi có thể có. Nhưng công nghệ đang được liên tục cải thiện, học máy và học sâu sẽ chịu trách nhiệm cho những tiến bộ về tầm nhìn máy tính, nhận dạng giọng nói và âm thanh, cũng như xử lý ngôn ngữ tự nhiên. Đó là những gì cho phép máy tính giao tiếp với con người (không phải lúc nào cũng thành công 100%, được chứng minh bởi con bot trên Twitter, như một việc hơi điên rồ và kỳ thị của Microsoft), và khiến cho những chiếc xe tự lái của Google trở nên khả thi. Đó cũng là lý do Facebook đạt được trình độ ngang hàng với con người trong việc nhận ra các cá nhân trong những bức ảnh, và tự động đề xuất gắn thẻ (tag) cho các cá nhân đó. Như vậy, có phải trí thông minh nhân tạo đã rất gần với chúng ta hay không? Có lẽ là không, ít nhất là không phù hợp với khoa học viễn tưởng. Nhiều nhà khoa học tin rằng máy tính sẽ không bao giờ có thể “suy nghĩ” như bộ não của con người. Dù bạn nhìn nhận nó như thế nào đi nữa, khả năng xem xét, hiểu và tương tác của máy tính với thế giới xung quanh chúng đang tăng lên với tốc độ đáng kinh ngạc. Và khi lượng dữ liệu mà chúng ta có tiếp tục tăng lên, thì khả năng học tập, hiểu biết và phản ứng của những chiếc máy tính cũng sẽ gia tăng.
RkJQdWJsaXNoZXIy MjI4NTM1Ng==