23 Jan, 2021
Học của máy
“Học của máy” là lĩnh vực khoa học liên quan tới thiết kế và phát triển các thuật toán cho phép máy tính học và đáp ứng dựa trên cơ sở dữ liệu của nó.
Máy tính có thể tự nó học dựa trên các ví dụ (dữ liệu) để nắm bắt một số điều bằng việc dùng phần mềm phức tạp dựa trên phân bố xác suất. Mỗi lúc nó phạm sai lầm, nó học không làm lại điều đó lần nữa cho nên qua thời gian học, nó có thể đáp ứng tương ứng với hình mẫu tương tự như hành vi con người.
Yếu tố then chốt của nghiên cứu việc học của máy là phát triển các thuật toán phần mềm tự động hoá nhận dạng các hình mẫu phức tạp và ra quyết định thông minh dựa trên dữ liệu quá khứ. Chẳng hạn, một chương trình máy tính được nói là học từ kinh nghiệm E đối với một lớp nhiệm vụ T nào đó và đo hiệu năng P nếu hiệu năng ở các nhiệm vụ trong T, được đo bởi P, cải thiện bằng kinh nghiệm E.
Vài tháng trước đây, một máy tính học máy có tên Watson đã nhớ trên 200 triệu trang dữ liệu để cho câu trả lời đúng đắn trong trò chơi “Jeopardy-Lâm nguy” và đã đánh bại người chơi trò đố chữ giỏi nhất thế giới. Máy tính này được IBM xây dựng có trên 2,500 lõi bộ xử lí song song, từng lõi có thể thực hiện tới 33 tỉ phép toán trong một giây. Nó có vài triệu mã phần mềm và mất hơn năm năm lập trình tại tiện nghi của Carnegie Mellon và IBM.
Vài năm trước, phiên bản trước đây của nó có tên là Xanh Lớn “Big Blue” đã học mọi nước đi có thể trong cờ Vua và đã đánh bại kì thủ Garry Kasparov, vô địch thế giới. Kể từ đó, “Big Blue” đã đánh bại mọi người chơi cờ Vua trong vài giây, vì nó có thể dự đoán mọi nước đi của bạn. Cờ Vua là trò chơi chiến lược và tính toán cho nên có thể viết chương trình phần mềm cho nó. Tuy nhiên, trả lời những câu hỏi được lựa chọn ngẫu nhiên là thách thức khác.
Trong thách thức này, Watson sẽ phải học mọi thứ có thể để cho nó có thể trả lời được những câu hỏi mà người thường có thể hỏi bằng việc dùng ngôn ngữ tự nhiên như tiếng Anh. Chẳng hạn: “Phố X ở New York là ở đâu?” hay “Thủ đô của Uganda là ở đâu.” Nó có thể trả lời các câu hỏi mơ hồ như “Thừa số Rh là gì” hay “Sách nào có người đàn bà có tên Scarlett người lấy một người có tên là Butler” (Đáp: Cuốn theo chiều gió) hay nó có thể trả lời: “Cầu thủ bóng đá có tên Pelé được sinh ra ở thành phố nào?” Mọi người thậm chí có thể hỏi lời bài hát được ưa chuộng của nhóm Beatles cho tới các nốt của bản giao hưởng nhạc cổ điển nào đó.”
Trả lời câu hỏi (QA) đã từng là mơ ước của lĩnh vực Trí tuệ nhân tạo (AI). Xây dựng chương trình cho nó là khó khăn hơn nhiều so với cờ Vua. Nó đi xa và sâu hơn điều động cơ tìm như Google làm khi kiểm cơ sở dữ liệu của nó về các từ khoá. Chẳng hạn: Google sẽ cho bạn 300,000 trang sánh đúng với việc tìm các từ “Greyhound” và “African country,” với điều đó rồi bạn có thể phải tìm thêm trong chúng để ra điều bạn cần. Nhưng Watson có thể nói cho bạn trong không đầy một giây rằng hai từ “Greyhound” và “African country” có liên quan tới một nước có tên là Ai Cập. (Greyhound là một kiểu chó có nguồn gốc từ Ai Cập).
Khi I.B.M. và tổ các nhà nghiên cứu CMU bắt đầu công việc của họ vào năm 2006, Watson có thể trả lời chỉ 15 phần trăm các câu hỏi. Nó tiếp tục học từ mọi sách trong thư viện quốc hội Mĩ, đọc mọi sách từ các thư viện ở châu Âu, mọi cuốn bách khoa toàn thư, từ điển, từ đồng nghĩa, cơ sở dữ liệu, các phân loại, Kinh Thánh, kịch đoạn phim, tiểu thuyết và kịch. Mọi lúc, nó trả lời sai, nó nhớ và qua thời gian qua suy diễn lập luận, nó học câu trả lời đúng. (Đây là điều trí tuệ nhân tạo tất cả là gì.) Để hiểu câu hỏi, máy phải học và phân tích ngôn ngữ tự nhiên (ngôn ngữ mà con người sử dụng), đánh giá nguồn, đề đạt các giả thuyết, kiểm cơ sở dữ liệu, thu thập nhiều thông tin, gộp các kết quả, và xếp hạng câu trả lời tốt nhất mà có yếu tố tự tin thống kê cao nhất để tìm ra câu trả lời thích hợp nhất.
Tất nhiên, câu trả lời đúng chỉ là một điều có tính thống kê, vấn đề của thường xuyên và có thể. Trong vài giây máy xử lí vô tận khả năng dựa trên hơn 100 thuật toán hội tụ vào giải pháp mà nó có thể cung cấp ra câu trả lời. Watson có thể trả lời được mọi câu hỏi không? Vẫn còn chưa đâu. Từ của con người là rất khó, một số câu có thể có nhiều nghĩa và điều đó gây lẫn lộn cho máy. Nhưng qua thời gian, máy sẽ học và dự đoán nghĩa đúng.
Vấn đề không phải là liệu máy có thể học như con người hay trả lời câu hỏi một cách đúng đắn. Sớm hay muộn điều đó sẽ được thực hiện nhưng chúng ta có thể làm gì với cái máy thông minh như Watson? Công nghệ này sẽ được sử dụng để làm gì? Liệu có khả năng máy sẽ học phân biệt đúng từ sai không? Bởi vì chúng ta đang đạt tới mức độ khác của công nghệ, chúng ta đã tạo ra máy có thể học và nghĩ. Cái gì sẽ là điều tiếp theo? Ngày nay IBM đang làm việc để thương mại hoá công nghệ này cho công nghiệp và doanh nghiệp. Trong tương lai gần, chúng ta có lẽ sẽ dùng nó cho nhiều nhiệm vụ thường ngày của chúng ta như điều chúng ta dùng iPods, iPhone hay iPads ngày nay.
Học của máy và Công nghệ ngôn ngữ là lĩnh vực kích động bên trong khoa Khoa học máy tính tại CMU, cùng với Robotics, chúng giúp tạo ra Watson và mở cánh cửa cho tiến bộ của công nghệ trong thế kỉ 21 nhưng cái gì sẽ là biên giới tiếp? Cái gì sẽ làm ích lợi cho xã hội chúng ta nhất với công nghệ này? Những câu hỏi này sẽ được trả lời bởi các sinh viên tương lai của chúng ta người tiếp tục thúc đẩy công nghệ lên mức mới.
(Một trong những người bạn của tôi tại CMU đã gợi ý rằng Watson có thể thay thế thầy giáo ở trường phổ thông sơ cấp. Trẻ em bao giờ cũng tò mò và hăm hở học, chúng hỏi đủ mọi loại câu hỏi mà có thể làm cho thầy giáo phát mệt. Ngược lại, Watson kiên nhẫn và không bao giờ mệt. Nó làm việc bẩy ngày và hai mươi tư giờ mà không yêu cầu nghỉ giải lao. Nó cũng không đòi tăng lương. Thật là ý tưởng thú vị!)
—-English vesrsion—-
Machine Learning
“Machine Learning” is a scientific field concerned with the design and development of algorithms that allow computers to learn and response based on data from its databases. A computer can learn by itself based on examples (data) to capture certain things using sophisticated software based on probability distribution. Each time it makes mistake, it learns not to do it again so over a period of learning, it can response according to a pattern similar to human behavior.
The key factor of machine learning research is to develop software algorithms that automatically recognize complex patterns and make intelligent decisions based on past data. For example, a computer program is said to learn from experience E with respect to some class of tasks T and performance measure P. If its performance at tasks in T, as measured by P, improves with experience E.
Few months ago, the machine learning computer called Watson has memorize over 200 million pages of data to correctly give answers in the game “Jeopardy” and defeated the world’s best quiz game persons. This computer built by IBM has over 2,500 parallel processor cores, each can perform up to 33 billion operations in a second. It has several millions of software code and took more than five years to program at Carnegie Mellon and IBM facilities.
Few years ago, its previous version named “Big Blue” has learned every possible moves in Chess and defeated Garry Kasparov, the world’s Chess champion. Since then, “Big Blue” has defeated everybody who play Chess in matter of few seconds, as it can predicted all of your moves. Chess is a game of strategy and calculation so it is possible to write a software program for it. However, answering randomly selected questions is different challenge.
In this challenge, Watson will have to learn everything possible so it can answer questions that a common person can ask using the natural language such as English. For example: “Where is X street in New York?” or “What is the capital of Uganda”. It can answer ambiguous questions such as “What is the Rh factor” or “What book has a woman named Scarlett who married a person named Butler” (Answer: Gone with the Wind) or it can answer: “What city the Soccer player named Pelé was born?” People can even ask for lyrics from the Beatles’ songs to the notes of certain classical music symphony”.
Question Answering (QA) has been the dream of Artificial Intelligence (AI) field. It is considerably more difficult to develop algorithms than chess. It goes much farther and deeper than what search engines like Google do when it check its database for keywords. For example: Google will give you 300,000 page matches for a search of the terms “Greyhound” and “African country,” which you can then have to search them more to find what you need. But Watson can tell you in less than a seconds that the two word “Greyhound” and “African country” is related to a country named Egypt. (Greyhound is a type of dog original from Egypt).
When I.B.M. and the team of CMU researchers began their work in 2006, Watson could answer only 15 percent of the questions. It continue to learn from every books in the U.S congress libraries, read all books from libraries in Europe, all encyclopedias, dictionaries, thesauri, databases, taxonomies, the Bibles, movie scripts, novels and plays. Every time, it answers wrong, it memorizes and over time through reasoning deduction, it learns the correct answer. (This is what Artificial Intelligence is all about). To understand the questions, the machine has to learn and analyze natural language (the language that human use), appraise sources, propose hypotheses, check the database, collect several information, merge the results, and rank the best answers that has the highest statistical confident factor to find the most appropriate answer.
Of course, the correct answer is only a statistical thing, a matter of frequency and likelihood. Within few seconds the machine process countless possibilities based on over 100 algorithms converge on a solution than it can provide the answer. Could Watson answer every questions? Not yet. Human words are very difficult, some simple sentence may have several meanings and it will confuse the machine. But over time, the machine will learn and predict the correct one.
The issue is not whether the machine can learn like a human being or answer questions correctly. It will be done sooner or later but what can we do with an intelligent machine like Watson? What this technology will be used for? Is it possible that the machine will learn to distinguish right from wrong? Now that we are reaching another level in technology, we have created a machine that can learn and think. What will be next? Today IBM is working to commercialize this technology to the industry and business. In the near future, we will probably use it for many of our daily tasks just like what we use iPods, iPhone or iPads today.
Machine Learning and Language Technology are exciting fields within the Computer Science department at CMU, together with Robotics, they helped create Watson and open the door for the advancement of technology in this 21st century but what will be the next frontier? What will benefit our society most with this technology? These questions will be answered by our future students who continue to push the technology to the next level.
(One of my friend at CMU suggested that Watson could replace teachers in elementary school. Children are always curious and eager to learn, they ask all kind of questions that can make teachers tired. On the contrary, Watson is patient and never tired. It works seven days and twenty four hours without asking for a break. It also not ask for raise. Interesting idea!)