CELIA QUILLIAN Minh Tuyết dịch AI FOR LIFE
PHẦN 1 Hiểu về AI Bạn đã sẵn sàng bước vào một khóa học cấp tốc về AI tạo sinh chưa? Đừng lo, bạn sẽ không bị chìm trong hàng đống thuật ngữ chuyên ngành hay lý thuyết kỹ thuật khô khan đâu. Trong Phần 1, tôi đã chắt lọc những thông tin cốt lõi thành hai chương ngắn gọn và vô cùng dễ hiểu. Bạn sẽ nắm được những điều quan trọng nhất mà người dùng AI cần biết để có thể sử dụng AI hiệu quả, bao gồm cả việc hiểu ưu điểm và nhược điểm của AI tạo sinh. Bạn cũng sẽ được hướng dẫn cách nắm bắt các khái niệm cơ bản về AI, khám phá cách thức hoạt động của các công cụ này và làm quen với những nền tảng AI tạo sinh phổ biến (và miễn phí) mà bạn có thể áp dụng vào các tình huống thực tế ở Phần 2. Bên cạnh đó, bạn còn được tìm hiểu hàng loạt tính năng đa dạng của AI, từ trò chuyện bằng giọng nói đến tạo hình ảnh và nhiều hơn thế nữa. Cuối cùng, bạn sẽ học cách tương tác với AI thông qua các kỹ thuật viết câu lệnh hiệu quả, cùng với một số mẹo và bí quyết hữu ích. Phần này sẽ giúp bạn xây dựng nền tảng vững chắc cho mọi tương tác với AI trong tương lai, dù là đơn giản hay phức tạp. Bây giờ thì cùng bắt đầu nhé!
Chương 1 L àAmI t qạ ou esni nvhớ i AI không chỉ là một từ khóa đang thịnh hành mà còn là một công nghệ đang phát triển với tốc độ chóng mặt và hiện vẫn còn trong giai đoạn đầu được ứng dụng rộng rãi. Tuy vậy, chỉ trong một thời gian ngắn nữa thôi, AI sẽ trở nên quen thuộc trong mọi khía cạnh đời thường, như cách internet từng làm. Dù bạn là người lần đầu tiếp cận hay đã từng thử “vọc” qua các công cụ AI tạo sinh như ChatGPT nhưng vẫn loay hoay không biết cách dùng sao cho hiệu quả, thì việc nắm được những nguyên tắc cơ bản, cả về cách AI vận hành lẫn cách tương tác hiệu quả với nó, chính là chìa khóa giúp bạn tận dụng tối đa sức mạnh của công nghệ này. Trước khi chúng ta khám phá những cách cụ thể để ứng dụng AI vào cuộc sống hằng ngày, phần này sẽ giúp bạn nắm được tất cả những gì cần biết để “dùng AI một cách thông minh”,
14 | AI for life từ cách nó vận hành đến cách tương tác sao cho đạt được kết quả như mong muốn. Mục tiêu của tôi trong chương này là giúp bạn hiểu rõ cách AI hoạt động và cách làm việc hiệu quả với AI, để bạn có thể khai thác sức mạnh của công nghệ này, không chỉ ở hiện tại mà cả trong tương lai, khi AI tiếp tục phát triển. AI không phải là chủ đề mới Dù có nhận ra hay không, rất có thể bạn đã và đang hưởng lợi từ công nghệ AI trong một thời gian dài rồi. Suốt nhiều năm qua, các công cụ tìm kiếm như Google hay Yahoo!, cũng như các chức năng nhận diện giọng nói của Siri (Apple) hay Alexa (Amazon), đã hoạt động nhờ vào những công nghệ AI tinh vi. Điện thoại thông minh có thể đề xuất từ ngữ hoặc sửa lỗi chính tả đều là nhờ AI. Vậy còn những gợi ý nội dung “chuẩn gu” trên các nền tảng xem phim hay nghe nhạc trực tuyến thì sao? Vẫn là nhờ AI. Những ví dụ tôi vừa nhắc đến chỉ là một phần nhỏ trong số rất nhiều cách mà chúng ta đang sử dụng AI trong cuộc sống hằng ngày. Thế nhưng mãi cho đến gần đây thì thuật ngữ AI hay trí tuệ nhân tạo mới thật sự trở thành những từ khóa phổ biến trong các cuộc trò chuyện thường ngày. Làn sóng chú ý này bắt nguồn từ một sự kiện làm chấn động thế giới công nghệ: OpenAI ra mắt ChatGPT vào ngày 30/11/2022.
Làm chủ AI | 15 Theo báo cáo của UBS1, sự kiện ra mắt đó đã giúp ChatGPT thu hút một triệu người dùng chỉ trong tuần đầu tiên, và sau hai tháng thì số người dùng đã vượt mốc 100 triệu. Nhờ việc truy cập dễ dàng, cách sử dụng đơn giản và dĩ nhiên là những yếu tố gây ấn tượng mạnh, AI bỗng dưng trở thành thuật ngữ mà hầu như ai cũng từng nghe qua, và đó là trong đời sống thường nhật chứ không phải trong các tác phẩm khoa học viễn tưởng. Sự bùng nổ xung quanh OpenAI, một cái tên từng ít được biết đến, đã khiến các “ông lớn” (như Google và Microsoft) và nhiều công ty khác nhanh chóng bước vào cuộc đua công nghệ với những công cụ AI tạo sinh của riêng họ. AI tạo sinh Trước hết, trí tuệ nhân tạo (Artificial Intelligence) là một thuật ngữ chung dùng để chỉ những hệ thống máy móc được lập trình để mô phỏng cách con người tư duy, học hỏi hoặc giải quyết vấn đề. AI “tạo sinh” là một nhánh của trí tuệ nhân tạo, dùng để chỉ những công cụ có khả năng “tạo ra” nội dung mới dựa trên yêu cầu (còn gọi là câu lệnh hoặc “prompt”) mà chúng nhận được. 1 Tên viết tắt của Union Bank of Switzerland (Ngân hàng Liên hiệp Thụy Sĩ), một trong những tập đoàn tài chính và ngân hàng đầu tư lớn nhất thế giới, có trụ sở chính tại Thụy Sĩ. Báo cáo của UBS là một tài liệu phân tích thị trường do tổ chức này phát hành, thường được xem là nguồn tham khảo uy tín trong lĩnh vực kinh tế, tài chính và công nghệ. (Tất cả chú thích trong sách là của người dịch và ban biên tập, trừ khi có ghi chú khác.)
16 | AI for life Những điều cơ bản về mô hình ngôn ngữ lớn ChatGPT và các công cụ mà chúng ta sẽ tìm hiểu trong Phần 1 là những ứng dụng AI tạo sinh hoạt động dựa trên cái gọi là “mô hình ngôn ngữ lớn” (Large Language Model – LLM). Đây là một dạng mô hình AI được thiết kế để xử lý, phản hồi và tương tác với ngôn ngữ của con người. Vì vậy, những công cụ này có thể phản hồi các yêu cầu của bạn bằng ngôn ngữ tự nhiên1. Ngoài ra, nhiều công cụ AI tạo sinh khác cũng sử dụng công nghệ LLM để thực hiện các tác vụ như tạo hình ảnh, âm nhạc, thậm chí là video – tất cả đều dựa vào yêu cầu được diễn đạt bằng ngôn ngữ của con người. Vậy LLM hoạt động như thế nào? Nói một cách đơn giản, khi bạn nhập một yêu cầu dạng văn bản vào các công cụ như ChatGPT, LLM sẽ dùng “kiến thức đã được huấn luyện” (gồm một kho dữ liệu khổng lồ) để dự đoán từng từ tiếp theo sao cho phù hợp nhất để trả lời yêu cầu ban đầu. Về cơ bản, LLM giống như một phiên bản được nâng cấp cực mạnh của tính năng tự động hoàn thành văn bản. Thay vì chỉ gợi ý một từ hay một cụm ngắn, nó có thể tạo ra hàng trăm từ được sắp xếp mạch lạc và phù hợp với yêu cầu ban đầu của bạn. Nói cách khác, những công cụ này cực kỳ giỏi trong việc bắt chước cách con người dùng ngôn ngữ. 1 Ngôn ngữ tự nhiên (natural language): ngôn ngữ mà con người sử dụng trong giao tiếp hằng ngày, ví dụ như tiếng Việt, tiếng Anh, tiếng Nhật… Khác với ngôn ngữ lập trình (dành cho máy tính hiểu), ngôn ngữ tự nhiên là loại ngôn ngữ tự phát triển theo thời gian trong xã hội loài người, mang tính linh hoạt, có cảm xúc, sắc thái và ngữ cảnh. Ở đây ý nói AI có khả năng giao tiếp với con người theo cách nói chuyện tự nhiên, dễ hiểu, giống như một người thật.
Làm chủ AI | 17 Sự hợp tác giữa con người và máy móc Nếu bạn thích những phép so sánh có hình ảnh, hãy thử tưởng tượng LLM giống như một nhà văn. Nhà văn này không chỉ am hiểu phong cách viết của hàng ngàn tác giả mà còn có khả năng bắt chước những lối viết đó cực kỳ khéo léo. Vì vậy, nếu bạn thuê họ viết một truyện ngắn theo phong cách của Charles Dickens1, bạn sẽ nhận được một bản thảo chẳng khác gì do Dickens viết thật! Nhưng giả sử bạn không hài lòng với một tình tiết nào đó, bạn có thể góp ý và yêu cầu nhà văn đó điều chỉnh lại cốt truyện. Dựa vào phản hồi của bạn và kiến thức chuyên môn của họ, bản thảo thứ hai chắc chắn sẽ hay hơn. Nhờ vào khả năng của LLM trong việc nhận diện và mô phỏng ngôn ngữ con người, các công cụ AI tạo sinh cũng tương tác với bạn theo cách như trong ví dụ vừa nêu. Bạn đưa ra một yêu cầu, mô hình AI sẽ dựa vào “kiến thức” mà nó đã học để tạo ra nội dung phù hợp với yêu cầu đó. Nếu thấy chưa ổn và muốn điều chỉnh, bạn chỉ cần nói rõ, AI sẽ dựa trên góp ý của bạn để đưa ra một kết quả mới phù hợp hơn. Dung lượng hội thoại Tại sao các LLM có thể điều chỉnh câu trả lời theo góp ý của người dùng như vậy? Khả năng phản hồi này phần lớn là nhờ vào “cửa sổ ngữ cảnh” (context window) của LLM. Về cơ bản, cửa sổ ngữ cảnh là dung lượng “bộ nhớ” mà một 1 Charles Dickens (1812-1870): tiểu thuyết gia người Anh nổi tiếng, được xem là một trong những cây bút vĩ đại nhất của văn học Anh thế kỷ 19.
18 | AI for life LLM có thể lưu giữ trong một cuộc trò chuyện giữa bạn và mô hình AI. Đơn vị đo của cửa sổ này là “token”1. Để dễ hình dung, bạn có thể hiểu một token tương đương với một từ dài khoảng năm chữ cái. Một cửa sổ ngữ cảnh 8.000 token – mức tối thiểu của các mô hình AI được đề cập trong quyển sách này – tương đương khoảng 27 trang của một quyển sách thông thường. Điều đó nghĩa là bạn có thể trò chuyện khá nhiều mà AI vẫn “nhớ” được nội dung trước đó. Hiện nay, một số mô hình LLM còn có cửa sổ ngữ cảnh lớn hơn rất nhiều, chẳng hạn như GPT-4o (128.000 token), Claude 3.5 Sonnet (200.000 token) hay thậm chí là hơn một triệu token với Gemini 1.5 Pro (chỉ có ở phiên bản trả phí). Bạn càng trò chuyện nhiều với AI thì mô hình LLM càng ghi nhớ nhiều “ngữ cảnh”. Mọi nội dung bạn nhập vào cuộc trò chuyện (kể cả tệp đính kèm) và mọi phản hồi mà công cụ AI tạo ra đều góp phần tạo nên bộ nhớ ngữ cảnh. AI sẽ dựa vào bộ nhớ này để tạo ra các phản hồi tiếp theo. Có thể hình dung bộ nhớ ngữ cảnh giống như một lớp “dữ liệu huấn luyện tạm thời” được phủ lên mô hình gốc, và nó chỉ được giữ lại trong phạm vi cho phép của cửa sổ ngữ cảnh. Tuy nhiên, nếu nhập quá nhiều nội dung và chạm đến giới hạn của cửa sổ ngữ cảnh (hoặc nếu bạn đính kèm các tệp quá lớn), bạn có thể thấy công cụ bắt đầu trở nên “ngáo ngơ” khi bạn nhắc tới vài thông tin mình đã cung cấp trước đó rất 1 Token: đơn vị nhỏ nhất mà mô hình AI sử dụng để hiểu và xử lý dữ liệu. Với văn bản, token có thể là một từ ngắn, một phần của từ hoặc ký tự. Với hình ảnh, token là các mảnh nhỏ của ảnh gọi là “patch”. Với âm thanh, token là các khung thời gian hoặc đặc trưng âm thanh.
Làm chủ AI | 19 lâu trong cuộc trò chuyện. Lúc này, có thể bạn cần nhắc lại thông tin để AI hiểu đúng. Điều này cũng khá giống cách con người tương tác với nhau, vì suy cho cùng thì chúng ta sẽ dễ nhớ một chi tiết được nhắc tới trong cuộc họp hôm qua hơn là một chi tiết đã nghe từ cả tháng trước. Ưu điểm của AI tạo sinh Quyển sách này sẽ tập trung vào cách dùng các công cụ AI tạo sinh như ChatGPT, vốn chủ yếu phản hồi yêu cầu của người dùng bằng văn bản, nhưng tôi cũng có đề cập đến khả năng tạo ảnh của AI. Nếu bạn muốn tạo ra hay tìm hiểu về điều gì đó có thể được thực hiện hoặc diễn đạt bằng văn bản, ChatGPT (và các công cụ AI tương tự) hoàn toàn có thể làm được. Sau đây là những ưu điểm đặc biệt của các công cụ AI tạo sinh sử dụng LLM: § Có nền tảng kiến thức khổng lồ: LLM “biết” rất nhiều điều. Hãy tưởng tượng bạn có thể hiểu toàn bộ nội dung của tất cả các quyển sách trong một thư viện khổng lồ – về cơ bản thì đó là điều ChatGPT có thể giúp bạn làm được. Tương tự như các công cụ tìm kiếm, AI tạo sinh cho phép bạn tiếp cận lượng thông tin khổng lồ trong thời gian nhanh kỷ lục, từ đó hỗ trợ bạn học tập, sáng tạo và thậm chí là tư duy nhanh hơn. § Hiểu rõ yêu cầu của bạn: LLM có khả năng hiểu rõ yêu cầu của người dùng. Dựa trên từ ngữ bạn sử dụng khi “trò chuyện” với công cụ, LLM có thể dự đoán câu trả lời phù hợp và trình bày thông tin
20 | AI for life theo cách bạn cần. Ngay cả khi bạn đưa ra một yêu cầu dài dòng và lộn xộn, công cụ vẫn có thể phản hồi hợp lý. (Dù vậy, bạn sẽ nhận được kết quả tốt hơn nếu dùng câu lệnh mạch lạc và rõ ràng – điều bạn sẽ được học trong phần sau của quyển sách này.) § Có khả năng ghi nhớ và hiểu ngữ cảnh: Các công cụ AI tạo sinh có khả năng ghi nhớ nội dung cuộc trò chuyện trong cùng một khung hội thoại, vậy nên bạn có thể liên tục mở rộng yêu cầu ban đầu. Nói một cách đơn giản, bạn có thể trò chuyện với một ứng dụng AI mà không sợ nó “quên” những gì bạn từng nói. Những công cụ này có giới hạn về “trí nhớ” trong mỗi khung hội thoại (như đã đề cập ở phần trước), nhưng nhìn chung, cơ chế hoạt động theo kiểu hội thoại là yếu tố khiến chúng trở nên rất dễ sử dụng. § Sáng tạo và linh hoạt: Nhờ sở hữu một kho kiến thức đồ sộ và khả năng nhận diện các kiểu mẫu trong dữ liệu, các LLM rất giỏi trong việc đề xuất ý tưởng và giải quyết vấn đề. Tương tự, nhờ vào cơ sở dữ liệu và khả năng nhận diện đã được huấn luyện, các LLM dễ dàng thích ứng với yêu cầu và phong cách mới, thậm chí có thể linh hoạt “nhập vai” bất kỳ nhân vật nào bạn yêu cầu để trả lời cho một truy vấn cụ thể. § Biết giao tiếp bằng nhiều ngôn ngữ: Nhờ được huấn luyện bằng kho dữ liệu bao gồm nhiều
Làm chủ AI | 21 ngôn ngữ khác nhau, các công cụ AI tạo sinh cũng rất giỏi trong việc dịch thuật, đặc biệt với những ngôn ngữ phổ biến trên thế giới. Ví dụ, ChatGPT có thể hiểu, dịch và phản hồi yêu cầu bằng hơn 80 ngôn ngữ khác nhau. § Chi phí hợp lý và dễ tiếp cận: Khả năng tiếp cận là một điểm cộng lớn của các công cụ này. Tuy nhiều công cụ AI phổ biến có cung cấp gói trả phí để mở khóa các tính năng nâng cao hơn, phần lớn các ứng dụng AI tạo sinh đều cung cấp phiên bản miễn phí cho bất kỳ ai có kết nối internet. Hạn chế của AI tạo sinh Chúng ta đã nói rằng AI tạo sinh có thể làm tốt được rất nhiều việc khác nhau, giống như một con dao đa năng Thụy Sĩ. Thế nhưng, cũng tương tự việc sử dụng dao đa năng không đúng cách sẽ gây rắc rối, việc dùng AI tạo sinh sai cách hoặc không hiểu rõ cách tận dụng AI hiệu quả sẽ dẫn đến những kết quả không như mong đợi. Mặc dù có thể thực hiện hàng loạt tác vụ hữu ích và tiếp cận được một kho kiến thức khổng lồ, AI vẫn không phải là những công cụ hoàn hảo. Hãy cùng điểm qua một số lầm tưởng phổ biến về AI tạo sinh cũng như những điểm hạn chế của chúng, để bạn có thể chủ động nhận biết và điều chỉnh khi sử dụng. Ảo giác Khi mới bắt đầu sử dụng các công cụ AI, bạn rất dễ nảy sinh một lầm tưởng phổ biến: vì AI có thể truy cập kho
22 | AI for life kiến thức khổng lồ, vì nó đưa ra câu trả lời rất nhanh chóng và đầy tự tin, và vì phần lớn thông tin nó cung cấp là đúng, nên bạn mặc định rằng nó luôn luôn đúng. Nhưng sự thật không phải vậy. Dù các mô hình AI đã được huấn luyện rất bài bản và thường cho ra kết quả có cơ sở, bạn vẫn cần ghi nhớ rằng các công cụ này có thể gặp hiện tượng gọi là “ảo giác”, tức là tạo ra thông tin không chính xác, không có thật, thậm chí vô nghĩa, nhưng lại trình bày một cách chắc chắn và tự tin như thể đó là sự thật. Suy cho cùng, AI cũng chỉ là mô hình dự đoán, mà đã là dự đoán thì không thể lúc nào cũng chính xác 100% được. Câu trả lời của AI tạo sinh thường chính xác nhất đối với các câu hỏi về các lĩnh vực có nhiều tài liệu tham khảo hoặc thông tin công khai. Ngược lại, mô hình dễ bị “ảo giác” nếu được hỏi về những chủ đề chuyên sâu hoặc hiếm gặp (chẳng hạn như các nghiên cứu khoa học mới công bố hoặc các vụ kiện cụ thể), hoặc khi câu hỏi liên quan đến các sự kiện diễn ra sau thời điểm người ta dừng cung cấp dữ liệu huấn luyện cho mô hình. Không chỉ vậy, nếu bạn nhờ ChatGPT tạo một danh mục tài liệu tham khảo cho nội dung đã trao đổi trong cuộc trò chuyện, nó sẽ “vui vẻ” cung cấp một danh sách trông rất giống một danh mục tài liệu tham khảo đúng chuẩn. Tuy nhiên, chỉ bằng một lượt tìm kiếm nhanh trên Google, có thể bạn sẽ bất ngờ phát hiện rằng một số bài nghiên cứu hoặc bài báo mà ChatGPT liệt kê thực chất không hề tồn tại! Giải pháp: Vì AI có thể tạo ra thông tin sai lệch nên khi sử dụng các công cụ AI tạo sinh, đặc biệt là trong
Làm chủ AI | 23 nghiên cứu hoặc công việc, bạn cần phải đối chiếu thông tin nhận được với nhiều nguồn khác để đảm bảo nội dung đó là chính xác. Cốt lõi của vấn đề nằm ở dữ liệu huấn luyện và chất lượng thông tin mà mô hình AI tiếp cận được. Ngay cả khi công cụ AI có khả năng tra cứu trực tuyến, bạn vẫn nên truy cập trực tiếp vào đường dẫn để đánh giá xem nguồn thông tin nó đưa ra có đáng tin không và phần tóm tắt của nó có phản ánh đúng nội dung gốc hay không. Các phép toán Chính vì hoạt động dựa trên cơ chế dự đoán nên các công cụ AI tạo sinh phổ biến được đề cập trong quyển sách này có thể giúp bạn giải những phép toán đơn giản (như 4 + 10 = 14) nhưng lại gặp khó khăn khi thực hiện những phép tính phức tạp hơn (như 4.229 × 2.099.032). Những công cụ này không phải là máy tính. Chúng chỉ đưa ra dự đoán rằng ký tự hoặc từ nào có khả năng xuất hiện tiếp theo, dựa trên dữ liệu và hình mẫu dùng để huấn luyện các thuật toán tinh vi của chúng. Nói chung, bạn có thể sử dụng AI để học cách giải một bài toán, chứ không nên trông chờ nó tính toán chính xác kết quả cho bạn. Giải pháp: Nếu bạn thật sự cần trợ giúp trong việc tính toán, ChatGPT có một tính năng phân tích dữ liệu mà bạn có thể truy cập qua gói ChatGPT Plus (gói ChatGPT miễn phí cũng có tính năng này, nhưng chỉ trong giới hạn nhất định). Tính năng này được huấn luyện chuyên biệt để thực hiện các phép tính nâng cao bằng cách chạy các đoạn mã Python khi trả lời các câu hỏi toán học.
MỤC LỤC Lời cảm ơn............................................................................5 Giới thiệu..............................................................................7 Phần 1: Hiểu về AI.........................................................11 Chương 1: Làm quen với AI tạo sinh................................13 Chương 2: Nhập môn đặt câu lệnh...................................43
Làm chủ AI | 335 Phần 2: Ứng dụng AI trong đời sống............................67 Chương 3: Dùng AI để chăm sóc gia đình........................71 Chương 4: Dùng AI để chăm sóc sức khỏe.......................99 Chương 5: Dùng AI để phát triển sự nghiệp...................131 Chương 6: Dùng AI để quản lý tài chính cá nhân..........169 Chương 7: Dùng AI để học tập và phát triển bản thân..199 Chương 8: Dùng AI để tạo dựng các mối quan hệ.........229 Chương 9: Dùng AI để tối ưu trải nghiệm du lịch.........263 Chương 10: Dùng AI để nâng tầm hoạt động giải trí....297
RkJQdWJsaXNoZXIy MjI4NTM1Ng==