Bình minh của mạng neuron nhân tạo – Phần I


Bằng chứng tồn tại duy nhất chứng minh rằng bất kỳ vấn đề khó khăn nào trong trí tuệ nhân tạo đều có thể được giải quyết là thực tế rằng tự nhiên đã giải quyết những vấn đề này thông qua quá trình tiến hóa. Nhưng từ những năm 1950 đã xuất hiện những manh mối về cách thức mà các máy tính có thể thực hiện hành vi thông minh, nếu các nhà nghiên cứu AI có một cách tiếp cận mà về cơ bản khác biệt so với việc xử lý biểu tượng.

Manh mối đầu tiên là bộ não của con người là những mô hình nhận dạng kiểu mẫu mạnh mẽ. Hệ thống thị giác của chúng ta có thể nhận diện một vật thể giữa khung cảnh lộn xộn chỉ trong 1/10 giây, dù vật thể đó có kích thước như thế nào, ở vị trí nào hay theo hướng nào so với chúng ta, và dù trước đó chúng ta có thể chưa bao giờ thấy nó. Tóm lại hệ thống thị giác của con người hoạt động giống như chiếc máy tính với chức năng  “nhận biết vật thể” là chỉ dẫn duy nhất.

Manh mối thứ hai là bộ não của con người có thể học cách thực hiện nhiều nhiệm vụ khó khăn thông qua thực hành, từ việc chơi piano đến thông thạo vật lý. Tạo hóa sử dụng việc học tập có mục đích chung để giải quyết các vấn đề chuyên biệt, và con người là những học trò vô địch. Đây là sức mạnh đặc biệt của chúng ta. Cách tổ chức vỏ não của chúng ta gần như giống nhau từ đầu đến cuối, và mạng lưới học sâu được tìm thấy trong tất cả các hệ thống giác quan và dây thần kinh vận động của con người.

Manh mối thứ ba là bộ não con người không hề bị lấp đầy bởi logic hoặc các quy tắc. Vâng, chúng ta có thể học cách tư duy logic hoặc tuân thủ các quy tắc, nhưng phải sau nhiều lần huấn luyện, và phần lớn chúng ta không giỏi lắm về việc này. Điều này được minh họa bằng câu trả lời điển hình cho một câu đố logic được gọi là “nhiệm vụ lựa chọn Wason” (Hình 3.1).Lựa chọn đúng là thẻ có số “8” và thẻ màu ghi. Trong nghiên cứu ban đầu, chỉ có 10% đối tượng có câu trả lời đúng. Nhưng phần lớn các đối tượng không gặp khó khăn với việc đưa ra câu trả lời đúng khi bài kiểm tra logic được dựa trên một bối cảnh quen thuộc (Hình 3.2).Lý do dường như là lĩnh vực cụ thể, càng quen thuộc với một lĩnh vực, chúng ta càng dễ dàng giải quyết các vấn đề trong lĩnh vực đó. Kinh nghiệm khiến cho việc lý giải trong một lĩnh vực trở nên dễ dàng hơn vì chúng ta có thể sử dụng những ví dụ mà mình đã gặp để đưa ra các giải pháp dựa trên trực giác. Ví dụ, trong vật lý, chúng ta đã học một lĩnh vực như điện và từ tính bằng cách giải quyết nhiều vấn đề, chứ không phải bằng cách ghi nhớ các công thức. Nếu trí thông minh của con người hoàn toàn dựa vào logic, nó phải là một lĩnh vực chung, nhưng thực tế không phải vậy.

Đầu mối thứ tư là bộ não của chúng ta chứa hàng tỷ tỷ neuron nhỏ luôn liên lạc với nhau một cách liên tục. Điều này cho thấy, đối với những giải pháp cho các vấn đề khó trong trí tuệ nhân tạo, chúng ta nên xem xét các máy tính với kiến trúc song song khổng lồ thay vì những chiếc máy tính có kiến trúc kỹ thuật số von Neumann mà qua đó dữ liệu và các lệnh được nạp vào thực hiện cùng một lúc. Vâng, đúng là máy Turing có khả năng tính toán bất kỳ chức năng có thể ước tính nào nếu có đủ bộ nhớ và thời gian, nhưng tự nhiên phải giải quyết vấn đề trong thời gian thực. Để làm được điều này, nó tận dụng các mạng lưới neuron của não bộ, giống như những chiếc máy tính mạnh mẽ nhất trên hành tinh, với số lượng rất lớn các bộ vi xử lý song song. Những thuật toán vận hành hiệu quả trên chúng cuối cùng sẽ chiến thắng.

Những người tiên phong buổi ban đầu

Trong thập niên 1950 và 1960, ngay sau khi Norbert Wiener giới thiệu lĩnh vực điều khiển học dựa trên hệ thống thông tin liên lạc và điều khiển trong cả máy móc và sinh vật sống, các hệ thống tự tổ chức đã đột ngột được đặc biệt quan tâm. Như một mẫu nhỏ của sự sáng tạo khéo léo mà việc này đã tạo ra, Oliver Selfridge đã tạo ra Pandemonium, một thiết bị nhận dạng mẫu, trong đó các “con quỷ” có tính năng phát hiện đặc trưng đấu tranh với nhau để có quyền đại diện các vật thể trong hình ảnh (một phép ẩn dụ cho việc học sâu; Hình 3.3); Bernard Widrow và sinh viên của ông – Ted Hoff tại Stanford đã phát minh ra thuật toán học LMS (bình phương tối thiểu), thuật toán mà, với sự tiếp nối của những người kế nhiệm, đã được sử dụng rộng rãi để xử lý tín hiệu thích nghi trong nhiều ứng dụng, từ việc khử tiếng ồn đến dự báo tài chính. Ở đây, tôi sẽ chỉ tập trung vào một trong những người tiên phong trong thập kỷ đầu, Frank Rosenblatt (Hình 3.4), mạng perceptron của ông là tiền đề trực tiếp của học sâu.Hình 3.3: Địa ngục. Oliver Selfridge tưởng tượng rằng có những con quỷ trong não chịu trách nhiệm giải nén các tính năng phức tạp và trừu tượng liên tiếp từ đầu vào là các giác quan, dẫn đến các quyết định. Mỗi con quỷ ở mỗi cấp sẽ vui mừng nếu nó khớp với đầu vào từ một cấp độ trước đó. Con quỷ quyết định cân nhắc mức độ phấn khích và tầm quan trọng của người cung cấp thông tin. Hình thức đánh giá bằng chứng này là một phép ẩn dụ cho các mạng lưới học sâu hiện tại – với nhiều cấp độ hơn. Trích từ tác phẩm của Peter H. Lindsay và Donald A. Norman: Xử lý thông tin con người: Giới thiệu về tâm lý học, tái bản lần thứ 2 (1977).

Học từ những ví dụ

Không nao núng bởi sự thiếu hiểu biết về chức năng của bộ não, những người tiên phong về AI mạng neuron đã lao về phía trước với phiên bản hoạt họa của các neuron và cách thức chúng được kết nối với nhau. Frank Rosenblatt tại Đại học Cornell (Hình 3.4) là một trong những người đầu tiên bắt chước kiến trúc hệ thống  thị giác của con người để nhận dạng kiểu mẫu tự động. Ông đã phát minh ra một mạng đơn giản gọi là “perceptron”, một thuật toán học có thể học cách phân chia các mẫu thành các loại khác nhau, chẳng hạn như các chữ cái trong bảng chữ cái. Các thuật toán là các thủ tục mà bạn phải làm theo từng bước để đạt được những mục tiêu đặc biệt, giống như bạn làm theo một công thức nướng bánh.Thiết bị hải quân mới học qua trải nghiệm thực tế.

Nhà tâm lý học cho thấy sự phôi thai của dòng máy tính được thiết kế để đọc và phát triển thông minh hơn.

Washington, ngày 7 tháng 7 (UPI) – Hải quân tiết lộ việc nghiên cứu và phát triển dòng máy tính hiện đại – thứ mà họ mong đợi sẽ có thể đi bộ, nói chuyện, nhìn, viết, tái tạo chính nó và có ý thức về sự tồn tại của nó.

Bước đầu – máy tính trị giá 2 triệu USD “704” của Cục Khí tượng đã học cách phân biệt giữa phải và trái sau 50 thử nghiệm chứng minh của Hải quân trước các ký giả.

Cơ quan này cho biết họ sẽ sử dụng nguyên tắc đó để chế tạo những cỗ máy tư duy Perceptron đầu tiên có thể đọc và viết. Nó được dự kiến sẽ hoàn thành trong khoảng một năm với chi phí 10 nghìn USD.

Tiến sĩ Frank Rosenblatt, người tạo nên Perceptron đã tiến hành chứng minh. Ông cho biết cỗ máy sẽ là thiết bị đầu tiên suy nghĩ như con người. Theo ông, cũng như con người, Perceptron ban đầu sẽ phạm sai lầm, nhưng sẽ phát triển thông minh hơn khi nó có được kinh nghiệm.

Tiến sĩ Rosenblatt, nhà tâm lý học nghiên cứu tại Phòng thí nghiệm Hàng không Cornell, Buffalo, cho  biết Perceptron có thể được sử dụng như những máy móc thám hiểm không gian.

Hình 3.4: Frank Rosenblatt ở Cornell đang chìm sâu trong suy nghĩ. Ông đã phát minh ra perceptron, tiền thân của các mạng lưới học sâu, trong đó có một thuật toán học tập đơn giản để phân chia hình ảnh thành các loại khác nhau. Bài viết trên tờ New York Times, ngày 8 tháng 7 năm 1958, từ một bản báo cáo của UPI. Máy perceptron được dự kiến sẽ có giá 100.000 USD khi hoàn thành vào năm 1959, hoặc tương đương khoảng 1 triệu USD ngày nay; máy tính IBM 704 có giá 2 triệu USD vào năm 1958, hoặc tương đương 20 triệu USD ngày nay, có thể thực hiện 12.000 phép nhân/giây, nhanh hơn rất nhiều vào thời điểm đó. Nhưng điện thoại Samsung Galaxy S6 rẻ hơn nhiều – mà vẫn có thể thực hiện 34 tỷ phép tính/giây, nhanh hơn 1 triệu lần.

(còn tiếp) 

TH: T.Giang – CSCI

Nguồn tham khảo: Terrence J. Sejnowski – Cuộc cách mạng học sâu – NXB CT 2019.

Sự tái sinh của trí tuệ nhân tạo – Phần cuối


Gerald Sussman – người đã tạo ra một số ứng dụng quan trọng của AI cho các vấn đề thực tế, trong đó có một hệ thống tích hợp với độ chính xác cao cho cơ học quỹ đạo – đã bảo vệ danh dự cho phương pháp tiếp cận trí tuệ nhân tạo của MIT bằng cách viện dẫn công trình kinh điển của Alan Turing, người đã chứng minh rằng máy Turing, một thử nghiệm tư duy, có thể tính toán bất kỳ hàm tính được nào. “Và sẽ mất bao lâu?” Tôi hỏi. “Bạn phải tính toán thật nhanh nếu không muốn bị đánh bại”, tôi nói thêm, sau đó bước ngang qua phòng để rót một tách cà phê. Và cuộc đối thoại của tôi với các giảng viên kết thúc.

“Có gì sai ở đây?” là một câu hỏi mà mọi sinh viên trong phòng thí nghiệm của tôi đều có thể trả lời. Nhưng các khán giả đang ăn trưa ở hai nhóm đầu tiên đã bị bối rối. Cuối cùng, một sinh viên ở nhóm thứ ba đưa ra câu trả lời như sau: “Máy tính kỹ thuật số là một thiết bị đa năng, có thể được lập trình để tính toán bất cứ thứ gì, mặc dù không hiệu quả, nhưng con ruồi là một máy tính có mục đích đặc biệt, nó có thể nhìn thấy và bay được nhưng không thể cân đối tập chi phiếu của tôi”. Đây là câu trả lời chính xác. Mạng lưới thị giác ở mắt ruồi đã phát triển qua hàng trăm triệu năm, và các thuật toán thị giác của nó được tích hợp vào chính mạng lưới đó. Đây là lý do tại sao bạn có thể đảo ngược quá trình thị giác bằng cách làm việc trên các sơ đồ lắp ghép và các luồng thông tin truyền qua các mạch thần kinh của mắt ruồi, và tại sao bạn không thể là điều đó cho một máy tính kỹ thuật số, khi chính bản thân phần cứng cần phải có phần mềm để xác định vấn đề nào đang được giải quyết.

Tôi đã nhận ra Rodney Brooks đang mỉm cười ở phía sau đám đông, đó là người mà tôi đã từng mời đến một hội thảo về thần kinh học tính toán ở Woods Hole thuộc Cape Cod, Massachusetts. Brooks đến từ Australia, và vào những năm 1980, ông là một giảng viên cơ sở tại phòng thí nghiệm AI của MIT, nơi ông đã tạo ra những con bọ robot có thể bước đi bằng cách sử dụng một kiến trúc không phụ thuộc vào logic kỹ thuật số. Cuối cùng, ông trở thành giám đốc phòng thí nghiệm và sau đó thành lập iRobot, công ty sản xuất robot hút bụi Roombas.

Căn phòng nơi tôi thuyết trình vào buổi chiều hôm đó rất lớn và được lấp đầy bởi đội ngũ sinh viên đại học, một thế hệ tiếp theo sẽ hướng tới tương lai thay vì quá khứ. Tôi nói về một mạng nơ-ron đã học được cách chơi cờ tào cáo, một dự án được thực hiện bởi tôi và Gerald Tesauro, nhà vật lý tại Trung tâm Nghiên cứu Hệ thống Phức hợp (The Center for Complex Systems Research) thuộc Đại học Illinois tại Urbana-Champaign. Cờ tào cáo là một cuộc đua đến kết thúc giữa hai người chơi, với các quân cờ di chuyển về phía trước theo số xúc xắc, vượt qua quân cờ của đối thủ. Không giống như cờ vua, một trò chơi đòi hỏi sự quyết đoán, cờ tào cáo được chi phối bởi cơ hội: vì không ai biết trước được kết quả của mỗi lần tung xúc xắc nên việc dự đoán đường đi nước bước của quân cờ trở nên càng khó khăn hơn. Nó là một trò chơi rất phổ biến ở Trung Đông, nơi có một số người kiếm sống bằng cách đánh cược lớn khi chơi.

Thay vì viết một chương trình máy tính dựa trên logic và suy nghiệm để xử lý tất cả các vị trí có thể trên ván cờ, một nhiệm vụ bất khả thi khi có tới 1020 vị trí khả thi trên ván cờ, chúng tôi đã cho mạng nơ-ron học cách chơi thông qua nhận dạng mẫu bằng cách quan sát một giáo viên chơi. Gerry tiếp tục tạo ra chương trình cờ tào cáo đầu tiên chơi ở cấp độ vô địch thế giới bằng cách  thiết lập mạng cờ tào cáo tự chơi với chính nó.

Sau khi trình bày xong, tôi được biết tin có một bài viết trên trang nhất tờ New York Times sáng hôm đó nói về việc các cơ quan chính phủ đang cắt giảm tài trợ cho trí tuệ nhân tạo như thế nào. Mặc dù đây là khởi đầu của một mùa đông cho nghiên cứu trí tuệ nhân tạo với các nhà nghiên cứu chính thống, nhưng nó đã không ảnh hưởng đến tôi hay cả nhóm tôi. Với chúng tôi thì mùa xuân cho các nghiên cứu mạng nơ-ron chỉ vừa mới bắt đầu.

Nhưng phương pháp tiếp cận trí tuệ nhân tạo mới của chúng tôi sẽ mất đến 25 năm để đưa ra các ứng dụng thực tế trong các lĩnh vực thị giác, lời nói và ngôn ngữ. Thậm chí vào năm 1989, lẽ ra tôi phải biết rằng chúng tôi sẽ mất rất nhiều thời gian. Vào năm 1978, khi còn là học viên cao học tại Princeton, tôi đã ngoại suy luật Moore về sự gia tăng theo cấp số nhân của năng lực tính toán, tăng gấp đôi cứ sau mỗi 18 tháng, xem sẽ mất bao lâu để đạt đến mức độ năng lực tính toán của bộ não và tôi đã kết luận rằng nó sẽ xảy ra vào năm 2015. May mắn thay, điều đó đã không ngăn cản tôi tiến về phía trước. Niềm tin của tôi vào mạng nơ-ron dựa trên trực giác mách bảo tôi rằng nếu thiên nhiên đã giải quyết được những vấn đề này thì chúng ta cũng có thể học hỏi từ thiên nhiên cách giải quyết chúng. Thậm chí, thời gian 25 mà tôi phải chờ đợi cũng không bằng một cái chớp mắt khi so với hàng triệu năm tiến hóa của thiên nhiên.

Bên trong vỏ não thị giác, các nơ-ron được sắp xếp theo thứ bậc các lớp. Khi thông tin từ các giác quan được biến đổi từ lớp vỏ não này tới lớp vỏ não khác, sự mô tả của thế giới ngày càng trở nên trừu tượng hơn. Qua nhiều thập kỷ, khi số lớp trong các mô hình mạng nơ-ron tăng lên, hiệu suất của chúng tiếp tục được cải thiện cho tới khi đạt đến một ngưỡng quan trọng cho phép chúng ta giải quyết các vấn đề mà vào những năm 1980 chúng ta chỉ có thể mơ đến. Kỹ thuật học sâu cho phép tự động hóa quá trình tìm kiếm những đặc trưng cơ bản để phân biệt các vật thể khác nhau trong một hình ảnh, và đó lý do tại sao thị giác máy tính ngày nay tốt hơn nhiều so với 5 năm trước đây.

Vào năm 2016, máy tính đã hoạt động nhanh hơn một triệu lần và bộ nhớ máy tính đã tăng lên hàng tỷ lần, từ megabyte lên terabyte. Nó có thể mô phỏng các mạng nơ-ron với hàng triệu đơn vị và hàng tỷ kết nối thần kinh, so với các mạng trong những năm 1980 chỉ có hàng trăm đơn vị và hàng ngàn liên kết. Mặc dù vẫn còn nhỏ bé so với các tiêu chuẩn của bộ não người với hàng trăm tỷ nơ-rơn thần kinh và một triệu tỷ kết nối khớp thần kinh nhưng các mạng ngày nay đã đủ lớn để có thể ứng dụng các lĩnh vực hẹp.

Học sâu trong các mạng nơ-ron sâu đã bắt đầu phát triển. Nhưng trước khi có các mạng sâu, chúng ta phải học cách huấn luyện các mạng nông.

TH: T.Giang – CSCI

Nguồn tham khảo: Terrence J. Sejnowski – Cuộc cách mạng học sâu – NXB CT 2019.

Sự tái sinh của trí tuệ nhân tạo – Phần II


Các hệ chuyên gia

Phổ biến trong những năm 1970 và 1980, các hệ chuyên gia AI đã được phát triển để giải quyết những vấn đề như chẩn đoán y học bằng cách sử dụng một bộ quy tắc. Vì vậy, hệ chuyên gia đầu tiên, có tên là MYCIN, được phát triển để xác định các vi khuẩn gây ra những bệnh truyền nhiễm như viêm màng não. Thoe cách tiếp cận hệ chuyên gia, đầu tiên, các nhà phát triển của MYCIN đã thu thập dữ liệu và quy tắc từ các chuyên gia về bệnh truyền nhiễm, cũng như những triệu chứng và bệnh án từ bệnh nhân, sau đó nhập chúng vào máy tính của hệ thống, và cuối cùng là lập trình máy tính bằng logic để suy luận. Tuy nhiên, đội ngũ phát triển đã gặp khó khăn trong việc thu thập dữ liệu và quy tắc từ các chuyên gia, đặc biệt là trong những lĩnh vực phức tạp hơn, nơi các nhà chẩn đoán tốt nhất không phụ thuộc vào quy tắc mà tiến hành nhận dạng mẫu dựa trên kinh nghiệm, thứ rất khó để mã hóa, và hệ thống phải được cập nhật liên tục khi dữ liệu mới được phát triển và quy tắc cũ đã trở nên lỗi thời. Và họ phải đối mặt với nhiều khó khăn hơn trong việc thu thập và nhập thông tin về các triệu chứng và bệnh án của bệnh nhân vào máy tính của hệ thống, một quá trình có thể mất nửa giờ hoặc lâu hơn cho mỗi bệnh nhân, đây là khoảng thời gian mà một bác sĩ bận rộn không thể đáp ứng được. Không ngạc nhiên khi MYCIN chưa bao giờ được sử dụng để chữa bệnh. Mặc dù nhiều hệ chuyên gia đã được viết cho các ứng dụng khác như quản lý tràn chất độc, lập kế hoạch nhiệm vụ cho các phương tiện tự vận hành và nhận dạng giọng nói, nhưng hiện nay rất ít trong số chúng được sử dụng.

Các nhà nghiên cứu đã thử nghiệm nhiều cách tiếp cận khác nhau trong những thập niên đầu của trí tuệ nhân tạo, nhưng những cách tiếp cận của họ không ứng dụng được vào thực tế. Họ không chỉ đánh giá thấp sự phức tạp của các vấn đề trong thế giới thực, mà còn đề xuất những giải pháp có quy mô khá tệ. Trong những lĩnh vực phức tạp, số lượng quy tắc có thể rất lớn, và khi dữ liệu mới được thêm vào bằng tay, việc theo dõi ngoại lệ và sự tương tác với các quy tắc khác trở nên không thực tế. Ví dụ, Douglas Lenat đã bắt đầu một dự án có tên “CYC” vào năm 1984 để mã hóa các giác quan cơ bản, nó dường như là một ý tưởng tốt vào thời điểm đó nhưng hóa ra lại là một cơn ác một trong thực tế. Chúng ta mặc định vô số sự thật về cách thức hoạt động của thế giới và phần lớn trong số đó đều dựa trên kinh nghiệm. Ví dụ, một con mèo rơi từ độ cao 12 mét có thể sẽ không bị nguy hiểm gì, nhưng vấn đề hoàn toàn khác khi một con người rơi xuống từ cùng độ cao đó.

Một lý do khác khiến cho sự phát triển của AI ban đầu quá chậm chạp chính là các máy tính kỹ thuật số cực kỳ thô sơ và bộ nhớ quá đắt đỏ so với các tiêu chuẩn ngày nay. Nhưng vì máy tính kỹ thuật số có hiệu quả cao trong các hoạt động logic, thao tác biểu tượng và áp dụng các quy tắc nên việc các nguyên hàm tính toán này sẽ được ưu tiên trong thế kỷ 20 không có gì đáng ngạc nhiên. Do đó, Allen Newell và Herbert Simon, hai nhà khoa học máy tính của Đại học Carnegie Mellon, có thể viết ra được một chương trình máy tính có tên là “Nhà lý luận loigc” (Logic Theorist) vào năm 1955. Nó có thể chứng minh các định lý logic trong cuốn Principia Mathematica (Các nguyên lý toán học) trong đó hệ thống hóa tất cả các lĩnh vực toán học do Alfred North Whitehead và Bertrand Russell viết. Trong thời kỳ đầu này, họ đã rất kỳ vọng vào việc máy tính thông minh chắc chắn sắp xuất hiện.

Những người tiên phong trong lĩnh vực trí tuệ nhân tạo đã cố gắng viết các chương trình máy tính với chức năng như trí thông minh của con người, nhưng lại không quan tâm đến cách thức bộ não đã thực sự đạt được hành vi thông minh. Khi tôi hỏi Allen Newell lý do tại sao, ông nói rằng cá nhân ông đã có được những hiểu biết sâu sắc từ các nghiên cứu về não bộ, nhưng đơn giản là vào thời điểm đó chưa có nhiều kiến thức hữu dụng. Các nguyên tắc cơ bản về chức năng của não bộ chỉ vừa mới xuất hiện vào những năm 1950. Tiêu biểu như công trình của Alan Hodgkin và Andrew Huxley, họ đã giải thích cách các tín hiệu từ não bộ được truyền đi trong một khoảng cách xa bởi sự tăng vọt – hoặc không có sự tăng vọt của điện áp trong các dây thần kinh. Một công trình tiêu biểu khác là của Bernard Katz, người đã khám phá ra manh mối về cách các tín hiệu điện được chuyển đổi thành tín hiệu hóa học ở các khớp thần kinh để giúp các nơ-ron giao tiếp với nhau.

Đến thập niên 1980, mặc dù có thêm nhiều kiến thức về não bộ và những hiểu biết này có thể được tiếp cận rộng rãi ngoài lĩnh vực sinh học, thế hệ các nhà nghiên cứu trí tuệ nhân tạo mới lại không mấy quan tâm đến não bộ, vì mục tiêu của họ là viết một chương trình tương đương với chức năng hoạt động của não bộ. Trong triết học, quan điểm này được gọi là thuyết chức năng mà với nhiều người đó là một cái có tốt để bỏ qua các chi tiết lộn xộn trong sinh học. Nhưng một nhóm nhỏ các nhà nghiên cứu AI, những người không theo xu hướng chủ đạo, tin rằng có một phương pháp tiếp cận trí tuệ nhân tạo khác được lấy cảm hứng từ nguyên lý sinh học thực tế của não bộ và được gọi với các tên khác nhau như là “mạng nơ-ron”, “chủ nghĩa kết nối” và “xử lý phân tán song song”. Phương pháp này cuối cùng cũng đã có thể giải quyết các vấn đề khó khăn mà AI dựa trên logic không thể vượt qua.

Tôi cũng là một người trong số đó.

Đang đi vào nơi nguy hiểm

Năm 1989, Michael Dertouzos, trưởng phòng thí nghiệm khao học máy tính của MIT, đã mời tôi đến thuyết trình tại MIT về sự tiên phong trong phương pháp tiếp cận AI dựa trên mạng nơ-ron của tôi (Hình 2.4). Khi đến nơi, tôi được Dertouzos chào đón nồng nhiệt, trong lúc chúng tôi cùng nhau đi lên thang máy, ông ấy nói với tôi rằng truyền thống của MIT là cho giảng viên khách mời 5 phút để mở một cuộc thảo luận với giảng viên và sinh về chủ đề của mình trong bữa ăn trưa. “Và họ ghét những gì anh làm”, ông nói thêm khi cánh cửa thang máy mở ra.Căn phòng chật cứng với 100 người khiến cả Dertouzos cũng ngạc nhiên. Ở đó, các nhà khoa học đã đứng thành ba nhóm: nhóm đầu tiên là giảng viên cao cấp, nhóm thứ hai là giảng viên cơ sở và sinh viên ở nhóm ngoài cùng. Và tôi tiến đến giữa căn phòng trước một bữa tiệc đứng với các món ăn trưa. Tôi có thể nói gì trong 5 phút để tạo ra sự khác biệt với những khán giả vốn dĩ đã ghét công việc tôi đang làm đây?

Tôi đã ứng ngay rằng: “Con ruồi đậu trên món ăn đó có một bộ não chỉ chứa  100.000 tế bào thần kinh; nó nặng một miligram và tiêu thụ một miliwatt năng lượng”, tôi nhanh chóng thêm vào. “Con ruồi có thể nhìn thấy, nó có thể bay, có thể định vị và có thể tìm thấy thức ăn. Nhưng điều thực sự đáng chú ý là nó có thể sinh sản. MIT sở hữu một siêu máy tính có trị giá 100 triệu USD: nó tiêu thụ một megawatt năng lượng và được làm mát bằng bộ máy điều hòa khổng lồ. Nhưng cái giá lớn nhất của siêu máy tính là sự hy sinh của con người cụ thể là các nhà lập trình để giải quyết mọi đòi hỏi của chương trình. Siêu máy tính đó không thể nhìn, không thể bay, và mặc dù nó chia sẻ với các máy tính khác nhưng không thể giao phối hay sinh sản được. Vậy có gì sai ở đây?

Sau một hồi im lặng, một giảng viên cao cấp nói: “Bởi vì chúng ta chưa viết chương trình thị giác”. (Bộ Quốc phòng gần đây đã đầu tư 600 triệu USD cho Sáng kiến Điện toán Chiến lược (Strategic Computing Initative) của họ, một chương trình chạy từ 1983 đến 1993 nhưng đã không thành công trong việc xây dựng hệ thống thị giác để dẫn đường cho xe tăng tự lái). Và tôi đã đáp lại: “Chúc may mắn với điều đó”.

(còn tiếp) 

TH: T.Giang – CSCI

Nguồn tham khảo: Terrence J. Sejnowski – Cuộc cách mạng học sâu – NXB CT 2019.

Sự tái sinh của trí tuệ nhân tạo – Phần I


Marvin Minsky là một nhà toán học xuất sắc và là người sáng lập phòng thí nghiệm trí tuệ nhân tạo của Viện Công nghệ Massachusetts (MIT AI Lab). Các nhà sáng lập đã đặt ra định hướng và văn hóa cho lĩnh vực này, nhờ sự góp sức không nhỏ của Minsky mà trí tuệ nhân tạo tại MIT vào những năm 1960 đã trở thành một pháo đài của trí thông minh. Với nhiệt huyết cùng ý tưởng phong phú hơn  bất kỳ ai khác mà tôi biết, ông có thể thuyết phục được bạn rằng vấn đề ông đang làm là đúng, ngay cả khi chúng rất khác với lẽ thường. Tôi ngưỡng mộ tính cách táo bạo cũng như sự thông minh của ông – nhưng không hẳn là đồng ý với hướng đi của ông trong lĩnh vực trí tuệ nhân tạo.

Trò chơi dành cho trẻ con ư?

Blocks World là ví dụ điển hình về một dự án xuất phát từ phòng thí nghiệm MIT trong những năm 1960. Để đơn giản hóa vấn đề thị giác, Blocks World đã gộp các khối hình chữ nhật có thể được xếp chồng lên nhau nhằm tạo ra một cấu trúc (Hình 2.1). Mục tiêu là viết một chương trình có thể diễn giải một lệnh, chẳng hạn như “Tìm một khối màu vàng lớn và đặt nó lên trên một khối màu đỏ”, và lập kế hoạch các bước cần thiết để cánh tay robot thực hiện lệnh đó. Điều này có vẻ như một trò trẻ con, nhưng họ đã phải viết một chương trình lớn, phức tạp, cồng kềnh đến nỗi không thể dễ dàng dò tìm lỗi và cuối cùng đã bị loại bỏ hoàn toàn khi cậu sinh viên viết chương trình này, Terry Winograd, rời khỏi MIT. Vấn đề dường như đơn giản này lại vô cùng khó khăn, và ngay cả nếu thành công, không có con đường trực tiếp nào dẫn Blocks World đến thế giới thực, nơi các vật thể với nhiều hình dạng, kích thước và trọng lượng khác nhau và không phải tất cả các góc đều vuông. So với một phòng thí nghiệm được kiểm soát và phương hướng và mức độ ánh sáng có thể được cố định thì trong thế giới thực, ánh sáng có thể thay đổi đáng kể theo vị trí và thời gian. Điều này đã làm cho việc nhận diện các vật thể của máy tính trở nên phức tạp hơn nhiều.Hình 2.1

Trong những năm 1960, phòng thí nghiệm AI của MIT đã nhận được khoản trợ cấp lớn từ cơ quan nghiên cứu quân đội để tạo ra một robot có thể chơi bóng bàn. Tôi từng nghe kể rằng một nhà nghiên cứu độc lập đã quên không đề xuất chi phí cho việc xây dựng hệ thống thị giác cho con robot, do đó, ông đã giao lại công giệc này cho một sinh viên sau đại học như một dự án mùa hè. Tôi đã từng hỏi Marvin Minsky liệu câu chuyện này có đúng sự thật hay không. Ông đã lập tức đáp rằng tôi đã sai: “Chúng tôi đã giao lại dự án này cho các sinh viên chưa tốt nghiệp đại học”. Một tài liệu từ kho lưu trữ tại MIT cũng đã xác nhận lời nói của ông. Những gì trông như thể một vấn đề dễ giải quyết hóa ra lại là bãi cát lún, thứ đã nuốt chửng cả một thế hệ các nhà nghiên cứu trong lĩnh vực thị giác máy tính.

Tại sao thị giác là một vấn đề khó khăn

Chúng ta hiếm khi gặp khó khăn trong việc xác định các vật thể bất chấp khác biệt về vị trí, kích thước, hướng và ánh sáng của đối tượng. Một trong những ý tưởng đầu tiên trong lĩnh vực thị giác máy tính là khớp mẫu của vật thể với các pixel trong hình ảnh, nhưng cách tiếp cận đó không thành công do các pixel của hai hình ảnh của cùng một vật thể ở các hướng khác nhau không khớp nhau. Ví dụ, hãy quan sát hai con chim trong Hình 2.2. Nếu đảo hình ảnh của con này cho con kia, bạn có thể có một phần khớp, nhưng các phần còn lại thì không; tuy nhiên, hình ảnh của một loài chim khác trong tư thế tươgn tự lại khá khớp.Hình 2.2

Sự phát triển trong lĩnh vực thị giác máy tính đạt được không phải bằng việc tập trung vào pixel mà nhờ tập trung vào các đặc trưng. Ví dụ, các nhà quan sát nhận dạng chim phải trở thành chuyên gia phân biệt giữa các loài khác nhau du chúng có thể chỉ khác nhau ở một vài dấu hiệu khó nhận biết. Một cuốn sách thực tiễn và phổ biến về nhận dạng các loài chim trong đó chỉ có một bức ảnh của một con chim, nhưng có rất nhiều bản vẽ sơ đồ chỉ ra sự khác biệt tinh tế giữa chúng (Hình 2.3). Một đặc điểm nhận dạng tốt là đặc điểm mà chỉ duy nhất một loài chim có, nhưng vì rất nhiều loài có nhiều đặc điểm giống nhau nên những đặc điểm để giúp phân biệt giữa các loài chim với nhau thường là một tập hợp các dấu hiệu độc đáo như sọc mắt, cách xếp đặt lông cánh và những mảng màu khác biệt trên đôi cánh. Trong trường hợp các đặc điểm này đều có ở những loài có liên quan chặt chẽ thì tiếng kêu và tiếng hót sẽ được sử dụng để phân biệt giữa loài này với loài khác. Những bản vẽ hoặc bức tranh về các loài chim hướng sự chú ý của chúng ta đến các đặc điểm phân biệt có liên quan sẽ hiệu quả hơn nhiều so với những bức ảnh chứa hàng trăm đặc điểm ít liên quan hơn (Hình 2.3).Hình 2.3

Vấn đề với cách tiếp cận dựa trên các đặc trưng này không chỉ cần rất nhiều nhân lực để phát triển những thiết bị dò tìm cho hàng trăm nghìn vật thể khác nhau trên thế giới, mà ngay cả đối với các thiết bị dò tìm đặc trưng tốt nhất, sự không rõ ràng phát sinh từ hỉnh ảnh của các vật thể bị che khuất một phần cũng làm cho việc nhận diện vật thể trong những bối cảnh lộn xộn trở thành một nhiệm vụ khó khăn đối với máy tính.

Vào những năm 1960, dường như không có ai nghĩ rằng để thị giác máy tính đạt được hiệu suất ngang với con người, chúng ta sẽ phải mất 50 năm và tăng gấp hàng triệu lần sức mạnh máy tính. Nhận định sai lầm rằng việc viết một chương trình thị giác máy tính thực ra chẳng khó khăn gì xuất phát từ những hành động mà chúng ta dễ dàng thực hiện, chẳng hạn như nhìn, nghe và di chuyển vòng quanh – nhưng con người đã mất hàng triệu năm tiến hóa để làm đúng những việc này. Và rồi những người tiên phong về trí tuệ nhân tạo đã rất thất vọng khi nhận thấy vấn đề thị giác máy tính vô cùng khó giải quyết. Ngược lại, họ thấy dễ dàng hơn khi lập trình máy tính để chứng minh các định lý toán học – một quá trình được cho là yêu cầu trí thông minh cao nhất – vì máy tính hóa ra có logic tốt hơn nhiều so với chúng ta. Khả năng tư duy logic là một sự phát triển muộn trong quá trình tiến hóa và ngay cả ở con người, nó cũng đòi hỏi sự huấn luyện để tuân theo một chuỗi dài các mệnh lệnh để logic nhằm cho ra một kết luận chính xác. Trong khi đó, đối với hầu hết các vấn đề con người cần giải quyết để tồn tại, sự khái quát từ những kinh nghiệm trước đây gần như lúc nào cũng giúp ích cho chúng ta.

(còn tiếp) 

TH: T.Giang – CSCI

Nguồn tham khảo: Terrence J. Sejnowski – Cuộc cách mạng học sâu – NXB CT 2019.

Sự phát triển của học máy – Phần cuối


Sự luân chuyển việc làm không có gì là mới mẻ. Những người nông dân ở thế kỷ 19 bị máy móc thay thế, và các công việc mới được tạo ra bởi máy móc, tất cả đều đòi hỏi một hệ thống giáo dục để đào tạo những kỹ năng mới cho công nhân. Sự khác biệt là hiện nay các công việc mới được tạo ra bởi trí tuệ nhân tạo sẽ yêu cầu những kỹ năng mới, khác nhau và luôn thay đổi bên cạnh các kỹ năng nhận thức truyền thống. Cho nên, chúng ta cần phải học suốt đời. Để làm được điều này, chúng ta sẽ cần một hệ thống giáo dục mới với nền tảng tại nhà hơn là ở trường.

May mắn thay, khi nhu cầu tìm việc làm mới đã trở nên cấp thiết, Internet cũng có sẵn các khóa học trực tuyến đại chúng mở (MOOC) miễn phí, cung cấp những kiến thức và kỹ năng mới. Mặc dù vẫn còn ở giai đoạn đầu nhưng hệ sinh thái giáo dục của MOOC đang phát triển nhanh chóng và hứa hẹn sẽ cung cấp hướng dẫn chất lượng cho nhiều người hơn bao giờ hết. Khi kết hợp với thế hệ tiếp theo của các trợ lý kỹ thuật số, MOOC có thể được chuyển đổi. Barbara Oakley và tôi đã phát triển khóa học MOOC phổ biến có tên là “Học cách học” (Learning How to Learn), dạy bạn cách để trở thành người học giỏi hơn (hình 1.11) và khóa học MOOC tiếp theo là “Thay đổi cách tư duy” (Mindshift), dạy bạn cách tái tạo lại bản thân và thay đổi cách sống.Khi tương tác với Internet, bạn đang tạo ra một lượng dữ liệu lớn mà máy có thể đọc được về bản thân bạn. Bạn đang là mục tiêu của các quảng cáo được tạo từ những mẩu thông tin kỹ thuật số bạn để lại trên Internet. Thông tin bạn tiết lộ trên Facebook và các trang mạng xã hội khác có thể được sử dụng để tạo ra một trợ lý kỹ thuật số, nó biết về bạn rõ hơn những người khác trên thế giới và sẽ không bao giờ quên bất cứ điều gì, hậu quả là nó sẽ trở thành bản sao ảo của bạn. Bằng cách đưa cả việc theo dõi Internet và học sâu vào dịch vụ, cơ hội giáo dục cho thế hệ con cháu chúng ta sẽ tốt hơn những thứ tốt nhất mà các gia đình giàu có đang sở hữu. Những đứa trẻ này sẽ có riêng cho mình một gia sư kỹ thuật số, người sẽ đồng hành với chúng trong suốt hành trình học tập. Giáo dục không chỉ mang tính cá nhân hóa nhiều hơn mà còn chính xác hơn. Đã có một loạt những thí nghiệm giáo dục đang được tiến hành trên toàn thế giới tại các chương trình như Khan Academy và được Gates, Chan-Zuckerberg và các quỹ thiện nguyện khác tài trợ đang thử nghiệm phần mềm để giúp mọi trẻ em có thể phát triển theo nhịp độ riêng của mình trong suốt quá trình giáo dục chính quy và thích ứng với nhu cầu cụ thể của từng trẻ. Sự sẵn có phổ biến của đội ngũ gia sư kỹ thuật số sẽ giải phóng giáo viên khỏi những phần lặp lại trong công việc giảng dạy, như chấm điểm, và cho phép họ thực hiện những gì con người làm tốt nhất – hỗ trợ cảm xúc cho những học sinh gặp khó khăn và kích thích trí tuệ cho những em có năng khiếu. Công nghệ giáo dục – hay còn gọi là edtech – đang phát triển nhanh chóng và quá trình chuyển đổi sang nền giáo dục chính xác có thể khá nhanh so với xe tự lái vì nó phải vượt qua ít khó khăn hơn, có nhu cầu cao hơn và giáo dục ở Mỹ là một thị trường hàng ngàn tỷ USD. Vấn đề lớn ở đây sẽ là ai có quyền truy cập vào những tập tin nội bộ của các trợ lý và gia sư kỹ thuật số.

Trí tuệ nhân tạo có phải là một mối đe dọa sinh tồn không?

Khi AlphaGo chiến thắng thuyết phục trước Lee Sedol tại giải cờ vây vào năm 2016, nó đã khơi dậy một phản ứng được hình thành từ nhiều năm qua liên quan đến mối lo ngại rằng trí tuệ nhân tạo có thể thay thế con người. Các nhà khoa học máy tính đã ký cam kết không sử dụng trí tuệ nhân tạo cho mục đích quân sự. Stephen Hawking và Bill Gates đã đưa ra những lời cảnh báo công khai về mối đe dọa sinh tồn gây ra bởi AI. Elon Musk và các doanh nhân khác ở Thung lũng Silicon thành lập một công ty mới có tên là OpenAI, với 1 tỷ USD tiền vốn và tuyển dụng Ilya Sutskever, từng là học trò của Geoffrey Hinton, làm giám đốc đầu tiên của công ty. Mặc dù mục tiêu đề ra của OpenAI là đảm bảo những khám phá AI trong tương lai sẽ được công khai cho tất cả mọi người sử dụng nhưng nó có một mục tiêu khác ẩn ý và quan trọng hơn – ngăn chặn các công ty tư nhân làm chuyện xấu. Vì vậy, chiến thắng của AlphaGo trước nhà vô địch cờ vây thế giới Sedol đã đẩy AI tới một điểm bùng phát. Gần như qua một đêm, AI đã chuyển mình từ bị đánh giá là một thất bại đến việc được nhìn nhận như là một mối đe dọa sinh tồn.

Đây không phải là lần đầu tiên một công ty công nghệ mới nổi dường như sẽ trở thành một mối đe dọa sinh tồn. Sự phát minh, phát triển và dự trữ vũ khí hạt nhân đã đe dọa thổi bay cả thế giới, nhưng bằng một cách nào đó, chúng ta đã kiểm soát và ngăn chặn điều đó xảy ra, ít nhất là cho đến ngày hôm nay. Khi công nghệ tái tổ hợp DNA lần đầu xuất hiện, có lo ngại rằng các sinh vật biến đổi gen nguy hiểm chết người sẽ gây ra sự đau khổ và chết chóc chưa từng có trên toàn cầu. Ngày nay, kỹ thuật di truyền là một công nghệ phát triển, và cho đến nay chúng ta đã kiểm soát được để tồn tại. Những tiến bộ gần đây của học máy đã đặt ra một mối đe dọa tương đối khiêm tốn so với vũ khí hạt nhân và các sinh vật chết chóc. Chúng ta cũng sẽ thích ứng với trí tuệ nhân tạo, và trên thực tế, điều này đã và đang xảy ra.

Một trong những hệ lụy của thành công mà DeepStack đạt được là một mạng học sâu có thể học cách trở thành kẻ nói dối đẳng cấp thế giới. Những gì mạng học sâu có thể được huấn luyện để làm chỉ giới hạn bởi trí tưởng tượng và dữ liệu của người huấn luyện. Nếu các mạng học sâu có thể được huấn luyện để lái xe an toàn, nó cũng có thể được huấn luyện để đua xe Công thức 1, và ai đó sẽ rất sẵn lòng mua nó. Ngày nay, để phát triển sản phẩm và dịch vụ sử dụng học sâu chúng ta vẫn cần những học viên được đào tạo chuyên sâu và có kỹ năng cao, nhưng khi chi phí điện toán tiếp tục giảm mạnh và phần mềm trở nên tự động, những học sinh trung học sẽ sớm có thể tạo ra các ứng dụng AI. Otto, công ty thương mại điện tử trực tuyến có thu nhập cao nhất ở Đức về quần áo, nội thất và thể thao, đang sử dụng học sâu để dự đoán trước thời gian và sản phẩm khách hàng có thể đặt dựa trên lịch sử đặt hàng và sau đó đặt hàng trước cho họ. Với độ chính xác lên đến 90%, khách hàng nhận được hàng gần như trước khi họ đăt. Được hoàn thành một cách tự động mà không cần đến sự can thiệp của con người, đặt hàng trước không chỉ tiết kiệm nhiều triệu euro mỗi năm cho công ty trong việc giảm hàng tồn kho và tỷ lệ gửi trả sản phẩm mà còn mang đến cho khách hàng sự hài lòng và giữ được chân họ. Thay vì thay thế các công nhân của Otto, học sâu đã thúc đẩy năng suất của họ. AI có thể giúp bạn đạt được năng suất cao hơn trong công việc.

Mặc dù các công ty công nghệ cao quy mô lớn đã đi tiên phong trong những ứng dụng học sâu, nhưng các công cụ học máy cũng đang có sẵn, phổ biến và nhiều công ty khác cũng đang bắt đầu được hưởng lợi. Alexa, một trợ lý kỹ thuật số cực kỳ phổ biến kết hợp với loa thông minh Amazon Echo, thực hiện các yêu cầu bằng ngôn ngữ tự nhiên dựa trên học sâu. Amazon Web Services (AWS) đã giới thiệu Toolbox có tên là “Lex”, “Poly” và “Comprehend”, giúp dễ dàng phát triển các giao diện ngôn ngữ tự nhiên giống nhau dựa trên việc chuyển tự động văn bản sang giọng nói, nhận dạng giọng nói và hiểu ngôn ngữ tự nhiên tương ứng. Các ứng dụng có tương tác đàm thoại hiện nằm trong tầm với của những doanh nghiệp nhỏ hơn vốn không đủ khả năng thuê chuyên gia học máy. AI có thể làm tăng sự hài lòng của khách hàng.

Việc các chương trình máy tính chơi cờ vua lấn át những kỳ thủ giỏi nhất có thể khiến mọi người ngừng chơi cờ vua hay không. Ngược lại, nó đã tăng cấp độ chơi của họ. Và nó cũng dân chủ hóa môn cờ vua. Trước kia, những người chơi cờ vua xuất sắc nhất đến từ các thành phố lớn như Moscow và New York, nơi tập trung các bậc thầy có thể dạy cho học trò trẻ tuổi và nâng cao cấp độ chơi của họ. Chương trình máy tính chơi cờ giúp cho Magnus Carlson, lớn lên trong một thị trấn nhỏ ở Na Uy, có khả năng trở thành bậc thầy chơi cờ ở tuổi 13, và hiện tại anh là nhà vô địch cờ vua thế giới. Tuy nhiên, lợi ích của trí tuệ nhân tạo không chỉ ảnh hưởng tới các trò chơi mà còn tới mỗi khía cạnh cần sự cố gắng của con người, từ nghệ thuật cho đến khoa học. AI có thể làm bạn thông minh hơn.

Trở lại tương lai

Cuộc cách mạng học sâu có hai chủ đề gắn kết với nhau: trí tuệ con người đã tiến hóa như thế nào và trí tuệ nhân tạo đang tiến hóa ra sao. Sự khác biệt lớn nhất giữa hai loại trí tuệ là trí tuệ của con người mất hàng triệu năm để tiến hóa, nhưng AI đang phát triển trên một quỹ đạo tính bằng thập kỷ. Mặc dù đây là tốc độ chênh lệch ngay cả đối với sự phát triển văn hóa nhưng việc giữ thái độ quá thận trọng của chúng ta có thể không phải là phản ứng phù hợp.

Những đột phá gần đây trong học sâu không phải là những thành công ngày một ngày hai mà bạn có thể tập hợp được từ các bài báo. Ít ai biết đến câu chuyện đằng sau sự thay đổi từ trí tuệ nhân tạo dựa trên những dữ liệu lớn và các thuật toán học. Cuộc cách ạmng học sâu kể về câu chuyện đó cũng như khám phá ra nguồn gốc và hậu quả của học sâu từ quan điểm của tôi, với tư cách là một người tiên phong phát triển thuật toán cho mạng neuron nhân tạo vào những năm 1980, và với vai trò là chủ tịch của Quỹ tài trợ Hệ thống Xử lý Thông tin Thần kinh (NIPS), đã giám sát những khám phá trong học máy và học sâu hơn 30 năm qua. Tôi và các đồng nghiệp trong cộng đồng mạng neuron là những người bị thua thiệt trong nhiều năm, nhưng sự kiên nhẫn và bền bỉ của chúng tôi cuối cùng đã đem lại thành quả.

TH: T.Giang – CSCI

Nguồn tham khảo: Terrence J. Sejnowski – Cuộc cách mạng học sâu – NXB CT 2019.

Sự phát triển của học máy – Phần V


Sau ván đấu đầu tiên, khi thua một nửa điểm mỏng manh, Ke Jie nói rằng anh ấy đã “rất gần với chiến thắng ở giữa trận đấu” và anh vô cùng hào hứng: “Tôi có thể cảm nhận nhịp tim mình đang đập mạnh! Có lẽ vì tôi quá phấn khích nên đã có một nước cờ ngu ngốc. Có thể đó là phần yếu nhất của con người”. Những gì Ke Jie trải nghiệm là một tình trạng cảm xúc dâng cao, nhưng khả năng kiềm chế cảm xúc là cần thiết để có thể thể hiện tốt nhất. Thực ra, các diễn vân sân khấu biết rằng nếu họ không cảm thấy lo lắng trước màn trình diễn của mình, họ sẽ không có được màn trình diễn tốt. Màn trình diễn của họ đi theo chữ U ngược, với những gì tốt nhất ở một trạng thái tối ưu giữa mức độ kích thích thấp và cao. Các vận động viên gọi đây là “trạng thái phong độ nhất”.

Trong một phiên bản mới của “Ngoại giao bóng bàn” (Ping-pong dilomacy), do Chính phủ Trung Quốc tổ chức, AlphaGo cũng đã đánh bại một nhóm năm người chơi hàng đầu vào ngày 26 tháng 5 năm 2017. Những người chơi này đã phân tích các nước đi của AlphaGo và thay đổi chiến thuật của họ. Trung Quốc đang đầu tư lớn vào học máy, và mục tiêu chính của sáng kiến trí tuệ (brain initiative) là khai thác trí tuệ cho các thuật toán mới.

Chương tiếp theo trong câu chuyện cờ vây còn thậm chí đáng chú ý hơn, nếu có thể. AlphaGo đã được bắt đầu bằng việc học có giám sát từ 160.000 trận cờ vây của con người trước khi tự chơi. Một số người nghĩ đây là gian lận – một chương trình trí tuệ nhân tạo tự trị phải có khả năng học theo cách chơi cờ vây mà không có kiến thức của con người. Tháng 10 năm 2017, một phiên bản mới – AlphaGo Zero, được tiết lộ rằng nó đã học chơi cờ vây chỉ bằng các quy luật của trò chơi, và đã thắng đậm AlphaGo Master – phiên bản đánh bại Ke Jie, với tỷ số 100 – 0. Hơn nữa, AlphaGo Zero đã học nhanh gấp 100 lần và với công suất tính toán chỉ bằng 1/10 so với AlphaGo Master. Bằng cách bỏ qua hoàn toàn các kiến thức của con người, AlphaGo Zero đã trở thành siêu-siêu nhân. Sẽ không ai biết AlphaGo có thể trở nên tốt đến mức nào khi thuật toán máy học tiếp tục được cải thiện.

AlphaGo Zero đã bỏ qua lối chơi của con người, nhưng vẫn còn rất nhiều kiến thức về cờ vây được đưa vào các tính năng mà chương trình sử dụng để thể hiện bàn cờ. AlphaGo Zero vẫn có thể cải thiện mà không cần bất cứ kiến thức nào của con người. Giống như Coca-Cola Zero đã loại bỏ tất cả calorie từ Coca-Cola; tất cả các kiến thức nghiệp vụ của cờ vây đã bị xóa khỏi AlphaZero. Kết quả là, AlphaZero có thể học thậm chí còn nhanh hơn và đánh bại hoàn toàn AlphaGo Zero. Để chứng minh quan điểm rằng càng ít càng tốt, AlphaZero đã học cách chơi cờ vua ở cấp độ siêu phàm mà không thay đổi tham số học tập nào, sử dụng những nước đi khác biệt mà trước đó chưa có người nào làm được. AlphaZero đã không thua một ván nào trước Stockfish, một chương trình chơi cờ vua hàng đầu đang chơi với cấp độ siêu phàm. Trong một trận đấu, AlphaZero đã táo bạo hy sinh quân Tượng, nước cờ đôi khi được sử dụng để giành lợi thế vị trí, tiếp theo là hy sinh quân Hậu, có vẻ như một sai lầm khủng khiếp cho tới khi nó dẫn đến Chiếu hết nhiều nước sau đó mà cả Stockfish và con người đều không nghĩ đến. Người ngoài hành tinh đã hạ cánh và Trái đất sẽ không bao giờ trở lại như cũ nữa.

Công ty phát triển AlphaGo, DeepMind, được đồng sáng lập vào năm 2010 bởi nhà thần kinh học Demis Hassabis (Hình 1.10, trái), là một nghiên cứu sinh sau tiến sĩ tại Đơn vị thần kinh học tính toán Gatsby của Đại học London (do Peter Dayan là chủ nhiệm – một cựu nghiên cứu sinh sau tiến sĩ ở phòng thí nghiệm của tôi và là người chiến thắng giải Brain Prize năm 2017 cùng với Raymond Dolan và Wolfram Schulz cho nghiên cứu của họ về học với phần thưởng). DeepMind đã được Google mua lại với giá 600 triệu USD vào năm 2014. Công ty tuyển dụng hơn 400 kỹ sư và nhà thần kinh học trong một nền văn hóa pha trộn giữ giới học viện và giới khởi nghiệp. Sự phối hợp giữa khoa học thần kinh và trí tuệ nhân tạo đang vận hành sâu và tăng tốc.

Học cách để trở nên thông minh hơn

AlphaGo có thông minh hay không? Người ta viết về chủ đề trí thông minh và ý thức nhiều hơn bất kỳ chủ đề nào khác trong tâm lý học, cả hai đều khó xác định. Kể từ những năm 1930, các nhà tâm lý học đã phân biệt giữa trí thông minh mềm, sử dụng lý luận và nhận dạng mẫu trong các tình huống mới để giải quyết các vấn đề mới mà không phụ thuộc vào kiến thức trước đó, và trí thông minh cứng, phụ thuộc vào kiến thức trước đó và là những gì tiêu chuẩn của các bài kiểm tra IQ đo lường. Trí thông minh mềm đi theo quỹ đạo phát triển, đạt được đỉnh điểm ở giai đoạn đầu của tuổi trưởng thành và giảm dần theo tuổi tác, trong khi trí thông minh cứng tăng dần và tiệm cận khi bạn già đi cho tới tận cuối đời. AlphaGo thể hiện cả trí thông minh cứng lẫn mềm trong một phạm vi hẹp, nhưng trong phạm vi này, nó đã thể hiện sự sáng tạo đáng kinh ngạc. Chuyên môn nghiệp vụ cũng được dựa trên việc học trong phạm vi hẹp. Chúng ta là chuyên gia trong lĩnh vực ngôn ngữ và luyện tập nó hàng ngày.

Thuật toán học tăng cường được dùng bởi AlphaGo có thể áp dụng vào nhiều vấn đề. Hình thức học này chỉ phụ thuộc vào phần thưởng người thắng nhận được sau khi kết thúc chuỗi nước cờ, mà nghịch lý là có thể giảm thiểu được thời gian dành cho việc ra quyết định. Khi kết hợp với nhiều mạng học sâu, điều này dẫn đến nhiều trí thông minh chuyên sâu (phụ thuộc vào lĩnh vực). Và thực sự, những tình huống được tạo ra với các loại trí thông minh chuyên sâu, phụ thuộc vào các lĩnh vực khác nhau như: xã hội, cảm xúc, cơ học, xây dựng. “Nhân tố g” mà các bài kiểm tra trí thông minh đưa ra đo lường tương quan với những lĩnh vực khác nhau. Có nhiều lý do phải cẩn thận trong việc diễn giải các bài kiểm tra IQ. IQ trung bình toàn thế giới tăng lên ba điểm qua mỗi thập kỷ kể từ khi nó được nghiên cứu lần đầu vào những năm 1930, một xu hướng gọi là “hiệu ứng Flynn”. Có nhiều lời giải thích khả thi cho hiệu ứng Flynn, như dinh dưỡng tốt hơn, chăm sóc sức khỏe tốt hơn và những yếu tố môi trường khác. Điều này khá hợp lý vì môi trường ảnh hưởng đến việc điều chỉnh gen, từ đó làm ảnh hưởng đến kết nối não, dẫn đến những thay đổi về hành vi. Vì con người đang sống trong môi trường nhân tạo nên bộ não đang được nhào nặn theo cách mà tự nhiên không bao giờ hướng đến. Con người có thể trở nên thông minh hơn sau một khoảng thời gian dài không? Mất bao lâu để IQ tiếp tục tăng lên? Tỷ lệ người sử dụng máy tính chơi cờ vua, cờ tào cáo (backgammon), và giờ đây là cờ vây đang tăng lên nhanh chóng kể từ khi xuất hiện chương trình máy tính chơi ở cấp độ vô địch, và nó đã cải thiện trí thông minh của người chơi. Học sâu sẽ thúc đẩy trí thông minh không chỉ của các nhà điều tra khoa học mà còn của những người làm trong mọi ngành nghề.

Các công cụ khoa học đang tạo ra dữ liệu với tốc độ phi thường. Các va chạm hạt cơ bản tại Máy gia tốc hạt lớn (Large Hadron Collider – LHC) ở Geneva tạo ra 25 petabyte dữ liệu mỗi năm. Kính viễn vọng khổng lồ (Large Synoptic Sky Telescope – LSST) sẽ tạo ra 6 petabyte dữ liệu mỗi năm. Học máy đang được dùng để phân tích bộ dữ liệu thiên văn và vật lý khổng lồ vốn dĩ quá lớn để con người tìm kiếm bằng phương pháp truyền thống. Ví dụ DeepLensing là một mạng neuron nhân tạo phát hiện hình ảnh của các thiên hà xa xôi bị bóp méo vì ánh sáng bị bẻ cong qua “thấu kính hấp dẫn” đi xung quanh một thiên hà khác nằm trên tấm nhìn thẳng. Điều này thúc đẩy khả năng phát hiện tự động ra nhiều thiên hà xa xôi mới. Có nhiều vấn đề “mò kim đáy bể” khác về vật lý và thiên văn học mà học sâu phải mở rộng từ các phương pháp truyền thống để phân tích dữ liệu.

Sự dịch chuyển của thị trường việc làm

Máy ATM được các ngân hàng đưa vào sử dụng vào cuối những năm 1960 để cung cấp tiền mặt cho chủ tài khoảng 24/7, một tiện ích được những người cần tiền mặt trước hoặc sau giờ làm việc của ngân hàng rất chào đón, vì vậy nó phải có khả năng đọc được hóa đơn viết tay. Và mặc dù máy ATM làm giảm lượng công việc hàng ngày của các nhân viên ngân hàng, nhưng lại có nhiều nhân viên ngân hàng hơn trước để cung cấp cho khách hàng các dịch vụ cá nhân hóa như tư vấn về thế chấp và đầu tư cùng các công việc mới liên quan đến sửa chữa máy ATM – cũng giống như động cơ hơi nước thay thế lao động thủ công, nhưng mặt khác đã tạo ra việc làm mới cho những công nhân lành nghề có thể chế tạo và bảo trì động cơ hơi nước hay lái đầu máy xe lửa hơi nước. Cũng như vậy, hoạt động marketing online của Amazon đã khiến nhiều nhân viên tại các cửa hàng bán lẻ truyền thống ở địa phương mất việc nhưng cũng tạo ra 380.000 công việc mới trong lĩnh vực phân phối và chuyển phát hàng hóa mà Amazon và các công ty con của họ bán được. Và bởi hệ thống trí tuệ nhân tạo tự động đã có thể thay thế con người thực hiện những công việc vốn yêu cầu kỹ năng nhận thức của con người nên sẽ có nhiều công việc mới cho những người có thể tạo ra và bảo trì những hệ thống này.

(còn tiếp)

TH: T.Giang – CSCI

Nguồn tham khảo: Terrence J. Sejnowski – Cuộc cách mạng học sâu – NXB CT 2019.

Sự phát triển của học máy – Phần IV


Học luật

Học sâu chỉ mới bắt đầu ảnh hưởng đến ngành luật. Phần lớn công việc thường xuyên của các nhân viên trong những công ty luật có mức tính hàng trăm dollar/giờ sẽ được tự động hóa, đặc biệt là ở những văn phòng thương mại lớn, có giá trị cao. Cụ thể, việc tìm và đánh giá cần công công nghệ hỗ trợ sẽ được trí tuệ nhân tạo thực hiện, có thể xem xét không mệt mỏi hàng ngàn tài liệu chứng cứ pháp lý. Hệ thống học sâu tự động cũng giúp các công ty luật tuân theo những quy định ngày càng phức tạp của chính phủ. Chúng sẽ đưa ra những lời khuyên pháp lý có sẵn cho những người bình thường không có đủ điều kiện để tìm đến luật sư. Không chỉ giúp giảm chi phí mà còn tăng tốc độ giải quyết các công việc pháp lý, một yếu tố quan trọng hơn cả chi phí. Thế giới pháp luật đang trên đường trở nên “sâu sắc về pháp lý”.

Học cách chơi Poker

Heads-up no-limit Texas hold’em là một trong những kiểu phổ biến nhất của Poker, thường được chơi trong sòng bạc casino, và hình thức cá cược không giới hạn được áp dụng tại sự kiện chính của World Series of Poker (hình 1.7). Poker mang tính thử thách vì không giống như cờ vua, nơi cả hai người chơi được cung cấp thông tin giống nhau, những người chơi poker có thông tin không đầy đủ, và ở cấp độ chơi cao nhất, các kỹ năng lừa bịp và mưu mẹo cũng quan trọng như những lá bài được chia.Nhà toán học John von Neumann, người sáng lập lý thuyết trò chơi toán học và dẫn đầu xu hướng máy tính kỹ thuật số, đặc biệt say mê poker. Như ông từng nói: “Đời thực bao gồm cả gian lận, cả một ít chiến thuật lừa gạt, cả tự hỏi bản thân người khác sẽ nghĩ thế nào về những gì tôi làm. Và đó chính là trò chơi trong lý thuyết của tôi”. Poker là trò chơi phản ánh các phần trí tuệ con người được cải thiện nhờ quá trình tiến hóa. Một mạng học sâu được gọi là “DeepStack”đã chơi 44.852 ván đấu với 33 người chơi poker chuyên nghiệp. Điều khiến cho các chuyên gia poker ngạc nhiên, đó là nó đã đánh bại người chơi giỏi nhất với một tỷ lệ lớn, một độ lệch chuẩn; nhưng nó đã đánh bại cả 33 người chơi với 4 độ lệch chuẩn, một tỷ lệ rất lớn. Nếu thành tích này được nhân rộng ở các lĩnh vực khác, nơi mà phán đoán của con người dựa trên thông tin không hoàn hảo là tối quan trọng, chẳng hạn như chính trị và quan hệ quốc tế, hậu quả có thể vượt ngoài tầm kiểm soát.

Học cách chơi cờ vây

Tháng 3 năm 2016, Lee Sedol, người Hàn Quốc với 18 lần vô địch thế giới, đã thua một trận gồm năm ván đấu trước AlphaGo của DeepMind (hình 1.8), một chương trình chơi cờ vây sử dụng mạng học sâu để đánh giá thế cờ và các nước cờ khả thi. Cờ vây còn khó hơn cả cờ vua. Nếu cờ vua là một trận đánh thì cờ vây là một cuộc chiến tranh. Bàn cờ vây có kích thước 19×19, lớn hơn so với kích thước 8×8 của bàn cờ vua, có khả năng tạo ra nhiều trận đánh quyết liệt trên các vị trí khác nhau của bàn cờ. Có những tương tác tầm xa giữa các trận đánh rất khó đánh giá, kể cả với các chuyên gia. Tổng số vị trí đánh hợp lệ cho cờ vây là 10170, cao hơn rất nhiều so với tổng số nguyên tử có trong vũ trụ.Bên cạnh một số mạng học sâu có khả năng đánh giá thế cờ và chọn nước đi tốt nhất, AlphaGo có một hệ thống học hoàn toàn khác, được sử dụng để giải quyết bài toán kết nối trách nhiệm tạm thời: nước cờ nào có thể giành chiến thắng, và nước cờ nào dẫn đến thất bại? Hạch nền của bộ não nhận các đường chiếu từ toàn bộ vỏ não và phản chiếu trở lại, giải quyết vấn đề này bằng thuật toán chênh lệch tạm thời và việc học tăng cường. AlphaGo đã sử dụng thuật toán học tương như của hạch nền nhằm đánh giá các chuỗi hành động để tối đa hóa các phần thưởng tương lai. AlphaGo đã tự học chơi cờ vây, rất rất nhiều lần.

Trận đấu giữa AlphaGo và Lee Sedol nhận được sự quan tâm rất lớn ở châu Á, nơi các nhà vô địch cờ vây là nhân vật quốc gia và được đối xử như những ngôi sao nhạc rock. Trước đó, AlphaGo đã đánh bại một nhà vô địch cờ vây người châu Âu nhưng cấp độ chơi thấp hơn đáng kể so với cấp độ chơi cao nhất ở châu Á và Lee Sedol không nghĩ sẽ có một trận đấu khó khăn như vậy. Thậm chí DeepMind, công ty phát triển AlphaGo, cũng không biết chương trình học sâu của họ mạnh đến thế nào. Kể từ trận đấu gần đây nhất, AlphaGo đã chơi hàng triệu ván cờ với vài phiên bản khác nhau của chính nó và không có cách nào để đánh giá về khả năng của nó.

Việc AlphaGo chiến thắng ba ván đầu trong số năm ván đầu thực sự trở thành cú sốc với mọi người và cho thấy cấp độ chơi cao không thể ngờ. Điều này thu hút lượt theo dõi ở phía Hàn Quốc, nơi các đài truyền hình lớn tường thuật trực tiếp trận đấu. Một vài nước cờ của AlphaGo mang tính cách mạng. Ở nước cờ thứ 38 trong ván đấu thứ hai, AlphaGo đã chơi vô cùng sáng tạo khiến Lee Sedol rất bất ngờ, và anh đã phải mất 10 phút để đi nước tiếp theo. AlphaGo thua ở ván thứ tư, một chiến thắng danh dự cho con người, và kết thúc trận đấu với bốn ván thắng (hình 1.9). Tôi đã thức rất khuya trong những đêm tháng 3 đó ở San Diego và bị mê hoặc bởi trận đấu này. Chúng tôi nhớ về khoảng thời gian tôi dính chặt vào màn hình tivi ở Cleveland vào ngày 2 tháng 6 năm 1966, lúc 10 giờ sáng, khi con tàu vũ trụ robot Sureyor đáp xuống Mặt trăng và truyền phát về những hình ảnh đầu tiên. Tôi đã thực sự chứng kiến thời khắc lịch sử này. AlphaGo đã vượt xa những gì tôi và mọi người nghĩ về khả năng của nó.

Vào ngày 4 tháng 1 năm 2017, một người chơi cờ vây trên máy chủ Internet với cái tên “Master” được tiết lộ chính là AlphaGo 2.0 đã giành chiến thắng tất cả 60 trận đấu với những người chơi giỏi nhất thế giới, bao gồm đương kim vô địch cờ vây thế giới, Ke Jie, một thần đồng 19 tuổi người Trung Quốc. Nó đã thể hiện cách chơi mới, đấu lại với sự khôn ngoan chiến lược của mọi thời đại. Ngày 27 tháng 5 năm 2017, Ke Jie đã thua AlphaGo ba trận đấu ở Hội nghị Tương lai Cờ vây (the Future of Go Summit) tại Chiết Giang, Trung Quốc (hình 1.10). Đây là những trận đấu cờ vây hay nhất từng được chơi và thu hút sự theo dõi của hàng triệu người Trung Quốc. Ke Jie kết luận: “Năm ngoái, tôi đã nghĩ cách chơi của AlphaGo cũng gần giống với con người, nhưng giờ tôi thấy nó chơi như một Vị thần cờ vây”.

(còn tiếp) 

TH: T.Giang – CSCI

Nguồn tham khảo: Terrence J. Sejnowski – Cuộc cách mạng học sâu – NXB CT 2019.

Sự phát triển của học máy – Phần III


Ung thư sâu bên trong

Các chuyên gia có thể mắc phải sai lầm trong việc phát hiện ung thư vú di căn qua hình ảnh sinh thiết hạch bạch huyết, những sai lầm này có thể gây ra hậu quả chết người. Đây là một vấn đề nhận dạng mẫu mà học sâu có thể làm rất tốt. Và thực sự, mạng lưới học sâu được huấn luyện dựa trên các tập hợp dữ liệu lớn có độ chính xác đạt đến 0,925, tốt nhưng không thể sánh bằng các chuyên gia với độ chính xác 0,966 ở cùng một bộ dữ liệu thử nghiệm. Tuy nhiên, khi việc dự đoán của học sâu được kết hợp với các chuyên gia, kết quả gần như hoàn hảo với độ chính xác là 0,995. Họ kết hợp cùng nhau tốt hơn là chỉ làm một mình vì mạng lưới học sâu và các chuyên gia có những cách nhìn khác nhau trên cùng dữ liệu. Nhiều người có thể được cứu sống. Điều này hướng tới một tương lai khi con người và máy móc làm việc cùng nhau như những đồng nghiệp chứ không phải là đối thủ của nhau.

Ngủ sâu

70% trong số chúng ta đôi khi gặp phải vấn đề nghiêm trọng về giấc ngủ, và nếu bạn rơi vào tình trạng này, sau khi chờ đợi hàng tháng để được bác sĩ (ngoại trừ trường hợp nguy cấp), bạn sẽ được chuyển đến phòng khám nơi bạn được theo dõi suốt đêm kèm theo cả tá điện cực để ghi lại điện não đồ (EEG) và hoạt động cơ khi bạn ngủ. Trong mỗi đêm, bạn sẽ chìm vào giấc ngủ sống chậm, và theo tuần hoàn, vào giấc ngủ mắt chuyển động nhanh (REM), trong lúc đó bạn sẽ mơ, nhưng chứng mất ngủ, chứng ngưng thở khi ngủ, hội chứng chân không yên và nhiều hội chứng rối loạn giấc ngủ khác có thể làm gián đoạn chu kỳ trên. Nếu bạn gặp vấn đề về giấc ngủ tại nhà thì việc ngủ trên một chiếc giường lạ được nối với các thiết bị y tế đáng sợ bằng dây điện có thể là một thách thức thật sự. Một chuyên gia giấc ngủ sẽ kiểm tra các bảng ghi điện não đồ của bạn và đánh dấu các giai đoạn ngủ trong mỗi 30 giây và phải mất đến vài giờ để ghi lại mỗi giấc ngủ tám tiếng. Cuối cùng, bạn sẽ nhận được một báo cáo về những bất thường trong chu kỳ giấc ngủ của bạn với chi phí là 2000 USD.

Chuyên gia về giấc ngủ sẽ được đào tạo để tìm kiếm các đặc điểm nhận biết cho các giai đoạn ngủ khác nhau dựa trên một hệ thống được Anthony Rechsthaffen và Alan Kales phát minh vào năm 1968. Tuy  nhiên, vì các đặc trưng này thường mơ hồ và không nhất quán nên các chuyên gia chỉ nhất trí về cách giải thích chúng trong 75% số lần. Ngược lại, Philip Low, một cựu sinh viên trong phòng thí nghiệm của tôi, đã sử dụng học không giám sát (unsupervised learning) để tự động phát hiện các giai đoạn ngủ với quãng thời gian là 3 giây và độ phù hợp với chuyên gia lên đến 87%, chỉ trong chưa đầy một phút. Hơn nữa, việc này yêu cầu ghi lại từ một vị trí duy nhất trên đầu chứ không phải nhiều chỗ tiếp xúc và một bó dây mà chỉ riêng thời gian để cắm vào và rút ra cũng đã không hề ít. Năm 2007, chúng tôi thành lập một công ty khởi nghiệp có tên là Neurovigil nhằm mang công nghệ này đến với các phòng khám chuyên về giấc ngủ, nhưng họ tỏ ra ít quan tâm vì nó phá vỡ dòng tiền của họ. Thật sự, khi viện phí được thanh toán bằng mã bảo hiểm, họ không có động cơ để áp dụng một tiến trình rẻ hơn. Neurovigil đã tìm thấy một thị trường khác ở những công ty dược phẩm lớn có hoạt động thử nghiệm lâm sàng và cần kiểm tra mức độ hiệu quả của thuốc đối với các kiểu giấc ngủ. Và ngày nay, nó đã xâm nhập vào thị trường thiết bị chăm sóc dài hạn, phục vụ những người lớn tuổi thường gặp các vấn đề về giấc ngủ.

Mô hình phòng khám chuyên về giấc ngủ còn thiếu sót vì các vấn đề về sức khỏe không thể được chẩn đoán một cách chính xác chỉ dựa trên những tình huống hạn chế. Mỗi người đều có một chuẩn khác nhau, và việc bắt đầu từ những chuẩn riêng biệt này là cách tốt nhất. Neurovigil có một thiết bị nhỏ gọn, iBrain, có thể ghi lại EEG của bạn tại nhà, truyền dữ liệu lên Internet và phân tích dữ liệu theo thời gian để tìm ra các xu hướng và sự bất thường. Điều này cho phép các bác sĩ phát hiện sớm vấn đề về sức khỏe khi còn có thể điều trị dễ dàng và ngăn chặn sự phát triển của các bệnh mãn tính. Ngoài ra, có những bệnh nếu được theo dõi liên tục thì việc điều trị sẽ hiệu quả hơn nhiều, như bệnh tiểu đường loại 1, mức độ đường trong máu có thể được giám sát và điều chỉnh bằng cách cung cấp isulin. Việc tiếp cận các cảm biến giá rẻ với khả năng ghi lại dữ liệu liên tục đang có tác động lớn đến quá trình chẩn đoán và điều trị các bệnh mãn tính khác.

Có một số bài học rút ra từ kinh nghiệm của Neurovigil. Không dễ để chuyển một công nghệ tốt và rẻ hơn thành một sản phẩm hoặc dịch vụ mới có thể tiêu thụ được, dù là một sản phẩm vượt trội hơn rất nhiều, khi mà một doanh nghiệp dẫn đầu vẫn đang cố thủ trên thị trường. Tuy nhiên, vẫn có những thị trường thứ cấp nơi công nghệ mới có thể tác động ngay và cần thời gian để cải thiện và cạnh tranh tốt hơn. Đây là cách mà công nghệ năng lượng mặt trời và công nghệ của nhiều ngành công nghiệp mới khác thâm nhập vào thị trường. Về lâu dài, các công nghệ mới và công nghệ giám sát giấc ngủ với những tiến bộ đã được chứng minh sẽ tiếp cận các bệnh nhân tại nhà và dần được tích hợp vào thực hành y tế.

Học cách kiếm tiền

Hơn 75% số lượng giao dịch trên sàn chứng khoán New York được thực hiện tự động (hình 1.6), được thúc đẩy bởi những giao dịch tần suất cao di chuyển vào và ra khỏi các vị trí trong thời gian ngắn hơn một giây. (Khi bạn không phải cho mỗi giao dịch, thậm chí những lợi thế nhỏ có thể mang lại lợi nhuận lớn). Giao dịch thuật toán trong một quy mô thời gian dài hơn sẽ tính đến xu hướng dài hạn dựa trên dữ liệu lớn. Học sâu ngày càng góp phần giúp kiếm được nhiều tiền hơn và mang lại lợi nhuận cao hơn. Vấn đề với việc dự đoán thị trường tài chính là dữ liệu quá lộn xộn và các điều kiện không ổn định – tâm lý có thể thay đổi ngay lập tức sau mỗi một cuộc bầu cử hay xung đột quốc tế. Điều này có nghĩa là thuật toán có thể dự đoán giá trị cổ phiếu trong hôm nay chưa chắc đã làm tốt công việc của mình vào ngày mai. Thực tế, hàng trăm thuật toán đã được sử dụng và những thuật toán tốt nhất sẽ tiếp tục được kết hợp với nhau để tối ưu hóa lợi nhuận.Trở về những năm 1980, khi tôi tư vấn cho Morgan Stanley về mô hình mạng neuron nhân tạo của giao dịch chứng khoán, tôi đã gặp David Shaw, một nhà khoa học máy tính chuyên về thiết kế máy tính song song. Khi rời trường Đại học Columbia, Shaw đã trở thành một nhà phân tích định lượng, trong những ngày đầu của giao dịch tự động. Ông đã thành lập công ty quản lý đầu tư của riêng mình ở Phố Wall, D.E. Shaw Group, và bây giờ ông là một tỷ phú. D.E. Shaw Group đang rất thành công, nhưng không thành công như Renaissance Technologies, một quỹ phòng hộ khác, do James Simons, một nhà toán học xuất sắc và cựu trưởng khoa Toán tại Đại học Stony Brook thành lập. Simons đã kiếm được 1,6 tỷ USD chỉ riêng trong năm 2016, và thậm chí đây chưa phải là năm tốt nhất của ông. Được gọi là “Bộ phận toán học và vật lý tốt nhất thế giới”, Renaissance “tránh tuyển dụng bất kỳ ai mang dáng dấp dù chỉ là một chút của Phố Wall”.

Không còn tham gia vào hoạt động hàng ngày của D.E. Shaw, giờ đây David Shaw đang mải mê với D.E. Shaw Research, xây dựng một máy tính song song với mục đích đặc biệt, gọi là “Anton”, thực hiện việc cuộn gập protein nhanh hơnso với bất kỳ máy tính nào khác trên hành tinh. Simons đã nghỉ hưu, không còn quản lý Renaissance và bắt đầu thành lập quỹ nghiên cứu về bệnh tự kỷ cùng các chương trình khác về khoa học vật lý và khoa học sinh học. Thông qua Viện Simons về Lý thuyết tính toán tại UC Berkeley, Trung tâm Simons về Trí tuệ xã hội tại MIT và Viện Flatiron ở New York, tổ chức từ thiện của Shaw có ảnh hưởng lớn lên phương pháp tính toán tiên tiến để phân tích, mô hình hóa và mô phỏng dữ liệu.

Dịch vụ tài chính đang trải qua một sự chuyển đổi lớn với công nghệ tài chính, hay còn gọi là “fintech”. Công nghệ thông tin, chẳng hạn như blockchain (chuỗi khối), là một sổ cái Internet bảo mật thay thế các trung gian tài chính trong giao dịch, đang được thử nghiệm trên quy mô nhỏ nhưng có thể sớm phá vỡ thị trường tài chính hàng nghìn tỷ USD. Học máy đang được sử dụng để cải thiện đánh giá tín dụng cho các khoản vay, để cung cấp thông tin tài chính và kinh doanh một cách chính xác, để nhận các tín hiệu trên phương tiện truyền thông xã hội nhằm dự đoán xu hướng thị trường, và cung cấp bảo mật sinh trắc học cho giao dịch tài chính. Người có nhiều dữ liệu nhất, cho dù lài ai, sẽ thắng, và thế giới sẽ tràn ngập các dữ liệu tài chính.

(còn tiếp) 

TH: T.Giang – CSCI

Nguồn tham khảo: Terrence J. Sejnowski – Cuộc cách mạng học sâu – NXB CT 2019.

Sự phát triển của học máy – Phần II


Xe tự lái là biểu hiện rõ nhất của một sự thay đổi lớn trong nền kinh tế được công nghệ thông tin (IT) thúc đẩy. Luồng thông tin lưu thông trên Internet cũng giống như dòng nước chảy qua ống dẫn trong thành phố. Các thông tin được tích lũy vào trung tâm dữ liệu khổng lồ vận hành bởi Google, Amazon, Microsoft và các công ty IT khác, đòi hỏi rất nhiều năng lượng điện nên chúng cần được đặt gần các nhà máy thủy điện, và việc truyền tải thông tin tạo ra rất nhiều nhiệt nên cần những con sông để cung cấp chất làm mát. Năm 2013, trung tâm dữ liệu ở Mỹ đã tiêu thụ 10 triệu megawatt, tương đương năng lượng do 34 nhà máy điện cỡ lớn sản xuất ra. Nhưng điều tạo nên ảnh hưởng thậm chí còn lớn hơn cho nền kinh tế hiện tại là cách những thông tin này được sử dụng. Thông tin trích ra từ dữ liệu thô đang dần được chuyển hóa thành kiến thức về con người và sự vật:: chúng ta làm gì, chúng ta muốn gì và chúng ta là ai. Ngày càng nhiều thiết bị điều khiển bằng máy tính đang sử dụng kiến thức này để giao tiếp với chúng ta thông qua lời nói. Không giống với những kiến thức thụ động trong sách vở, tri thức trên đám mây là trí tuệ bên ngoài, vượt ra khỏi bộ não của chúng ta, đang trở thành một phần hiện hữu trong cuộc sống con người.

Học cách dịch

Hiện nay, học sâu được dùng trong hơn 100 dịch vụ ở Google, từ ứng dụng Street View cho đến Inbox Smart Reply và tìm kiếm bằng giọng nói. Vài năm trước, các kỹ sư ở Google nhận thấy rằng họ phải mở rộng các ứng dụng tính toán chuyên sâu này lên cấp độ đám mây. Để thiết kế con chip chuyên dụng cho việc học sâu, họ khéo léo thiết kế một bảng mạch vừa với khe cắm ổ cứng trong giá đỡ trung tâm dữ liệu. Bổ xử lý Tensor (TPU) của Google được triển khai ở các máy chủ trên toàn thế giới, giúp cải thiện hiệu suất của các ứng dụng học sâu.

Một ví dụ về việc học sâu có thể tạo nên thay đổi một cách nhanh chóng như thế nào là tác động của nó đối với việc dịch ngôn ngữ – một chiếc chén thánh cho trí tuệ nhân tạo vì nó phụ thuộc vào khả năng hiểu một câu. Gầy đây, phiên bản mới công bố của Google Translate dựa vào học sâu thể hiện bước tiến vượt bậc về chất lượng dịch giữa các ngôn ngữ tự nhiên. Gần như qua một đêm, việc dịch ngôn ngữ đã chuyển từ một mớ cụm tù lộn xộn thành một câu mạch lạc (hình 1.3). Các phương pháp máy tính trước đó chỉ tìm kiếm sự kết hợp những từ có thể được dịch cùng nhau còn học sâu tìm thấy sự phụ thuộc thông qua cả câu.Được cảnh báo về sự cải thiện bất ngờ của Google Translate vào ngày 18 tháng 11 năm 2016, Jun Rekimoto ở Đại học Tokyo đã kiểm tra hệ thống mới bằng cách để nó dịch phần mở đầu tác phẩm “The Snows of Kilimanjaro – Tuyết trên đỉnh Kilimanjaro” của Ernest Hemingway sang tiếng Nhật rồi tiếp tục dịch lại về tiếng Anh – với kết quả như sau (bạn đoán xem đâu là bản gốc của Hemingway nhé):

1/ Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountian in Africa. Its western summit is called the Masai “Ngaje Ngai”, the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.

2/ Kilimanjaro is a mountain of 19,710 feet covered wit snow and is said to be highest mountain in Africa. The summit of the west is called the “Ngaje Ngai” in Masai; the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.

(Bản số 1 là của Hemingway).

Bước tiếp theo là huấn luyện mạng học sâu lớn hơn trên quy mô các đoạn văn nhằm cải thiện tính mạch lạc giữa các câu. Từ ngữ có lịch sử văn hóa lâu đời. Vladimir Nabokov, một nhà văn người Nga và viết tiểu thuyết tiếng Anh, tác giả của Lolita, đưa ra kết luận rằng không thể dịch thơ ra các ngôn ngữ khác nhau. Bản dịch sát nghĩa tác phẩm Eugene Onegin của Aleksandr Pushkin sang tiếng Anh của ông, với nhiều chú thích về bối cảnh văn hóa của từng đoạn thơ, là minh chứng rõ rệt cho quan điểm của ông. Có thể Google Translate sẽ dịch được tác phẩm của Shakespeare vào một ngày nào đó bằng cách tích hợp tất cả các bài thơ của ông.

Học cách lắng nghe

Một chiếc chén thánh khác của trí tuệ nhân tạo là nhận dạng giọng nói. Cho đến gần đây, tính năng nhận dạng giọng nói không phụ thuộc vào người nói bằng máy tính bị giới hạn trong phạm vi hẹp, chẳng hạn như việc đặt vé máy bay. Hiện nay, tính năng này không còn bị giới hạn nữa. Một dự án nghiên cứu mùa hè tại Microsoft Research được một thực tập sinh đến từ Đại học Toronto tiến hành vào năm 2012 đã cải thiện đáng kể hiệu suất hệ thống nhận dạng giọng nói của Microsoft (hình 1.4). Năm 2016, một nhóm tại Microsoft đã thông báo rằng mạng học sâu với 120 tầng đã đạt được hiệu suất như trình độ con người trong một bài kiểm tra tiêu chuẩn cho khả năng nhận dạng nhiều giọng nói.

Kết quả của bước đột phá này sẽ lan rộng khắp xã hội trong vài năm tới, khi bàn phím máy tính sẽ được thay thế bằng các giao diện ngôn ngữ tự nhiên. Điều này đang diễn ra với các trợ lý kỹ thuật số như Alexa của Amazon, Siri của Apple và Cortana của Microsoft. Một ngày nào đó, bàn phím máy tính sẽ trở thành vật trưng bày trong bảo tàng, cũng giống như máy đánh chữ đã trở nên lỗi thời khi việc sử dụng máy tính cá nhân ngày càng trở nên phổ biến.

Khi nhận dạng giọng nói được kết hợp với bản dịch ngôn ngữ, việc trao đổi thông tin trong thời gian thực giữa các nền văn hóa sẽ trở nên khả thi. Universal Translator của Star Trek sẽ nằm trong tầm với của chúng ta (hình 1.4). Tại sao tính năng nhận dạng giọng nói và dịch ngôn ngữ của máy tính lại mất quá nhiều thời gian mới có thể đạt đến trình độ con người? Liệu việc những tính năng này và các khả năng nhận thức khác của máy tính đạt ngưỡng cùng một lúc có phải chỉ do ngẫu nhiên không? Tất cả các bước đột phá này đang được thúc đẩy bởi dữ liệu lớn (big data).Học cách chẩn đoán

Ngoài da

Các lĩnh vực dịch vụ và nghề nghiệp liên quan cũng sẽ thay đổi khi học máy phát triển và được ứng dụng cho nhiều vấn đề khác, nơi có sẵn dữ liệu lớn. Chẩn đoán y học dựa trên hồ sơ của hàng triệu bệnh nhân sẽ trở nên chính xác hơn. Một nghiên cứu gần đây đã áp dụng học sâu vào 130.000 hình ảnh da liễu cho hơn 2000 bệnh khác nhau – một dữ liệu y khoa lớn hơn gấp 10 lần dữ liệu sử dụng trước đó (hình 1.5). Mạng lưới nghiên cứu được huấn luyện để chẩn đoán từng căn bệnh từ một “bộ dữ liệu thử nghiệm” gồm những hình ảnh mới mà trước đây nó chưa từng thấy. Hiệu suất chẩn đoán của nó trên các hình ảnh mới có thể so sánh được và trong một số trường hợp tốt hơn cả 21 bác sĩ chuyên khoa da liễu. Chỉ ít lâu nữa thôi, mọi người có thể dùng một chiếc điện thoại thông minh chụp lại hình ảnh vùng da thương tổn đáng ngờ và ngay lập tức được chẩn đoán, thay vì phải trả một số tiền đáng kể, tới phòng khám, xếp hàng dài chờ đợi để được bác sĩ chẩn đoán thương tổn. Điều này sẽ giúp chất lượng và phạm vi của dịch vụ chăm sóc da liễu được cải thiện đáng kể. Nếu mỗi người có thể nhanh chóng nhận được đánh giá từ chuyên gia, họ sẽ đến phòng khám ở giai đoạn đầu của bệnh về da, khi nó được điều trị dễ dàng hơn. Tất cả các bác sĩ sẽ chẩn đoán tốt hơn những căn bệnh về da hiếm gặp với sự giúp đỡ của học sâu.(còn tiếp) 

TH: T.Giang – CSCI

Nguồn tham khảo: Terrence J. Sejnowski – Cuộc cách mạng học sâu – NXB CT 2019.

Sự phát triển của học máy – Phần I


Cách đây không lâu, mọi người thường cho rằng thị giác máy tính (computer vision) sẽ không thể cạnh tranh được với khả năng thị giác của đứa bé 1 tuổi. Điều đó đã không còn đúng nữa: máy tính giờ đây có thể nhận biết được các vật thể bằng hình ảnh giống như hầu hết người trưởng thành, và có những chiếc xe được trang bị hệ thống máy tính có thể tự lái an toàn hơn so với một thanh niên 16 tuổi. Và máy tính đã học từ kinh nghiệm, theo hướng đi mà tự nhiên đã dẫn dắt hàng triệu năm trước thay vì phải học cách quan sát hoặc cách điều khiển xe. Điều thúc đẩy sự tiến bộ này chính là những kho dữ liệu lớn. Ngày nay, dữ liệu là một loại “dầu” mới trong thế giới kỹ thuật số. Các thuật toán học tập là các nhà máy tinh chế trích xuất thông tin từ dữ liệu thô; thông tin có thể được dùng để tạo ra kiến thức; kiến thức dẫn đến sự hiểu biết; và hiểu biết mang đến sự khôn ngoan. Chào mừng bạn đến với thế giới mới của học sâu.

Học sâu là một nhánh của học máy, có nguồn gốc từ toán học, khoa học máy tính và khoa học thần kinh. Mạng lưới học sâu học tập từ dữ liệu theo cách thức mà các em bé học từ thế giới xung quanh chúng, bắt đầu với đôi mắt trong sáng và dần dần đạt được những kỹ năng cần thiết để điều hướng các môi trường mới. Về nguồn gốc học sâu, chúng ta quay trở lại với sự ra đời của trí tuệ nhân tạo (AI) trong những năm 1950, khi có hai tầm nhìn cạnh tranh về cách tạo ra trí tuệ nhân tạo: một bên dựa vào logic và các chương trình máy tính đã chi phối AI trong nhiều thập kỷ; một bên lại dựa vào việc học trực tiếp từ dữ liệu, cách này cần nhiều thời gian hơn để phát triển.

Trong thế kỷ 20, khi máy tính còn chưa phát triển và việc lưu trữ dữ liệu quá đắt đỏ so với tiêu chuẩn hiện nay thì logic là một cách hiệu quả để giải quyết vấn đề. Mỗi vấn đề sẽ được các lập trình viên giải quyết bằng cách viết một chương trình khác nhau, và vấn đề càng lớn, chương trình sẽ càng lớn. Ngày nay, năng lực của máy tính và dữ liệu lớn (big data) trở nên vô cùng dồi dào, và việc giải quyết các vấn đề sử dụng thuật toán học tập trở nên nhanh hơn, chính xác hơn và hiệu quả hơn. Chúng ta có thể dùng cùng một thuật toán học tập để giải quyết nhiều vấn đề khó; các giải pháp của nó sẽ sử dụng ít nguồn nhân lực hơn so với việc viết cho mỗi vấn đề một chương trình máy tính khác nhau.

Học cách lái xe

Vào năm 2005, Stanley – một chiếc xe tự lái do nhóm của Sebastian Thrun thiết kế tại trường Đại học Stanford – đã thắng giải thưởng Grand Challenge trị giá 2 triệu USD tiền mặt của Cơ quan Chỉ đạo các Dự án Nghiên cứ Quốc phòng tiên tiến (DARPA). Họ đã dạy nó điều hướng trên sa mạc ở California bằng cách sử dụng học máy. Đoạn đường dài 132 dặm với những đường hầm hẹp và các khúc cua ngoặt đột ngột, bao gồm cả Beer Bottle Pass, một con đường núi quanh co với một bên là dốc đứng, bên kia là núi đá (hình 1.1). Thay vì làm theo phương pháp AI truyền thống là viết chương trình máy tính để dự đoán mọi tình huống. Thrun đã lái chiếc Stanley vòng quanh sa mạc (hình 1.2), và nó đã tự học để dự đoán cách lái xe dựa trên những thông tin giác quan đầu vào từ các cảm biến thị giác và khoảng cách.Sau đó, Thrun đã thành lập Google X, một khu vực thử nghiệm cho các dự án công nghệ cao, nơi công nghệ cho xe tự lái được phát triển xa hơn. Những chiếc xe tự lái của Google đã đi dược 3,5 triệu dặm vòng quanh khu vực Vịnh San Francisco. Uber đã triển khai một đội xe ô tô tự lái ở Pittsburgh. Apple cũng đang mở rộng các dòng sản phẩm mà hệ điều hành của họ kiểm soát bằng cách chuyển sang những chiếc xe tự lái, với hy vọng sẽ lặp lại bước thành công đột phá như trong thị trường điện thoại di động. Nhìn thấy một lĩnh vực kinh doanh không thay đổi trong 100 năm qua đã có bước dịch chuyển trước mắt mình, các nhà sản xuất xe hơi cũng đang tiếp bước trên con đường này. General Motors đã chi ra 1 tỷ USD cho Cruise Automation, một công ty khởi nghiệp ở Thung lũng Silicon đang phát triển công nghệ xe không người lái, và đã đầu tư thêm 600 triệu USD để nghiên cứu và phát triển trong năm 2017. Cũng trong năm đó, Intel đã mua lại Mobileye, một công ty chuyên về cảm biến và thị giác máy tính cho xe tự lái, với trị giá 15,3 tỷ USD. Đây là một khoản đầu tư khá lớn choo lĩnh vực giao thông vận tải trị giá hàng ngàn tỷ USD của nền kinh tế.Xe tự lái sẽ sớm phá vỡ kế sinh nhai của hàng triệu tài xế xe tải và taxi. Cuối cùng, liệu bạn có cần sở hữu xe hơi tại một thành phố mà xe tự lái có thể xuất hiện trong vòng một phút và đưa bạn tới nơi cần đến một cách an toàn. Bạn thậm chí không cần phải tìm chỗ đỗ xe. Hiện nay, một chiếc xe trung bình chỉ cần được sử dụng 4% thời gian, nghĩa là nó cần đỗ ở nơi nào đó trong 96% thời gian còn lại. Nhưng vì xe tự lái có thể phục vụ và đỗ bên ngoài thành phố nên một diện tích đất lớn của thành phố hiện đang là bãi đỗ xe có thể được chuyển đổi mục đích sử dụng sao cho hiệu quả hơn. Đội ngũ quy hoạch đô thị đã suy nghĩ trước về ngày các bãi đổ xe trở thành công viên. Các làn đỗ xe dọc đường phố thực sự có thể trở thành làn đường dành cho xe đạp. Nhiều lĩnh vực kinh doanh khác có liên quan đến xe hơi có thể bị ảnh hưởng, bao gồm các công ty bảo hiểm xe và cửa hàng phụ tùng. Không còn vé phạt tốc độ hay đỗ xe nữa. Các vụ tai nạn do người lái xe sử dụng bia rượu hay ngủ gật cũng sẽ ít xảy ra hơn. Thời gian lãng phí cho việc đi lại trong công việc sẽ được dùng vào mục đích khác. Vào năm 2014, theo Cục Thống kê Dân số Mỹ, 139 triệu người Mỹ tốn trung bình 52 phút để đi lại từ nhà đến nơi làm việc mỗi ngày. Con số này lên tới 29,6 tỷ giờ mỗi năm, hay con số đáng kinh ngạc hơn là 3,4 triệu năm cuộc sống của con người có thể được sử dụng tốt hơn. Và một khi được phát triển và sử dụng rộng rãi, xe tự lái có thể tự trở về nhà mà không cần đến bất kỳ sự hỗ trợ nào, điều này cũng chấm dứt nạn trộm cắp ô tô. Mặc dù có nhiều trở ngại về quy định và pháp lý, nhưng khi xe tự lái trở nên phổ biến, chúng ta sẽ được sống trong một thế giới mới. Xe tải sẽ là phương tiện đầu tiên trở thành xe tự hành, có lẽ là trong 10 năm nữa; với taxi là 15 năm và xe khách là khoảng 15 – 25 năm, từ lúc bắt đầu đến khi được thay thế hoàn toàn.

Vị trí quan trọng của những chiếc xe hơi trong xã hội sẽ thay đổi theo cách mà chúng ta không thể tưởng tượng, và một hệ sinh thái xe mới sẽ xuất hiện. Giống như sự xuất hiện của xe hơi hơn 100 năm trước đã hình thành nên nhiều ngành công nghiệp và công việc mới, một hệ sinh thái với tốc độ phát triển rất nhanh xung quanh xe tự lái cũng sẽ xuất hiện. Waymo, công ty phát triển thiết bị tự lái của Google, đã đầu tư 1 tỷ USD trong hơn 8 năm và xây dựng một cơ sở thử nghiệm bí mật ở thung lũng trung tâm California với một thị trấn giả rộng hơn 36 ha, bổ sung cả những người chạy xe đạp giả và các sự cố hư hỏng máy giả. Mục đích nhằm mở rộng tập dữ liệu huấn luyện bao gồm cả những tình huống đặc biệt và không thường gặp, được gọi là những tình huống nguy cấp. Những sự kiện hiếm gặp khi lái xe trên đường cao tốc thường dẫn đến tai nạn. Sự khác biệt giữa xe tự lái và xe có người lái là khi một chiếc xe được trải nghiệm tình huống hiếm gặp thì việc trải nghiệm học tập sẽ được lan truyền đến những chiếc xe tự lái khác, một hình thức thông minh tập thể. Nhiều cơ sở thử nghiệm tương tự cũng đang được chính các công ty xe tự lái khác xây dựng. Điều này tạo ra nhiều công việc chưa từng tồn tại trước đó, và các chuỗi cung ứng mới cho cảm biến và laser, những thiết bị cần thiết để chỉ dẫn cho xe tự lái.

(còn tiếp) 

TH: T.Giang – CSCI

Nguồn tham khảo: Terrence J. Sejnowski – Cuộc cách mạng học sâu – NXB CT 2019.