Hậu Siri: Dữ liệu Internet chính là chìa khóa cho sự tiến hóa của AI

pegasus3390

Well-Known Member
attachment.php


Từ cỗ máy HAL trong phim A Space Odyssey hay Samantha trong bộ phim Her, nhiều thập kỷ qua, chúng ta chứng kiến những ý tưởng về việc các trí tuệ nhân tạo được dẫn dắt bởi những cỗ máy một ngày nào đó có thể tương tác với con người, làm theo các hướng dẫn cũng như đưa ra các quyết định một cách độc lập.

Từ khi mà Siri được ra mắt trên chiếc iPhone 4, Google, Facebook, Amazon, Microsoft và ngay cả Baidu cũng bắt đầu tham gia vào lĩnh vực này. Nhưng mặc dù đã có rất nhiều thế hệ trợ lý ảo đưa ra các tính năng mới và các thức sử dụng, nhưng chúng vẫn còn rất xa mới đạt được những gì chúng ta thấy trong phim. Sẽ không bao giờ có một ai đó có thể có một tình yêu lãng mạn với “cô nàng” Siri, hoặc NASA sẽ đưa Alexa để kiểm soát các tàu vũ trụ hiện nay.

Những gì chúng ta thấy trong phim đã đưa những tiêu chuẩn lên rất cao, còn chúng ta vẫn đang trông chờ một trợ lý ảo điều khiển bằng giọng nói có thể tiến ra đời thực. Tuy nhiên, lĩnh vực trợ lý thông minh có khả năng hỗ trợ công việc hằng ngày của chúng ta đang đến gần hơn những gì chúng ta nghĩ.

Các trợ lý ảo hiện nay thụ động và cần phải có người dùng điều khiển.

Khi nói về các trợ lý ảo cá nhân, mọi người đều nghĩ đến các hệ thống như Siri, Cortana hoặc Amazon Echo. Những người đam mê công nghệ gần đây cũng nghe đồn về Viv từ những người đã tạo ra Siri, Facebook hiện nay cũng đã tung ra M và các công cụ trí tuệ nhân tạo như Operator hoặc Magic. Tuy nhiên, trong khi các công cụ mới chủ yếu được “đánh bóng” nhờ quảng cáo, việc sử dụng thực tế đều làm chúng ta hiểu rằng, tất cả chúng đều chỉ dừng lại ở những tác vụ đơn giản như đặt câu hỏi và trả lời.

Trong suốt nhiều năm rất nhiều tín hiệu cho thấy rằng, những công ty tiên phong rất nghiêm túc trong vấn đề đưa AI đến một mức độ cao hơn. Google đã mua lại công ty đến từ London chuyên nghiên cứu về deep learning với giá gần nửa tỷ USD vào năm 2014, IBM cũng mua lại AlchemyAPI năm ngoái, còn Apple thì mua lại 2 công ty về AI trong 4 ngày và hàng loạt các công ty liên quan trong năm ngoái.

Những thương vụ thâu tóm này bắt đầu nở rộ khi mà những kỹ thuật deep learning có nhiều đột phát với việc sử dụng GPU để hỗ trợ khiến cho các hệ thống có thể cải thiện rất nhiều trong việc nhận dạng các hình mẫu, và điều đó có khả năng ứng dụng cao trong việc nhận dạng giọng nói cũng như “tầm nhìn” của những chiếc máy tính. Theo như Tim Tuttle, nhà sáng lập cũng như CEO của Expect Labs nói rằng trong 2 năm tới, có thể máy tính sẽ có thể thực hiện các chỉ dẫn còn tốt hơn so với con người.

Trong khi người ta cho rằng việc giao tiếp thông qua các giác quan là thiết yếu đối với trí tuệ con người thì nó chỉ là một yếu tố quan trọng trong rất nhiều những yếu tố khác. Có đến 6 yếu tố chính cần thiết mà một chiếc máy tính cần có để có thể hoàn toàn vượt qua được bài kiểm tra Turning: việc xử lý ngôn ngữ một cách tự nhiên, khả năng thể hiện kiến thức, suy nghĩ chủ động, học máy, khả năng dự đoán tình huống và chuyển động máy móc.

Nói một cách đơn giản hơn, có rất nhiều thứ cần phải làm để xây dựng nên một trí thông minh nhân tạo, và khả năng nhận dạng giọng nói là một trong số đó. Việc nói ra có lẽ sẽ thuận tiện hơn đánh máy khi mà chúng ta đang bận tay, nhưng những lúc đó thì giọng nói của chúng ta hiếm khi nào đủ to rõ và rành mạch để trở nên dễ tiếp nhận đối với 1 cỗ máy (ngay đến chúng ta đôi khi cũng cần phải hỏi lại mà). Đôi khi chúng ta muốn gọi Siri để hỏi về một việc gì đó rồi cuối cùng lại thấy rằng thà mở máy tính hoặc điện thoại ra Google còn nhanh hơn.

Bối cảnh chính là phần khó nhất của câu chuyện.

Nhóm phát triển đằng sau Viv tin rằng họ có thể tạo ra một trợ lý cá nhân tốt hơn, sử dụng các công nghệ deep learning tiên tiến để làm cho chiếc máy có thể tự dạy chính mình cách thức để giải quyết vấn đề. Trong khi họ vẫn cẩn thận giữ bí mật về công nghệ của mình thì những xung quanh nói rằng hệ thống này đòi hỏi phải có sự hướng dẫn từ phía con người để có thể có thể tạo ra các tình huống sử dụng của con người. Cũng với cách đó chính con người cũng có thể học cách giải quyết vấn đề thông qua việc sử dụng những giải pháp hoặc kiến thức của người khác để biết cách xử lý, họ hướng dẫn AI có thể tự tìm ra cách thức riêng để giải quyết các vấn đề.

Tuy nhiên, nếu so sánh với con người tại điểm này thì chúng ta khác với những chiếc máy, chúng ta có khả năng để tự tạo ra những vấn đề mang tính tình huống dựa trên những kiến thức của chính chúng ta rồi đưa ra những lựa chọn để giải quyết. Chúng ta có khả năng tự nhiên để liên kết những sự kiện quá khứ nhằm tìm ra câu trả lời và đưa ra quyết định, trong khi đó các chương trình AI hiện tại thường gặp thất bại trong việc liên kết các vấn đề với một lý do chung nào đó và cũng rất khó để đưa ra hình mẫu của tình huống xung quanh những vấn đề đó.

Tình huống thực tế chính là cái sẽ mang lại cho trí tuệ nhân tạo khả năng để đúc kết những quyết định thông minh hơn là việc đơn giản chỉ làm theo các chỉ dẫn. Để làm được điều đó, nó phải có thể liên kết được những sự việc trong quá khứ, hiện tại và tương lai để có thể giải quyết các vấn đề phức tạp.

Việc dạy được những cỗ máy về tình huống dẫn đến hành vi của con người là một công việc không dễ dàng; con người không phải lúc nào cũng có thể dự đoán (đoán tâm lý phụ nữ đi thì biết ^^) và sự đa dạng của những tình huống cũng gần như vô tận. Ở cấp độ cá nhân, sử dụng kỹ thuật machine learning để hiểu được cách xử lý vấn đề của một người nào đó trong xã hội cũng như đưa ra quyết định cần có rất nhiều dữ liệu được đưa vào. Việc này có thể đòi hỏi phải theo dõi người dùng 24h/ngày và cho đến khi hệ thống đọc suy nghĩ chưa tồn tại thì chúng ta cũng phải giải thích cho cỗ máy biết được cách thức bạn nghĩ để nó có thể suy nghĩ giống bạn.

Khai thác sức mạnh của Internet

Kỹ thuật machine learning đòi hỏi rất nhiều dữ liệu. Chỉ riêng việc xử lý ngôn ngữ một cách tự nhiên thì dữ liệu về cơ bản sẽ được thu thập theo nhiều đề tài, trong đó có rất nhiều mẫu câu viết có thể được sử dụng bởi AI. Để đưa cho dễ hình dung thì khi mà cỗ máy Watson khi thắng con người trong kỳ thi vấn đáp đã phải sử dụng toàn bộ cơ sở dữ liệu của Wikipedia

Điều thú vị về chiếc máy IBM Watson là những chủ đề được nạp vào trong máy không có một cấu trúc thứ bậc, điều này nghĩa là Watson có thể sử dụng dữ liệu mà không cần sự giám sát của con người. Và nếu như hệ thống M của Facebook sử dụng kỹ thuật tương tự để có khả năng thực hiện các mục tiêu xa hơn như trò chuyện và các tác vụ phức tạp? Câu hỏi là hình mẫu của chúng sẽ như thế nào và làm sao để có được những dữ liệu phù hợp?

Trên Internet chứa đựng hàng triệu giờ nói chuyện, các video, sách, dữ liệu và tất cả mọi thứ dễ dàng cho phép tạo ra một mạng lưới thần kinh, nền tảng của trí tuệ. Nếu bạn muốn tạo ra một cỗ máy về tình yêu? Hãy cho nó đọc “Romeo và Juliet” hoặc các tiểu thuyết lãng mạn khác. Còn về kinh doanh? Hãy đưa nó các bài báo mới của tờ The Wall Street Journal. Chính DeepMind là ví dụ điển hình về việc học cờ vây, hoặc nếu muốn dạy ngôn ngữ cho AI thì có thể dùng đến 300.000 bài báo từ CNN và Daily Mail.

Dữ liệu có sẵn ở đó, và cho đến nay có vẻ chúng ta tạm thời vẫn chỉ ở những bước đầu. Tuy nhiên một làn sóng mới về các hệ thống machine learning sẽ sớm cho chúng ta có thể tận dụng được lượng dữ liệu tính bằng exabytes mà thế giới web đang chưa đựng và từ đó tạo nên bước tiến vượt trội để tạo ra sự tiến hóa tiếp theo với sự ra đời của “siêu trí tuệ nhân tạo”

Bên cạnh việc đào bới những dữ liệu chưa được sắp xếp trong biển dữ liệu online, một hướng đi khác có thể làm cho cuộc sống của chúng ta dễ dàng hơn với các thiết bị cầm tay. Hằng ngày, chúng ta đưa ra hàng trăm quyết định online và nó thể hiện ở mỗi lần chúng ta nhấn chọn vào 1 link, những cú click này đều được ghi chú lại bởi các công ty quảng cáo và phân tích. Thử tưởng tượng nếu tất cả các thông tin đó đều được AI sử dụng và xác định thói quen lướt web của người dùng để rồi sau đó thu thập các thông tin tương tự những thông tin được người dùng yêu thích, bên cạnh hàng triệu người dùng khác, và đưa ra xu hướng thông tin chúng ta.

Điều này không chỉ mở ra khả năng cho phép người dùng cá nhân hóa cũng như gia tăng trải nghiệm duyệt Web mà nó còn có thể hiểu được các yêu cầu của người dùng tốt hơn đồng thời cung cấp những thông tin cần thiết ngay trước cả khi chúng ta yêu cầu.

Những nhà nghiên cứu dự đoán rằng chúng ta còn phải đợi thêm ít nhất là thập kỷ tiếp theo để có thể thực sự trải nghiệm những hệ thống trí tuệ nhân tạo “giống người”. Bên cạnh đó, Internet cũng chuyển sang giai đoạn mà ở đó nó lưu trữ tất cả những thành phần cần thiết để cung cấp dữ liệu cho AI, nó cũng sẽ có rất nhiều con bot, những công cụ tìm kiếm và phân tích cũng như nhiều hàm API để hỗ trợ việc “đào xới” thông tin trực tuyến mà chúng ta cần.

Do đó, chúng ta có thể bỏ qua những gì trên phim ảnh và hãy nhìn vào những gì đang diễn ra trước mắt chúng ta để thấy rằng chúng ta còn có một cơ hội rất tuyệt vời để tạo ra các sản phẩm trí tuệ nhân tạo có thể làm cho cuộc sống con người trở nên dễ dàng hơn bằng cách tối ưu hóa công việc hằng ngày của chúng ta.

 
Bên trên