lengockhanhi
Film critic
Gần đây, Nhi có viết một số bài viết có nội dung khoa học, để giúp các bạn khám phá ra một lĩnh vực hoàn toàn mới là khoa học ứng dụng vào điện ảnh. Qua những bài này, chúng ta sẽ thấy rõ rằng: (1) Điện ảnh ngày nay đã trở thành một môn khoa học chứ không phải là nghệ thuật thuần túy, (2) tại Mỹ, ngành điện ảnh có sự hỗ trợ rất lớn từ các nhà khoa học chuyên ngành toán học, vật lý, hóa học, y học và xã hội học để tối ưu hóa hoạt động làm phim của họ, và (3) Ngày nay tất cả những gì chúng ta xem trên phim hoàn toàn được tính toán có ý đồ một cách chính xác, chuẩn mực theo khoa học chứ không đơn giản là sáng tạo nghệ thuật.
Khoa học điện ảnh có hai chiều, một mặt nghiên cứu cơ chế của tác động phim ảnh lên bộ não người, nhằm giải thích một số hiện tượng về tâm lý, sinh lý sau khi xem phim của con người. Mặt khác, nó áp dụng những kết quả nghiên cứu này vào việc làm phim nhằm tái tạo lại những hiệu quả sinh học đó một cách có chủ ý, gây cảm xúc trên con người, và từ đó giúp các nhà làm phim chọn giải pháp tối ưu nhất trong việc chọn màu sắc, tốc độ hình ảnh và cấu trúc kịch bản.
Trong bài viết này, Nhi sẽ phân tích báo cáo khoa học của hai tác giả Zeeshan Rasheed và Mubarak Shah thuộc phòng thí nghiệm tin học ứng dụng, Đại học Central Florida, Orlando. Họ đã chứng minh được cơ chế bộ não con người phân loại một bộ phim theo các thể loại như: action, drama, comedy, horror là một phản xạ có tính logic toán học. Bằng chứng là họ đã tạo được thuật toán cho phép một cái máy vi tính phân loại phim dựa vào tín hiệu hình ảnh và âm thanh (tức là hoàn toàn vật lý, độc lập với suy nghĩ có tính cảm xúc của sinh vật sống).
Như ta biết, phim ảnh thường được phân loại thành hai nhóm lớn, một nhóm là Action (hành động), một nhóm là non action (không phải hành động). trong nhóm Non action có những thể loại nhỏ hơn là Drama (chính kịch), Horror (kinh dị), Comedy (hài), Romance (tình cảm). Người ta không thể lý giải hoàn toàn cách phân loại này, chỉ biết là nó dựa vào cảm xúc của khn giả khi xem phim, ví dụ phim action tạo ra sự kích động, phim horror gây sợ hãi, phim hài gây vui vẻ, phim drama gây cảm xúc căng thẳng hoặc trung tính.
Nhưng cơ chế vì sao bộ não bạn phân biệt được loại phim mình đang xem: Tôi đang xem phim Action, hay chỉ cần xem trailer bạn có thể nói: Đây là 1 phim horror! Điều này khó giải thích.
2 nhà khoa học Zeeshan Rasheed và Mubarak Shah đã có cách nhìn khác với vấn đề, họ cho rằng phân loại phim có thể là 1 phản xạ lý tính nhiều hơn cảm tính. Để chứng minh việc này, họ đã lập trình cho máy tính để nó phân loại phim, bạn không tin việc này ? Nhi sẽ kể cho bạn nghe họ đã làm thế nào.
Đầu tiên, máy tính phải phân ra 2 loại chính: hành động hay không hành động
Để nhận diện 1 phim action, thuật toán dựa trên tín hiệu hình ảnh và âm thanh theo hai nguyên tắc như sau:
Về mặt âm thanh: Phân tích file wave của âm thanh phim action, họ thấy phim hành động sẽ có sự xuất hiện đỉnh cực đại âm thanh cao (tương ứng với tiếng súng, các vụ nổ)
Hình: đoạn sóng âm thanh của phim The World Is Not Enough (a), sau khi đơn giản hóa sẽ làm xuất hiện các đỉnh cực đại (b và c)
Về hình ảnh
Tiêu chuẩn phân loại phim Action hay non action dựa vào 3 đặc tính: Độ dài của cảnh quay, sự xáo trộn của các pixel và sự có mặt các cảnh cháy nổ trong phim
Đầu tiên, để phát hiện ra cảnh cháy nổ, hình ảnh trong phim sẽ được chuyển về thang đen trắng và máy sẽ phân tích cường độ ánh sáng. Giữa hai khung hình của 1 vụ nổ sẽ có sự tăng sáng đột ngột theo gradient trên 1 nền tĩnh
Hình: Phát hiện vụ cháy nổ
(a) và (b) là 2 khung hình gần nhau trong 1 cảnh cháy nổ, phát hiện sự tăng sáng trên đồ thị (c), còn (d) và (e) là 2 khung hình trên cảnh không có cháy nổ, nên đồ thị (f) không thay đổi.
Độ dài cảnh quay:
Phim hành động có sự cắt cảnh nhanh hơn các thể loại phim khác, cảnh quay thường ngắn. Sự phân tích bằng máy tính cho ra giá trị thời gian của mỗi cảnh tính bằng số khung hình.
Ta chia số khung hình tổng cộng của phim cho số cảnh quay trên kịch bản, ta sẽ biết số khung hình trung bình cho 1 cảnh lớn hay nhỏ. Nếu con số này nhỏ thì rất có khả năng đây là 1 phim hành động.
Một cách máy móc hơn, máy tính có thể phát hiện ranh giới giữa hai cảnh, nhờ vào sự thay đổi đột ngột bản đồ phân bố pixel sáng và tối giữa 2 khung hình.
Sự xáo trộn về thị giác trong cùng cảnh phim
Nếu ta chồng nhiều khung hình của 1 cảnh quay lên nhau, ta sẽ thấy sự dao động của các mảng màu (tương ứng với biên độ cử động của đối tượng trong cảnh quay), ví dụ như khi máy quay tập trung vào một cảnh tĩnh, sự dao động này là tối thiểu hay không có, nhưng khi máy lia nhanh, hay diễn viên chuyển động, vung tay, đi lại (dù trong một cảnh nền tĩnh) thì sẽ xuất hiện dao động hay xáo trộn về vị trí của các pixel, chuyển động càng nhanh thì biên độ xáo trộn càng lớn (ví dụ diễn viên đấm đá thì sẽ gây xáo trộn lớn hơn là diễn viên ngồi im nói chuyện và chỉ cử động nét mặt).
Trong thuật toán, màu sắc được tinh giản thành thang đo trắng-đen-xám, máy tính sẽ phân tích sự chuyển vị trí các pixel trên bản đồ giữa 2 khung hình (ví dụ đen thành xám, hay thàng trắng và theo chiều của 1 vector) và tính ra góc dao động của pixel đó so với vị trí và phương ban đầu, nếu không có chuyển động trong cảnh quay, góc này sẽ bằng 0 cho mọi pixel, còn trong 1 cảnh hành động tổng các góc của các pixel sẽ rất lớn.
Hình: Bản đồ pixel không bị xáo trộn nhiều trong 4 khung hình (a,b) cùng 1 cảnh quay trong phim Legally Blonde.
Hình: Ngược lại, trong phim: kiss of Dragon khi Jet Li đấm vào mặt một tên gian ác thì sẽ gây ra xáo trộn nhiều về pixel trong 4 khung hình (d,e)
Hình: Khi kết hợp 2 tiêu chuẩn: Độ dài cảnh quay và sự xáo trộn thị giác, có thể thấy 2 biến số này tương quan với nhau, nếu vẽ đường biểu diễn L, ta sẽ phân loại được 2 nhóm phim: Action là những phim nằm gần và dưới đường L, và nhóm khác là non action (không phải hành động
Như vậy, bằng 3 tiêu chuần này, máy tính có thể phân loại phim 1 cách chính xác ra 2 loại lớn là: Action hay Non action, nhưng để phân loại sâu hơn, trong thể loại Non Action, các tác giả dựa vào một tiêu chuẩn khác: đó là cường độ ánh sáng.
Để phân loại các nhóm thứ cấp của thể loại phim « không hành động », máy tính sẽ phân tích dựa vào cường độ ánh sáng và màu sắc. Vì lựa chọn màu sắc và ánh sáng hoàn toàn do ý đồ của đạo diễn nhằm gây cảm xúc nào đó cho khán giả. Các phim kinh dị thường có màu sắc u tối, nhợt nhạt, độ tương phản cao. Ngược lại, những cảnh quay màu sắc tươi sáng thường của phim Drama hay phim hài.
Để đơn giản, màu sắc cũng bị tinh giản về 1 thang đo Đen-Xám-trắng. Sau khi phân tích thử nghiệm 1 loạt nhiều phim hài, nhiều phim kinh dị và nhiều phim Drama, các nhà nghiên cứu thấy rằng :
Phim hài : Màu sắc trung bình ở ngay trung tâm của thang đo (vùng xám) và biên độ dao động lớn.
Phim kinh dị : Màu sắc (trung bình) của phim bị lệch về phía cực Đen trong thang đo, biên độ dao động nhỏ
Phim Drama : Không có hai đặc tính trên
Hình: (a) phim Legally Blonde, ánh sáng phân bố ở trung tâm thang đen-Trắng (vùng xám)
(b) Phim Sleepy Hollow: ánh sáng bị lệch phải (cực đen) trên thang đen-xám-trắng
(c) Phim Ali, không có 2 đặc tính này.
Hình: kết luận cuối cùng: Bằng những tiêu chuẩn đơn thuần lý tính (chuyển động pixel, cường độ âm thanh, cường độ ánh sáng), máy tính có thể phân loại chính xác 19 bộ phim chỉ nhờ vào việc chiếu 1 đoạn preview.
Bàn luận của Nhi: Mô hình này chỉ áp dụng cho những phim thuần 1 thể loại, chứ không áp dụng được cho những phim có kết cấu nội dung phức tạp. Kiss of Dragon là 1 phim thuần hành động, nhưng Inglorius Basterd thì không, nó vừa là action, vừa là drama. Tuy nhiên, nghiên cứu này cũng cho thấy yếu tố action là chìa khoá quan trọng và gây ấn tượng cho khán giả trên trailer, có những khán giả thích đi coi phim Action và trong trailer có yếu tố action họ sẽ thích bộ phim, cho là đó là 1 phim action trước khi xét đến các yếu tố khác. Hạn chế của việc phân tích chuyển động của pixel sẽ không áp dụng được cho những phim thuần túy Drama, romance có cách quay phim cực kì sáng tạo như Amilie Poulain, Penelope. Mô hình tỏ ra khá hoàn hảo cho phim kinh dị, thật vậy, khi xem 1 trailer bộ não bạn sẽ hiểu rất nhanh đây là 1 phim kinh dị.
Đây là bài viết thứ 3 của Nhi về đề tài khoa học ứng dụng vào điện ảnh, hơi khô khan nhưng rất thú vị. (Nhi không phải là bà cụ non phải không ?)
Chúc các bạn cinephile và gia đình một mùa phục sinh an lành.
Khoa học điện ảnh có hai chiều, một mặt nghiên cứu cơ chế của tác động phim ảnh lên bộ não người, nhằm giải thích một số hiện tượng về tâm lý, sinh lý sau khi xem phim của con người. Mặt khác, nó áp dụng những kết quả nghiên cứu này vào việc làm phim nhằm tái tạo lại những hiệu quả sinh học đó một cách có chủ ý, gây cảm xúc trên con người, và từ đó giúp các nhà làm phim chọn giải pháp tối ưu nhất trong việc chọn màu sắc, tốc độ hình ảnh và cấu trúc kịch bản.
Trong bài viết này, Nhi sẽ phân tích báo cáo khoa học của hai tác giả Zeeshan Rasheed và Mubarak Shah thuộc phòng thí nghiệm tin học ứng dụng, Đại học Central Florida, Orlando. Họ đã chứng minh được cơ chế bộ não con người phân loại một bộ phim theo các thể loại như: action, drama, comedy, horror là một phản xạ có tính logic toán học. Bằng chứng là họ đã tạo được thuật toán cho phép một cái máy vi tính phân loại phim dựa vào tín hiệu hình ảnh và âm thanh (tức là hoàn toàn vật lý, độc lập với suy nghĩ có tính cảm xúc của sinh vật sống).
Như ta biết, phim ảnh thường được phân loại thành hai nhóm lớn, một nhóm là Action (hành động), một nhóm là non action (không phải hành động). trong nhóm Non action có những thể loại nhỏ hơn là Drama (chính kịch), Horror (kinh dị), Comedy (hài), Romance (tình cảm). Người ta không thể lý giải hoàn toàn cách phân loại này, chỉ biết là nó dựa vào cảm xúc của khn giả khi xem phim, ví dụ phim action tạo ra sự kích động, phim horror gây sợ hãi, phim hài gây vui vẻ, phim drama gây cảm xúc căng thẳng hoặc trung tính.
Nhưng cơ chế vì sao bộ não bạn phân biệt được loại phim mình đang xem: Tôi đang xem phim Action, hay chỉ cần xem trailer bạn có thể nói: Đây là 1 phim horror! Điều này khó giải thích.
2 nhà khoa học Zeeshan Rasheed và Mubarak Shah đã có cách nhìn khác với vấn đề, họ cho rằng phân loại phim có thể là 1 phản xạ lý tính nhiều hơn cảm tính. Để chứng minh việc này, họ đã lập trình cho máy tính để nó phân loại phim, bạn không tin việc này ? Nhi sẽ kể cho bạn nghe họ đã làm thế nào.
Đầu tiên, máy tính phải phân ra 2 loại chính: hành động hay không hành động
Để nhận diện 1 phim action, thuật toán dựa trên tín hiệu hình ảnh và âm thanh theo hai nguyên tắc như sau:
Về mặt âm thanh: Phân tích file wave của âm thanh phim action, họ thấy phim hành động sẽ có sự xuất hiện đỉnh cực đại âm thanh cao (tương ứng với tiếng súng, các vụ nổ)

Hình: đoạn sóng âm thanh của phim The World Is Not Enough (a), sau khi đơn giản hóa sẽ làm xuất hiện các đỉnh cực đại (b và c)
Về hình ảnh
Tiêu chuẩn phân loại phim Action hay non action dựa vào 3 đặc tính: Độ dài của cảnh quay, sự xáo trộn của các pixel và sự có mặt các cảnh cháy nổ trong phim
Đầu tiên, để phát hiện ra cảnh cháy nổ, hình ảnh trong phim sẽ được chuyển về thang đen trắng và máy sẽ phân tích cường độ ánh sáng. Giữa hai khung hình của 1 vụ nổ sẽ có sự tăng sáng đột ngột theo gradient trên 1 nền tĩnh

Hình: Phát hiện vụ cháy nổ
(a) và (b) là 2 khung hình gần nhau trong 1 cảnh cháy nổ, phát hiện sự tăng sáng trên đồ thị (c), còn (d) và (e) là 2 khung hình trên cảnh không có cháy nổ, nên đồ thị (f) không thay đổi.
Độ dài cảnh quay:
Phim hành động có sự cắt cảnh nhanh hơn các thể loại phim khác, cảnh quay thường ngắn. Sự phân tích bằng máy tính cho ra giá trị thời gian của mỗi cảnh tính bằng số khung hình.
Ta chia số khung hình tổng cộng của phim cho số cảnh quay trên kịch bản, ta sẽ biết số khung hình trung bình cho 1 cảnh lớn hay nhỏ. Nếu con số này nhỏ thì rất có khả năng đây là 1 phim hành động.
Một cách máy móc hơn, máy tính có thể phát hiện ranh giới giữa hai cảnh, nhờ vào sự thay đổi đột ngột bản đồ phân bố pixel sáng và tối giữa 2 khung hình.
Sự xáo trộn về thị giác trong cùng cảnh phim
Nếu ta chồng nhiều khung hình của 1 cảnh quay lên nhau, ta sẽ thấy sự dao động của các mảng màu (tương ứng với biên độ cử động của đối tượng trong cảnh quay), ví dụ như khi máy quay tập trung vào một cảnh tĩnh, sự dao động này là tối thiểu hay không có, nhưng khi máy lia nhanh, hay diễn viên chuyển động, vung tay, đi lại (dù trong một cảnh nền tĩnh) thì sẽ xuất hiện dao động hay xáo trộn về vị trí của các pixel, chuyển động càng nhanh thì biên độ xáo trộn càng lớn (ví dụ diễn viên đấm đá thì sẽ gây xáo trộn lớn hơn là diễn viên ngồi im nói chuyện và chỉ cử động nét mặt).
Trong thuật toán, màu sắc được tinh giản thành thang đo trắng-đen-xám, máy tính sẽ phân tích sự chuyển vị trí các pixel trên bản đồ giữa 2 khung hình (ví dụ đen thành xám, hay thàng trắng và theo chiều của 1 vector) và tính ra góc dao động của pixel đó so với vị trí và phương ban đầu, nếu không có chuyển động trong cảnh quay, góc này sẽ bằng 0 cho mọi pixel, còn trong 1 cảnh hành động tổng các góc của các pixel sẽ rất lớn.

Hình: Bản đồ pixel không bị xáo trộn nhiều trong 4 khung hình (a,b) cùng 1 cảnh quay trong phim Legally Blonde.

Hình: Ngược lại, trong phim: kiss of Dragon khi Jet Li đấm vào mặt một tên gian ác thì sẽ gây ra xáo trộn nhiều về pixel trong 4 khung hình (d,e)

Hình: Khi kết hợp 2 tiêu chuẩn: Độ dài cảnh quay và sự xáo trộn thị giác, có thể thấy 2 biến số này tương quan với nhau, nếu vẽ đường biểu diễn L, ta sẽ phân loại được 2 nhóm phim: Action là những phim nằm gần và dưới đường L, và nhóm khác là non action (không phải hành động
Như vậy, bằng 3 tiêu chuần này, máy tính có thể phân loại phim 1 cách chính xác ra 2 loại lớn là: Action hay Non action, nhưng để phân loại sâu hơn, trong thể loại Non Action, các tác giả dựa vào một tiêu chuẩn khác: đó là cường độ ánh sáng.
Để phân loại các nhóm thứ cấp của thể loại phim « không hành động », máy tính sẽ phân tích dựa vào cường độ ánh sáng và màu sắc. Vì lựa chọn màu sắc và ánh sáng hoàn toàn do ý đồ của đạo diễn nhằm gây cảm xúc nào đó cho khán giả. Các phim kinh dị thường có màu sắc u tối, nhợt nhạt, độ tương phản cao. Ngược lại, những cảnh quay màu sắc tươi sáng thường của phim Drama hay phim hài.
Để đơn giản, màu sắc cũng bị tinh giản về 1 thang đo Đen-Xám-trắng. Sau khi phân tích thử nghiệm 1 loạt nhiều phim hài, nhiều phim kinh dị và nhiều phim Drama, các nhà nghiên cứu thấy rằng :
Phim hài : Màu sắc trung bình ở ngay trung tâm của thang đo (vùng xám) và biên độ dao động lớn.
Phim kinh dị : Màu sắc (trung bình) của phim bị lệch về phía cực Đen trong thang đo, biên độ dao động nhỏ
Phim Drama : Không có hai đặc tính trên

Hình: (a) phim Legally Blonde, ánh sáng phân bố ở trung tâm thang đen-Trắng (vùng xám)
(b) Phim Sleepy Hollow: ánh sáng bị lệch phải (cực đen) trên thang đen-xám-trắng
(c) Phim Ali, không có 2 đặc tính này.

Hình: kết luận cuối cùng: Bằng những tiêu chuẩn đơn thuần lý tính (chuyển động pixel, cường độ âm thanh, cường độ ánh sáng), máy tính có thể phân loại chính xác 19 bộ phim chỉ nhờ vào việc chiếu 1 đoạn preview.
Bàn luận của Nhi: Mô hình này chỉ áp dụng cho những phim thuần 1 thể loại, chứ không áp dụng được cho những phim có kết cấu nội dung phức tạp. Kiss of Dragon là 1 phim thuần hành động, nhưng Inglorius Basterd thì không, nó vừa là action, vừa là drama. Tuy nhiên, nghiên cứu này cũng cho thấy yếu tố action là chìa khoá quan trọng và gây ấn tượng cho khán giả trên trailer, có những khán giả thích đi coi phim Action và trong trailer có yếu tố action họ sẽ thích bộ phim, cho là đó là 1 phim action trước khi xét đến các yếu tố khác. Hạn chế của việc phân tích chuyển động của pixel sẽ không áp dụng được cho những phim thuần túy Drama, romance có cách quay phim cực kì sáng tạo như Amilie Poulain, Penelope. Mô hình tỏ ra khá hoàn hảo cho phim kinh dị, thật vậy, khi xem 1 trailer bộ não bạn sẽ hiểu rất nhanh đây là 1 phim kinh dị.
Đây là bài viết thứ 3 của Nhi về đề tài khoa học ứng dụng vào điện ảnh, hơi khô khan nhưng rất thú vị. (Nhi không phải là bà cụ non phải không ?)
Chúc các bạn cinephile và gia đình một mùa phục sinh an lành.
Chỉnh sửa lần cuối: