Phân biệt tác vụ I/O và tác vụ chuyên sâu CPU
Bài viết được sự cho phép của tác giả Tống Xuân Hoài
Vấn đề
Là một lập trình viên Node.js đã bao giờ bạn nghe đến thế mạnh của Node.js là xử lý các tác vụ I/O và không đồng bộ, rằng Node.js không phải là lựa chọn tốt nhất cho các ứng dụng thiên về khả năng khai thác triệt để sức mạnh CPU? Vậy thì tác vụ I/O là gì và tại sao Node.js lại mạnh về I/O? Việc nói Node.js không thực sự tốt với các phép tính lớn là có đúng không. Bài viết ngày hôm nay tôi sẽ dành thời gian nói về vấn đề nêu trên.
Tác vụ I/O là gì?
I/O (Input/Output) đề cập đến sự tương tác của máy tính hay chương trình máy tính với ổ đĩa (disk) và mạng của hệ thống. Ví dụ các hoạt động I/O bao gồm đọc/ghi dữ liệu từ ổ đĩa, thực hiện các yêu cầu HTTP và tương tác với cơ sở dữ liệu. Chúng rất chậm so với việc truy cập bộ nhớ RAM hoặc các phép tính được thực hiện trên CPU.
Chúng ta biết rằng Node.js sử dụng V8 của Chrome để thực thi mã Javascript có điều với sức mạnh của V8 cũng phải chào thua trước I/O bởi chúng không hoàn toàn phụ thuộc vào tốc độ xử lý của CPU như tốc độ đọc/ghi của ổ đĩa, tốc độ của mạng… Nếu I/O được xử lý trên V8 nó sẽ gây ra một cuộc tắc nghẽn nghiêm trọng vì mất quá nhiều thời gian, chính vì thế Node.js phải tìm ra một giải pháp để tận dụng được sức mạnh của V8 mà vẫn phải xử lý được I/O.
Giải pháp của Node là lựa chọn libuv cho xử lý I/O không đồng bộ. Đây là thư viện C đa nền tảng cung cấp hỗ trợ cho I/O không đồng bộ dựa trên các vòng lặp sự kiện (Event Loop).
Luồng chính gặp các tác vụ I/O sẽ đẩy chúng xuống libuv, kết quả được đưa trở lại cho luồng chính thông qua Event Loop. Cứ như thế tạo nên một vòng lặp vô hạn mà luồng chính không bị chặn bởi I/O nữa.
Trong Node.js có khái niệm worker, chúng có nhiệm vụ chuyển các yêu cầu I/O từ luồng chính đến libuv và chờ nhận phải hồi, trong thời gian đó chúng không phải làm gì khác và có thể bị hệ điều hành huỷ lập lịch (de-scheduled) để cho một worker khác gửi yêu cầu. Do đó các tác vụ I/O được worker chuyển vào từ trước vẫn được xử lý ngay cả khi luồng liên kết không chạy.
Hệ điều hành đã tối ưu các công cụ quản lý tệp và cơ sở dữ liệu cũng được tối ưu hoá cao để xử lý đồng thời nhiều yêu cầu chờ xử lý. Ví dụ như sắp xếp lại thứ tự ưu tiên khi có đồng thời nhiều yêu cầu đọc/ghi dữ liệu vào một tệp.
Khi chạy một ứng dụng Node.js bạn sẽ có một số thread pools chuyên dùng để xử lý các yêu cầu I/O. Nhóm luồng này được tạo bởi libuv. Số lượng mặc định của nó là 4 nhưng có thể tăng lên tối đa 128 thông qua biến môi trường UV_THREADPOOL_SIZE
.
Tác vụ chuyên sâu CPU
Là những công việc đòi hỏi nhiều về khả năng tính toán của CPU. Đó có thể là những phép tính phức tạp về mã hoá/giải mã, xử lý hình ảnh, xử lý video… Các worker cũng có thể chuyển những yêu cầu tính toán phức tạp này, lập lịch và xử lý chúng bên ngoài luồng chính. Nhưng chúng chỉ được xử lý khi worker được lập lịch trên một trong các lõi của CPU. Ví dụ nếu CPU của bạn có 4 lõi và bạn tạo ra 5 worker thì một trong những worker này không được tham gia xử lý, trong khi vẫn phải duy trì một nguồn tài nguyên cho nó (bộ nhớ & lập lịch) gây ra tình trạng lãng phí tài nguyên.
Để hiểu rõ hơn về cách Node.js xử lý các task tính toán nặng thông qua Worker Threads tôi khuyên bạn nên đọc bài Worker threads là gì? Bạn đã biết khi nào thì sử dụng Worker threads trong node.js chưa?.
Có thể thấy nếu như luồng chính đưa các tác vụ I/O ra libuv, nó sẽ ngăn chặn được một cuộc tắc nghẽn nghiêm trọng. Trong khi đó, các tác vụ thiên về CPU suy cho cùng sẽ chiếm thời gian xử lý. Giải pháp là tạo ra các child process hoặc worker threads nhưng những giải pháp này còn phụ thuộc vào sức mạnh của phần cứng.
Tổng kết
Với mô hình kiến trúc của Node.js được thiết kế để tận dụng sức mạnh của V8 mà vẫn giải quyết được I/O thế nên Node.js hoàn toàn phù hợp với những bài toán thiên về I/O. Thế nhưng không phải là Node.js không xử lý được những bài toán nặng về tính toán. Bằng cách tạo ra những child process hoặc worker threads trên CPU đa lõi hoàn toàn có thể xử lý mà không chặn luồng chính.
Bài viết gốc được đăng tải tại 2coffee.dev
Xem thêm:
- Khi nào nên sử dụng cluster trong Node.js – đa luồng trong Node.js
- Logging ứng dụng viết bằng node.js qua 3 cấp độ
- Tìm hiểu Buffers trong Node.js, cách sử dụng Buffers
Xem thêm các việc làm công nghệ hấp dẫn trên TopDev
- Đ Đại dương xanh cho Doanh nghiệp tăng trưởng bền vững trên Zalo
- L Lakehouse Architecture: Nền tảng dữ liệu cho ứng dụng AI trong tương lai
- G Giải Quyết Bài Toán Kinh Doanh Bằng Big Data và AI
- B BenQ RD Series – Dòng Màn Hình Lập Trình 4k+ Đầu Tiên Trên Thế Giới
- F Framework nào tốt nhất cho dự án của bạn? – Checklist chi tiết
- K Kinh nghiệm xử lý responsive table hiệu quả
- S Stackoverflow là gì? Bí kíp tận dụng Stack Overflow hiệu quả
- 7 7 kinh nghiệm hữu ích khi làm việc với GIT trong dự án
- B Bài tập Python từ cơ bản đến nâng cao (có lời giải)
- B Bảo mật API là gì? Một số nguyên tắc và kỹ thuật cần biết