Nhóm trí tuệ nhân tạo của Tổ chức cộng tác hình ảnh da quốc tế (ISIC) phát hành hướng dẫn đầu tiên phát triển dựa trên các thuật toán trí tuệ nhân tạo (AI) được sử dụng trong da liễu.
Các hướng dẫn, được xuất bản trên JAMA Dermatology vào ngày 1/12/2021, gồm 1 loạt các khuyến cáo mà các bên liên quan nên xem xét khi phát triển và đánh giá các thuật toán AI dựa trên hình ảnh trong da liễu. Các khuyến cáo được chia thành các loại số liệu, kỹ thuật, đánh giá kỹ thuật và ứng dụng. ISIC là 1 mối quan hệ đối tác trong ngành và học viện được thiết kế tạo điều kiện thuận lợi đối với việc ứng dụng hình ảnh da kỹ thuật số giúp giảm tỷ lệ tử vong do ung thư hắc tố, và được tổ chức thành các nhóm làm việc khác nhau, gồm cả nhóm làm việc về AI, theo trang web của tổ chức.
Mục tiêu của những hướng dẫn này là tạo báo cáo chất lượng cao hơn với đặc điểm tập số liệu và thuật toán của AI da liễu, theo tác giả đầu tiên Roxana Daneshjou, MD, PhD, Đại học Stanford (Calif.). Hy vọng những hướng dẫn này cũng hỗ trợ các cơ quan quản lý trên toàn thế giới khi họ đang đánh giá các thuật toán được sử dụng trong da liễu.
Các tác giả khuyến cáo các bộ số liệu được sử dụng bởi các thuật toán AI phải có mô tả hình ảnh và chi tiết các tạo tác hình ảnh. Đối với nhiếp ảnh, chúng gồm loại máy ảnh được sử dụng; hình ảnh được chụp trong các điều kiện tiêu chuẩn hóa hay các điều kiện khác nhau; chúng được chụp bởi các nhiếp ảnh gia chuyên nghiệp hay các chuyên gia chăm sóc sức khỏe; và có chất lượng hình ảnh. Các nhà nghiên cứu cũng khuyến cáo các nhà phát triển nên đưa vào mô tả hình ảnh loại ánh sáng được sử dụng và liệu bức ảnh có chứa dấu bút, tóc, hình xăm, chấn thương, hiệu ứng phẫu thuật hay các nhiễu động thể chất khác hay không.
Số liệu định dạng tệp hình ảnh có thể trao đổi ghi nhận được từ máy ảnh và các quy trình tiền xử lý như chuẩn hóa màu và xử lý sau hình ảnh, chẳng hạn như lọc ảnh. Ngoài ra, các nhà phát triển nên báo cáo và biện minh việc gồm các hình ảnh được tạo bởi một thuật toán trong một tập số liệu. Bất kỳ hình ảnh công khai được sử dụng trong bộ số liệu đều phải có tài liệu tham khảo và các hình ảnh được sử dụng riêng tư nên được công khai nếu có thể.
Các hướng dẫn của nhóm công tác ISIC cũng đưa đến các khuyến cáo siêu số liệu cấp bệnh nhân. Mỗi hình ảnh phải gồm vị trí địa lý của bệnh nhân và trung tâm y tế mà họ đến cũng như tuổi, giới tính và giới tính, dân tộc và / hoặc chủng tộc và màu da của họ. Đây là 1 lĩnh vực ghi nhận được sự thiếu minh bạch trong bộ số liệu AI trong các thuật toán trong 1 đánh giá gần đây. Nhiều bài báo AI cung cấp thông tin chi tiết các hình ảnh được sử dụng đào tạo và kiểm tra các thuật toán. Ví dụ: chỉ có 7 trong số 70 bài báo có bất kỳ thông tin của tông màu da trong hình ảnh được sử dụng phát triển và / hoặc thử nghiệm các thuật toán AI. Hiểu được sự đa dạng của hình ảnh được sử dụng giúp đào tạo và kiểm tra các thuật toán là rất quan trọng vì các thuật toán được phát triển trên hình ảnh của làn da chủ yếu là da trắng có thể sẽ không hiệu quả với làn da đen và nâu.
Chẩn đoán tổn thương da, AI có nguy cơ không đạt được màu da
Các tác giả hướng dẫn cũng yêu cầu các nhà phát triển thuật toán mô tả các hạn chế của việc không đưa vào thông tin siêu số liệu cấp bệnh nhân khi thông tin này không đầy đủ hoặc không cung cấp. Hạn chế các nhà phát triển thuật toán nhận xét những sai lệch tiềm ẩn trong các thuật toán. Ví dụ, 1 thuật toán chỉ dựa trên hình ảnh y tế từ xa có thể không nắm bắt được đầy đủ các loại bệnh được thấy trong 1 phòng khám trực tiếp.
Khi mô tả thuật toán AI, các nhà phát triển nên trình bày chi tiết lý do của kích thước và phân vùng của tập số liệu, tiêu chuẩn gồm và loại trừ hình ảnh cũng như sử dụng bất kỳ mẫu bên ngoài với các tập thử nghiệm. Các tác giả nên xem xét bất kỳ sự khác biệt giữa các đặc điểm hình ảnh được sử dụng phát triển thuật toán và những đặc điểm có thể gặp phải trong thế giới thực.
Khuyến cáo kỹ thuật
Các hình ảnh trong tập số liệu được gắn nhãn là 1 thách thức duy nhất trong việc phát triển các thuật toán AI đối với bệnh da liễu. Các nhà phát triển nên sử dụng chẩn đoán mô bệnh học trong việc ghi nhãn, nhưng điều này đôi khi có thể dẫn đến nhiễu nhãn.
Nhiều thuật toán AI trong da liễu sử dụng phương pháp học có giám sát, yêu cầu các ví dụ được gắn nhãn giúp thuật toán ghi nhận các tính năng giúp phân biệt giữa các tổn thương. Một số bài báo sử dụng nhãn đồng thuận, các bác sĩ da liễu cung cấp nhãn dán nhãn với các bệnh ung thư da; tuy nhiên, tiêu chuẩn chẩn đoán ung thư da là sử dụng mô bệnh học từ sinh thiết. Bác sĩ da liễu có thể sinh thiết 7-8 khối u ác tính nghi ngờ trước khi phát hiện 1 khối u ác tính thực sự, vì vậy bác sĩ da liễu dán nhãn ung thư da dễ nhiễu nhãn.
Hướng dẫn của ISIC nêu rõ tiêu chuẩn vàng ghi nhãn hình ảnh da liễu là 1 lĩnh vực vẫn cần được nghiên cứu trong tương lai, nhưng hiện tại, chẩn đoán, nhãn và nhóm chẩn đoán được sử dụng trong kho số liệu cũng như bản thể học công cộng như ICD-11, AnatomyMapper và SNOMED -CT nên được đưa vào bộ số liệu hình ảnh da liễu.
Các nhà phát triển AI cũng nên cung cấp mô tả chi tiết thuật toán của họ, gồm các phương pháp, quy trình làm việc, công thức toán học cũng như khả năng tổng quát hóa của thuật toán trên nhiều tập số liệu.
Một khuyến cáo quan trọng khác là các nhà phát triển thuật toán nên cung cấp 1 cách giúo các thuật toán được các nhà nghiên cứu đánh giá công khai. Nhiều thuật toán AI trong khoa da liễu không chia sẻ số liệu hoặc thuật toán.
Chẳng hạn, công cụ trợ lý da liễu hỗ trợ AI được báo cáo gần đây của Google ghi nhận độ chính xác và khả năng chẩn đoán bệnh da ở cấp độ bác sĩ da liễu. Các tùy chọn khác như Model Dermatology, được phát triển bởi Seung Seog Han, MD, PhD, thuộc Phòng khám Da liễu ở Seoul, Hàn Quốc cùng các đồng nghiệp, cung cấp giao diện lập trình ứng dụng giúp các nhà nghiên cứu thử nghiệm thuật toán. Loại mở này là chìa khóa giúp đánh giá tính mạnh mẽ của thuật toán.
Các nhà phát triển cũng nên rõ ràng trong giải thích thuật toán của họ cách các điểm đánh dấu hiệu suất và điểm chuẩn sẽ chuyển sang ứng dụng lâm sàng được đề xuất. Trong bối cảnh này, ca sử dụng, bối cảnh mà ứng dụng AI đang được sử dụng phải được mô tả rõ ràng ai là người dùng dự định và họ đang sử dụng thuật toán theo kịch bản lâm sàng.
Các hướng dẫn trường hợp sử dụng mô hình cũng phải được mô tả bởi các nhà phát triển AI. Danh sách kiểm tra gồm việc phác thảo các trường hợp sử dụng các thuật toán và mô tả các trường hợp sử dụng có thể nằm trong phạm vi của thuật toán so với các trường hợp sử dụng nằm ngoài phạm vi. Ví dụ: một thuật toán được phát triển giúp cung cấp hỗ trợ quyết định của các bác sĩ da liễu, với 1 con người trong vòng lặp, có thể không đủ chính xác phát hành trực tiếp tới người tiêu dùng.
Vì mục tiêu của các thuật toán AI trong da liễu là việc triển khai cuối cùng tới các bác sĩ lâm sàng và bệnh nhân, các tác giả yêu cầu các nhà phát triển xem xét những thiếu sót và tác hại tiềm ẩn của thuật toán trong quá trình triển khai. Các cân nhắc đạo đức và tác động đến các nhóm dân số dễ tổn thương cũng nên được xem xét và thảo luận. Một thuật toán yêu cầu các phương pháp điều trị y tế thẩm mỹ có thể có tác động tiêu cực do bản chất thiên lệch của các tiêu chuẩn sắc đẹp và một thuật toán chẩn đoán các bệnh riêng biệt.
Trước khi triển khai thuật toán AI, nhóm công tác ISIC khuyến cáo các nhà phát triển thực hiện các thử nghiệm lâm sàng tiềm năng xác nhận. Các danh sách kiểm tra và hướng dẫn như SPIRIT-AI và CONSORT-AI cung cấp hướng dẫn cách thiết kế các thử nghiệm lâm sàng kiểm tra các thuật toán AI.
Hiện nay chưa có các thuật toán AI được cấp duyệt trong da liễu; tuy nhiên, có 1 số ứng dụng có nhãn hiệu CE ở Châu Âu và không có cơ chế giám sát.
Một bộ hướng dẫn báo cáo tiêu chuẩn không chỉ giúp minh bạch trong việc đánh giá số liệu và hiệu suất của các mô hình và thuật toán, mà còn buộc phải xem xét các vấn đề công bằng, giảm thiểu sự thiên vị và các kết quả có ý nghĩa lâm sàng.
Hướng dẫn ISIC cung cấp 1 bước quan trọng trong việc trao quyền tới các bác sĩ lâm sàng, thực hành và lĩnh vực định hình của AI và các công cụ và hệ thống trí tuệ tăng cường thúc đẩy và nâng cao kết quả lâm sàng có ý nghĩa, đồng thời tăng cường mối quan hệ cốt lõi giữa bệnh nhân và bác sĩ lâm sàng và đảm bảo chúng được dựa trên các nguyên tắc công bằng, bình đẳng và minh bạch.
Tài liệu tham khảo
Skin Imaging Working Group Releases First Guidelines for AI Algorithms Used in Dermatology
Jeff Craven
December 22, 2021.