Rangkaian Transformer Dipertingkat Secara Tempatan Menetapkan Penanda Aras Baharu Dalam Pengelasan Imej Hiperspektral | INSTITUT KAJIAN PERLADANGAN (IKP)
» ARTIKEL » Rangkaian Transformer Dipertingkat Secara Tempatan Menetapkan Penanda Aras Baharu dalam Pengelasan Imej Hiperspektral

Rangkaian Transformer Dipertingkat Secara Tempatan Menetapkan Penanda Aras Baharu dalam Pengelasan Imej Hiperspektral

Imej hiperspektral (HSI) merakam maklumat spektrum yang terperinci merentasi ratusan jalur, membolehkan pengelasan penutup bumi yang tepat untuk aplikasi seperti pertanian, pemantauan alam sekitar dan penerokaan mineral. Namun, kaedah pengelasan tradisional seperti KNN, SVM dan CNN sering berdepan kekangan data latihan yang terhad serta gagal menangkap ciri global dan tempatan secara berkesan.

Bagi mengatasi cabaran ini, Huang et al. memperkenalkan Rangkaian Transformer Dipertingkat Secara Tempatan (LETNet) untuk pengelasan HSI. LETNet direka bentuk sebagai model ringan tetapi berkuasa, menggabungkan dua modul utama: Multibranch Spatial–Spectral Tokenization (MSST) dan Dual-Branch Transformer Encoder (DTE).

Modul MSST mengekstrak ciri spatial dan spektral menggunakan konvolusi depth-wise dan point-wise, sambil mengekalkan maklumat mentah melalui sambungan residual. Ini memastikan kehilangan maklumat diminimumkan semasa proses pengekodan token. Modul DTE pula terdiri daripada cabang transformer global yang menangkap kebergantungan jarak jauh, dan cabang transformer tempatan yang menggunakan konvolusi graf dan segmentasi superpixel untuk mempertingkatkan pengekstrakan ciri tempatan.

Strategi penggabungan adaptif dengan pemberat boleh belajar digunakan untuk mengintegrasikan ciri global dan tempatan secara dinamik. Dengan hanya satu lapisan CNN dan transformer encoder, LETNet mengurangkan bilangan parameter secara ketara, sekali gus mengurangkan risiko overfitting terutamanya apabila data Latihan adalah terhad.

Ujian ke atas empat set data penanda aras iaitu PaviaU, Houston2013, LongKou dan SDFC menunjukkan prestasi LETNet yang unggul dari segi ketepatan, kecekapan dan kestabilan. Ia mengatasi model CNN dan transformer sedia ada, menjadikannya penyelesaian yang berkesan dan berskala untuk aplikasi penderiaan jauh dunia sebenar.

Rajah 1: Rangka kerja keseluruhan bagi rangkaian transformer yang dipertingkat secara tempatan untuk pengelasan imej hiperspektral (HSI). (a) Model ini terdiri daripada modul MSST dan DTE. Modul pengekodan token mengekstrak ciri spektral dan spatial melalui lapisan konvolusi jenis depth-wise dan point-wise. Modul DTE pula mengandungi pengekod transformer global dan pengekod transformer yang dipertingkat secara tempatan, masing-masing berfungsi untuk menangkap struktur global dan tempatan dalam HSI. (b) Graf tempatan dibina berdasarkan segmentasi superpixel, yang menyediakan maklumat awal spatial untuk cabang tempatan. (c) Kami membangunkan IMSA dengan konvolusi graf tempatan dan blok konvolusi (Convblock) bagi mempertingkatkan pengekstrakan ciri spatial–spektral dalam pengekod tempatan yang dipertingkat.

 

Rujukan: S. Huang, W. Xiao, H. Chen, S. K. Bejo and H. Zhang, "Hyperspectral Image Classification Based on a Locally Enhanced Transformer Network," in IEEE Transactions on Geoscience and Remote Sensing, vol. 63, pp. 1-17, 2025, Art no. 5513217.

Pautan: https://doi.org/

Tarikh Input: 30/09/2025 | Kemaskini: 30/09/2025 | ainzubaidah

PERKONGSIAN MEDIA

INSTITUT KAJIAN PERLADANGAN (IKP)
Universiti Putra Malaysia
43400 UPM Serdang
Selangor Darul Ehsan
+603-9769 1044
+603-9769 XXXX
W, (02:51:51am-02:56:51am, 08 Oct 2025)   [*LIVETIMESTAMP*]