Ide-ide terbaru dalam pengenalan pola. “Pengendalian adaptif sistem yang kompleks berdasarkan teori pengenalan pola. Petunjuk dalam pengenalan pola

Dan tanda-tanda. Masalah seperti ini cukup sering teratasi, misalnya saat menyeberang atau berkendara melalui jalan yang mengikuti lampu lalu lintas. Mengenali warna lampu lalu lintas yang menyala dan mengetahui peraturan lalu lintas memungkinkan Anda membuat keputusan yang tepat tentang apakah Anda boleh atau tidak bisa menyeberang jalan saat ini.

Penciptaan sistem buatan pengenalan pola masih merupakan masalah teoritis dan teknis yang kompleks. Kebutuhan akan pengakuan semacam itu muncul di berbagai bidang - mulai dari urusan militer dan sistem keamanan hingga digitalisasi semua jenis sinyal analog.

Secara tradisional, tugas pengenalan pola termasuk dalam rangkaian tugas kecerdasan buatan.

Petunjuk dalam pengenalan pola

Dua arah utama dapat dibedakan:

  • Ilmu yang mempelajari kemampuan pengenalan yang dimiliki makhluk hidup, penjelasan dan pemodelannya;
  • Pengembangan teori dan metode untuk membangun perangkat yang dirancang untuk memecahkan masalah individu untuk tujuan terapan.

Pernyataan formal tentang masalah

Pengenalan pola adalah penugasan data awal ke kelas tertentu dengan mengidentifikasi fitur-fitur penting yang menjadi ciri data ini dari total massa data yang tidak penting.

Ketika menetapkan masalah pengenalan, mereka mencoba menggunakan bahasa matematika, mencoba, berbeda dengan teori jaringan saraf tiruan, yang dasarnya adalah memperoleh hasil melalui eksperimen, untuk menggantikan eksperimen dengan penalaran logis dan pembuktian matematis.

Rumusan klasik dari masalah pengenalan pola: Diberikan sekumpulan objek. Klasifikasi perlu dibuat mengenai mereka. Suatu himpunan diwakili oleh himpunan bagian yang disebut kelas. Diberikan: informasi tentang kelas, deskripsi keseluruhan himpunan, dan deskripsi informasi tentang suatu objek yang keanggotaannya dalam kelas tertentu tidak diketahui. Berdasarkan informasi yang tersedia tentang kelas dan deskripsi objek, diperlukan untuk menentukan kelas mana yang termasuk dalam objek tersebut.

Gambar monokrom paling sering dipertimbangkan dalam masalah pengenalan pola, yang memungkinkan untuk mempertimbangkan gambar sebagai fungsi pada bidang. Jika kita mempertimbangkan suatu titik yang ditetapkan pada bidang, di mana fungsinya menyatakan karakteristiknya pada setiap titik gambar - kecerahan, transparansi, kepadatan optik, maka fungsi tersebut adalah rekaman formal gambar.

Himpunan semua fungsi yang mungkin pada bidang adalah model himpunan semua bayangan. Memperkenalkan konsepnya kesamaan di antara gambar Anda dapat mengajukan tugas pengenalan. Jenis spesifik dari pernyataan tersebut sangat bergantung pada tahapan pengakuan selanjutnya sesuai dengan pendekatan tertentu.

Beberapa metode pengenalan pola grafis

Untuk pengenalan pola optik, Anda dapat menggunakan metode menghitung tampilan suatu objek pada berbagai sudut, skala, offset, dll. Untuk huruf, Anda perlu menghitung font, properti font, dll.

Pendekatan kedua adalah mencari garis besar suatu benda dan memeriksa sifat-sifatnya (konektivitas, keberadaan sudut, dll.)

Pendekatan lain adalah dengan menggunakan jaringan saraf tiruan. Metode ini memerlukan sejumlah besar contoh tugas pengenalan (dengan jawaban yang benar), atau struktur jaringan saraf khusus yang mempertimbangkan spesifikasi tugas ini.

Perceptron sebagai metode pengenalan pola

F. Rosenblatt, memperkenalkan konsep model otak, yang tugasnya menunjukkan bagaimana fenomena psikologis dapat muncul dalam sistem fisik tertentu, yang struktur dan sifat fungsionalnya diketahui, menggambarkan eksperimen diskriminasi yang paling sederhana. Eksperimen ini sepenuhnya terkait dengan metode pengenalan pola, namun berbeda karena algoritma solusinya tidak deterministik.

Eksperimen paling sederhana yang dengannya seseorang dapat memperoleh informasi signifikan secara psikologis tentang suatu sistem tertentu bermuara pada fakta bahwa model tersebut disajikan dengan dua rangsangan yang berbeda dan diharuskan untuk meresponsnya dengan cara yang berbeda. Tujuan dari percobaan tersebut mungkin untuk mempelajari kemungkinan diskriminasi spontan oleh sistem tanpa adanya intervensi dari pihak pelaku eksperimen, atau, sebaliknya, untuk mempelajari diskriminasi yang dipaksakan, di mana pelaku eksperimen berusaha untuk melatih sistem untuk melakukan hal tersebut. melakukan klasifikasi yang diperlukan.

Dalam percobaan pelatihan perceptron, biasanya disajikan urutan gambar tertentu, yang mencakup perwakilan dari setiap kelas yang akan dibedakan. Menurut beberapa aturan modifikasi memori, pilihan respons yang benar diperkuat. Perceptron kemudian disajikan dengan stimulus kontrol dan kemungkinan memperoleh respon yang benar untuk rangsangan dari kelas tertentu ditentukan. Bergantung pada apakah stimulus kontrol yang dipilih cocok atau tidak dengan salah satu gambar yang digunakan dalam urutan pelatihan, hasil yang berbeda diperoleh:

  1. Jika stimulus kontrol tidak sesuai dengan stimulus pelatihan mana pun, maka eksperimen tidak hanya dikaitkan dengan diskriminasi murni, tetapi juga mencakup elemen generalisasi.
  2. Jika suatu stimulus kontrol menggairahkan sekumpulan elemen sensorik tertentu yang sama sekali berbeda dari elemen-elemen yang diaktifkan di bawah pengaruh rangsangan yang diberikan sebelumnya dari kelas yang sama, maka eksperimen tersebut adalah suatu penelitian. generalisasi murni.

Perceptron tidak mempunyai kapasitas untuk melakukan generalisasi murni, namun berfungsi cukup memuaskan dalam eksperimen diskriminasi, terutama jika stimulus kontrol cukup cocok dengan salah satu gambar yang telah diperoleh pengalaman oleh perceptron.

Contoh soal pengenalan pola

  • Pengenalan kode batang
  • Pengenalan plat nomor
  • Pengenalan gambar
  • Pengakuan wilayah lokal kerak bumi di mana terdapat endapan mineral

Lihat juga

Catatan

literatur

  • Gorelik A.L., Skripkin V.A. Metode pengenalan. - edisi ke-4. - M.: Sekolah Tinggi, 1984, 2004. - 262 hal.
  • Vapnik V.N., Chervonenkis A.Ya. Teori pengenalan pola. - M.: Nauka, 1974. - 416 hal.
  • Vasiliev V.I. Sistem pengakuan. Direktori. - edisi ke-2. - K.: Naukova Dumka, 1983. - 424 hal.
  • George Stockman, Linda Shapiro. Visi komputer = Visi Komputer. - M.: Binom. Laboratorium Pengetahuan, 2006. - 752 hal. - ISBN 5-947-74384-1
  • Forsythe David A., Pons Jean. Visi komputer. Pendekatan modern = Visi Komputer: Pendekatan Modern. - M.: Williams, 2004. - 928 hal. - ISBN 0-13-085198-1
  • Cheng S.-K. Prinsip desain untuk sistem informasi visual. - M.: Mir, 1994. - 408 hal.

Tautan

  • Yuri Lifshit. Kursus “Masalah modern ilmu komputer teoretis” - kuliah tentang metode statistik pengenalan pola, pengenalan wajah, klasifikasi teks
  • Jurnal Penelitian Pengenalan Pola

Yayasan Wikimedia. 2010.

  • Bahasa yang dikenali
  • Raspopa

Lihat apa itu “Teori Pengenalan Pola” di kamus lain:

    teori pengenalan pola- arahan ilmiah berdasarkan data psikologi dan fisiologi, teori probabilitas dan terkait dengan pengembangan prinsip dan konstruksi sistem (termasuk berbasis komputer) yang dirancang untuk menentukan apakah suatu objek tertentu milik salah satu... ... Kamus Ensiklopedis Psikologi dan Pedagogi

    Pengenalan pola- arah ilmiah yang terkait dengan pengembangan prinsip dan konstruksi sistem yang dirancang untuk menentukan apakah suatu objek tertentu termasuk dalam salah satu kelas objek yang telah ditentukan sebelumnya. Di bawah objek di R. o. memahami berbagai mata pelajaran... Ensiklopedia Besar Soviet

    PENGENALAN POLA- bagian matematika. sibernetika, mengembangkan prinsip dan metode klasifikasi, serta identifikasi objek, fenomena, proses, sinyal, situasi dari semua objek yang dapat dijelaskan oleh sekumpulan tanda atau properti tertentu yang terbatas,... ... Ensiklopedia Matematika

    Pengenalan pola

    Pengenalan pola (sibernetika)- Pengenalan wajah otomatis dengan program khusus. Teori pengenalan pola adalah salah satu cabang sibernetika yang mengembangkan landasan teori dan metode klasifikasi dan identifikasi objek, fenomena, proses, sinyal, situasi, objek dll,... ... Wikipedia

    TEORI INFORMASI- bagian matematika terapan dan sibernetika yang berkaitan dengan matematika. deskripsi dan penilaian kualitas transmisi, penyimpanan, pengambilan dan klasifikasi informasi. Istilah I. t., yang muncul pada tahun 50-an. Abad ke-20, masih (pada tahun 1978) tidak memiliki satu pun... ... Ensiklopedia Matematika

    Pembelajaran tanpa pengawasan- (Bahasa Inggris: Pembelajaran tanpa pengawasan, pembelajaran mandiri, pembelajaran spontan) salah satu metode pembelajaran mesin, di mana sistem yang diuji secara spontan belajar melakukan tugas, tanpa intervensi dari luar... ... Wikipedia

    Jaringan saraf tiruan- Istilah ini memiliki arti lain, lihat Jaringan saraf (arti). Skema jaringan saraf sederhana. Hijau menunjukkan neuron masukan, neuron tersembunyi berwarna biru, neuron keluaran berwarna kuning... Wikipedia

Metode kekerasan. Dalam metode ini, perbandingan dilakukan dengan database tertentu, di mana untuk setiap objek disajikan pilihan berbeda untuk memodifikasi tampilan. Misalnya, untuk pengenalan pola optik, Anda dapat menggunakan metode penghitungan pada sudut atau skala yang berbeda, perpindahan, deformasi, dll. Untuk huruf, Anda dapat menghitung font atau propertinya. Dalam hal pengenalan pola bunyi, dilakukan perbandingan dengan beberapa pola yang diketahui (sebuah kata yang diucapkan oleh banyak orang). Selanjutnya dilakukan analisis lebih mendalam terhadap ciri-ciri citra. Dalam kasus pengenalan optik, ini mungkin merupakan penentuan karakteristik geometris. Dalam hal ini, sampel suara dilakukan analisis frekuensi dan amplitudo.

Metode selanjutnya - penggunaan jaringan syaraf tiruan(IN). Hal ini memerlukan sejumlah besar contoh tugas pengenalan, atau struktur jaringan saraf khusus yang mempertimbangkan secara spesifik tugas yang diberikan. Namun, metode ini sangat efisien dan produktif.

Metode berdasarkan estimasi kepadatan distribusi nilai fitur. Dipinjam dari teori klasik keputusan statistik, di mana objek kajian dianggap sebagai realisasi variabel acak multidimensi yang didistribusikan dalam ruang fitur menurut hukum tertentu. Mereka didasarkan pada skema pengambilan keputusan Bayesian yang mengacu pada probabilitas awal objek yang termasuk dalam kelas tertentu dan kepadatan distribusi fitur bersyarat.

Sekelompok metode yang didasarkan pada estimasi kepadatan distribusi nilai fitur berhubungan langsung dengan metode analisis diskriminan. Pendekatan Bayesian dalam pengambilan keputusan adalah salah satu metode parametrik yang paling berkembang dalam statistik modern, yang mana ekspresi analitis dari hukum distribusi (hukum normal) diasumsikan diketahui dan hanya sejumlah kecil parameter (vektor mean dan matriks kovarians). ) perlu diestimasi. Kesulitan utama dalam menggunakan metode ini adalah kebutuhan untuk mengingat seluruh sampel pelatihan untuk menghitung perkiraan kepadatan dan sensitivitas yang tinggi terhadap sampel pelatihan.

Metode berdasarkan asumsi tentang kelas fungsi keputusan. Dalam kelompok ini, jenis fungsi keputusan dianggap diketahui dan fungsi kualitasnya ditentukan. Berdasarkan fungsi ini, perkiraan optimal terhadap fungsi keputusan ditemukan dengan menggunakan urutan pelatihan. Fungsi kualitas aturan keputusan biasanya dikaitkan dengan kesalahan. Keuntungan utama metode ini adalah kejelasan rumusan matematis dari masalah pengenalan. Kemungkinan mengekstraksi pengetahuan baru tentang sifat suatu objek, khususnya pengetahuan tentang mekanisme interaksi atribut, di sini pada dasarnya dibatasi oleh struktur interaksi tertentu, yang ditetapkan dalam bentuk fungsi keputusan yang dipilih.

Metode perbandingan dengan prototipe. Ini adalah metode pengenalan ekstensional yang paling mudah dalam praktiknya. Digunakan ketika kelas yang dikenali ditampilkan sebagai kelas geometri kompak. Kemudian pusat pengelompokan geometri (atau objek yang paling dekat dengan pusat) dipilih sebagai titik prototipe.

Untuk mengklasifikasikan objek yang tidak terdefinisi, prototipe terdekat ditemukan dan objek tersebut termasuk dalam kelas yang sama dengannya. Jelasnya, tidak ada gambaran umum yang terbentuk dalam metode ini. Berbagai jenis jarak dapat digunakan sebagai ukuran.

Metode k-tetangga terdekat. Metode ini terdiri dari fakta bahwa ketika mengklasifikasikan objek yang tidak diketahui, ditemukan sejumlah (k) fitur terdekat secara geometris dalam ruang tetangga terdekat lainnya yang sudah diketahui keanggotaannya dalam kelas mana pun. Keputusan untuk mengklasifikasikan suatu objek yang tidak diketahui dibuat dengan menganalisis informasi tentang tetangga terdekatnya. Kebutuhan untuk mengurangi jumlah objek dalam sampel pelatihan (preseden diagnostik) merupakan kelemahan metode ini, karena hal ini mengurangi keterwakilan sampel pelatihan.

Berdasarkan fakta bahwa algoritme pengenalan yang berbeda berperilaku berbeda pada sampel yang sama, muncul pertanyaan tentang aturan keputusan sintetik yang akan menggunakan kekuatan semua algoritme. Untuk tujuan ini, terdapat metode sintetik atau kelompok aturan pengambilan keputusan yang menggabungkan aspek paling positif dari setiap metode.

Untuk menyimpulkan tinjauan metode pengenalan, kami akan menyajikan intisari di atas dalam tabel ringkasan, menambahkan juga beberapa metode lain yang digunakan dalam praktik.

Tabel 1. Tabel klasifikasi metode pengenalan, perbandingan bidang penerapan dan keterbatasannya

Klasifikasi metode pengenalan

Daerah aplikasi

Keterbatasan (kekurangan)

Metode pengenalan intensif

Metode berdasarkan perkiraan kepadatan

Masalah dengan distribusi yang diketahui (normal), kebutuhan untuk mengumpulkan statistik yang besar

Kebutuhan untuk menghitung seluruh sampel pelatihan selama pengenalan, sensitivitas tinggi terhadap non-representatif sampel pelatihan dan artefak

Metode Berbasis Asumsi

Kelas harus dapat dipisahkan dengan baik

Jenis fungsi keputusan harus diketahui terlebih dahulu. Ketidakmampuan untuk memperhitungkan pengetahuan baru tentang korelasi antar sifat

Metode Boolean

Masalah kecil

Ketika memilih aturan keputusan yang logis, pencarian yang mendalam diperlukan. Intensitas tenaga kerja yang tinggi

Metode linguistik

Tugas menentukan tata bahasa dari sekumpulan pernyataan (deskripsi objek) tertentu sulit untuk diformalkan. Masalah teoritis yang belum terpecahkan

Metode pengenalan ekstensional

Metode perbandingan dengan prototipe

Masalah dimensi ruang fitur yang kecil

Ketergantungan hasil klasifikasi yang tinggi pada metrik. Metrik optimal tidak diketahui

k metode tetangga terdekat

Ketergantungan hasil klasifikasi yang tinggi pada metrik. Perlunya pencacahan lengkap sampel pelatihan selama pengenalan. Upaya komputasi

Algoritma untuk menghitung estimasi (ABO)

Masalah berdimensi kecil dari segi jumlah kelas dan fitur

Ketergantungan hasil klasifikasi pada metrik. Perlunya pencacahan lengkap sampel pelatihan selama pengenalan. Kompleksitas teknis yang tinggi dari metode ini

Decision Rule Collectives (DRCs) adalah metode sintetik.

Masalah berdimensi kecil dari segi jumlah kelas dan fitur

Kompleksitas teknis metode yang sangat tinggi, banyaknya permasalahan teoritis yang belum terpecahkan, baik dalam menentukan bidang kompetensi metode privat maupun dalam metode privat itu sendiri

Secara umum, ada tiga metode pengenalan pola yang dapat dibedakan: Metode brute force. Dalam hal ini dilakukan perbandingan dengan database, dimana untuk setiap jenis objek disajikan berbagai modifikasi tampilan. Misalnya, untuk pengenalan pola optik, Anda dapat menggunakan metode menghitung penampakan suatu objek pada berbagai sudut, skala, perpindahan, deformasi, dll. Untuk huruf, Anda perlu menghitung font, properti font, dll. pengenalan gambar suara, oleh karena itu, perbandingan dibuat dengan beberapa pola yang diketahui (misalnya, sebuah kata yang diucapkan oleh beberapa orang).

Pendekatan kedua melibatkan analisis yang lebih mendalam terhadap karakteristik gambar. Dalam hal pengenalan optik, ini dapat berupa penentuan berbagai karakteristik geometris. Dalam hal ini, sampel suara dikenai analisis frekuensi, amplitudo, dll.

Metode selanjutnya adalah penggunaan jaringan syaraf tiruan (JST). Metode ini memerlukan sejumlah besar contoh tugas pengenalan selama pelatihan, atau struktur jaringan saraf khusus yang mempertimbangkan kekhususan tugas ini. Namun, ia menawarkan efisiensi dan produktivitas yang lebih tinggi.

4. Sejarah pengenalan pola

Mari kita pertimbangkan secara singkat formalisme matematis dari pengenalan pola. Suatu objek dalam pengenalan pola dijelaskan oleh sekumpulan karakteristik dasar (fitur, properti). Ciri-ciri utama dapat bersifat berbeda: ciri-ciri tersebut dapat diambil dari himpunan terurut dari tipe garis nyata, atau dari himpunan diskrit (yang, bagaimanapun, juga dapat memiliki struktur). Pemahaman terhadap suatu objek ini konsisten dengan kebutuhan akan penerapan praktis pengenalan pola dan dengan pemahaman kita tentang mekanisme persepsi objek oleh manusia. Memang benar, kami percaya bahwa ketika seseorang mengamati (mengukur) suatu objek, informasi tentang objek tersebut tiba melalui sejumlah sensor (saluran yang dianalisis) yang terbatas ke otak, dan setiap sensor dapat dikaitkan dengan karakteristik objek yang sesuai. Selain fitur-fitur yang sesuai dengan pengukuran kita terhadap suatu objek, ada juga fitur yang dipilih, atau sekelompok fitur, yang kita sebut fitur klasifikasi, dan mencari tahu nilainya untuk vektor X tertentu adalah tugas yang dilakukan oleh sistem pengenalan alami dan buatan.

Jelas bahwa untuk menetapkan nilai ciri-ciri tersebut, diperlukan informasi tentang bagaimana ciri-ciri yang diketahui berkaitan dengan ciri-ciri yang mengklasifikasikannya. Informasi tentang hubungan ini diberikan dalam bentuk preseden, yaitu sekumpulan deskripsi objek yang memiliki nilai karakteristik klasifikasi yang diketahui. Dan berdasarkan informasi preseden ini, perlu untuk membangun aturan keputusan yang akan menetapkan deskripsi sewenang-wenang suatu objek nilai-nilai fitur klasifikasinya.

Pemahaman tentang masalah pengenalan pola ini telah ditetapkan dalam sains sejak tahun 50-an abad yang lalu. Dan kemudian diketahui bahwa produksi seperti itu bukanlah hal baru sama sekali. Kami telah menemukan formulasi serupa dan sudah ada metode analisis data statistik yang telah terbukti cukup baik, yang secara aktif digunakan untuk banyak masalah praktis, seperti misalnya diagnostik teknis. Oleh karena itu, langkah pertama pengenalan pola terjadi di bawah pendekatan statistik, yang menentukan masalah utama.

Pendekatan statistik didasarkan pada gagasan bahwa ruang asal benda adalah ruang probabilistik, dan tanda (karakteristik) benda merupakan variabel acak yang ditentukan di dalamnya. Kemudian tugas data scientist adalah, berdasarkan pertimbangan tertentu, mengajukan hipotesis statistik tentang sebaran fitur, atau lebih tepatnya, tentang ketergantungan fitur pengklasifikasian pada fitur lainnya. Hipotesis statistik, pada umumnya, adalah sekumpulan fungsi distribusi fitur yang ditentukan secara parametrik. Hipotesis statistik yang khas dan klasik adalah hipotesis tentang normalitas distribusi ini (para ahli statistik telah mengemukakan banyak sekali jenis hipotesis semacam itu). Setelah merumuskan hipotesis, tinggal menguji hipotesis tersebut pada data preseden. Pengujian ini terdiri dari pemilihan distribusi tertentu dari kumpulan distribusi yang awalnya ditentukan (parameter hipotesis distribusi) dan menilai keandalan (interval kepercayaan) pilihan tersebut. Sebenarnya fungsi distribusi ini adalah jawaban dari permasalahan tersebut, hanya saja objeknya tidak lagi diklasifikasikan secara jelas, tetapi dengan probabilitas tertentu untuk menjadi bagian dari kelas. Para ahli statistik juga telah mengembangkan pembenaran asimtotik untuk metode tersebut. Pembenaran tersebut dibuat sesuai dengan skema berikut: fungsi tertentu untuk kualitas pilihan distribusi ditetapkan (interval kepercayaan) dan ditunjukkan bahwa dengan peningkatan jumlah preseden, pilihan kami dengan probabilitas cenderung 1 menjadi benar dalam pengertian fungsional ini (interval kepercayaan cenderung 0). Ke depan, kami akan mengatakan bahwa pandangan statistik tentang masalah pengenalan ternyata sangat bermanfaat tidak hanya dalam kaitannya dengan algoritma yang dikembangkan (yang mencakup metode analisis klaster dan diskriminan, regresi nonparametrik, dll.), tetapi juga kemudian mengarah pada Vapnik untuk penciptaan teori pengakuan statistik yang mendalam.

Namun, ada argumen kuat yang dibuat bahwa masalah pengenalan pola tidak dapat direduksi menjadi statistik. Masalah seperti itu pada prinsipnya dapat dilihat dari sudut pandang statistik dan hasil penyelesaiannya dapat diinterpretasikan secara statistik. Untuk melakukan ini, kita hanya perlu berasumsi bahwa ruang objek permasalahan bersifat probabilistik. Namun dari sudut pandang instrumentalisme, kriteria keberhasilan interpretasi statistik suatu metode pengenalan tertentu hanya dapat berupa adanya justifikasi metode tersebut dalam bahasa statistika sebagai salah satu cabang matematika. Pembenaran di sini berarti pengembangan persyaratan dasar untuk tugas yang menjamin keberhasilan penerapan metode ini. Namun, saat ini, untuk sebagian besar metode pengakuan, termasuk metode yang muncul secara langsung dalam kerangka pendekatan statistik, pembenaran yang memuaskan belum ditemukan. Selain itu, algoritma statistik yang paling umum digunakan saat ini, seperti diskriminan linier Fisher, jendela Parzen, algoritma EM, metode tetangga terdekat, belum lagi jaringan kepercayaan Bayesian, memiliki sifat heuristik yang kuat dan mungkin memiliki interpretasi yang berbeda dengan statistik. Dan terakhir, untuk semua hal di atas, harus ditambahkan bahwa selain perilaku asimtotik dari metode pengenalan, yang merupakan masalah utama statistik, praktik pengenalan menimbulkan pertanyaan tentang kompleksitas komputasi dan struktural dari metode yang jauh melampaui batas-batasnya. ruang lingkup teori probabilitas saja.

Jadi, bertentangan dengan aspirasi para ahli statistik untuk mempertimbangkan pengenalan pola sebagai cabang statistik, ide-ide yang sangat berbeda dimasukkan dalam praktik dan ideologi pengenalan. Salah satunya disebabkan oleh penelitian di bidang pengenalan pola visual dan didasarkan pada analogi berikut.

Seperti yang telah disebutkan, dalam kehidupan sehari-hari orang terus-menerus memecahkan (seringkali secara tidak sadar) masalah dalam mengenali berbagai situasi, gambaran pendengaran dan visual. Kemampuan komputer seperti itu, paling-paling, adalah sesuatu yang akan terjadi di masa depan. Oleh karena itu, beberapa pionir pengenalan pola menyimpulkan bahwa penyelesaian masalah ini pada komputer, secara umum, harus meniru proses berpikir manusia. Upaya paling terkenal untuk mendekati masalah dari sudut ini adalah studi terkenal F. Rosenblatt tentang perceptron.

Pada pertengahan tahun 50-an, tampaknya ahli neurofisiologi telah memahami prinsip-prinsip fisik otak (dalam buku “The New Mind of the King,” fisikawan teoretis terkenal Inggris R. Penrose dengan menarik mempertanyakan model jaringan saraf otak, dengan membenarkan peran penting efek mekanika kuantum dalam fungsinya; meskipun model ini dipertanyakan sejak awal, Berdasarkan penemuan ini, F. Rosenblatt mengembangkan model untuk mempelajari pengenalan gambar visual, yang disebutnya perceptron Rosenblatt, yang mewakili. fungsi berikut (Gbr. 1):

Gambar 1. Rangkaian Perceptron

Pada masukannya, perceptron menerima vektor objek, yang dalam karya Rosenblatt merupakan vektor biner yang menunjukkan piksel layar mana yang dihitamkan oleh gambar dan mana yang tidak. Selanjutnya, masing-masing tanda diumpankan ke masukan neuron, yang tindakannya adalah perkalian sederhana dengan bobot neuron tertentu. Hasilnya diumpankan ke neuron terakhir, yang menjumlahkannya dan membandingkan jumlah totalnya dengan ambang batas tertentu. Tergantung pada hasil perbandingan, objek input X dikenali diperlukan atau tidak. Kemudian tugas pengajaran pengenalan pola adalah memilih bobot neuron dan nilai ambang batas sehingga perceptron memberikan jawaban yang benar pada gambar visual preseden. Rosenblatt percaya bahwa fungsi yang dihasilkan akan baik dalam mengenali gambar visual yang diinginkan meskipun objek masukan tidak termasuk dalam preseden. Untuk alasan bionik, dia juga menemukan metode untuk memilih bobot dan ambang batas, yang tidak akan kita bahas lebih lanjut. Anggap saja pendekatannya berhasil dalam sejumlah masalah pengenalan dan memunculkan seluruh arah penelitian dalam algoritma pembelajaran berdasarkan jaringan saraf, kasus khusus di antaranya adalah perceptron.

Selanjutnya, berbagai generalisasi perceptron ditemukan, fungsi neuron menjadi lebih rumit: neuron sekarang tidak hanya dapat mengalikan bilangan masukan atau menjumlahkannya dan membandingkan hasilnya dengan ambang batas, tetapi juga menerapkan fungsi yang lebih kompleks dalam kaitannya dengan bilangan tersebut. Gambar 2 menunjukkan salah satu komplikasi neuron berikut:

Beras. 2 Diagram jaringan saraf.

Selain itu, topologi jaringan saraf bisa jadi jauh lebih kompleks daripada yang dipertimbangkan oleh Rosenblatt, misalnya:

Beras. 3. Diagram jaringan saraf Rosenblatt.

Komplikasi menyebabkan peningkatan jumlah parameter yang dapat disesuaikan selama pelatihan, tetapi pada saat yang sama meningkatkan kemampuan untuk menyesuaikan pola yang sangat kompleks. Penelitian di bidang ini sekarang berjalan dalam dua arah yang terkait erat - berbagai topologi jaringan dan berbagai metode konfigurasi sedang dipelajari.

Jaringan saraf saat ini tidak hanya sebagai alat untuk memecahkan masalah pengenalan pola, tetapi juga telah digunakan dalam penelitian tentang memori asosiatif dan kompresi gambar. Meskipun bidang penelitian ini sangat tumpang tindih dengan masalah pengenalan pola, bidang ini mewakili cabang sibernetika yang terpisah. Bagi seorang pengenal saat ini, jaringan saraf tidak lebih dari sekumpulan pemetaan yang ditentukan secara parametrik dan sangat spesifik, yang dalam pengertian ini tidak memiliki keunggulan signifikan dibandingkan banyak model pembelajaran serupa lainnya yang akan dicantumkan secara singkat di bawah.

Sehubungan dengan penilaian terhadap peran jaringan saraf untuk pengenalan itu sendiri (yaitu, bukan untuk bionik, yang saat ini sangat penting), saya ingin mencatat hal-hal berikut: jaringan saraf, menjadi objek yang sangat kompleks untuk matematika. analisis, bila digunakan dengan benar, memungkinkan ditemukannya hukum-hukum yang sangat non-sepele dalam data. Kesulitan analisis mereka, secara umum, dijelaskan oleh strukturnya yang kompleks dan, sebagai konsekuensinya, kemungkinan yang hampir tidak ada habisnya untuk menggeneralisasi berbagai macam pola. Namun kelebihan ini, seperti yang sering terjadi, merupakan sumber potensi kesalahan dan kemungkinan pelatihan ulang. Seperti yang akan dibahas di bawah, pandangan ganda terhadap prospek model pembelajaran apa pun adalah salah satu prinsip pembelajaran mesin.

Arah pengakuan populer lainnya adalah aturan logis dan pohon keputusan. Dibandingkan dengan metode pengenalan yang disebutkan di atas, metode ini paling aktif menggunakan gagasan untuk mengekspresikan pengetahuan kita tentang bidang subjek dalam bentuk struktur yang mungkin paling alami (pada tingkat sadar) - aturan logis. Aturan logika dasar berarti pernyataan seperti “jika fitur yang tidak dapat diklasifikasikan ada di relasi X, maka fitur yang diklasifikasikan ada di relasi Y.” Contoh aturan dalam diagnosa medis adalah sebagai berikut: jika pasien berusia di atas 60 tahun dan sebelumnya pernah mengalami serangan jantung, maka jangan melakukan operasi - risiko hasil negatifnya tinggi.

Untuk mencari aturan logis dalam data, diperlukan dua hal: menentukan ukuran “informatif” aturan dan ruang aturan. Dan tugas mencari aturan kemudian berubah menjadi tugas pencacahan penuh atau sebagian dalam ruang aturan untuk menemukan aturan yang paling informatif. Definisi kandungan informasi dapat diperkenalkan dengan berbagai cara, dan kami tidak akan membahasnya secara mendalam, mengingat ini juga merupakan parameter tertentu dari model. Ruang pencarian ditentukan dengan cara standar.

Setelah menemukan aturan yang cukup informatif, tahap “merakit” aturan menjadi pengklasifikasi akhir dimulai. Tanpa membahas secara mendalam masalah yang muncul di sini (dan jumlahnya cukup banyak), kami akan mencantumkan 2 metode utama “perakitan”. Tipe pertama adalah daftar linier. Tipe kedua adalah pemungutan suara berbobot, ketika setiap aturan diberi bobot tertentu, dan objek ditetapkan oleh pengklasifikasi ke kelas yang memiliki jumlah aturan terbanyak yang dipilih.

Akibatnya, fase konstruksi aturan dan fase "perakitan" dilakukan bersama-sama dan, ketika menyusun pemungutan suara atau daftar berbobot, pencarian aturan pada bagian data kasus dipanggil berulang kali untuk memastikan kesesuaian yang lebih baik antara data dan model. .

Bab 3: Tinjauan Analitik Pengenalan Pola dan Metode Pengambilan Keputusan

Teori pengenalan pola dan otomatisasi kontrol

Tugas utama pengenalan pola adaptif

Pengenalan adalah proses informasi yang dilaksanakan oleh beberapa pengubah informasi (saluran informasi cerdas, sistem pengenalan) yang memiliki masukan dan keluaran. Masukan sistem berupa informasi tentang ciri-ciri apa saja yang dimiliki objek yang disajikan. Output sistem menampilkan informasi tentang kelas mana (gambar umum) yang dimiliki objek yang dikenali.

Saat membuat dan mengoperasikan sistem pengenalan pola otomatis, sejumlah masalah terpecahkan. Mari kita bahas tugas-tugas ini secara singkat dan sederhana. Perhatikan bahwa penulis yang berbeda memiliki rumusan yang sama untuk masalah ini, dan himpunan itu sendiri tidak sama, karena sampai batas tertentu bergantung pada model matematika spesifik yang menjadi dasar sistem pengenalan ini atau itu. Selain itu, beberapa masalah dalam model pengenalan tertentu tidak memiliki solusi dan karenanya tidak diajukan.

Tugas memformalkan bidang studi

Pada dasarnya tugas ini adalah tugas pengkodean. Daftar kelas umum dikompilasi yang mungkin mencakup implementasi spesifik objek, serta daftar karakteristik yang, pada prinsipnya, mungkin dimiliki objek ini.

Tugas membentuk sampel pelatihan

Set pelatihan adalah database yang berisi deskripsi implementasi spesifik objek dalam bahasa fitur, dilengkapi dengan informasi tentang kepemilikan objek tersebut pada kelas pengenalan tertentu.

Tugas pelatihan sistem pengenalan

Sampel pelatihan digunakan untuk membentuk gambaran umum kelas pengenalan berdasarkan generalisasi informasi tentang fitur apa yang dimiliki objek sampel pelatihan milik kelas ini dan kelas lain.

Masalah pengurangan dimensi ruang fitur

Setelah melatih sistem pengenalan (memperoleh statistik tentang distribusi frekuensi fitur berdasarkan kelas), setiap fitur dapat menentukan nilainya untuk memecahkan masalah pengenalan. Setelah ini, fitur yang paling tidak berharga dapat dihapus dari sistem fitur. Kemudian sistem pengenalan harus dilatih kembali, karena sebagai akibat dari penghapusan beberapa fitur, statistik distribusi fitur yang tersisa antar kelas berubah. Proses ini dapat diulangi, mis. berulang-ulang.

Tugas pengakuan

Objek sampel yang dikenali diakui, yang khususnya dapat terdiri dari satu objek. Sampel yang dikenali dibentuk mirip dengan sampel pelatihan, tetapi tidak berisi informasi tentang kepemilikan objek ke kelas, karena inilah yang ditentukan selama proses pengenalan. Hasil dari pengenalan setiap objek adalah distribusi atau daftar semua kelas pengenalan dalam urutan menurun sesuai dengan tingkat kemiripan objek yang dikenali dengannya.

Masalah kendali mutu pengakuan

Setelah diketahui, kecukupannya dapat ditentukan. Untuk objek sampel pelatihan, hal ini dapat segera dilakukan, karena bagi objek tersebut sudah diketahui kelas mana yang mereka ikuti. Untuk objek lainnya, informasi ini dapat diperoleh nanti. Bagaimanapun, kemungkinan kesalahan rata-rata aktual untuk semua kelas pengenalan dapat ditentukan, serta kemungkinan kesalahan saat menugaskan objek yang dikenali ke kelas tertentu.

Hasil pengakuan harus diinterpretasikan dengan mempertimbangkan informasi yang tersedia tentang kualitas pengakuan.

Masalah adaptasi

Jika, sebagai hasil dari prosedur pengendalian mutu, ditentukan tidak memuaskan, maka deskripsi objek yang dikenali secara salah dapat disalin dari sampel yang dikenali ke sampel pelatihan, dilengkapi dengan informasi klasifikasi yang memadai dan digunakan untuk memformat ulang aturan pengambilan keputusan. , yaitu diperhitungkan. Terlebih lagi, jika objek-objek ini tidak termasuk dalam kelas pengenalan yang ada, yang dapat menjadi penyebab kesalahan pengenalannya, maka daftar ini dapat diperluas. Akibatnya, sistem pengenalan beradaptasi dan mulai mengklasifikasikan objek-objek ini secara memadai.

Masalah pengenalan terbalik

Tugas pengenalannya adalah bahwa untuk objek tertentu, berdasarkan karakteristiknya yang diketahui, sistem menetapkan objek tersebut termasuk dalam kelas yang sebelumnya tidak diketahui. Sebaliknya, dalam masalah pengenalan terbalik, untuk kelas pengenalan tertentu, sistem menetapkan fitur mana yang paling merupakan karakteristik objek kelas ini dan mana yang bukan (atau objek sampel pelatihan mana yang termasuk dalam kelas ini).

Masalah cluster dan analisis konstruktif

Cluster adalah sekelompok objek, kelas atau fitur yang dalam setiap cluster mereka semirip mungkin, dan di antara cluster yang berbeda mereka sedapat mungkin berbeda.

Sebuah konstruksi (dalam konteks yang dibahas di bagian ini) adalah sistem cluster yang berlawanan. Jadi, dalam arti tertentu, konstruk-konstruk tersebut merupakan hasil analisis klaster terhadap klaster-klaster.

Dalam analisis klaster, tingkat persamaan dan perbedaan antar objek (kelas, fitur) diukur secara kuantitatif, dan informasi ini digunakan untuk klasifikasi. Hasil analisis cluster adalah pengklasifikasian objek ke dalam cluster. Klasifikasi ini dapat direpresentasikan dalam bentuk jaringan semantik.

Tugas analisis kognitif

Dalam analisis kognitif, informasi tentang persamaan dan perbedaan antar kelas atau karakteristik menjadi kepentingan peneliti itu sendiri, dan bukan untuk digunakan untuk klasifikasi, seperti dalam analisis cluster dan konstruktif.

Jika ciri yang sama merupakan karakteristik dari dua kelas pengenalan, maka hal ini berkontribusi pada kesamaan kedua kelas tersebut. Jika fitur ini tidak seperti biasanya untuk salah satu kelas, maka ini berkontribusi terhadap perbedaan.

Jika dua ciri berkorelasi satu sama lain, maka dalam arti tertentu keduanya dapat dianggap sebagai satu ciri, dan jika antikorelasi, maka dianggap berbeda. Dengan mempertimbangkan keadaan ini, adanya ciri-ciri yang berbeda pada kelas yang berbeda juga memberikan kontribusi tertentu terhadap persamaan dan perbedaannya.

Hasil analisis kognitif dapat disajikan dalam bentuk diagram kognitif.

Metode pengenalan pola dan karakteristiknya

Prinsip klasifikasi metode pengenalan pola

Pengenalan pola mengacu pada masalah membangun dan menerapkan operasi formal pada representasi numerik atau simbolik objek di dunia nyata atau ideal, yang hasilnya mencerminkan hubungan kesetaraan antara objek-objek tersebut. Hubungan kesetaraan mengungkapkan kepemilikan objek yang dievaluasi ke kelas mana pun, yang dianggap sebagai unit semantik independen.

Saat membangun algoritma pengenalan, kelas kesetaraan dapat ditentukan oleh peneliti yang menggunakan ide-ide bermaknanya sendiri atau menggunakan informasi tambahan eksternal tentang persamaan dan perbedaan objek dalam konteks masalah yang sedang dipecahkan. Kemudian mereka berbicara tentang “pengakuan dengan seorang guru.” Jika tidak, mis. Ketika sistem otomatis memecahkan masalah klasifikasi tanpa menggunakan informasi pelatihan eksternal, kita berbicara tentang klasifikasi otomatis atau “pengenalan tanpa pengawasan.” Kebanyakan algoritma pengenalan pola memerlukan penggunaan daya komputasi yang sangat besar, yang hanya dapat disediakan oleh teknologi komputer berkinerja tinggi.

Berbagai penulis (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, F.E. Temnikov, J. Tu, R. Gonzalez, P. Winston, K. Fu, Ya.Z. Tsypkin, dll) memberikan tipologi metode pengenalan pola yang berbeda. Beberapa penulis membedakan antara metode parametrik, nonparametrik dan heuristik, yang lain mengidentifikasi kelompok metode berdasarkan aliran historis dan tren di bidang ini. Misalnya, dalam karya yang memberikan gambaran akademis tentang metode pengenalan, tipologi metode pengenalan pola berikut digunakan:

  • metode berdasarkan prinsip pemisahan;
  • metode statistik;
  • metode yang dibangun berdasarkan “fungsi potensial”;
  • metode penghitungan peringkat (voting);
  • metode berdasarkan kalkulus proposisional, khususnya pada peralatan aljabar logis.

Klasifikasi ini didasarkan pada perbedaan dalam metode formal pengenalan pola dan oleh karena itu pertimbangan pendekatan heuristik terhadap pengenalan, yang telah dikembangkan secara penuh dan memadai dalam sistem pakar, dihilangkan. Pendekatan heuristik didasarkan pada pengetahuan dan intuisi peneliti yang sulit diformalkan. Dalam hal ini, peneliti sendiri yang menentukan informasi apa dan bagaimana sistem harus digunakan untuk mencapai efek pengenalan yang diperlukan.

Tipologi metode pengenalan yang serupa dengan tingkat detail yang berbeda-beda ditemukan dalam banyak karya tentang pengenalan. Pada saat yang sama, tipologi yang diketahui tidak memperhitungkan satu karakteristik yang sangat signifikan, yang mencerminkan kekhususan cara merepresentasikan pengetahuan tentang suatu bidang subjek menggunakan algoritma pengenalan pola formal.

D.A.Pospelov (1990) mengidentifikasi dua cara utama menyajikan pengetahuan:

  • disengaja, berupa diagram hubungan antar atribut (fitur).
  • ekstensional, menggunakan fakta spesifik (objek, contoh).

Representasi yang disengaja menangkap pola dan hubungan yang menjelaskan struktur data. Sehubungan dengan tugas diagnostik, fiksasi tersebut terdiri dari pendefinisian operasi pada atribut (fitur) objek yang mengarah pada hasil diagnostik yang diperlukan. Representasi yang disengaja diimplementasikan melalui operasi pada nilai atribut dan tidak menyiratkan operasi pada fakta (objek) informasi tertentu.

Pada gilirannya, representasi pengetahuan ekstensional dikaitkan dengan deskripsi dan fiksasi objek tertentu dari bidang subjek dan diimplementasikan dalam operasi, yang elemen-elemennya merupakan objek sebagai sistem integral.

Sebuah analogi dapat ditarik antara representasi pengetahuan yang intens dan ekstensional dan mekanisme yang mendasari aktivitas belahan otak kiri dan kanan manusia. Jika belahan kanan dicirikan oleh representasi prototipe holistik dari dunia sekitarnya, maka belahan kiri beroperasi dengan pola yang mencerminkan hubungan antar atribut dunia ini.

Dua cara mendasar untuk merepresentasikan pengetahuan yang dijelaskan di atas memungkinkan kami mengusulkan klasifikasi metode pengenalan pola berikut:

  • metode yang disengaja berdasarkan operasi dengan fitur.
  • metode ekstensional berdasarkan operasi dengan objek.

Harus ditekankan secara khusus bahwa keberadaan dua (dan hanya dua) kelompok metode pengenalan ini: metode yang beroperasi dengan tanda dan metode yang beroperasi dengan objek, sangatlah alami. Dari sudut pandang ini, tidak satu pun dari metode ini, yang diambil secara terpisah dari yang lain, memungkinkan kita untuk membentuk refleksi yang memadai terhadap bidang studi. Menurut penulis, ada hubungan yang saling melengkapi antara metode ini dalam pengertian N. Bohr, oleh karena itu, sistem pengakuan yang menjanjikan harus memastikan penerapan kedua metode ini, dan bukan sembarang salah satunya.

Dengan demikian, klasifikasi metode pengenalan yang dikemukakan oleh D. A. Pospelov didasarkan pada pola-pola mendasar yang mendasari cara kognisi manusia secara umum, yang menempatkannya pada posisi yang benar-benar istimewa (istimewa) dibandingkan dengan klasifikasi lain, yang dengan latar belakang ini terlihat lebih ringan dan palsu.

Metode yang disengaja

Ciri khas metode intensional adalah bahwa metode tersebut menggunakan berbagai karakteristik fitur dan hubungannya sebagai elemen operasi ketika membangun dan menerapkan algoritma pengenalan pola. Elemen tersebut dapat berupa nilai individual atau interval nilai fitur, nilai rata-rata dan varians, matriks hubungan fitur, dll., di mana tindakan dilakukan, dinyatakan dalam bentuk analitis atau konstruktif. Pada saat yang sama, objek dalam metode ini tidak dianggap sebagai unit informasi integral, tetapi bertindak sebagai indikator untuk menilai interaksi dan perilaku atributnya.

Kelompok metode pengenalan pola yang disengaja sangat luas, dan pembagiannya ke dalam subkelas sampai batas tertentu bersifat kondisional.

Metode berdasarkan estimasi kepadatan distribusi nilai fitur

Metode pengenalan pola ini dipinjam dari teori klasik keputusan statistik, di mana objek penelitian dianggap sebagai realisasi variabel acak multidimensi yang didistribusikan dalam ruang fitur menurut hukum tertentu. Mereka didasarkan pada skema pengambilan keputusan Bayesian yang mengacu pada probabilitas apriori objek yang termasuk dalam kelas tertentu yang dapat dikenali dan kepadatan distribusi bersyarat dari nilai vektor fitur. Metode-metode ini bertujuan untuk menentukan rasio kemungkinan di berbagai area ruang fitur multidimensi.

Sekelompok metode yang didasarkan pada estimasi kepadatan distribusi nilai fitur berhubungan langsung dengan metode analisis diskriminan. Pendekatan Bayesian dalam pengambilan keputusan adalah salah satu metode parametrik yang paling berkembang dalam statistik modern, yang mana ekspresi analitis dari hukum distribusi (dalam hal ini, hukum normal) dianggap diketahui dan hanya sejumlah kecil parameter ( vektor nilai rata-rata dan matriks kovarians) perlu diestimasi.

Kesulitan utama dalam menggunakan metode ini adalah kebutuhan untuk mengingat seluruh sampel pelatihan untuk menghitung perkiraan kepadatan distribusi probabilitas lokal dan sensitivitas yang tinggi terhadap sampel pelatihan yang tidak representatif.

Metode berdasarkan asumsi tentang kelas fungsi keputusan

Dalam kelompok metode ini, bentuk umum fungsi keputusan dianggap diketahui dan fungsi kualitasnya ditentukan. Berdasarkan fungsi ini, perkiraan terbaik dari fungsi keputusan ditemukan dengan menggunakan urutan pelatihan. Yang paling umum adalah representasi fungsi keputusan dalam bentuk polinomial nonlinier linier dan umum. Fungsi kualitas aturan keputusan biasanya dikaitkan dengan kesalahan klasifikasi.

Keuntungan utama metode berdasarkan asumsi kelas fungsi keputusan adalah kejelasan rumusan matematis dari masalah pengenalan sebagai masalah pencarian ekstrem. Keragaman metode dalam kelompok ini dijelaskan oleh beragamnya fungsi kualitas aturan keputusan dan algoritma pencarian ekstrem yang digunakan. Generalisasi dari algoritma yang sedang dipertimbangkan, yang meliputi, khususnya, algoritma Newton, algoritma tipe perceptron, dll., adalah metode pendekatan stokastik.

Kemampuan algoritma pencarian ekstrem gradien, khususnya pada kelompok aturan keputusan linier, telah dipelajari dengan cukup baik. Konvergensi algoritma ini telah dibuktikan hanya pada kasus ketika kelas objek yang dikenali ditampilkan dalam ruang fitur dengan struktur geometris kompak.

Kualitas aturan keputusan yang cukup tinggi dapat dicapai dengan menggunakan algoritma yang tidak memiliki bukti matematis yang ketat mengenai konvergensi solusi ke ekstrem global. Algoritma tersebut mencakup sekelompok besar prosedur pemrograman heuristik yang mewakili arah pemodelan evolusi. Pemodelan evolusioner adalah metode bionik yang dipinjam dari alam. Hal ini didasarkan pada penggunaan mekanisme evolusi yang diketahui untuk menggantikan proses pemodelan bermakna suatu objek kompleks dengan pemodelan fenomenologis evolusinya. Perwakilan pemodelan evolusioner yang terkenal dalam pengenalan pola adalah metode penghitungan argumen kelompok (MGUA). Dasar dari GMDH adalah prinsip pengorganisasian mandiri, dan algoritma GMDH mereproduksi skema seleksi massal.

Namun pencapaian tujuan praktis dalam hal ini tidak dibarengi dengan penggalian pengetahuan baru tentang sifat objek yang dikenali. Kemungkinan mengekstraksi pengetahuan ini, khususnya pengetahuan tentang mekanisme interaksi atribut (fitur), di sini pada dasarnya dibatasi oleh struktur interaksi tersebut, yang ditetapkan dalam bentuk fungsi keputusan yang dipilih.

Metode Boolean

Metode logis pengenalan pola didasarkan pada peralatan aljabar logis dan memungkinkan seseorang untuk beroperasi dengan informasi yang terkandung tidak hanya dalam fitur individu, tetapi juga dalam kombinasi nilai fitur. Dalam metode ini, nilai atribut apa pun dianggap sebagai peristiwa dasar.

Dalam bentuknya yang paling umum, metode logis dapat dicirikan sebagai jenis pencarian melalui sampel pelatihan pola logis dan pembentukan sistem aturan keputusan logis tertentu (misalnya, dalam bentuk konjungsi peristiwa dasar), masing-masing dari yang mempunyai bobot tersendiri. Kelompok metode logis beragam dan mencakup metode dengan kompleksitas dan kedalaman analisis yang berbeda-beda. Untuk fitur dikotomis (Boolean), apa yang disebut pengklasifikasi mirip pohon, metode pengujian buntu, algoritma “Bark”, dll.

Algoritme “Kora”, seperti metode pengenalan pola logis lainnya, cukup intensif secara komputasi, karena diperlukan pencarian yang lengkap saat memilih konjungsi. Oleh karena itu, ketika menggunakan metode logis, tuntutan tinggi ditempatkan pada organisasi proses komputasi yang efisien, dan metode ini bekerja dengan baik dengan dimensi ruang fitur yang relatif kecil dan hanya pada komputer yang kuat.

Metode linguistik (struktural).

Metode linguistik pengenalan pola didasarkan pada penggunaan tata bahasa khusus yang menghasilkan bahasa yang dapat digunakan untuk mendeskripsikan kumpulan properti objek yang dikenali.

Untuk berbagai kelas objek, elemen non-turunan (atom) (subgambar, atribut) dan kemungkinan hubungan di antara mereka diidentifikasi. Tata bahasa mengacu pada aturan untuk membangun objek dari elemen non-turunan ini.

Jadi, setiap objek merupakan kumpulan unsur-unsur non-turunan, yang “terhubung” satu sama lain dengan satu atau lain cara, atau dengan kata lain, melalui “kalimat” dari suatu “bahasa”. Saya ingin menekankan secara khusus nilai ideologis yang sangat signifikan dari pemikiran ini.

Dengan mengurai sebuah “kalimat” secara sintaksis, seseorang dapat menentukan “kebenaran” sintaksisnya atau, secara ekuivalen, apakah suatu tata bahasa tetap yang mendeskripsikan suatu kelas dapat menghasilkan deskripsi suatu objek yang ada.

Namun, tugas merekonstruksi (mendefinisikan) tata bahasa dari sekumpulan pernyataan (kalimat – deskripsi objek) tertentu yang menghasilkan bahasa tertentu sulit untuk diformalkan.

Metode ekstensional

Dalam metode kelompok ini, berbeda dengan arah intensional, setiap objek yang diteliti, pada tingkat yang lebih besar atau lebih kecil, diberikan signifikansi diagnostik independen. Pada intinya, metode ini dekat dengan pendekatan klinis, yang menganggap manusia bukan sebagai rangkaian objek yang diberi peringkat berdasarkan satu indikator atau lainnya, tetapi sebagai sistem integral, yang masing-masing bersifat individual dan memiliki nilai diagnostik khusus. Sikap hati-hati terhadap objek penelitian tidak memungkinkan untuk mengecualikan atau menghilangkan informasi tentang setiap objek individu, yang terjadi ketika menggunakan metode pengarahan yang disengaja yang menggunakan objek hanya untuk mendeteksi dan mencatat pola perilaku atributnya.

Operasi utama dalam pengenalan pola dengan menggunakan metode yang dibahas adalah operasi penentuan persamaan dan perbedaan suatu objek. Objek dalam kelompok metode tertentu memainkan peran preseden diagnostik. Selain itu, tergantung pada kondisi tugas tertentu, peran preseden individu dapat bervariasi dalam batas yang paling luas: dari yang utama dan menentukan hingga partisipasi yang sangat tidak langsung dalam proses pengakuan. Pada gilirannya, kondisi masalah mungkin memerlukan partisipasi sejumlah preseden diagnostik yang berbeda untuk penyelesaian yang berhasil: dari satu di setiap kelas yang dikenali hingga ukuran sampel penuh, serta metode berbeda untuk menghitung ukuran persamaan dan perbedaan objek. . Persyaratan ini menjelaskan pembagian lebih lanjut dari metode ekstensional ke dalam subkelas.

Metode perbandingan dengan prototipe

Ini adalah metode pengenalan ekstensional yang paling sederhana. Ini digunakan, misalnya, ketika kelas-kelas yang dikenali ditampilkan dalam ruang fitur dengan pengelompokan geometris yang kompak. Dalam hal ini, biasanya pusat pengelompokan geometri kelas (atau objek yang paling dekat dengan pusat) dipilih sebagai titik prototipe.

Untuk mengklasifikasikan objek yang tidak diketahui, ditemukan prototipe terdekat dan objek tersebut termasuk dalam kelas yang sama dengan prototipe ini. Jelasnya, tidak ada gambar kelas umum yang dihasilkan dalam metode ini.

Berbagai jenis jarak dapat digunakan sebagai ukuran kedekatan. Seringkali, untuk fitur dikotomis, jarak Hamming digunakan, yang dalam hal ini sama dengan kuadrat jarak Euclidean. Dalam hal ini, aturan keputusan untuk mengklasifikasikan objek setara dengan fungsi keputusan linier.

Fakta ini harus diperhatikan secara khusus. Ini dengan jelas menunjukkan hubungan antara prototipe dan representasi atribut informasi tentang struktur data. Dengan menggunakan representasi di atas, misalnya, seseorang dapat mempertimbangkan skala pengukuran tradisional, yang merupakan fungsi linier dari nilai karakteristik dikotomis, sebagai prototipe diagnostik hipotetis. Pada gilirannya, jika analisis struktur spasial kelas yang dikenali memungkinkan kita untuk menarik kesimpulan tentang kekompakan geometrisnya, maka cukup mengganti masing-masing kelas ini dengan satu prototipe, yang sebenarnya setara dengan model diagnostik linier.

Dalam praktiknya, tentu saja, situasinya seringkali berbeda dengan contoh ideal yang digambarkan. Seorang peneliti yang bermaksud menerapkan metode pengenalan berdasarkan perbandingan dengan kelas diagnostik prototipe menghadapi masalah yang sulit.

Pertama, pilihan ukuran kedekatan (metrik), yang secara signifikan dapat mengubah konfigurasi spasial sebaran objek. Kedua, masalah independen adalah analisis struktur multidimensi data eksperimen. Kedua masalah ini sangat akut bagi peneliti dalam kondisi ruang fitur berdimensi tinggi, yang merupakan karakteristik dari masalah nyata.

k metode tetangga terdekat

Metode k-nearest neighbour untuk memecahkan masalah analisis diskriminan pertama kali diusulkan pada tahun 1952. Ini adalah sebagai berikut.

Saat mengklasifikasikan objek yang tidak diketahui, ditemukan bilangan tertentu (k) yang secara geometris paling dekat dengannya dalam ruang fitur objek lain (tetangga terdekat) dengan keanggotaan yang sudah diketahui dalam kelas yang dikenali. Keputusan untuk menetapkan objek yang tidak diketahui ke kelas diagnostik tertentu dibuat dengan menganalisis informasi tentang afiliasi yang diketahui dari tetangga terdekatnya, misalnya, menggunakan penghitungan suara sederhana.

Awalnya, metode k-tetangga terdekat dianggap sebagai metode nonparametrik untuk memperkirakan rasio kemungkinan. Untuk metode ini, perkiraan teoritis efektivitasnya diperoleh dibandingkan dengan pengklasifikasi Bayesian yang optimal. Telah terbukti bahwa probabilitas kesalahan asimtotik untuk metode k-nearest neighbours melebihi kesalahan aturan Bayes tidak lebih dari dua kali lipat.

Saat menggunakan metode k-nearest neighbours untuk pengenalan pola, peneliti harus memecahkan masalah sulit dalam memilih metrik untuk menentukan kedekatan objek yang didiagnosis. Masalah ini dalam kondisi ruang fitur berdimensi tinggi menjadi sangat buruk karena kompleksitas metode ini yang cukup, yang menjadi signifikan bahkan untuk komputer berperforma tinggi. Oleh karena itu, di sini, seperti halnya metode perbandingan dengan prototipe, masalah kreatif dalam menganalisis struktur multidimensi data eksperimen perlu dipecahkan untuk meminimalkan jumlah objek yang mewakili kelas diagnostik.

Kebutuhan untuk mengurangi jumlah objek dalam sampel pelatihan (preseden diagnostik) merupakan kelemahan metode ini, karena mengurangi keterwakilan sampel pelatihan.

Algoritma untuk menghitung peringkat (“voting”)

Prinsip pengoperasian algoritma perhitungan penilaian (ABO) adalah menghitung prioritas (skor kesamaan) yang mencirikan “kedekatan” objek yang dikenali dan direferensikan menurut sistem ansambel fitur, yang merupakan sistem himpunan bagian dari sekumpulan fitur tertentu. .

Tidak seperti semua metode yang dibahas sebelumnya, algoritma untuk menghitung perkiraan beroperasi dengan deskripsi objek dengan cara yang secara fundamental baru. Untuk algoritme ini, objek ada secara bersamaan di subruang yang sangat berbeda dari ruang fitur. Kelas ABO mengambil ide penggunaan fitur pada kesimpulan logisnya: karena tidak selalu diketahui kombinasi fitur mana yang paling informatif, maka di ABO derajat kemiripan objek dihitung dengan membandingkan semua kombinasi fitur yang mungkin atau spesifik. fitur yang termasuk dalam deskripsi objek.

Penulis menyebut kombinasi fitur (subruang) yang digunakan sebagai himpunan pendukung atau himpunan deskripsi parsial suatu objek. Konsep kedekatan umum antara objek yang dikenali dan objek sampel pelatihan (dengan klasifikasi yang diketahui), yang disebut objek referensi, diperkenalkan. Kedekatan ini diwakili oleh kombinasi kedekatan objek yang dikenali dengan objek referensi, dihitung berdasarkan kumpulan deskripsi parsial. Dengan demikian, ABO merupakan perpanjangan dari metode k-nearest neighbours, dimana kedekatan objek hanya dipertimbangkan dalam satu ruang fitur tertentu.

Perpanjangan lain dari ABO adalah bahwa dalam algoritma ini tugas menentukan persamaan dan perbedaan objek dirumuskan sebagai parametrik dan tahap pengaturan ABO berdasarkan set pelatihan disorot, di mana nilai optimal dari yang dimasukkan parameter dipilih. Kriteria kualitasnya adalah kesalahan pengenalan, dan secara harfiah semuanya diparameterisasi:

  • aturan untuk menghitung kedekatan suatu benda berdasarkan karakteristik individu;
  • aturan untuk menghitung kedekatan objek dalam subruang fitur;
  • tingkat pentingnya objek referensi tertentu sebagai preseden diagnostik;
  • pentingnya kontribusi setiap kumpulan fitur referensi terhadap penilaian akhir kemiripan objek yang dikenali dengan kelas diagnostik mana pun.

Parameter ABO ditentukan dalam bentuk nilai ambang batas dan (atau) sebagai bobot komponen yang ditentukan.

Kemampuan teoritis AVO setidaknya tidak lebih rendah dari algoritma pengenalan pola lainnya, karena dengan bantuan AVO semua operasi yang mungkin dilakukan dengan objek yang diteliti dapat diimplementasikan.

Namun, seperti yang biasanya terjadi, perluasan kemampuan potensial menemui kesulitan besar dalam implementasi praktisnya, terutama pada tahap konstruksi (penyetelan) algoritma jenis ini.

Beberapa kesulitan telah disebutkan sebelumnya ketika membahas metode k-nearest neighbours, yang dapat diartikan sebagai versi ABO yang terpotong. Hal ini juga dapat dipertimbangkan dalam bentuk parametrik dan mengurangi masalah menjadi menemukan metrik tertimbang dari jenis yang dipilih. Pada saat yang sama, di sini, untuk masalah berdimensi tinggi, muncul pertanyaan dan masalah teoretis yang kompleks terkait dengan pengorganisasian proses komputasi yang efektif.

Untuk AVO, jika Anda mencoba menggunakan kemampuan algoritma ini semaksimal mungkin, kesulitan ini akan meningkat berkali-kali lipat.

Permasalahan yang disebutkan menjelaskan bahwa dalam praktiknya, penggunaan ABO untuk menyelesaikan permasalahan berdimensi tinggi disertai dengan pengenalan beberapa batasan dan asumsi heuristik. Secara khusus, ada contoh penggunaan ABO dalam psikodiagnostik, di mana jenis ABO diuji, yang sebenarnya setara dengan metode k-nearest neighbours.

Kolektif Aturan Keputusan

Untuk melengkapi tinjauan kita tentang metode pengenalan pola, mari kita lihat satu pendekatan lagi. Inilah yang disebut dengan kelompok aturan pengambilan keputusan (DRGs).

Karena algoritme pengenalan yang berbeda memanifestasikan dirinya secara berbeda pada sampel objek yang sama, pertanyaan yang muncul tentu saja tentang aturan keputusan sintetik yang secara adaptif menggunakan kekuatan algoritme ini. Aturan keputusan sintetik menggunakan skema pengakuan dua tingkat. Pada tingkat pertama, algoritma pengenalan pribadi beroperasi, yang hasilnya digabungkan pada tingkat kedua dalam blok sintesis. Metode penyatuan yang paling umum didasarkan pada identifikasi bidang kompetensi algoritma tertentu. Cara paling sederhana untuk menemukan bidang kompetensi adalah dengan membagi ruang atribut secara apriori berdasarkan pertimbangan profesional suatu ilmu tertentu (misalnya, mengelompokkan sampel menurut atribut tertentu). Kemudian, untuk setiap area yang dipilih, algoritma pengenalannya sendiri dibangun. Metode lain didasarkan pada penggunaan analisis formal untuk menentukan area lokal dari ruang fitur sebagai lingkungan objek yang dikenali dimana keberhasilan algoritma pengenalan tertentu telah terbukti.

Pendekatan paling umum untuk membangun blok sintesis mempertimbangkan indikator yang dihasilkan dari algoritma tertentu sebagai karakteristik awal untuk membangun aturan keputusan umum yang baru. Dalam hal ini, semua metode arah intensional dan ekstensional di atas dalam pengenalan pola dapat digunakan. Efektif untuk memecahkan masalah pembuatan seperangkat aturan keputusan adalah algoritma logis dari tipe "Kora" dan algoritma untuk menghitung perkiraan (ABO), yang membentuk dasar dari apa yang disebut pendekatan aljabar, yang menyediakan studi dan deskripsi konstruktif dari algoritma pengenalan, yang sesuai dengan semua jenis algoritma yang ada.

Analisis komparatif metode pengenalan pola

Mari kita bandingkan metode pengenalan pola yang dijelaskan di atas dan evaluasi tingkat kecukupannya terhadap persyaratan yang dirumuskan dalam Bagian 3.3.3 untuk model SDA untuk sistem kontrol otomatis adaptif untuk sistem yang kompleks.

Untuk menyelesaikan permasalahan nyata dari kelompok metode intensional, metode parametrik dan metode berdasarkan usulan tentang bentuk fungsi keputusan mempunyai nilai praktis. Metode parametrik membentuk dasar metodologi tradisional untuk menyusun indikator. Penerapan metode ini dalam masalah nyata dikaitkan dengan penerapan pembatasan yang kuat pada struktur data, yang mengarah pada model diagnostik linier dengan perkiraan parameternya yang sangat kasar. Bila menggunakan metode berdasarkan asumsi bentuk fungsi keputusan, peneliti juga terpaksa beralih ke model linier. Hal ini disebabkan oleh tingginya dimensi ruang fitur, karakteristik masalah nyata, yang ketika derajat fungsi keputusan polinomial meningkat, memberikan peningkatan besar dalam jumlah anggotanya dengan peningkatan kualitas pengenalan yang bermasalah. Jadi, dengan memproyeksikan area penerapan potensial metode pengenalan intens ke dalam masalah nyata, kami memperoleh gambaran yang sesuai dengan metodologi tradisional model diagnostik linier yang dikembangkan dengan baik.

Sifat-sifat model diagnostik linier, di mana indikator diagnostik diwakili oleh jumlah tertimbang dari karakteristik awal, telah dipelajari dengan baik. Hasil model ini (dengan normalisasi yang sesuai) diinterpretasikan sebagai jarak dari objek yang diteliti ke suatu hyperplane di ruang fitur atau, dengan kata lain, sebagai proyeksi objek ke suatu garis lurus di ruang tersebut. Oleh karena itu, model linier hanya memadai untuk konfigurasi geometris sederhana dari area ruang fitur di mana objek dari kelas diagnostik berbeda dipetakan. Dengan distribusi yang lebih kompleks, model ini pada dasarnya tidak dapat mencerminkan banyak fitur struktur data eksperimen. Pada saat yang sama, fitur tersebut dapat memberikan informasi diagnostik yang berharga.

Pada saat yang sama, kemunculan struktur multidimensi sederhana dalam masalah nyata (khususnya, distribusi normal multidimensi) harus dianggap sebagai pengecualian daripada sebagai aturan. Seringkali kelas diagnostik dibentuk berdasarkan kriteria eksternal yang kompleks, yang secara otomatis memerlukan heterogenitas geometris kelas-kelas ini dalam ruang fitur. Hal ini terutama berlaku untuk kriteria “vital”, yang paling sering ditemui dalam praktik. Dalam kondisi seperti itu, penggunaan model linier hanya menangkap pola informasi eksperimental yang paling “kasar”.

Penggunaan metode ekstensional tidak dikaitkan dengan asumsi apa pun tentang struktur informasi eksperimen, kecuali bahwa di dalam kelas yang dikenali harus ada satu atau lebih kelompok objek yang agak mirip, dan objek dari kelas yang berbeda harus agak berbeda satu sama lain. Jelasnya, untuk ukuran sampel pelatihan apa pun yang terbatas (dan tidak bisa yang lain), persyaratan ini selalu dipenuhi hanya karena alasan adanya perbedaan acak antar objek. Sebagai ukuran kemiripan, digunakan berbagai ukuran kedekatan (jarak) objek dalam ruang fitur. Oleh karena itu, penggunaan metode pengenalan pola ekstensional yang efektif bergantung pada seberapa baik ukuran kedekatan yang ditentukan ditentukan, serta objek sampel pelatihan mana (objek dengan klasifikasi yang diketahui) yang berfungsi sebagai preseden diagnostik. Solusi yang berhasil untuk masalah ini memberikan hasil yang mendekati batas efisiensi pengenalan yang dapat dicapai secara teoritis.

Keuntungan dari metode pengenalan pola ekstensional diimbangi, pertama-tama, oleh kompleksitas teknis yang tinggi dalam implementasi praktisnya. Untuk ruang fitur berdimensi tinggi, tugas yang tampaknya sederhana yaitu menemukan pasangan titik terdekat menjadi masalah serius. Selain itu, banyak penulis mencatat sebagai suatu masalah kebutuhan untuk mengingat sejumlah besar objek yang mewakili kelas yang dikenali.

Hal ini sendiri bukan merupakan masalah, tetapi dianggap sebagai masalah (misalnya, dalam metode k-nearest neighbours) karena ketika setiap objek dikenali, semua objek di set pelatihan akan dicari secara lengkap.

Oleh karena itu, disarankan untuk menerapkan model sistem pengenalan di mana masalah penghitungan lengkap objek dalam sampel pelatihan selama pengenalan dihilangkan, karena ini dilakukan hanya sekali ketika menghasilkan gambar umum dari kelas pengenalan. Selama pengenalan itu sendiri, objek yang diidentifikasi hanya dibandingkan dengan gambar umum dari kelas pengenalan, yang jumlahnya tetap dan sepenuhnya tidak bergantung pada ukuran sampel pelatihan. Pendekatan ini memungkinkan Anda untuk meningkatkan ukuran sampel pelatihan hingga kualitas gambar umum berkualitas tinggi yang diperlukan tercapai, tanpa rasa takut bahwa hal ini dapat menyebabkan peningkatan waktu pengenalan yang tidak dapat diterima (karena waktu pengenalan dalam model ini tidak bergantung pada ukuran sampel pelatihan sama sekali).

Masalah teoritis dalam penggunaan metode pengenalan ekstensional dikaitkan dengan masalah pencarian kelompok fitur yang informatif, menemukan metrik yang optimal untuk mengukur persamaan dan perbedaan objek, dan menganalisis struktur informasi eksperimental. Pada saat yang sama, keberhasilan pemecahan masalah ini memungkinkan tidak hanya untuk membangun algoritma pengenalan yang efektif, tetapi juga untuk melakukan transisi dari pengetahuan ekstensional tentang fakta empiris ke pengetahuan yang disengaja tentang pola strukturnya.

Transisi dari pengetahuan ekstensional ke intensional terjadi pada tahap ketika algoritma pengenalan formal telah dibangun dan efektivitasnya telah dibuktikan. Kemudian mekanisme yang mencapai efisiensi yang dihasilkan dipelajari. Kajian semacam itu, terkait dengan analisis struktur geometri data, misalnya dapat mengarah pada kesimpulan bahwa cukup mengganti objek yang mewakili kelas diagnostik tertentu dengan satu perwakilan tipikal (prototipe). Hal ini setara, seperti disebutkan di atas, dengan menentukan skala diagnostik linier tradisional. Mungkin juga cukup dengan mengganti setiap kelas diagnostik dengan beberapa objek, yang dikonsep sebagai perwakilan khas dari beberapa subkelas, yang setara dengan membuat kipas skala linier. Ada opsi lain yang akan dibahas di bawah.

Dengan demikian, tinjauan metode pengenalan menunjukkan bahwa sejumlah metode pengenalan pola yang berbeda kini telah dikembangkan secara teoritis. Literatur memberikan klasifikasi rinci tentang mereka. Namun, untuk sebagian besar metode ini tidak ada implementasi perangkat lunak, dan hal ini sangat wajar, bahkan bisa dikatakan “ditentukan sebelumnya” oleh karakteristik metode pengenalan itu sendiri. Hal ini dapat dilihat dari fakta bahwa sistem seperti itu jarang disebutkan dalam literatur khusus dan sumber informasi lainnya.

Akibatnya, pertanyaan tentang penerapan praktis metode pengenalan teoretis tertentu untuk memecahkan masalah praktis dengan dimensi data nyata (yaitu cukup signifikan) dan pada komputer modern yang nyata masih kurang berkembang.

Keadaan di atas dapat dipahami jika kita mengingat bahwa kompleksitas model matematika secara eksponensial meningkatkan kompleksitas implementasi perangkat lunak dari sistem dan pada tingkat yang sama mengurangi kemungkinan bahwa sistem ini akan berfungsi secara praktis. Artinya, pada kenyataannya hanya sistem perangkat lunak yang didasarkan pada model matematika yang cukup sederhana dan “transparan” yang dapat diimplementasikan di pasar. Oleh karena itu, seorang pengembang yang tertarik untuk mereplikasi produk perangkat lunaknya mendekati masalah pemilihan model matematika bukan dari sudut pandang ilmiah murni, tetapi sebagai seorang pragmatis, dengan mempertimbangkan kemungkinan implementasi perangkat lunak. Ia percaya bahwa model tersebut harus sesederhana mungkin, yang berarti model tersebut harus diterapkan dengan biaya yang lebih rendah dan kualitas yang lebih baik, dan juga harus berhasil (efektif secara praktis).

Dalam hal ini, tugas penerapan dalam sistem pengenalan suatu mekanisme untuk menggeneralisasi deskripsi objek yang termasuk dalam kelas yang sama tampaknya sangat relevan, yaitu. mekanisme pembentukan gambar umum yang kompak. Jelasnya, mekanisme generalisasi seperti itu akan memungkinkan untuk "mengompresi" sampel pelatihan dari dimensi apa pun ke database gambar umum yang diketahui sebelumnya berdasarkan dimensi. Hal ini juga akan memungkinkan untuk mengajukan dan memecahkan sejumlah masalah yang bahkan tidak dapat dirumuskan dalam metode pengenalan seperti metode perbandingan dengan prototipe, metode k-nearest neighbours dan ABO.

Inilah tugasnya:

  • menentukan kontribusi informasi fitur terhadap potret informasi dari gambar yang digeneralisasi;
  • analisis konstruktif cluster dari gambar umum;
  • penentuan muatan semantik suatu fitur;
  • analisis fitur cluster-konstruktif semantik;
  • perbandingan yang bermakna dari gambaran umum kelas satu sama lain dan karakteristik satu sama lain (diagram kognitif, termasuk diagram Merlin).

Metode yang memungkinkan tercapainya solusi terhadap masalah-masalah ini juga membedakan sistem yang menjanjikan berdasarkan sistem tersebut dari sistem lain, seperti halnya kompiler berbeda dari penerjemah, karena berkat pembentukan gambaran umum dalam sistem yang menjanjikan ini, kemandirian waktu pengenalan dari ukuran sampel pelatihan tercapai. Diketahui bahwa keberadaan ketergantungan inilah yang menyebabkan biaya waktu komputer yang secara praktis tidak dapat diterima untuk pengenalan dalam metode seperti metode k-tetangga terdekat, ABO dan KRP pada dimensi sampel pelatihan ketika kita dapat berbicara tentang statistik yang memadai .

Untuk menyimpulkan gambaran singkat tentang metode pengenalan, mari kita sajikan intisari di atas dalam tabel ringkasan (Tabel 3.1), yang berisi uraian singkat berbagai metode pengenalan pola menurut parameter berikut:

  • klasifikasi metode pengenalan;
  • bidang penerapan metode pengenalan;
  • klasifikasi keterbatasan metode pengenalan.
Klasifikasi metode pengenalan Daerah aplikasi Keterbatasan (kekurangan)
Metode pengenalan intensif Metode berdasarkan perkiraan kepadatan distribusi nilai fitur (atau persamaan dan perbedaan objek) Masalah dengan distribusi yang diketahui, biasanya normal, memerlukan kumpulan statistik yang banyak Kebutuhan untuk menghitung seluruh sampel pelatihan selama pengenalan, sensitivitas tinggi terhadap non-representatif sampel pelatihan dan artefak
Metode berdasarkan asumsi tentang kelas fungsi keputusan Kelas-kelas harus dapat dipisahkan dengan baik, sistem fitur harus ortonormal Jenis fungsi keputusan harus diketahui terlebih dahulu. Ketidakmampuan untuk memperhitungkan pengetahuan baru tentang korelasi antar sifat
Metode Boolean Saat memilih aturan keputusan logis (konjungsi), diperlukan pencarian yang lengkap. Kompleksitas komputasi yang tinggi
Metode linguistik (struktural). Masalah dimensi ruang fitur yang kecil Tugas merekonstruksi (mendefinisikan) tata bahasa dari sekumpulan pernyataan (deskripsi objek) tertentu sulit untuk diformalkan. Masalah teoritis yang belum terpecahkan
Metode pengenalan ekstensional Metode perbandingan dengan prototipe Masalah dimensi ruang fitur yang kecil Ketergantungan hasil klasifikasi yang tinggi terhadap ukuran jarak (metrik). Metrik optimal tidak diketahui
k metode tetangga terdekat Ketergantungan hasil klasifikasi yang tinggi terhadap ukuran jarak (metrik). Perlunya pencacahan lengkap sampel pelatihan selama pengenalan. Upaya komputasi
Algoritma untuk menghitung rating (voting) AVO Masalah berdimensi kecil dari segi jumlah kelas dan fitur Ketergantungan hasil klasifikasi pada ukuran jarak (metrik). Perlunya pencacahan lengkap sampel pelatihan selama pengenalan. Kompleksitas teknis yang tinggi dari metode ini
Kolektif Aturan Keputusan (DRC) Masalah berdimensi kecil dari segi jumlah kelas dan fitur Kompleksitas teknis metode yang sangat tinggi, banyaknya permasalahan teoritis yang belum terpecahkan, baik dalam menentukan bidang kompetensi metode privat maupun dalam metode privat itu sendiri

Tabel 3.1 — Tabel ringkasan klasifikasi metode pengenalan, perbandingan bidang penerapan dan keterbatasannya

Peran dan tempat pengenalan pola dalam otomatisasi pengendalian sistem yang kompleks

Sistem kendali otomatis terdiri dari dua bagian utama: objek kendali dan sistem kendali.

Sistem kontrol melakukan fungsi-fungsi berikut:

  • identifikasi keadaan objek penguasaan;
  • pengembangan tindakan pengendalian berdasarkan tujuan pengelolaan, dengan memperhatikan keadaan objek pengendalian dan lingkungan;
  • memberikan pengaruh kendali pada objek kendali.

Pengenalan pola tidak lebih dari mengidentifikasi keadaan suatu objek.

Oleh karena itu, kemungkinan penggunaan sistem pengenalan pola pada tahap mengidentifikasi keadaan objek kontrol tampak cukup jelas dan wajar. Namun, hal ini mungkin tidak diperlukan. Oleh karena itu, timbul pertanyaan dalam kasus mana disarankan untuk menggunakan sistem pengenalan dalam sistem kontrol otomatis dan dalam kasus mana tidak.

Menurut literatur, banyak sistem kontrol otomatis yang dikembangkan sebelumnya dan modern dalam subsistem untuk mengidentifikasi keadaan objek kontrol dan mengembangkan tindakan kontrol menggunakan model matematika deterministik dari "perhitungan langsung", yang secara jelas dan sederhana menentukan apa yang harus dilakukan dengan kontrol. objek jika memiliki parameter eksternal tertentu.

Pada saat yang sama, pertanyaan tentang bagaimana parameter ini berhubungan dengan keadaan tertentu dari objek kontrol tidak diajukan atau diselesaikan. Posisi ini sesuai dengan sudut pandang bahwa “secara default” hubungan satu-ke-satu mereka diterima. Oleh karena itu, istilah “parameter objek kontrol” dan “keadaan objek kontrol” dianggap sebagai sinonim, dan konsep “keadaan objek kontrol” tidak diperkenalkan secara eksplisit sama sekali. Namun, jelas bahwa dalam kasus umum, hubungan antara parameter yang dapat diamati dari objek kontrol dan keadaannya bersifat dinamis dan probabilistik.

Jadi, sistem kendali otomatis tradisional pada dasarnya adalah sistem kendali parametrik, yaitu. sistem yang tidak mengatur keadaan objek kontrol, tetapi hanya parameter yang dapat diamati. Keputusan tentang tindakan pengendalian dibuat dalam sistem seolah-olah “secara membabi buta”, yaitu. tanpa membentuk gambaran holistik tentang objek kendali dan lingkungan pada keadaannya saat ini, serta tanpa meramalkan perkembangan lingkungan dan reaksi objek kendali terhadap pengaruh kendali tertentu terhadapnya, bertindak bersamaan dengan pengaruh lingkungan yang diperkirakan. .

Dari perspektif yang dikembangkan dalam penelitian ini, istilah “pengambilan keputusan” dalam pengertian modern hampir tidak sepenuhnya dapat diterapkan pada sistem kendali otomatis tradisional. Faktanya adalah bahwa “pengambilan keputusan”, setidaknya, mengandaikan visi holistik dari suatu objek di lingkungan, tidak hanya dalam keadaan saat ini, tetapi juga dalam dinamika, dan dalam interaksi baik satu sama lain maupun dengan sistem kendali, melibatkan mempertimbangkan berbagai pilihan alternatif untuk pengembangan keseluruhan sistem ini, serta mempersempit keragaman (pengurangan) alternatif tersebut berdasarkan kriteria sasaran tertentu. Jelas, semua ini tidak ditemukan dalam sistem kendali otomatis tradisional, atau memang ada, tetapi dalam bentuk yang disederhanakan.

Tentu saja, metode tradisional sudah memadai dan penggunaannya cukup tepat dan dapat dibenarkan dalam kasus di mana objek kendali benar-benar merupakan sistem yang stabil dan ditentukan secara ketat, dan pengaruh lingkungan terhadapnya dapat diabaikan.

Namun, dalam kasus lain cara ini tidak efektif.

Jika objek kontrol bersifat dinamis, maka model yang mendasari algoritma kontrol dengan cepat menjadi tidak memadai, karena hubungan antara parameter input dan output, serta kumpulan parameter penting itu sendiri, berubah. Intinya, ini berarti bahwa sistem kendali otomatis tradisional mampu mengendalikan keadaan objek kendali hanya di dekat titik keseimbangan melalui tindakan kendali yang lemah terhadapnya, yaitu. dengan metode gangguan kecil. Jauh dari keadaan setimbang, dari sudut pandang tradisional, perilaku objek kendali terlihat tidak dapat diprediksi dan tidak dapat dikendalikan.

Jika tidak ada hubungan yang jelas antara parameter input dan output dari objek kontrol (yaitu antara parameter input dan keadaan objek), dengan kata lain, jika hubungan ini memiliki sifat probabilistik yang jelas, maka model deterministik di mana itu adalah diasumsikan bahwa hasil pengukuran suatu parameter tertentu hanya berupa angka pada awalnya tidak dapat diterapkan. Selain itu, jenis hubungan ini mungkin tidak diketahui, dan kemudian kita perlu melanjutkan dari asumsi paling umum: bersifat probabilistik atau tidak terdefinisi sama sekali.

Sistem kontrol otomatis yang dibangun berdasarkan prinsip tradisional hanya dapat bekerja berdasarkan parameter, yang pola hubungannya telah diketahui, dipelajari, dan tercermin dalam model matematika. Dalam penelitian ini, tugasnya adalah mengembangkan metode perancangan otomatis sistem kendali yang memungkinkan terciptanya sistem yang mampu mengidentifikasi parameter paling signifikan, dan menentukan sifat hubungan antara parameter tersebut dan keadaan objek kendali.

Dalam hal ini, perlu menggunakan metode pengukuran yang lebih maju dan sesuai dengan situasi nyata:

  • klasifikasi atau pengenalan gambar (pembelajaran berdasarkan sampel pelatihan, kemampuan beradaptasi algoritma pengenalan, kemampuan beradaptasi kumpulan kelas dan parameter yang dipelajari, pemilihan parameter paling signifikan dan pengurangan dimensi deskripsi sambil mempertahankan redundansi yang diberikan, dll.);
  • pengukuran statistik, bila hasil pengukuran suatu parameter tertentu bukanlah suatu bilangan tersendiri, melainkan suatu distribusi probabilitas: perubahan suatu variabel statistik tidak berarti perubahan nilainya itu sendiri, melainkan perubahan ciri-ciri distribusi probabilitas. nilai-nilainya.

Akibatnya, sistem kendali otomatis yang didasarkan pada pendekatan deterministik tradisional secara praktis tidak bekerja dengan objek kendali dinamis multi-parameter yang ditentukan secara lemah, seperti, misalnya, sistem sosial-ekonomi makro dan mikro dalam perekonomian dinamis “ masa transisi”, hierarki elit dan kelompok etnis, masyarakat dan pemilih, fisiologi dan jiwa manusia, ekosistem alam dan buatan dan banyak lainnya.

Sangatlah penting bahwa pada pertengahan tahun 80-an, aliran I. Prigogine mengembangkan pendekatan yang menyatakan bahwa perkembangan sistem apa pun (termasuk manusia) berganti periode di mana sistem tersebut berperilaku “kebanyakan deterministik” atau “kebanyakan acak”. Secara alami, sistem kendali yang sebenarnya harus mengendalikan objek kendali secara stabil tidak hanya pada bagian “deterministik” dalam sejarahnya, tetapi juga pada titik-titik ketika perilaku selanjutnya menjadi sangat tidak pasti. Hal ini berarti bahwa perlu untuk mengembangkan pendekatan terhadap sistem kontrol yang perilakunya mengandung unsur keacakan yang besar (atau yang saat ini secara matematis digambarkan sebagai “keacakan”).

Oleh karena itu, sistem kontrol otomatis yang menjanjikan yang memberikan kontrol terhadap sistem multi-parameter dinamis yang kompleks dan deterministik lemah tampaknya akan mencakup, sebagai tautan fungsional penting, subsistem untuk mengidentifikasi dan memprediksi keadaan lingkungan dan objek kontrol, berdasarkan metode kecerdasan buatan (terutama pola). pengakuan), mendukung metode pengambilan keputusan dan teori informasi.

Mari kita pertimbangkan secara singkat masalah penggunaan sistem pengenalan gambar untuk membuat keputusan tentang tindakan pengendalian (masalah ini akan dibahas lebih rinci nanti, karena ini adalah kunci untuk pekerjaan ini). Jika kita mengambil target dan keadaan lain dari objek kontrol sebagai kelas pengenalan, dan faktor-faktor yang mempengaruhinya sebagai fitur, maka ukuran hubungan antara faktor dan keadaan dapat dibentuk dalam model pengenalan pola. Hal ini memungkinkan, untuk keadaan tertentu dari objek pengendalian, untuk memperoleh informasi tentang faktor-faktor yang mendorong atau menghambat transisinya ke keadaan ini, dan, atas dasar ini, untuk mengembangkan keputusan mengenai tindakan pengendalian.

Faktor-faktor tersebut dapat dibagi menjadi beberapa kelompok berikut:

  • mengkarakterisasi latar belakang objek kontrol;
  • mengkarakterisasi keadaan objek kontrol saat ini;
  • faktor lingkungan;
  • faktor teknologi (dapat dikendalikan).

Dengan demikian, sistem pengenalan pola dapat digunakan sebagai bagian dari sistem kendali otomatis: dalam subsistem untuk mengidentifikasi keadaan objek kendali dan mengembangkan tindakan kendali.

Hal ini sesuai bila objek kontrol adalah sistem yang kompleks.

Membuat keputusan tentang tindakan pengendalian dalam sistem kendali otomatis

Solusi untuk masalah sintesis sistem kontrol otomatis adaptif dengan sistem yang kompleks dipertimbangkan dalam pekerjaan ini, dengan mempertimbangkan banyak analogi yang mendalam antara metode pengenalan pola dan pengambilan keputusan.

Di satu sisi, masalah pengenalan pola adalah pengambilan keputusan apakah objek yang dikenali termasuk dalam kelas pengenalan tertentu.

Di sisi lain, penulis mengusulkan untuk mempertimbangkan masalah pengambilan keputusan sebagai masalah decoding terbalik atau masalah pengenalan pola terbalik (lihat bagian 2.2.2).

Kesamaan ide-ide dasar yang mendasari metode pengenalan pola dan pengambilan keputusan menjadi sangat jelas ketika mempertimbangkannya dari perspektif teori informasi.

Berbagai masalah pengambilan keputusan

Pengambilan keputusan sebagai realisasi tujuan

Definisi: pengambilan keputusan (“pilihan”) adalah suatu tindakan atas serangkaian alternatif, sebagai akibatnya rangkaian alternatif awal dipersempit, yaitu. pengurangannya terjadi.

Pilihan adalah tindakan yang memberi tujuan pada semua aktivitas. Melalui tindakan pilihan, subordinasi semua aktivitas pada tujuan tertentu atau serangkaian tujuan yang saling terkait diwujudkan.

Oleh karena itu, agar tindakan pilihan menjadi mungkin, diperlukan hal-hal berikut:

  • menghasilkan atau menemukan serangkaian alternatif yang harus diambil pilihannya;
  • penentuan tujuan pengambilan pilihan;
  • pengembangan dan penerapan metode untuk membandingkan alternatif satu sama lain, yaitu. Menentukan peringkat preferensi untuk setiap alternatif menurut kriteria tertentu yang memungkinkan seseorang menilai secara tidak langsung seberapa baik setiap alternatif sesuai dengan tujuan.

Pekerjaan modern di bidang pendukung keputusan telah mengungkapkan situasi yang khas, yaitu formalisasi lengkap untuk menemukan solusi terbaik (dalam arti tertentu) hanya mungkin untuk masalah yang relatif sederhana yang telah dipelajari dengan baik, sedangkan dalam praktiknya, masalah yang terstruktur lemah adalah mungkin. lebih sering ditemui, yang sama sekali tidak ada algoritma formal yang dikembangkan (kecuali untuk pencarian mendalam dan trial and error). Namun, para profesional yang berpengalaman, kompeten, dan cakap sering kali membuat pilihan yang ternyata cukup baik. Oleh karena itu, tren modern dalam praktik pengambilan keputusan dalam situasi alami adalah menggabungkan kemampuan manusia untuk memecahkan masalah informal dengan kemampuan metode formal dan pemodelan komputer: sistem pendukung keputusan interaktif, sistem pakar, sistem kontrol otomatis manusia-mesin adaptif, jaringan saraf dan sistem kognitif.

Pengambilan keputusan sebagai penghilangan ketidakpastian (pendekatan informasi)

Proses memperoleh informasi dapat dianggap sebagai pengurangan ketidakpastian akibat penerimaan sinyal, dan jumlah informasi dapat dianggap sebagai ukuran kuantitatif tingkat penghilangan ketidakpastian.

Tetapi sebagai hasil dari pemilihan subset alternatif tertentu dari himpunan tersebut, yaitu. akibat pengambilan keputusan terjadi hal yang sama (mengurangi ketidakpastian). Artinya setiap pilihan, setiap keputusan menghasilkan sejumlah informasi tertentu, dan oleh karena itu dapat digambarkan dalam teori informasi.

Klasifikasi masalah pengambilan keputusan

Banyaknya tugas pengambilan keputusan disebabkan oleh kenyataan bahwa setiap komponen situasi di mana keputusan dibuat dapat diimplementasikan dalam pilihan yang berbeda secara kualitatif.

Mari kita daftar beberapa opsi berikut:

  • himpunan alternatif, di satu sisi, dapat berhingga, dapat dihitung, atau kontinu, dan di sisi lain, tertutup (yaitu diketahui sepenuhnya) atau terbuka (termasuk elemen yang tidak diketahui);
  • penilaian terhadap alternatif dapat dilakukan menurut satu atau lebih kriteria, yang pada gilirannya dapat bersifat kuantitatif atau kualitatif;
  • Modus pemilihannya bisa tunggal (satu kali), atau ganda, berulang, termasuk umpan balik atas hasil pilihan, yaitu. memungkinkan pelatihan algoritma pengambilan keputusan dengan mempertimbangkan konsekuensi pemilu sebelumnya;
  • konsekuensi dari pemilihan masing-masing alternatif dapat diketahui secara pasti sebelumnya (pilihan dalam kondisi pasti), bersifat probabilistik bila probabilitas hasil yang mungkin terjadi setelah pilihan dibuat diketahui (pilihan dalam kondisi risiko) atau mempunyai hasil yang ambigu yang tidak diketahui. probabilitas (pilihan dalam kondisi ketidakpastian);
  • tanggung jawab untuk memilih mungkin tidak ada, baik individu atau kelompok;
  • tingkat konsistensi tujuan dalam pilihan kelompok dapat bervariasi dari kepentingan para pihak yang sepenuhnya kebetulan (pilihan kooperatif) hingga kebalikannya (pilihan dalam situasi konflik). Pilihan perantara juga dimungkinkan: kompromi, koalisi, konflik yang berkembang atau memudar.

Berbagai kombinasi dari pilihan-pilihan ini menyebabkan banyak masalah pengambilan keputusan yang telah dipelajari pada tingkat yang berbeda-beda.

Bahasa untuk menggambarkan metode pengambilan keputusan

Fenomena yang satu dan sama dapat dibicarakan dalam berbagai bahasa dengan tingkat umum dan kecukupan yang berbeda-beda. Hingga saat ini, tiga bahasa utama untuk menggambarkan pilihan telah muncul.

Yang paling sederhana, paling berkembang dan populer adalah bahasa kriteria.

Bahasa kriteria

Nama bahasa ini dikaitkan dengan asumsi dasar bahwa setiap alternatif individu dapat dievaluasi dengan beberapa (satu) angka tertentu, setelah itu perbandingan alternatif direduksi menjadi perbandingan angka-angka yang bersesuaian.

Misalkan (X) adalah himpunan alternatif, dan x adalah alternatif tertentu yang termasuk dalam himpunan ini: x∈X. Maka diyakini bahwa untuk semua x suatu fungsi q(x) dapat ditentukan, yang disebut kriteria (kriteria kualitas, fungsi tujuan, fungsi preferensi, fungsi utilitas, dll.), yang memiliki sifat jika alternatif x 1 lebih disukai ke x 2 (dilambangkan: x 1 > x 2), lalu q(x 1) > q(x 2).

Dalam hal ini, pilihannya adalah mencari alternatif dengan nilai fungsi kriteria tertinggi.

Namun, dalam praktiknya, penggunaan hanya satu kriteria untuk membandingkan tingkat preferensi terhadap alternatif ternyata merupakan penyederhanaan yang tidak dapat dibenarkan, karena pertimbangan alternatif yang lebih rinci mengarah pada kebutuhan untuk mengevaluasinya bukan berdasarkan satu, tetapi berdasarkan banyak kriteria, yang mungkin mempunyai sifat yang berbeda dan berbeda secara kualitatif satu sama lain.

Misalnya, ketika memilih jenis pesawat yang paling dapat diterima oleh penumpang dan organisasi pengoperasi pada jenis rute tertentu, perbandingan dilakukan secara bersamaan menurut banyak kelompok kriteria: teknis, teknologi, ekonomi, sosial, ergonomis, dll.

Masalah multikriteria tidak mempunyai solusi umum yang unik. Oleh karena itu, banyak cara yang diusulkan untuk memberikan masalah multikriteria suatu bentuk tertentu yang memungkinkan adanya solusi umum tunggal. Tentu saja, solusi ini umumnya berbeda untuk metode yang berbeda. Oleh karena itu, mungkin hal yang paling penting dalam memecahkan masalah multikriteria adalah pembenaran terhadap formulasi jenis ini.

Berbagai pilihan digunakan untuk menyederhanakan masalah pemilihan multikriteria. Mari kita daftar beberapa di antaranya.

  1. Maksimalisasi bersyarat (tidak ditemukan ekstrem global dari kriteria integral, tetapi ekstrem lokal dari kriteria utama).
  2. Cari alternatif dengan properti tertentu.
  3. Menemukan himpunan Pareto.
  4. Mengurangi masalah multi-kriteria menjadi masalah berkriteria tunggal dengan memperkenalkan kriteria integral.

Mari kita perhatikan lebih detail rumusan formal metode untuk mereduksi masalah multikriteria menjadi masalah kriteria tunggal.

Mari kita perkenalkan kriteria integral q 0 (x) sebagai fungsi skalar dari argumen vektor:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Kriteria integral memungkinkan Anda mengurutkan alternatif berdasarkan nilai q 0, sehingga menyoroti yang terbaik (dalam arti kriteria ini). Bentuk fungsi q 0 ditentukan oleh seberapa spesifik kita membayangkan kontribusi setiap kriteria terhadap kriteria integral. Biasanya fungsi aditif dan perkalian digunakan:

q 0 = ∑a saya ⋅q saya /s saya

1 - q 0 = ∏(1 - b saya ⋅q saya /s saya)

Koefisien yang saya berikan:

  1. Tanpa dimensi atau dimensi tunggal dari bilangan a i ⋅q i /s i (kriteria parsial yang berbeda mungkin memiliki dimensi yang berbeda, dan kemudian operasi aritmatika tidak dapat dilakukan pada kriteria tersebut dan direduksi menjadi kriteria integral).
  2. Normalisasi, yaitu memastikan kondisi: b i ⋅q i /s i<1.

Koefisien a i dan b i mencerminkan kontribusi relatif dari kriteria parsial q i terhadap kriteria integral.

Jadi, dalam rumusan multikriteria, masalah pengambilan keputusan dalam memilih salah satu alternatif direduksi menjadi pemaksimalan kriteria integral:

x * = arg maks(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Masalah utama dalam perumusan multikriteria masalah pengambilan keputusan adalah perlunya mencari bentuk analitis dari koefisien a i dan b i yang dapat memberikan sifat-sifat model sebagai berikut:

  • tingkat kecukupan yang tinggi terhadap bidang studi dan sudut pandang para ahli;
  • kesulitan komputasi minimal dalam memaksimalkan kriteria integral, yaitu. perhitungannya untuk berbagai alternatif;
  • kestabilan hasil pemaksimalan kriteria integral dari gangguan kecil pada data awal.
  • Stabilitas solusi berarti bahwa perubahan kecil pada data awal akan menyebabkan perubahan kecil pada nilai kriteria integral, dan oleh karena itu, menyebabkan perubahan kecil pada keputusan yang diambil. Jadi, jika data awalnya hampir sama, maka keputusan harus diambil sama atau hampir sama.

Bahasa pilihan biner berurutan

Bahasa hubungan biner adalah generalisasi dari bahasa multikriteria dan didasarkan pada fakta bahwa ketika kita mengevaluasi suatu alternatif, evaluasi ini selalu relatif, yaitu. secara eksplisit atau lebih sering secara implisit, alternatif lain dari kumpulan yang diteliti atau dari populasi umum digunakan sebagai dasar atau kerangka acuan untuk perbandingan. Pemikiran manusia didasarkan pada pencarian dan analisis hal-hal yang berlawanan (konstruk), sehingga selalu lebih mudah bagi kita untuk memilih salah satu dari dua pilihan yang berlawanan daripada satu pilihan dari himpunan yang besar dan tidak terurut sama sekali.

Jadi, asumsi dasar bahasa ini adalah sebagai berikut:

  • alternatif terpisah tidak dievaluasi, mis. fungsi kriteria tidak diperkenalkan;
  • untuk setiap pasangan alternatif, dalam beberapa hal dapat ditentukan bahwa salah satu dari alternatif tersebut lebih disukai daripada yang lain atau bahwa alternatif tersebut setara atau tidak dapat dibandingkan;
  • hubungan preferensi pada pasangan alternatif mana pun tidak bergantung pada sisa alternatif yang disajikan untuk dipilih.

Ada berbagai cara untuk menentukan relasi biner: garis lurus, matriks, menggunakan grafik preferensi, metode bagian, dll.

Hubungan antar alternatif suatu pasangan diungkapkan melalui konsep kesetaraan, keteraturan dan dominasi.

Bahasa fungsi seleksi umum

Bahasa fungsi pilihan didasarkan pada teori himpunan dan memungkinkan Anda mengoperasikan peta dari himpunan hingga himpunan bagiannya sesuai dengan pilihan yang berbeda tanpa harus menyebutkan elemennya. Bahasa ini sangat umum dan berpotensi menggambarkan pilihan apa pun. Namun, peralatan matematika fungsi seleksi umum saat ini masih dikembangkan dan diuji terutama pada masalah yang telah diselesaikan dengan menggunakan pendekatan berbasis kriteria atau biner.

Seleksi kelompok

Biarlah ada sekelompok orang yang mempunyai hak untuk berpartisipasi dalam pengambilan keputusan kolektif. Mari kita asumsikan bahwa kelompok ini sedang mempertimbangkan serangkaian alternatif tertentu, dan setiap anggota kelompok membuat pilihannya sendiri. Tugasnya adalah mengembangkan solusi yang dengan cara tertentu mengoordinasikan pilihan individu dan dalam arti tertentu mengungkapkan “pendapat umum” kelompok, yaitu. diterima sebagai pilihan kelompok.

Tentu saja, prinsip-prinsip yang berbeda untuk mengoordinasikan keputusan individu akan sesuai dengan keputusan kelompok yang berbeda.

Aturan untuk mengoordinasikan keputusan individu selama pemilihan kelompok disebut aturan pemungutan suara. Yang paling umum adalah “aturan mayoritas”, di mana alternatif dengan suara terbanyak diterima sebagai keputusan kelompok.

Perlu dipahami bahwa keputusan seperti itu hanya mencerminkan prevalensi sudut pandang yang berbeda dalam kelompok, dan bukan pilihan yang benar-benar optimal, yang tidak dapat dipilih oleh siapa pun sama sekali. “Kebenaran tidak ditentukan melalui pemungutan suara.”

Selain itu, ada yang disebut “paradoks pemungutan suara”, yang paling terkenal adalah paradoks Arrow.

Paradoks-paradoks ini dapat menyebabkan, dan kadang-kadang memang mengarah, pada aspek-aspek yang sangat tidak menyenangkan dalam prosedur pemungutan suara: misalnya, ada kasus-kasus ketika kelompok tidak dapat membuat satu keputusan sama sekali (tidak ada kuorum atau semua orang memilih pilihan unik mereka sendiri, dll.) .), dan terkadang ( dengan pemungutan suara multi-tahap), minoritas dapat memaksakan kehendaknya pada mayoritas.

Pilihan dalam kondisi ketidakpastian

Kepastian merupakan kasus khusus dari ketidakpastian, yaitu: ketidakpastian yang mendekati nol.

Dalam teori pilihan modern, diyakini bahwa ada tiga jenis ketidakpastian utama dalam masalah pengambilan keputusan:

  1. Ketidakpastian informasi (statistik) data awal untuk pengambilan keputusan.
  2. Ketidakpastian akibat pengambilan keputusan (pilihan).
  3. Ketidakjelasan deskripsi komponen proses pengambilan keputusan.

Mari kita lihat secara berurutan.

Ketidakpastian informasi (statistik) dalam sumber data

Data yang diperoleh tentang bidang studi tidak dapat dianggap benar-benar akurat. Selain itu, tentu saja, data ini sendiri tidak menarik bagi kita, tetapi hanya sebagai sinyal yang mungkin membawa informasi tertentu tentang apa yang benar-benar menarik bagi kita. Oleh karena itu, lebih realistis untuk mempertimbangkan bahwa kita berhadapan dengan data yang tidak hanya bermasalah dan tidak akurat, namun juga tidak langsung, dan mungkin tidak lengkap. Selain itu, data ini tidak menyangkut seluruh populasi yang diteliti, namun hanya sebagian tertentu saja, yang sebenarnya dapat kami kumpulkan datanya, namun pada saat yang sama kami ingin menarik kesimpulan tentang keseluruhan populasi, dan kami juga ingin mengetahui tingkat reliabilitas kesimpulan tersebut.

Dalam kondisi seperti ini, teori keputusan statistik digunakan.

Ada dua sumber utama ketidakpastian dalam teori ini. Pertama, tidak diketahui sebaran apa yang diikuti oleh data asli. Kedua, tidak diketahui sebaran apa yang dimiliki himpunan (populasi umum) yang ingin kita tarik kesimpulannya dari himpunan bagiannya yang membentuk data awal.

Prosedur statistik adalah prosedur pengambilan keputusan yang menghilangkan kedua jenis ketidakpastian ini.

Perlu dicatat bahwa ada sejumlah alasan yang menyebabkan penerapan metode statistik yang salah:

  • Kesimpulan statistik, seperti kesimpulan lainnya, selalu mempunyai reliabilitas atau validitas tertentu. Namun, tidak seperti banyak kasus lainnya, keandalan kesimpulan statistik diketahui dan ditentukan selama studi statistik;
  • kualitas solusi yang diperoleh sebagai hasil penerapan prosedur statistik bergantung pada kualitas sumber data;
  • data yang tidak bersifat statistik tidak boleh diproses secara statistik;
  • prosedur statistik yang sesuai dengan tingkat informasi apriori tentang populasi yang diteliti harus digunakan (misalnya, metode ANOVA tidak boleh diterapkan pada data non-Gaussian). Jika sebaran data awal tidak diketahui, maka perlu ditetapkan atau menggunakan beberapa metode berbeda dan membandingkan hasilnya. Jika sangat berbeda, ini menunjukkan tidak dapat diterapkannya beberapa prosedur yang digunakan.

Ketidakpastian konsekuensi

Ketika konsekuensi dari memilih satu atau beberapa alternatif secara jelas ditentukan oleh alternatif itu sendiri, maka kita tidak dapat membedakan antara alternatif tersebut dan konsekuensinya, dengan menganggap bahwa dengan memilih suatu alternatif, kita sebenarnya memilih konsekuensinya.

Namun, dalam praktik nyata, kita sering kali harus menghadapi situasi yang lebih kompleks, ketika pilihan satu atau beberapa alternatif secara ambigu menentukan konsekuensi dari pilihan yang dibuat.

Dalam kasus himpunan alternatif yang terpisah dan hasil pilihannya, asalkan himpunan hasil yang mungkin itu sama untuk semua alternatif, kita dapat berasumsi bahwa berbagai alternatif berbeda satu sama lain dalam distribusi probabilitas hasil. Distribusi probabilitas ini dalam kasus umum mungkin bergantung pada hasil pemilihan alternatif dan hasil aktual yang dihasilkan. Dalam kasus yang paling sederhana, kemungkinan hasilnya sama. Hasil itu sendiri biasanya mempunyai arti untung atau rugi dan dinyatakan secara kuantitatif.

Jika hasilnya sama untuk semua alternatif, maka tidak ada pilihan. Jika alternatifnya berbeda, Anda dapat membandingkan alternatif dengan memberikan perkiraan kuantitatif tertentu untuk alternatif tersebut. Keanekaragaman masalah dalam teori permainan dikaitkan dengan perbedaan pilihan karakteristik numerik kerugian dan keuntungan sebagai akibat dari pemilihan alternatif, perbedaan tingkat konflik antara pihak-pihak yang memilih alternatif, dll.

Anggaplah ketidakpastian seperti ini sebagai ketidakpastian yang samar-samar

Setiap tugas pilihan adalah tugas penyempitan yang ditargetkan dari serangkaian alternatif. Baik deskripsi formal alternatif (daftarnya sendiri, daftar fitur atau parameternya), dan deskripsi aturan perbandingannya (kriteria, hubungan) selalu diberikan dalam satu atau beberapa skala pengukuran (bahkan ketika salah satunya siapa yang melakukan ini tidak tahu tentang ini).

Diketahui bahwa semua skala kabur, tetapi pada tingkat yang berbeda-beda. Istilah “kabur” mengacu pada sifat skala, yang terdiri dari fakta bahwa selalu mungkin untuk menghadirkan dua alternatif yang dapat dibedakan, yaitu. berbeda dalam skala yang sama dan tidak dapat dibedakan, yaitu. identik, di sisi lain - lebih kabur. Semakin sedikit gradasi pada skala tertentu, maka semakin kabur.

Dengan demikian, kita dapat dengan jelas melihat alternatif-alternatif tersebut dan pada saat yang sama mengklasifikasikannya secara samar-samar, yaitu. memiliki ketidakpastian tentang kelas mana yang mereka ikuti.

Dalam karya pertama mereka mengenai pengambilan keputusan dalam situasi yang tidak jelas, Bellman dan Zadeh mengemukakan gagasan bahwa tujuan dan kendala harus direpresentasikan sebagai himpunan fuzzy pada himpunan alternatif.

Tentang beberapa keterbatasan pendekatan optimasi

Dalam semua masalah seleksi dan metode pengambilan keputusan yang dibahas di atas, masalahnya adalah menemukan yang terbaik dalam himpunan awal dalam kondisi tertentu, yaitu. alternatif yang optimal dalam arti tertentu.

Gagasan optimalitas adalah gagasan sentral sibernetika dan telah tertanam kuat dalam praktik perancangan dan pengoperasian sistem teknis. Pada saat yang sama, gagasan ini memerlukan sikap hati-hati ketika kita mencoba menerjemahkannya ke dalam bidang pengelolaan sistem yang kompleks, besar, dan ditentukan secara lemah, seperti misalnya sistem sosial ekonomi.

Ada alasan yang cukup bagus untuk kesimpulan ini. Mari kita lihat beberapa di antaranya:

  1. Solusi optimal seringkali tidak stabil, yaitu perubahan kecil pada kondisi masalah, masukan, atau kendala dapat menyebabkan pemilihan alternatif yang berbeda secara signifikan.
  2. Model optimasi telah dikembangkan hanya untuk kelas sempit dari permasalahan yang cukup sederhana, yang tidak selalu mencerminkan objek kontrol yang sebenarnya secara memadai dan sistematis. Paling sering, metode optimasi memungkinkan optimasi hanya subsistem yang cukup sederhana dan dijelaskan secara formal dari beberapa sistem yang besar dan kompleks, mis. izinkan hanya pengoptimalan lokal. Namun jika setiap subsistem dari suatu sistem yang besar bekerja secara maksimal, hal ini tidak berarti bahwa sistem secara keseluruhan akan bekerja secara maksimal. Oleh karena itu, optimalisasi suatu subsistem tidak selalu mengarah pada perilaku yang diperlukan ketika mengoptimalkan sistem secara keseluruhan. Selain itu, terkadang optimasi lokal dapat menimbulkan konsekuensi negatif bagi sistem secara keseluruhan. Oleh karena itu, dalam melakukan optimasi subsistem dan sistem secara keseluruhan, perlu ditentukan pohon tujuan dan subtujuan serta prioritasnya.
  3. Seringkali, memaksimalkan kriteria optimasi menurut beberapa model matematika dianggap sebagai tujuan optimasi, namun kenyataannya tujuannya adalah untuk mengoptimalkan objek kontrol. Kriteria optimasi dan model matematika selalu berhubungan dengan tujuan hanya secara tidak langsung, yaitu. kurang lebih cukup, tetapi selalu kira-kira.

Jadi, gagasan optimalitas, yang sangat bermanfaat untuk sistem yang dapat diformalkan secara matematis secara memadai, harus ditransfer ke sistem yang kompleks dengan hati-hati. Tentu saja, model matematika yang terkadang diusulkan untuk sistem seperti itu dapat dioptimalkan. Namun, kita harus selalu mempertimbangkan penyederhanaan yang kuat dari model-model ini, yang dalam kasus sistem yang kompleks tidak dapat lagi diabaikan, serta fakta bahwa tingkat kecukupan model-model ini dalam kasus sistem yang kompleks hampir tidak diketahui. . Oleh karena itu, tidak diketahui apa arti praktis dari optimasi ini. Tingginya kepraktisan optimasi dalam sistem teknis seharusnya tidak menimbulkan ilusi bahwa optimasi tersebut akan sama efektifnya ketika mengoptimalkan sistem yang kompleks. Pemodelan matematis yang bermakna dari sistem yang kompleks sangatlah sulit, mendekati dan tidak akurat. Semakin kompleks sistemnya, semakin hati-hati Anda harus mempertimbangkan gagasan untuk mengoptimalkannya.

Oleh karena itu, ketika mengembangkan metode untuk mengendalikan sistem yang kompleks, besar, dan deterministik lemah, penulis mempertimbangkan hal utama tidak hanya optimalitas pendekatan yang dipilih dari sudut pandang matematika formal, tetapi juga kecukupannya terhadap tujuan dan sifat dari sistem tersebut. objek kontrol.

Metode seleksi ahli

Ketika mempelajari sistem yang kompleks, sering kali muncul masalah yang, karena berbagai alasan, tidak dapat dirumuskan dan diselesaikan secara ketat dengan menggunakan peralatan matematika yang dikembangkan saat ini. Dalam kasus ini, jasa ahli (analis sistem) digunakan, yang pengalaman dan intuisinya membantu mengurangi kompleksitas masalah.

Namun, harus diingat bahwa para ahli itu sendiri adalah sistem yang sangat kompleks, dan aktivitas mereka juga bergantung pada banyak kondisi eksternal dan internal. Oleh karena itu, dalam metode pengorganisasian penilaian ahli, banyak perhatian diberikan untuk menciptakan kondisi eksternal dan psikologis yang menguntungkan bagi pekerjaan para ahli.

Pekerjaan seorang ahli dipengaruhi oleh faktor-faktor berikut:

  • tanggung jawab atas penggunaan hasil pemeriksaan;
  • pengetahuan bahwa pakar lain juga terlibat;
  • tersedianya kontak informasi antar ahli;
  • hubungan interpersonal para ahli (jika ada kontak informasi di antara mereka);
  • kepentingan pribadi pakar terhadap hasil penilaian;
  • kualitas pribadi para ahli (kesombongan, konformisme, kemauan, dll.)

Interaksi antar para ahli dapat merangsang sekaligus menekan aktivitas mereka. Oleh karena itu, dalam kasus yang berbeda, metode pemeriksaan yang berbeda digunakan, berbeda dalam sifat interaksi para ahli satu sama lain: survei dan kuesioner anonim dan terbuka, pertemuan, diskusi, permainan bisnis, brainstorming, dll.

Ada berbagai metode untuk pemrosesan matematis dari pendapat para ahli. Para ahli diminta mengevaluasi berbagai alternatif baik dengan menggunakan satu atau suatu sistem indikator. Selain itu, mereka diminta untuk mengevaluasi tingkat pentingnya setiap indikator (“bobot” atau “kontribusinya”). Para ahli itu sendiri juga diberi tingkat kompetensi yang sesuai dengan kontribusi masing-masing terhadap pendapat yang dihasilkan kelompok.

Metodologi yang dikembangkan untuk bekerja dengan para ahli adalah metode Delphi. Gagasan utama metode ini adalah bahwa kritik dan argumentasi mempunyai pengaruh yang menguntungkan bagi ahli jika harga dirinya tidak terpengaruh dan disediakan kondisi yang mengecualikan konfrontasi pribadi.

Perlu ditekankan secara khusus bahwa terdapat perbedaan mendasar dalam sifat penggunaan metode pakar dalam sistem pakar dan dalam pendukung keputusan. Jika dalam kasus pertama para ahli diminta untuk memformalkan metode pengambilan keputusan, maka dalam kasus kedua - hanya keputusan itu sendiri.

Karena para ahli terlibat dalam implementasi fungsi-fungsi yang saat ini tidak disediakan oleh sistem otomatis sama sekali, atau dilakukan oleh mereka lebih buruk daripada manusia, arah yang menjanjikan untuk pengembangan sistem otomatis adalah otomatisasi maksimum dari fungsi-fungsi ini.

Sistem pendukung keputusan otomatis

Manusia selalu menggunakan asisten ketika mengambil keputusan: mereka hanyalah penyedia informasi tentang objek manajemen, dan konsultan (penasihat) yang menawarkan pilihan keputusan dan menganalisis konsekuensinya. Seseorang yang mengambil keputusan selalu mengambil keputusan dalam lingkungan informasi tertentu: bagi pemimpin militer itu adalah markas besar, bagi rektor itu adalah dewan akademik, bagi menteri itu adalah kolegium.

Saat ini, infrastruktur informasi untuk pengambilan keputusan tidak dapat dibayangkan tanpa sistem otomatis untuk penilaian keputusan yang interaktif dan khususnya sistem pendukung keputusan (DDS - Sistem Pendukung Keputusan), yaitu. sistem otomatis yang dirancang khusus untuk menyiapkan informasi yang dibutuhkan seseorang untuk mengambil keputusan. Pengembangan sistem pendukung keputusan dilakukan khususnya dalam kerangka proyek internasional yang dilaksanakan di bawah naungan International Institute for Applied Systems Analysis di Laxenburg (Austria).

Membuat pilihan dalam situasi kehidupan nyata memerlukan sejumlah operasi, beberapa di antaranya lebih efisien dilakukan oleh manusia dan lainnya oleh mesin. Kombinasi efektif dari keunggulan-keunggulan tersebut sekaligus mengkompensasi kekurangan-kekurangannya diwujudkan dalam sistem pendukung keputusan otomatis.

Seseorang membuat keputusan lebih baik daripada mesin dalam kondisi ketidakpastian, tetapi untuk membuat keputusan yang tepat, ia juga memerlukan informasi yang memadai (lengkap dan dapat diandalkan) yang menjadi ciri bidang subjek. Namun, diketahui bahwa manusia tidak dapat menangani dengan baik sejumlah besar informasi “mentah” yang belum diproses. Oleh karena itu, peran mesin dalam pendukung keputusan mungkin untuk melakukan persiapan awal informasi tentang objek kontrol dan faktor-faktor yang tidak dapat dikendalikan (lingkungan), untuk membantu melihat konsekuensi dari pengambilan keputusan tertentu, dan juga untuk menyajikan semua informasi tersebut dalam bentuk visual. dan cara yang nyaman.

Dengan demikian, sistem pendukung keputusan otomatis mengkompensasi kelemahan seseorang, membebaskannya dari pemrosesan informasi awal yang rutin, dan menyediakan lingkungan informasi yang nyaman di mana ia dapat menunjukkan kekuatannya dengan lebih baik. Sistem ini tidak ditujukan untuk mengotomatisasi fungsi-fungsi pengambil keputusan (dan, sebagai akibatnya, mengasingkan fungsi-fungsi ini darinya, dan oleh karena itu tanggung jawab atas keputusan yang dibuat, yang seringkali umumnya tidak dapat diterima), tetapi untuk membantunya dalam menemukan solusi yang baik. larutan.

Tinjauan metode pengenalan pola yang ada

LP Popova , DAN TENTANG. Dataev

Kemampuan untuk “mengenali” dianggap sebagai ciri utama manusia, serta organisme hidup lainnya. Pengenalan pola adalah cabang sibernetika yang mengembangkan prinsip dan metode klasifikasi, serta identifikasi objek, fenomena, proses, sinyal, situasi - semua objek yang dapat dijelaskan oleh serangkaian tanda atau properti terbatas yang menjadi ciri suatu objek. .

Gambar merupakan gambaran suatu objek. Gambar memiliki sifat karakteristik, yang memanifestasikan dirinya dalam kenyataan bahwa pengenalan dengan sejumlah fenomena terbatas dari himpunan yang sama memungkinkan untuk mengenali sejumlah besar perwakilannya.

Dalam teori pengenalan pola, dua arah utama dapat dibedakan:

    studi tentang kemampuan pengenalan yang dimiliki manusia dan organisme hidup lainnya;

    pengembangan teori dan metode untuk membangun perangkat yang dirancang untuk memecahkan masalah pengenalan pola individu di area aplikasi tertentu.

Selanjutnya artikel ini menjelaskan permasalahan, prinsip dan metode penerapan sistem pengenalan citra terkait dengan perkembangan arah kedua. Bagian kedua dari artikel ini membahas metode jaringan saraf pengenalan pola, yang dapat dikaitkan dengan arah pertama teori pengenalan pola.

Masalah membangun sistem pengenalan gambar

Permasalahan yang timbul ketika membangun sistem pengenalan pola otomatis biasanya dapat diklasifikasikan menjadi beberapa bidang utama. Yang pertama berkaitan dengan penyajian data awal yang diperoleh sebagai hasil pengukuran terhadap objek yang akan dikenali masalah sensitivitas. Setiap nilai yang diukur adalah suatu “karakteristik suatu gambar atau objek. Mari kita asumsikan, misalnya, bahwa gambar tersebut adalah simbol alfanumerik digunakan pada sensor. Jika retina terdiri dari n elemen, maka hasil pengukuran dapat direpresentasikan sebagai vektor pengukuran atau vektor gambar ,

dimana setiap elemen xi, mengambil, misalnya, nilai 1 jika bayangan suatu simbol melewati sel retina ke-i, dan nilai 0 sebaliknya.

Mari kita lihat Gambar. 2(b). Dalam hal ini, gambar merupakan fungsi kontinu (seperti sinyal suara) dari variabel t. Jika pengukuran nilai fungsi dilakukan pada titik diskrit t1,t2, ..., tn, maka vektor bayangan dapat dibentuk dengan mengambil x1= f(t1),x2=f(t2),... , xn = f(tn).

Gambar 1. Mengukur retina

Masalah kedua dalam pengenalan pola dikaitkan dengan isolasi ciri atau properti karakteristik dari data awal yang diperoleh dan pengurangan dimensi vektor pola. Masalah ini sering kali diartikan sebagai masalah pra-pemrosesan dan pemilihan fitur.

Fitur suatu kelas gambar adalah sifat karakteristik yang umum untuk semua gambar dari kelas tertentu. Ciri-ciri yang menjadi ciri perbedaan antar kelas individu dapat diartikan sebagai ciri antar kelas. Fitur intrakelas, yang umum untuk semua kelas yang dipertimbangkan, tidak membawa informasi berguna dari sudut pandang pengenalan dan mungkin tidak diperhitungkan. Pemilihan fitur dianggap sebagai salah satu tugas penting yang terkait dengan pembangunan sistem pengenalan. Jika hasil pengukuran memungkinkan kita memperoleh serangkaian ciri khas yang lengkap untuk semua kelas, pengenalan dan klasifikasi gambar yang sebenarnya tidak akan menimbulkan kesulitan khusus. Pengenalan otomatis kemudian akan direduksi menjadi proses atau prosedur pencocokan sederhana seperti pemindaian tabel. Namun, dalam sebagian besar masalah pengenalan praktis, menentukan keseluruhan ciri khas ternyata sangat sulit, bahkan tidak mungkin. Biasanya dimungkinkan untuk mengekstrak beberapa fitur diskriminatif dari data asli dan menggunakannya untuk menyederhanakan proses pengenalan pola otomatis. Secara khusus, dimensi vektor pengukuran dapat dikurangi dengan menggunakan transformasi yang meminimalkan kehilangan informasi.

Masalah ketiga yang terkait dengan pembangunan sistem pengenalan pola adalah menemukan prosedur pengambilan keputusan optimal yang diperlukan untuk identifikasi dan klasifikasi. Setelah data yang dikumpulkan tentang gambar yang akan dikenali diwakili oleh titik atau vektor pengukuran dalam ruang gambar, kita membiarkan mesin mengetahui kelas gambar mana yang sesuai dengan data tersebut. Biarkan mesin dirancang untuk membedakan kelas M, dilambangkan w1, w2, ... ..., wm. Dalam hal ini, ruang gambar dapat dianggap terdiri dari M daerah, yang masing-masing berisi titik-titik yang bersesuaian dengan gambar dari satu kelas. Dalam hal ini, tugas pengenalan dapat dianggap sebagai membangun batas-batas area keputusan yang memisahkan kelas M berdasarkan vektor pengukuran yang terdaftar. Biarkan batas-batas ini didefinisikan, misalnya, dengan fungsi keputusan d1(x), d2(x),..., dm(x). Fungsi-fungsi ini, disebut juga fungsi diskriminan, adalah fungsi skalar dan bernilai tunggal dari bayangan x. Jika di(x) > dj(x), maka bayangan x termasuk kelas w1. Dengan kata lain, jika fungsi keputusan ke-i di(x) mempunyai nilai terbesar, maka ilustrasi bermakna skema klasifikasi otomatis berdasarkan implementasi proses pengambilan keputusan ditunjukkan pada Gambar. 2 (dalam diagram “GR” adalah generator fungsi keputusan).

Gambar 2. Skema klasifikasi otomatis.

Fungsi penentu dapat diperoleh dengan beberapa cara. Dalam kasus di mana terdapat informasi apriori lengkap tentang gambar yang dikenali, fungsi pengambilan keputusan dapat ditentukan secara tepat berdasarkan informasi ini. Jika hanya informasi kualitatif yang tersedia mengenai gambar, asumsi yang masuk akal dapat dibuat mengenai bentuk fungsi penentu. Dalam kasus terakhir, batas-batas wilayah solusi mungkin menyimpang secara signifikan dari yang sebenarnya, oleh karena itu perlu diciptakan suatu sistem yang mampu mencapai hasil yang memuaskan melalui serangkaian penyesuaian yang berurutan.

Objek (gambar) yang akan dikenali dan diklasifikasikan menggunakan sistem pengenalan pola otomatis harus mempunyai seperangkat karakteristik yang dapat diukur. Apabila untuk seluruh kelompok gambar hasil pengukuran yang bersangkutan ternyata sama, maka benda-benda tersebut dianggap termasuk dalam kelas yang sama. Tujuan dari sistem pengenalan pola adalah, berdasarkan informasi yang dikumpulkan, menentukan kelas objek dengan karakteristik serupa dengan yang diukur pada objek yang dikenali. Kebenaran pengakuan bergantung pada jumlah informasi diskriminatif yang terkandung dalam karakteristik yang diukur dan efisiensi penggunaan informasi tersebut.

      Metode dasar untuk mengimplementasikan sistem pengenalan pola

Pengenalan pola mengacu pada masalah membangun dan menerapkan operasi formal pada representasi numerik atau simbolik objek di dunia nyata atau ideal, yang hasilnya mencerminkan hubungan kesetaraan antara objek-objek tersebut. Hubungan kesetaraan mengungkapkan kepemilikan objek yang dievaluasi ke kelas mana pun, yang dianggap sebagai unit semantik independen.

Saat membangun algoritma pengenalan, kelas kesetaraan dapat ditentukan oleh peneliti yang menggunakan ide-ide bermaknanya sendiri atau menggunakan informasi tambahan eksternal tentang persamaan dan perbedaan objek dalam konteks masalah yang sedang dipecahkan. Kemudian mereka berbicara tentang “pengakuan dengan seorang guru.” Jika tidak, mis. Ketika sistem otomatis memecahkan masalah klasifikasi tanpa menggunakan informasi pelatihan eksternal, kita berbicara tentang klasifikasi otomatis atau “pengenalan tanpa pengawasan.” Kebanyakan algoritma pengenalan pola memerlukan penggunaan daya komputasi yang sangat besar, yang hanya dapat disediakan oleh teknologi komputer berkinerja tinggi.

Berbagai penulis (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, Temnikov F.E., Afonin V.A., Dmitriev V.I., J. Tu, R. Gonzalez, P. Winston, K. Fu, Ya.Z. Tsypkin, dll.) memberikan tipologi metode pengenalan pola yang berbeda. Beberapa penulis membedakan antara metode parametrik, nonparametrik dan heuristik, yang lain mengidentifikasi kelompok metode berdasarkan aliran historis dan tren di bidang ini.

Pada saat yang sama, tipologi yang diketahui tidak memperhitungkan satu karakteristik yang sangat signifikan, yang mencerminkan kekhususan cara merepresentasikan pengetahuan tentang suatu bidang subjek menggunakan algoritma pengenalan pola formal. D.A.Pospelov mengidentifikasi dua cara utama menyajikan pengetahuan:

    Representasi yang disengaja - dalam bentuk diagram hubungan antar atribut (fitur).

    Representasi ekstensional - menggunakan fakta spesifik (objek, contoh).

Perlu dicatat bahwa keberadaan dua kelompok metode pengenalan ini: metode yang beroperasi dengan tanda dan metode yang beroperasi dengan objek, sangatlah alami. Dari sudut pandang ini, tidak satu pun dari metode ini, yang diambil secara terpisah dari yang lain, memungkinkan kita untuk membentuk refleksi yang memadai terhadap bidang studi. Di antara metode-metode ini terdapat hubungan saling melengkapi dalam pengertian N. Bohr, oleh karena itu, sistem pengakuan yang menjanjikan harus memastikan implementasi kedua metode ini, dan bukan hanya salah satunya.

Dengan demikian, klasifikasi metode pengenalan yang dikemukakan oleh D.A. Pospelov didasarkan pada pola-pola mendasar yang mendasari cara kognisi manusia secara umum, yang menempatkannya pada posisi yang benar-benar istimewa (istimewa) dibandingkan dengan klasifikasi lain, yang dengan latar belakang ini terlihat lebih ringan dan palsu.

Metode yang disengaja

Ciri khas metode intensional adalah bahwa metode tersebut menggunakan berbagai karakteristik fitur dan hubungannya sebagai elemen operasi ketika membangun dan menerapkan algoritma pengenalan pola. Elemen tersebut dapat berupa nilai individual atau interval nilai fitur, nilai rata-rata dan varians, matriks hubungan fitur, dll., di mana tindakan dilakukan, dinyatakan dalam bentuk analitis atau konstruktif. Pada saat yang sama, objek dalam metode ini tidak dianggap sebagai unit informasi integral, tetapi bertindak sebagai indikator untuk menilai interaksi dan perilaku atributnya.

Kelompok metode pengenalan pola yang disengaja sangat luas, dan pembagiannya menjadi subkelas sampai batas tertentu tergantung pada:

– metode berdasarkan perkiraan kepadatan distribusi nilai fitur

– metode berdasarkan asumsi tentang kelas fungsi keputusan

– metode logis

– metode linguistik (struktural).

Metode berdasarkan estimasi kepadatan distribusi nilai fitur. Metode pengenalan pola ini dipinjam dari teori klasik keputusan statistik, di mana objek penelitian dianggap sebagai realisasi variabel acak multidimensi yang didistribusikan dalam ruang fitur menurut hukum tertentu. Mereka didasarkan pada skema pengambilan keputusan Bayesian yang mengacu pada probabilitas apriori objek yang termasuk dalam kelas tertentu yang dapat dikenali dan kepadatan distribusi bersyarat dari nilai vektor fitur. Metode-metode ini bertujuan untuk menentukan rasio kemungkinan di berbagai area ruang fitur multidimensi.

Sekelompok metode yang didasarkan pada estimasi kepadatan distribusi nilai fitur berhubungan langsung dengan metode analisis diskriminan. Pendekatan Bayesian dalam pengambilan keputusan adalah salah satu metode parametrik yang paling berkembang dalam statistik modern, yang mana ekspresi analitis dari hukum distribusi (dalam hal ini, hukum normal) dianggap diketahui dan hanya sejumlah kecil parameter ( vektor nilai rata-rata dan matriks kovarians) perlu diestimasi.

Kelompok ini juga mencakup metode penghitungan rasio kemungkinan untuk karakteristik independen. Cara ini, kecuali asumsi independensi sifat (yang pada kenyataannya hampir tidak pernah terpenuhi), tidak mengandaikan pengetahuan tentang bentuk fungsional hukum distribusi. Ini dapat diklasifikasikan sebagai metode nonparametrik.

Metode nonparametrik lainnya, yang digunakan ketika bentuk kurva kepadatan distribusi tidak diketahui dan tidak ada asumsi sama sekali tentang sifatnya, menempati posisi khusus. Ini termasuk metode histogram multidimensi yang terkenal, metode “k-tetangga terdekat”, metode jarak Euclidean, metode fungsi potensial, dll., yang generalisasinya adalah metode yang disebut “perkiraan Parzen”. Metode ini secara formal beroperasi dengan objek sebagai struktur integral, namun bergantung pada jenis tugas pengenalan, metode ini dapat bertindak dalam bentuk intensional dan ekstensional.

Metode nonparametrik menganalisis jumlah relatif objek yang termasuk dalam volume multidimensi tertentu dan menggunakan berbagai fungsi jarak antara objek dalam set pelatihan dan objek yang dikenali. Untuk karakteristik kuantitatif, ketika jumlahnya jauh lebih kecil dari ukuran sampel, operasi dengan objek memainkan peran perantara dalam memperkirakan kepadatan distribusi lokal dari probabilitas bersyarat dan objek tidak membawa beban semantik unit informasi independen. Pada saat yang sama, ketika jumlah fitur sepadan dengan atau lebih besar dari jumlah objek yang diteliti, dan fitur tersebut bersifat kualitatif atau dikotomis, maka tidak ada pembicaraan tentang estimasi lokal mengenai kepadatan distribusi probabilitas. Dalam hal ini objek-objek dalam metode nonparametrik tertentu dianggap sebagai satuan informasi yang berdiri sendiri (fakta empiris yang integral) dan metode-metode tersebut memperoleh makna menilai persamaan dan perbedaan objek-objek yang diteliti.

Dengan demikian, operasi teknologi yang sama dari metode nonparametrik, bergantung pada kondisi masalah, masuk akal baik berupa estimasi lokal dari kepadatan distribusi probabilitas nilai fitur, atau estimasi persamaan dan perbedaan objek.

Dalam konteks representasi pengetahuan yang disengaja, sisi pertama metode nonparametrik, seperti perkiraan kepadatan distribusi probabilitas, dipertimbangkan di sini. Banyak penulis mencatat bahwa dalam praktiknya, metode nonparametrik seperti penduga Parzen bekerja dengan baik. Kesulitan utama dalam menggunakan metode ini adalah kebutuhan untuk mengingat seluruh sampel pelatihan untuk menghitung perkiraan kepadatan distribusi probabilitas lokal dan sensitivitas yang tinggi terhadap sampel pelatihan yang tidak representatif.

Metode berdasarkan asumsi tentang kelas fungsi keputusan. Dalam kelompok metode ini, bentuk umum fungsi keputusan dianggap diketahui dan fungsi kualitasnya ditentukan. Berdasarkan fungsi ini, perkiraan terbaik dari fungsi keputusan dicari dalam urutan pelatihan. Yang paling umum adalah representasi fungsi keputusan dalam bentuk polinomial nonlinier linier dan umum. Fungsi kualitas aturan keputusan biasanya dikaitkan dengan kesalahan klasifikasi.

Keuntungan utama metode berdasarkan asumsi kelas fungsi keputusan adalah kejelasan rumusan matematis dari masalah pengenalan sebagai masalah pencarian ekstrem. Solusi untuk masalah ini sering kali dicapai dengan menggunakan beberapa algoritma gradien. Keragaman metode dalam kelompok ini dijelaskan oleh beragamnya fungsi kualitas aturan keputusan dan algoritma pencarian ekstrem yang digunakan. Generalisasi dari algoritma yang sedang dipertimbangkan, yang meliputi, khususnya, algoritma Newton, algoritma tipe perceptron, dll., adalah metode pendekatan stokastik. Berbeda dengan metode pengenalan parametrik, keberhasilan penggunaan kelompok metode ini tidak terlalu bergantung pada ketidaksesuaian antara gagasan teoretis tentang hukum distribusi objek dalam ruang fitur dan realitas empiris. Semua operasi tunduk pada satu tujuan utama - menemukan fungsi kualitas ekstrem dari aturan pengambilan keputusan. Pada saat yang sama, hasil parametrik dan metode yang dipertimbangkan mungkin serupa. Seperti yang ditunjukkan di atas, metode parametrik untuk kasus distribusi normal objek di kelas berbeda dengan matriks kovarians yang sama menghasilkan fungsi keputusan linier. Kami juga mencatat bahwa algoritme untuk memilih fitur informatif dalam model diagnostik linier dapat diartikan sebagai versi khusus dari algoritme gradien untuk mencari ekstrem.

Kemampuan algoritma pencarian ekstrem gradien, khususnya pada kelompok aturan keputusan linier, telah dipelajari dengan cukup baik. Konvergensi algoritma ini telah dibuktikan hanya pada kasus ketika kelas objek yang dikenali ditampilkan dalam ruang fitur dengan struktur geometris kompak. Namun, keinginan untuk mencapai kualitas aturan keputusan yang memadai seringkali dapat dipenuhi dengan bantuan algoritma yang tidak memiliki bukti matematis yang ketat mengenai konvergensi solusi ke ekstrem global.

Algoritma tersebut mencakup sekelompok besar prosedur pemrograman heuristik yang mewakili arah pemodelan evolusi. Pemodelan evolusioner adalah metode bionik yang dipinjam dari alam. Hal ini didasarkan pada penggunaan mekanisme evolusi yang diketahui untuk menggantikan proses pemodelan bermakna suatu objek kompleks dengan pemodelan fenomenologis evolusinya.

Perwakilan pemodelan evolusioner yang terkenal dalam pengenalan pola adalah metode penghitungan argumen kelompok (MGUA). Dasar dari GMDH adalah prinsip pengorganisasian mandiri, dan algoritma GMDH mereproduksi skema seleksi massal. Dalam algoritma GMDH, anggota polinomial umum disintesis dan dipilih dengan cara khusus, yang sering disebut polinomial Kolmogorov-Gabor. Sintesis dan seleksi ini dilakukan dengan kompleksitas yang semakin meningkat, dan tidak mungkin untuk memprediksi sebelumnya bentuk akhir dari polinomial umum tersebut. Pertama, kombinasi fitur awal berpasangan sederhana biasanya dipertimbangkan, dari mana persamaan fungsi keputusan dikompilasi, biasanya tidak lebih tinggi dari orde kedua. Setiap persamaan dianalisis sebagai fungsi keputusan independen, dan nilai parameter persamaan yang dikompilasi ditemukan dengan satu atau lain cara menggunakan sampel pelatihan. Kemudian, dari kumpulan fungsi keputusan yang dihasilkan, dipilih beberapa fungsi keputusan terbaik. Kualitas fungsi keputusan individu diperiksa pada sampel kontrol (validasi), yang kadang-kadang disebut prinsip penambahan eksternal. Fungsi keputusan parsial yang dipilih selanjutnya dianggap sebagai variabel perantara yang berfungsi sebagai argumen awal untuk sintesis serupa dari fungsi keputusan baru, dll. Proses sintesis hierarki tersebut berlanjut hingga kriteria kualitas ekstrem dari fungsi keputusan tercapai, yang dalam praktiknya dimanifestasikan dalam penurunan kualitas ini ketika mencoba untuk lebih meningkatkan urutan suku polinomial dibandingkan dengan fitur aslinya.

Prinsip pengorganisasian mandiri yang mendasari GMDH disebut pengorganisasian mandiri heuristik, karena seluruh proses didasarkan pada pengenalan penambahan eksternal, yang dipilih secara heuristik. Hasil dari suatu keputusan mungkin sangat bergantung pada heuristik ini. Model diagnostik yang dihasilkan bergantung pada bagaimana objek dibagi menjadi sampel pelatihan dan pengujian, bagaimana kriteria kualitas pengenalan ditentukan, berapa banyak variabel yang diteruskan ke baris seleksi berikutnya, dll.

Fitur-fitur yang ditunjukkan dari algoritma GMDH juga merupakan karakteristik dari pendekatan lain terhadap pemodelan evolusioner. Namun mari kita perhatikan di sini satu aspek lagi dari metode yang sedang dipertimbangkan. Inilah inti maknanya. Dengan menggunakan metode berdasarkan asumsi kelas fungsi keputusan (evolusioner dan gradien), dimungkinkan untuk membangun model diagnostik dengan kompleksitas tinggi dan memperoleh hasil yang dapat diterima secara praktis. Pada saat yang sama, pencapaian tujuan praktis dalam hal ini tidak dibarengi dengan perolehan pengetahuan baru tentang sifat objek yang dikenali. Kemungkinan mengekstraksi pengetahuan ini, khususnya pengetahuan tentang mekanisme interaksi atribut (fitur), di sini pada dasarnya dibatasi oleh struktur interaksi tersebut, yang ditetapkan dalam bentuk fungsi keputusan yang dipilih. Oleh karena itu, hal maksimal yang dapat dikatakan setelah membangun model diagnostik tertentu adalah membuat daftar kombinasi fitur dan fitur itu sendiri yang disertakan dalam model yang dihasilkan. Namun makna kombinasi yang mencerminkan sifat dan struktur sebaran objek yang diteliti seringkali masih dirahasiakan dalam kerangka pendekatan ini.

Metode Boolean. Metode logis pengenalan pola didasarkan pada peralatan aljabar logis dan memungkinkan seseorang untuk beroperasi dengan informasi yang terkandung tidak hanya dalam fitur individu, tetapi juga dalam kombinasi nilai fitur. Dalam metode ini, nilai atribut apa pun dianggap sebagai peristiwa dasar.

Dalam bentuknya yang paling umum, metode logis dapat dicirikan sebagai jenis pencarian melalui sampel pelatihan pola logis dan pembentukan sistem aturan keputusan logis tertentu (misalnya, dalam bentuk konjungsi peristiwa dasar), masing-masing dari yang mempunyai bobot tersendiri. Kelompok metode logis beragam dan mencakup metode dengan kompleksitas dan kedalaman analisis yang berbeda-beda. Untuk fitur dikotomis (Boolean), apa yang disebut pengklasifikasi mirip pohon, metode pengujian buntu, algoritma “Bark” dan lain-lain sangat populer. Metode yang lebih kompleks didasarkan pada formalisasi metode induktif D.S. Mill. Formalisasi dilakukan dengan membangun teori kuasi-aksiomatik dan didasarkan pada logika banyak nilai yang diurutkan banyak dengan pembilang pada tupel dengan panjang variabel.

Algoritme “Kora”, seperti metode pengenalan pola logis lainnya, cukup memakan waktu, karena diperlukan pencarian yang lengkap saat memilih konjungsi. Oleh karena itu, ketika menggunakan metode logis, tuntutan tinggi ditempatkan pada organisasi proses komputasi yang efisien, dan metode ini bekerja dengan baik dengan dimensi ruang fitur yang relatif kecil dan hanya pada komputer yang kuat.

Metode linguistik (sintaksis atau struktural). Metode linguistik pengenalan pola didasarkan pada penggunaan tata bahasa khusus yang menghasilkan bahasa, yang dengannya serangkaian properti objek yang dikenali dapat dijelaskan. Tata bahasa mengacu pada aturan untuk membangun objek dari elemen non-turunan ini.

Jika deskripsi gambar dibuat dengan menggunakan elemen non-turunan (subgambar) dan hubungannya, maka pendekatan linguistik atau sintaksis dengan menggunakan prinsip sifat umum digunakan untuk membangun sistem pengenalan otomatis. Sebuah gambar dapat dideskripsikan menggunakan struktur hierarki subgambar, mirip dengan struktur sintaksis bahasa. Keadaan ini memungkinkan penerapan teori bahasa formal dalam memecahkan masalah pengenalan gambar. Tata bahasa gambar diasumsikan mengandung kumpulan elemen berhingga yang disebut variabel, elemen non-turunan, dan aturan substitusi. Sifat aturan substitusi menentukan jenis tata bahasa. Di antara tata bahasa yang paling banyak dipelajari, kita dapat mencatat tata bahasa reguler, tanpa konteks, dan tata bahasa komponen langsung. Poin kunci dari pendekatan ini adalah pemilihan elemen non-turunan dari gambar, kombinasi elemen-elemen tersebut dan hubungan yang menghubungkannya ke dalam tata bahasa gambar, dan, terakhir, penerapan proses analisis dan pengenalan dalam bahasa yang sesuai. Pendekatan ini sangat berguna ketika bekerja dengan gambar yang tidak dapat dideskripsikan dengan pengukuran numerik atau sangat kompleks sehingga fitur lokalnya tidak dapat diidentifikasi dan kita harus beralih ke properti global objek.

Misalnya, E.A. Butakov, V.I. Ostrovsky, I.L. Fadeev mengusulkan struktur sistem pemrosesan gambar berikut (Gbr. 3), menggunakan pendekatan linguistik, di mana setiap blok fungsional adalah kompleks perangkat lunak (mikroprogram) (modul) yang mengimplementasikan fungsi terkait.

Gambar 3. Diagram blok perangkat pengenal

Upaya untuk menerapkan metode linguistik matematika pada masalah analisis gambar mengarah pada kebutuhan untuk memecahkan sejumlah masalah yang terkait dengan pemetaan struktur dua dimensi suatu gambar ke dalam rantai satu dimensi bahasa formal.

Metode ekstensional

Dalam metode kelompok ini, berbeda dengan arah intensional, setiap objek yang diteliti, pada tingkat yang lebih besar atau lebih kecil, diberikan signifikansi diagnostik independen. Pada intinya, metode ini dekat dengan pendekatan klinis, yang menganggap manusia bukan sebagai rangkaian objek yang diberi peringkat berdasarkan satu indikator atau lainnya, tetapi sebagai sistem integral, yang masing-masing bersifat individual dan memiliki nilai diagnostik khusus. Sikap hati-hati terhadap objek penelitian tidak memungkinkan untuk mengecualikan atau menghilangkan informasi tentang setiap objek individu, yang terjadi ketika menggunakan metode pengarahan yang disengaja yang menggunakan objek hanya untuk mendeteksi dan mencatat pola perilaku atributnya.

Operasi utama dalam pengenalan pola dengan menggunakan metode yang dibahas adalah operasi penentuan persamaan dan perbedaan suatu objek. Objek dalam kelompok metode tertentu memainkan peran preseden diagnostik. Selain itu, tergantung pada kondisi tugas tertentu, peran preseden individu dapat bervariasi dalam batas yang paling luas: dari yang utama dan menentukan hingga partisipasi yang sangat tidak langsung dalam proses pengakuan. Pada gilirannya, kondisi masalah mungkin memerlukan partisipasi sejumlah preseden diagnostik yang berbeda untuk penyelesaian yang berhasil: dari satu di setiap kelas yang dikenali hingga ukuran sampel penuh, serta metode berbeda untuk menghitung ukuran persamaan dan perbedaan objek. . Persyaratan ini menjelaskan pembagian lebih lanjut metode ekstensional ke dalam subkelas:

    metode perbandingan dengan prototipe;

    metode k-tetangga terdekat;

    kumpulan aturan keputusan.

Metode perbandingan dengan prototipe. Ini adalah metode pengenalan ekstensional yang paling sederhana. Ini digunakan, misalnya, ketika kelas-kelas yang dikenali ditampilkan dalam ruang fitur dengan pengelompokan geometris yang kompak. Dalam hal ini, biasanya pusat pengelompokan geometri kelas (atau objek yang paling dekat dengan pusat) dipilih sebagai titik prototipe.

Untuk mengklasifikasikan objek yang tidak diketahui, ditemukan prototipe terdekat dan objek tersebut termasuk dalam kelas yang sama dengan prototipe ini. Jelasnya, tidak ada gambar kelas umum yang dihasilkan dalam metode ini.

Berbagai jenis jarak dapat digunakan sebagai ukuran kedekatan. Seringkali, untuk fitur dikotomis, jarak Hamming digunakan, yang dalam hal ini sama dengan kuadrat jarak Euclidean. Dalam hal ini, aturan keputusan untuk mengklasifikasikan objek setara dengan fungsi keputusan linier.

Fakta ini harus diperhatikan secara khusus. Ini dengan jelas menunjukkan hubungan antara prototipe dan representasi atribut informasi tentang struktur data. Dengan menggunakan representasi di atas, misalnya, seseorang dapat mempertimbangkan skala pengukuran tradisional, yang merupakan fungsi linier dari nilai karakteristik dikotomis, sebagai prototipe diagnostik hipotetis. Pada gilirannya, jika analisis struktur spasial kelas-kelas yang dikenali memungkinkan kita untuk menarik kesimpulan tentang kekompakan geometrisnya, maka cukup mengganti masing-masing kelas ini dengan satu prototipe, yang sebenarnya setara dengan model diagnostik linier.

Dalam praktiknya, tentu saja, situasinya seringkali berbeda dengan contoh ideal yang digambarkan. Seorang peneliti yang bermaksud menerapkan metode pengenalan berdasarkan perbandingan dengan kelas diagnostik prototipe menghadapi masalah yang sulit. Pertama-tama, pilihan ukuran kedekatan (metrik), yang secara signifikan dapat mengubah konfigurasi spasial sebaran objek. Dan kedua, masalah independen adalah analisis struktur multidimensi data eksperimen. Kedua masalah ini sangat akut bagi peneliti dalam kondisi ruang fitur berdimensi tinggi, yang merupakan karakteristik dari masalah nyata.

Metode k-tetangga terdekat. Metode k-nearest neighbours untuk memecahkan masalah analisis diskriminan pertama kali diusulkan pada tahun 1952. Ini adalah sebagai berikut.

Saat mengklasifikasikan objek yang tidak diketahui, ditemukan bilangan tertentu (k) yang secara geometris paling dekat dengannya dalam ruang fitur objek lain (tetangga terdekat) dengan keanggotaan yang sudah diketahui dalam kelas yang dikenali. Keputusan untuk menetapkan objek yang tidak diketahui ke kelas diagnostik tertentu dibuat dengan menganalisis informasi tentang afiliasi yang diketahui dari tetangga terdekatnya, misalnya, menggunakan penghitungan suara sederhana.

Awalnya, metode k-tetangga terdekat dianggap sebagai metode nonparametrik untuk memperkirakan rasio kemungkinan. Untuk metode ini, perkiraan teoritis efektivitasnya diperoleh dibandingkan dengan pengklasifikasi Bayesian yang optimal. Telah terbukti bahwa probabilitas kesalahan asimtotik untuk metode k-nearest neighbours melebihi kesalahan aturan Bayes tidak lebih dari dua kali lipat.

Seperti disebutkan di atas, dalam masalah nyata sering kali kita perlu mengoperasikan objek yang dijelaskan oleh sejumlah besar fitur kualitatif (dikotomis). Dalam hal ini, dimensi ruang fitur sepadan atau melebihi volume sampel yang diteliti. Dalam kondisi seperti itu, akan lebih mudah untuk menafsirkan setiap objek sampel pelatihan sebagai pengklasifikasi linier terpisah. Kemudian kelas diagnostik ini atau itu diwakili bukan oleh satu prototipe, tetapi oleh sekumpulan pengklasifikasi linier. Interaksi gabungan dari pengklasifikasi linier pada akhirnya menghasilkan permukaan linier sepotong-sepotong yang memisahkan kelas-kelas yang dikenali dalam ruang fitur. Jenis permukaan pemisah, yang terdiri dari potongan-potongan bidang hiper, dapat bervariasi dan bergantung pada posisi relatif agregat yang diklasifikasikan.

Interpretasi lain dari mekanisme klasifikasi menggunakan aturan k-nearest neighbours juga dapat digunakan. Hal ini didasarkan pada gagasan tentang adanya variabel laten tertentu, abstrak atau dihubungkan oleh suatu transformasi ke ruang fitur aslinya. Jika dalam ruang variabel laten jarak berpasangan antar objek sama dengan ruang ciri aslinya, dan jumlah variabel tersebut jauh lebih sedikit daripada jumlah objek, maka interpretasi metode k-nearest neighbours dapat dipertimbangkan dari sudut pandang membandingkan estimasi nonparametrik dari kepadatan distribusi probabilitas bersyarat. Pandangan tentang variabel laten yang disajikan di sini mirip dengan pandangan tentang dimensi sebenarnya dan pandangan lain yang digunakan dalam berbagai teknik reduksi dimensi.

Saat menggunakan metode k-nearest neighbours untuk pengenalan pola, peneliti harus memecahkan masalah sulit dalam memilih metrik untuk menentukan kedekatan objek yang didiagnosis. Masalah ini dalam kondisi ruang fitur berdimensi tinggi menjadi sangat buruk karena kompleksitas metode ini yang cukup, yang menjadi signifikan bahkan untuk komputer berperforma tinggi. Oleh karena itu, di sini, seperti halnya metode perbandingan dengan prototipe, masalah kreatif dalam menganalisis struktur multidimensi data eksperimen perlu dipecahkan untuk meminimalkan jumlah objek yang mewakili kelas diagnostik.

Algoritma untuk menghitung rating (voting). Prinsip pengoperasian algoritma perhitungan penilaian (ABO) adalah menghitung prioritas (skor kesamaan) yang mencirikan “kedekatan” objek yang dikenali dan direferensikan menurut sistem ansambel fitur, yang merupakan sistem himpunan bagian dari sekumpulan fitur tertentu. .

Tidak seperti semua metode yang dibahas sebelumnya, algoritma untuk menghitung perkiraan beroperasi dengan deskripsi objek dengan cara yang secara fundamental baru. Untuk algoritme ini, objek ada secara bersamaan di subruang yang sangat berbeda dari ruang fitur. Kelas ABO mengambil ide penggunaan fitur pada kesimpulan logisnya: karena tidak selalu diketahui kombinasi fitur mana yang paling informatif, maka di ABO derajat kemiripan objek dihitung dengan membandingkan semua kombinasi fitur yang mungkin atau spesifik. fitur yang termasuk dalam deskripsi objek.

Kumpulan aturan keputusan. Aturan pengambilan keputusan menggunakan skema pengakuan dua tingkat. Pada tingkat pertama, algoritma pengenalan pribadi beroperasi, yang hasilnya digabungkan pada tingkat kedua dalam blok sintesis. Metode penyatuan yang paling umum didasarkan pada identifikasi bidang kompetensi algoritma tertentu. Cara paling sederhana untuk menemukan bidang kompetensi adalah dengan membagi ruang atribut secara apriori berdasarkan pertimbangan profesional suatu ilmu tertentu (misalnya, mengelompokkan sampel menurut atribut tertentu). Kemudian, untuk setiap area yang dipilih, algoritma pengenalannya sendiri dibangun. Metode lain didasarkan pada penggunaan analisis formal untuk menentukan area lokal dari ruang fitur sebagai lingkungan objek yang dikenali dimana keberhasilan algoritma pengenalan tertentu telah terbukti.

Pendekatan paling umum untuk membangun blok sintesis mempertimbangkan indikator yang dihasilkan dari algoritma tertentu sebagai karakteristik awal untuk membangun aturan keputusan umum yang baru. Dalam hal ini, semua metode arah intensional dan ekstensional di atas dalam pengenalan pola dapat digunakan. Efektif untuk memecahkan masalah pembuatan sekelompok aturan keputusan adalah algoritma logis dari tipe "Kora" dan algoritma untuk menghitung perkiraan (ABO), yang membentuk dasar dari apa yang disebut pendekatan aljabar, yang menyediakan studi dan deskripsi konstruktif dari algoritma pengenalan, yang sesuai dengan semua jenis algoritma yang ada.

Metode jaringan saraf

Metode jaringan saraf tiruan adalah metode yang didasarkan pada penggunaan berbagai jenis jaringan saraf tiruan (NN). Area utama penerapan berbagai jaringan saraf untuk pengenalan pola dan gambar:

    aplikasi untuk mengekstraksi karakteristik atau fitur utama dari gambar yang diberikan,

    klasifikasi gambar itu sendiri atau karakteristik yang sudah diekstraksi darinya (dalam kasus pertama, ekstraksi karakteristik utama terjadi secara implisit di dalam jaringan),

    memecahkan masalah optimasi.

Jaringan saraf multilayer. Arsitektur jaringan saraf multilayer (MNN) terdiri dari lapisan-lapisan yang terhubung secara berurutan, di mana neuron dari setiap lapisan dihubungkan dengan masukannya ke semua neuron pada lapisan sebelumnya, dan keluaran dari lapisan berikutnya.

Penerapan paling sederhana dari jaringan saraf satu lapis (disebut memori asosiatif otomatis) adalah melatih jaringan untuk merekonstruksi gambar yang diumpankan. Dengan memasukkan gambar uji sebagai masukan dan menghitung kualitas gambar yang direkonstruksi, Anda dapat mengevaluasi seberapa baik jaringan mengenali gambar masukan. Sifat positif dari metode ini adalah bahwa jaringan dapat memulihkan gambar yang terdistorsi dan berisik, namun tidak cocok untuk tujuan yang lebih serius.

MNN juga digunakan untuk klasifikasi gambar langsung - baik gambar itu sendiri dalam beberapa bentuk atau serangkaian karakteristik utama gambar yang diekstraksi sebelumnya diberikan sebagai masukan pada keluaran, neuron dengan aktivitas maksimum menunjukkan keanggotaan dalam kelas yang dikenali (Gbr. 2). 4). Jika aktivitas ini berada di bawah ambang batas tertentu, maka gambar yang dikirimkan dianggap tidak termasuk dalam kelas mana pun yang diketahui. Proses pembelajaran menetapkan kesesuaian gambar yang diberikan pada input dengan milik kelas tertentu. Ini disebut pembelajaran yang diawasi. Pendekatan ini baik untuk tugas kontrol akses sekelompok kecil orang. Pendekatan ini memastikan bahwa jaringan membandingkan gambar itu sendiri secara langsung, tetapi dengan bertambahnya jumlah kelas, waktu pelatihan dan pengoperasian jaringan meningkat secara eksponensial. Oleh karena itu, tugas-tugas seperti menemukan orang serupa dalam database besar memerlukan penggalian serangkaian karakteristik utama yang menjadi dasar pencarian.

Pendekatan klasifikasi menggunakan karakteristik frekuensi seluruh gambar dijelaskan dalam. Jaringan saraf lapisan tunggal berdasarkan neuron multi-nilai digunakan.

Penerapan jaringan saraf tiruan untuk klasifikasi citra ditunjukkan ketika masukan jaringan menerima hasil dekomposisi citra menggunakan metode komponen utama.

Dalam MNN klasik, koneksi saraf antar lapisan terhubung sepenuhnya, dan gambar direpresentasikan sebagai vektor satu dimensi, meskipun dua dimensi. Arsitektur jaringan saraf konvolusional bertujuan untuk mengatasi kekurangan ini. Ini menggunakan bidang reseptor lokal (menyediakan konektivitas neuron dua dimensi lokal), bobot bersama (menyediakan deteksi fitur tertentu di mana saja dalam gambar) dan organisasi hierarki dengan subsampling spasial. Jaringan saraf konvolusional (CNN) memberikan resistensi parsial terhadap perubahan skala, perpindahan, rotasi, dan distorsi.

MNN juga digunakan untuk mendeteksi objek tipe tertentu. Selain fakta bahwa setiap MNN yang dilatih dapat, sampai batas tertentu, menentukan apakah gambar termasuk dalam kelas “mereka”, ia dapat dilatih secara khusus untuk mendeteksi kelas tertentu secara andal. Dalam hal ini, kelas keluaran akan menjadi kelas milik dan bukan milik tipe gambar tertentu. Detektor jaringan saraf digunakan untuk mendeteksi gambar wajah pada gambar masukan. Gambar dipindai oleh jendela berukuran 20x20 piksel, yang diumpankan ke input jaringan, yang memutuskan apakah area tertentu termasuk dalam kelas wajah. Pelatihan dilakukan dengan menggunakan contoh positif (berbagai gambar wajah) dan contoh negatif (gambar yang bukan wajah). Untuk meningkatkan keandalan deteksi, tim jaringan saraf digunakan, dilatih dengan bobot awal yang berbeda, akibatnya jaringan saraf membuat kesalahan dengan cara yang berbeda, dan keputusan akhir dibuat melalui pemungutan suara seluruh tim.

Gambar 5. Komponen utama (eigenfaces) dan penguraian citra menjadi komponen utama

Jaringan saraf juga digunakan untuk mengekstrak karakteristik gambar utama, yang kemudian digunakan untuk klasifikasi selanjutnya. Dalam , metode implementasi jaringan saraf dari metode analisis komponen utama ditampilkan. Inti dari metode analisis komponen utama adalah memperoleh koefisien yang dirancang secara maksimal yang mencirikan gambar masukan. Koefisien ini disebut komponen utama dan digunakan untuk kompresi citra statistik, dimana sejumlah kecil koefisien digunakan untuk mewakili keseluruhan citra. Jaringan saraf dengan satu lapisan tersembunyi yang berisi N neuron (yang jauh lebih kecil dari dimensi gambar), dilatih menggunakan metode propagasi mundur untuk mengembalikan gambar keluaran yang diberikan sebagai masukan, menghasilkan koefisien dari N komponen utama pertama pada keluaran neuron tersembunyi , yang digunakan untuk perbandingan. Biasanya, 10 hingga 200 komponen utama digunakan. Ketika jumlah suatu komponen bertambah, keterwakilannya menurun drastis, dan tidak masuk akal untuk menggunakan komponen dengan jumlah yang besar. Saat menggunakan fungsi aktivasi nonlinier elemen saraf, dekomposisi nonlinier menjadi komponen utama dimungkinkan. Nonlinier memungkinkan variasi dalam data masukan tercermin secara lebih akurat. Dengan menerapkan analisis komponen utama pada dekomposisi gambar wajah, kami memperoleh komponen utama, yang disebut eigenfaces, yang juga memiliki properti berguna - terdapat komponen yang terutama mencerminkan karakteristik penting wajah seperti jenis kelamin, ras, emosi. Ketika direkonstruksi, komponen-komponen tersebut memiliki tampilan seperti wajah, dengan komponen pertama mencerminkan bentuk wajah yang paling umum, komponen kedua mewakili berbagai perbedaan kecil antar wajah (Gbr. 5). Metode ini sangat cocok untuk menemukan gambar wajah yang serupa di database besar. Kemungkinan pengurangan lebih lanjut dimensi komponen utama menggunakan NN juga ditunjukkan. Dengan menilai kualitas rekonstruksi gambar masukan, Anda dapat menentukan secara akurat keanggotaannya dalam kelas wajah.

Jaringan saraf tingkat tinggi. Jaringan saraf tingkat tinggi (HANN) berbeda dari MNN karena hanya memiliki satu lapisan, tetapi masukan neuron juga menerima suku tingkat tinggi, yang merupakan produk dari dua atau lebih komponen vektor masukan. Jaringan semacam itu juga dapat membentuk permukaan pemisah yang rumit.

jaringan saraf Hopfield. Hopfield NN (HNS) adalah lapisan tunggal dan terhubung penuh (tidak ada koneksi antar neuron sendiri), outputnya terhubung ke input. Berbeda dengan MNS, NSC adalah relaksasi - yaitu. diatur ke keadaan awal, ia beroperasi hingga mencapai keadaan stabil, yang akan menjadi nilai keluarannya. Untuk mencari minimum global sehubungan dengan masalah optimasi, digunakan modifikasi stokastik NSC.

Penggunaan NSH sebagai memori asosiatif memungkinkan Anda memulihkan gambar yang dilatih jaringan secara akurat ketika gambar terdistorsi diumpankan ke input. Dalam hal ini, jaringan akan “mengingat” gambar terdekat (dalam arti energi minimum lokal), dan dengan demikian mengenalinya. Fungsi tersebut juga dapat direpresentasikan sebagai penerapan berurutan dari memori asosiatif otomatis yang dijelaskan di atas. Tidak seperti memori asosiatif otomatis, NSC idealnya mengembalikan gambar secara akurat. Untuk menghindari interferensi minimum dan meningkatkan kapasitas jaringan, berbagai metode digunakan.

Jaringan saraf Kohonen yang mengatur dirinya sendiri. Jaringan saraf Kohonen yang mengatur dirinya sendiri (KONNs) menyediakan pengurutan topologi dari ruang gambar masukan. Mereka memungkinkan pemetaan kontinu secara topologi dari ruang masukan berdimensi n ke dalam ruang keluaran berdimensi m, m<

Kognitron. Arsitektur Cognitron mirip dengan struktur korteks visual; ia memiliki organisasi multilapis hierarki di mana neuron antar lapisan hanya terhubung secara lokal. Dipelajari dengan pembelajaran kompetitif (tanpa guru). Setiap lapisan otak menerapkan tingkat generalisasi yang berbeda; lapisan masukan peka terhadap pola sederhana, seperti garis, dan orientasinya pada area tertentu dalam domain visual, sedangkan respons lapisan lain lebih kompleks, abstrak, dan tidak bergantung pada posisi pola. Fungsi serupa diterapkan di kognisi dengan memodelkan organisasi korteks visual.

Neocognitron adalah pengembangan lebih lanjut dari gagasan cognitron dan lebih akurat mencerminkan struktur sistem visual, memungkinkan Anda mengenali gambar terlepas dari transformasi, rotasi, distorsi, dan perubahan skalanya.

Cognitron adalah alat pengenalan gambar yang kuat, tetapi memerlukan biaya komputasi yang tinggi, yang saat ini tidak dapat dicapai.

Metode jaringan saraf yang dipertimbangkan memberikan pengenalan gambar yang cepat dan andal, tetapi ketika menggunakan metode ini, muncul masalah dalam mengenali objek tiga dimensi. Namun pendekatan ini mempunyai banyak keuntungan.

      Kesimpulan

Saat ini, terdapat cukup banyak sistem pengenalan pola otomatis untuk berbagai tugas terapan.

Pengenalan pola dengan metode formal sebagai arahan ilmiah yang mendasar tidak ada habisnya.

Metode matematika pemrosesan gambar memiliki beragam penerapan: sains, teknologi, kedokteran, bidang sosial. Kedepannya peran pengenalan pola dalam kehidupan manusia akan semakin meningkat.

Metode jaringan saraf memberikan pengenalan gambar yang cepat dan andal. Pendekatan ini memiliki banyak keuntungan dan merupakan salah satu yang paling menjanjikan.

literatur

    D.V. Brilyuk, V.V. Starovoitov. Metode jaringan saraf untuk pengenalan gambar // /

    Kuzin L.T. Dasar-dasar sibernetika: Dasar-dasar model sibernetika. T.2. - M.: Energi, 1979. - 584 hal.

    Peregudov F.I., Tarasenko F.P. Pengantar Analisis Sistem: Buku Ajar. – M.: Sekolah Tinggi, 1997. - 389 hal.

    Temnikov F.E., Afonin V.A., Dmitriev V.I. Landasan teori teknologi informasi. - M.: Energi, 1979. - 511 hal.

    Tu J., Gonzalez R. Prinsip pengenalan pola. /Trans. dari bahasa Inggris - M.: Mir, 1978. - 410 hal.

    Winston P. Kecerdasan buatan. /Trans. dari bahasa Inggris - M.: Mir, 1980. - 520 hal.

    Fu K. Metode struktural dalam pengenalan pola: Terjemahan dari bahasa Inggris. - M.: Mir, 1977. - 320 hal.

    Tsypkin Ya.Z. Dasar-dasar teori informasi identifikasi. - M.: Nauka, 1984. - 520 hal.

    Pospelov G.S. Kecerdasan buatan adalah dasar dari teknologi informasi baru. - M.: Nauka, 1988. - 280 hal.

    Yu.Lifshits, Metode statistik pengenalan pola ///modern/07modernnote.pdf

    Bohr N. Fisika atom dan kognisi manusia. /Diterjemahkan dari bahasa Inggris - M.: Mir, 1961. - 151 hal.

    Butakov E.A., Ostrovsky V.I., Fadeev I.L. Pemrosesan gambar di komputer.1987.-236p.

    Duda R., Hart P. Pengenalan pola dan analisis pemandangan. /Diterjemahkan dari bahasa Inggris - M.: Mir, 1978. - 510 hal.

    Adipati V.A. Psikodiagnostik komputer. - SPb.: Persaudaraan, 1994. - 365 hal.

    Aizenberg I.N., Aizenberg N.N. dan Krivosheev G.A. Neuron Biner Multinilai dan Universal: Algoritma Pembelajaran, Aplikasi pada Pemrosesan dan Pengenalan Gambar. Catatan Kuliah dalam Kecerdasan Buatan – Pembelajaran Mesin dan Penambangan Data dalam Pengenalan Pola, 1999, hal. 21-35.

    Ranganath S. dan Arun K. Pengenalan wajah menggunakan fitur transformasi dan jaringan saraf. Pengenalan Pola 1997, Vol. 30, hal. 1615-1622.

    Golovko V.A. Neurointelligence: Teori dan aplikasi. Buku 1. Organisasi dan pelatihan jaringan saraf dengan koneksi langsung dan umpan balik - Brest: BPI, 1999, - 260 hal.

    Vetter T. dan Poggio T. Kelas Objek Linier dan Sintesis Gambar Dari Satu Contoh Gambar. Transaksi IEEE pada Analisis Pola dan Kecerdasan Mesin 1997, Vol. 19, hal. 733-742.

    Golovko V.A. Neurointelligence: Teori dan aplikasi. Buku 2. Pengorganisasian mandiri, toleransi kesalahan dan penerapan jaringan saraf - Brest: BPI, 1999, - 228 hal.

    Lawrence S., Giles C. L., Tsoi A. C. dan Back A. D. Pengenalan Wajah: Pendekatan Jaringan Neural Konvolusional. Transaksi IEEE di Jaringan Syaraf Tiruan, Edisi Khusus Jaringan Syaraf Tiruan dan Pengenalan Pola, hal. 1-24.

    Wasserman F. Teknologi neurokomputer: Teori dan praktik, 1992 – 184 hal.

    Rowley, H. A., Baluja, S. dan Kanade, T. Deteksi Wajah Berbasis Jaringan Syaraf Tiruan. Transaksi IEEE pada Analisis Pola dan Kecerdasan Mesin 1998, Vol. 20, hal. 23-37.

    Valentin D., Abdi H., O"Toole A. J. dan Cottrell G. W. Model pemrosesan wajah connectionist: survei. IN: Pattern Recognition 1994, Vol. 27, hlm. 1209-1230.

    Dokumen

    Mereka membuat algoritma pengakuangambar-gambar. Metodepengakuangambar-gambar Seperti disebutkan di atas... kenyataannya tidak ada"ekosistem secara umum", dan ada hanya individu... kesimpulan dari detail ini tinjauanmetodepengakuan kami presentasikan di...

  1. Tinjauan metode untuk mengidentifikasi orang berdasarkan gambar wajah, dengan mempertimbangkan kekhasan pengenalan visual

    Tinjauan

    ... pengakuan oleh seseorang dari objek kontras rendah, termasuk. orang Diberikan tinjauan umum metode ... Ada seluruh baris metode ... jalan, sebagai hasil penelitian, sebuah platform untuk berkembang metodepengakuan ...

  2. Dinamakan Glazkova Valentina Vladimirovna PENELITIAN DAN PENGEMBANGAN METODE PEMBANGUNAN ALAT PERANGKAT LUNAK UNTUK KLASIFIKASI DOKUMEN HIPERTEKS MULTI-TOPIK Spesialisasi 05

    Abstrak disertasi

    Dokumen hiperteks. Bab ini menyediakan tinjauanyang adametode solusi untuk masalah yang sedang dipertimbangkan, deskripsi... dengan memotong kelas yang paling tidak relevan // Matematika metodepengakuangambar-gambar: Konferensi Seluruh Rusia ke-13. wilayah leningrad...

  3. Slide 0 Ikhtisar tugas bioinformatika yang berkaitan dengan analisis dan pengolahan teks genetik

    Kuliah

    Urutan DNA dan protein. Tinjauan tugas bioinformatika sebagai tugas... sinyal memerlukan penggunaan modern metodepengakuangambar-gambar, pendekatan statistik dan... dengan kepadatan gen yang rendah. Yang ada program prediksi gen tidak...