Kalkulator online analisis korelasi Spearman. Contoh mencari koefisien korelasi rank Spearman. Dalam kasus apa Anda dapat melakukannya tanpa pemeringkatan?

Jika ada dua rangkaian nilai yang diurutkan, maka rasional untuk menghitung korelasi peringkat Spearman.

Seri tersebut dapat diwakili:

  • sepasang ciri yang ditentukan dalam kelompok objek yang diteliti;
  • sepasang karakteristik bawahan individu, ditentukan dalam 2 objek yang diteliti menurut serangkaian karakteristik yang sama;
  • sepasang karakteristik bawahan kelompok;
  • subordinasi karakteristik individu dan kelompok.

Metode ini melibatkan pemeringkatan indikator secara terpisah untuk setiap karakteristik.

Nilai terkecil mempunyai pangkat terkecil.

Metode ini mengacu pada metode statistik nonparametrik yang dirancang untuk menetapkan adanya hubungan antara fenomena yang diteliti:

  • menentukan derajat paralelisme sebenarnya antara dua rangkaian data kuantitatif;
  • penilaian kedekatan hubungan yang teridentifikasi, dinyatakan secara kuantitatif.

Analisis korelasi

Metode statistik yang dirancang untuk mengidentifikasi adanya hubungan antara 2 atau lebih nilai acak (variabel), serta kekuatannya disebut analisis korelasi.

Itu mendapat namanya dari correlatio (lat.) - rasio.

Saat menggunakannya, skenario berikut mungkin terjadi:

  • adanya korelasi (positif atau negatif);
  • tidak ada korelasi (nol).

Jika ada hubungan antar variabel, kita berbicara tentang korelasinya. Dengan kata lain, kita dapat mengatakan bahwa ketika nilai X berubah, pasti akan terjadi perubahan proporsional pada nilai Y.

Berbagai ukuran komunikasi (koefisien) digunakan sebagai alat.

Pilihan mereka dipengaruhi oleh:

  • suatu metode untuk mengukur bilangan acak;
  • sifat hubungan antara bilangan acak.

Adanya hubungan korelasi dapat ditampilkan secara grafis (grafik) dan menggunakan koefisien (tampilan numerik).

Hubungan korelasi dicirikan oleh ciri-ciri berikut:

  • kekuatan koneksi (dengan koefisien korelasi dari ±0,7 hingga ±1 – kuat; dari ±0,3 hingga ±0,699 – rata-rata; dari 0 hingga ±0,299 – lemah);
  • arah komunikasi (langsung atau sebaliknya).

Tujuan Analisis Korelasi

Analisis korelasi tidak memungkinkan kita untuk membangun hubungan sebab akibat antara variabel-variabel yang diteliti.

Hal ini dilakukan dengan tujuan:

  • membangun hubungan antar variabel;
  • memperoleh informasi tertentu tentang suatu variabel berdasarkan variabel lain;
  • menentukan kedekatan (hubungan) ketergantungan ini;
  • menentukan arah sambungan yang terjalin.

Metode analisis korelasi


Analisis ini dapat dilakukan dengan menggunakan:

  • metode kuadrat atau Pearson;
  • metode peringkat atau Spearman.

Metode Pearson dapat diterapkan pada perhitungan yang memerlukan penentuan gaya yang ada antar variabel secara akurat. Karakteristik yang dipelajari dengan bantuannya harus diungkapkan hanya secara kuantitatif.

Untuk menerapkan metode Spearman atau korelasi peringkat, tidak ada persyaratan ketat untuk ekspresi karakteristik - ini dapat bersifat kuantitatif dan atributif. Berkat metode ini, informasi yang diperoleh bukan tentang penentuan kekuatan sambungan secara pasti, tetapi bersifat perkiraan.

Baris variabel mungkin berisi varian terbuka. Misalnya pengalaman kerja dinyatakan dalam nilai seperti sampai 1 tahun, lebih dari 5 tahun, dan sebagainya.

Koefisien korelasi

Besaran statistik yang mencirikan sifat perubahan dua variabel disebut koefisien korelasi atau koefisien korelasi berpasangan. Secara kuantitatif berkisar antara -1 hingga +1.

Peluang yang paling umum adalah:

  • Pearson– berlaku untuk variabel yang termasuk dalam skala interval;
  • pendekar tombak– untuk variabel skala ordinal.

Keterbatasan penggunaan koefisien korelasi

Memperoleh data yang tidak dapat diandalkan saat menghitung koefisien korelasi dimungkinkan dalam kasus di mana:

  • tersedia jumlah nilai variabel yang memadai (25-100 pasang observasi);
  • antara variabel-variabel yang diteliti, misalnya, dibangun hubungan kuadratik, bukan hubungan linier;
  • dalam setiap kasus data berisi lebih dari satu observasi;
  • adanya nilai anomali (outlier) dari variabel;
  • data yang diteliti terdiri dari subkelompok observasi yang dapat dibedakan dengan jelas;
  • adanya korelasi tidak memungkinkan kita untuk menentukan variabel mana yang dapat dianggap sebagai sebab dan mana sebagai akibat.

Memeriksa signifikansi korelasi

Untuk mengevaluasi besaran statistik, digunakan konsep signifikansi atau keandalannya, yang mencirikan kemungkinan terjadinya suatu besaran secara acak atau nilai ekstremnya.

Metode yang paling umum untuk menentukan signifikansi suatu korelasi adalah uji t Student.

Nilainya dibandingkan dengan nilai tabel, banyaknya derajat kebebasan diambil 2. Bila diperoleh nilai kriteria yang dihitung lebih besar dari nilai tabel, hal ini menunjukkan signifikansi koefisien korelasi.

Dalam melakukan perhitungan ekonomi, tingkat kepercayaan 0,05 (95%) atau 0,01 (99%) dianggap cukup.

peringkat Spearman

Koefisien korelasi peringkat Spearman memungkinkan Anda menetapkan secara statistik adanya hubungan antar fenomena. Perhitungannya melibatkan penetapan nomor seri – peringkat – untuk setiap atribut. Pangkatnya bisa naik atau turun.

Jumlah fitur yang diurutkan dapat berapa saja. Ini adalah proses yang agak memakan waktu dan membatasi jumlah mereka. Kesulitan dimulai ketika Anda mencapai 20 tanda.

Untuk menghitung koefisien Spearman, gunakan rumus:

di mana:

n – menampilkan jumlah fitur yang diberi peringkat;

d tidak lebih dari selisih rangking dua variabel;

dan ∑(d2) adalah jumlah kuadrat selisih rangking.

Penerapan analisis korelasi dalam psikologi

Dukungan statistik terhadap penelitian psikologi memungkinkan untuk menjadikannya lebih obyektif dan sangat representatif. Pemrosesan statistik data yang diperoleh selama eksperimen psikologis membantu mengekstraksi informasi berguna sebanyak mungkin.

Metode yang paling banyak digunakan untuk memproses hasilnya adalah analisis korelasi.

Sebaiknya dilakukan analisis korelasi terhadap hasil yang diperoleh selama penelitian:

  • kecemasan (menurut tes R. Temml, M. Dorca, V. Amin);
  • hubungan keluarga (kuesioner “Analisis hubungan keluarga” (AFV) oleh E.G. Eidemiller, V.V. Yustitskis);
  • tingkat internalitas-eksternalitas (kuesioner oleh E.F. Bazhin, E.A. Golynkina dan A.M. Etkind);
  • tingkat kelelahan emosional di kalangan guru (kuesioner oleh V.V. Boyko);
  • hubungan antara unsur-unsur kecerdasan verbal siswa selama pelatihan multidisiplin (metodologi oleh K.M. Gurevich dan lain-lain);
  • hubungan antara tingkat empati (metode V.V. Boyko) dan kepuasan pernikahan (kuesioner oleh V.V. Stolin, T.L. Romanova, G.P. Butenko);
  • hubungan antara status sosiometri remaja (tes Jacob L. Moreno) dan karakteristik gaya pendidikan keluarga (kuesioner oleh E.G. Eidemiller, V.V. Yustitskis);
  • struktur tujuan hidup remaja yang dibesarkan dalam keluarga dengan dua orang tua dan orang tua tunggal (kuesioner Edward L. Deci, Richard M. Ryan Ryan).

Petunjuk singkat untuk melakukan analisis korelasi menggunakan kriteria Spearman

Analisis korelasi dilakukan dengan menggunakan metode Spearman sesuai dengan algoritma berikut:

  • karakteristik berpasangan yang sebanding disusun dalam 2 baris, yang satu diberi tanda X, dan yang lainnya diberi tanda Y;
  • nilai deret X disusun dalam urutan menaik atau menurun;
  • urutan susunan nilai deret Y ditentukan oleh kesesuaiannya dengan nilai deret X;
  • untuk setiap nilai dalam seri X, tentukan peringkatnya - tetapkan nomor urut dari nilai minimum hingga maksimum;
  • untuk setiap nilai pada deret Y, tentukan juga rangkingnya (dari minimum ke maksimum);
  • menghitung selisih (D) antara pangkat X dan Y, dengan menggunakan rumus D=X-Y;
  • nilai selisih yang dihasilkan dikuadratkan;
  • melakukan penjumlahan kuadrat selisih pangkat;
  • lakukan perhitungan menggunakan rumus:

Contoh korelasi Spearman

Adanya korelasi antara pengalaman kerja dan tingkat cedera perlu ditentukan jika data berikut tersedia:

Metode analisis yang paling cocok adalah metode rank, karena salah satu cirinya disajikan dalam bentuk pilihan terbuka: pengalaman kerja maksimal 1 tahun dan pengalaman kerja 7 tahun atau lebih.

Penyelesaian masalah diawali dengan pemeringkatan data, yang disusun menjadi tabel kerja dan dapat dilakukan secara manual, karena volumenya tidak besar:

Pengalaman kerja Jumlah cedera Nomor serial (peringkat) Perbedaan peringkat Perbedaan peringkat kuadrat
d(xy)
hingga 1 tahun 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 atau lebih 6 5 1 +4 16
Σ d2 = 38,5

Kemunculan rangking pecahan pada kolom disebabkan karena jika muncul varian yang besarnya sama, maka ditemukan mean aritmatika dari rangking tersebut. Dalam contoh ini, indikator cedera 12 muncul dua kali dan diberi peringkat 2 dan 3, carilah mean aritmatika dari peringkat tersebut (2+3)/2= 2,5 dan letakkan nilai ini di lembar kerja untuk 2 indikator.
Dengan mensubstitusikan nilai-nilai yang diperoleh ke dalam rumus kerja dan melakukan perhitungan sederhana, kita memperoleh koefisien Spearman sebesar -0,92

Nilai koefisien negatif menunjukkan adanya hubungan terbalik antara karakteristik dan memungkinkan kita untuk menyatakan bahwa pengalaman kerja yang singkat disertai dengan sejumlah besar cedera. Apalagi kekuatan hubungan antara indikator-indikator tersebut cukup besar.
Tahap perhitungan selanjutnya adalah menentukan reliabilitas koefisien yang diperoleh:
kesalahannya dan ujian Siswa dihitung

37. Koefisien korelasi peringkat Spearman.

S.56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Koefisien korelasi peringkat Spearman digunakan dalam kasus di mana:
- variabel punya skala peringkat pengukuran;
- distribusi datanya terlalu berbeda normal atau tidak diketahui sama sekali;
- sampel memiliki volume kecil (N< 30).

Penafsiran koefisien korelasi rank Spearman tidak berbeda dengan koefisien Pearson, namun maknanya agak berbeda. Untuk memahami perbedaan antara metode-metode ini dan secara logis membenarkan penerapannya, mari kita bandingkan rumusnya.

Koefisien korelasi Pearson:

Koefisien korelasi Spearman:

Seperti yang Anda lihat, rumusnya sangat berbeda. Mari kita bandingkan rumusnya

Rumus korelasi Pearson menggunakan mean aritmatika dan deviasi standar dari deret yang berkorelasi, namun rumus Spearman tidak. Oleh karena itu, untuk memperoleh hasil yang memadai dengan menggunakan rumus Pearson, deret korelasi harus mendekati distribusi normal (rata-rata dan simpangan baku adalah parameter distribusi normal). Hal ini tidak relevan dengan rumus Spearman.

Salah satu elemen rumus Pearson adalah standarisasi setiap deret di skala z.

Seperti yang Anda lihat, konversi variabel ke skala Z terdapat dalam rumus koefisien korelasi Pearson. Oleh karena itu, untuk koefisien Pearson, skala data tidak menjadi masalah sama sekali: misalnya, kita dapat mengkorelasikan dua variabel, salah satunya memiliki nilai min. = 0 dan maks. = 1, dan menit kedua. = 100 dan maks. = 1000. Betapapun berbedanya rentang nilainya, semuanya akan dikonversi ke nilai z standar yang skalanya sama.

Oleh karena itu, normalisasi seperti itu tidak terjadi pada koefisien Spearman

KONDISI WAJIB PENGGUNAAN KOEFISIEN SPEARMAN ADALAH KESETARAAN RANGE DUA VARIABEL.

Sebelum menggunakan koefisien Spearman untuk rangkaian data dengan rentang yang berbeda, perlu dilakukan pangkat. Pemeringkatan menghasilkan nilai-nilai dari rangkaian ini memperoleh nilai minimum yang sama = 1 (peringkat minimum) dan maksimum yang sama dengan jumlah nilai (maksimum, peringkat terakhir = N, yaitu jumlah kasus maksimum dalam sampel) .

Dalam kasus apa Anda dapat melakukannya tanpa pemeringkatan?

Ini adalah kasus ketika data awalnya skala peringkat. Misalnya, tes orientasi nilai Rokeach.

Selain itu, ini adalah kasus ketika jumlah opsi nilai kecil dan sampel berisi nilai minimum dan maksimum yang tetap. Misalnya dalam diferensial semantik, minimum = 1, maksimum = 7.

Contoh penghitungan koefisien korelasi rank Spearman

Uji orientasi nilai Rokeach dilakukan pada dua sampel X dan Y. Tujuan: untuk mengetahui seberapa dekat hierarki nilai sampel tersebut (secara harfiah, seberapa miripnya).

Nilai yang dihasilkan r=0,747 diperiksa dengan tabel nilai kritis. Berdasarkan tabel, dengan N=18, nilai yang diperoleh signifikan pada taraf p<=0,005

Koefisien korelasi peringkat Spearman dan Kendal

Untuk variabel yang termasuk dalam skala ordinal atau untuk variabel yang tidak berdistribusi normal, serta untuk variabel yang termasuk dalam skala interval, korelasi rank Spearman dihitung, bukan koefisien Pearson. Untuk melakukan ini, nilai-nilai variabel individual diberi peringkat, yang kemudian diproses menggunakan rumus yang sesuai. Untuk mendeteksi korelasi peringkat, kosongkan kotak centang korelasi Pearson default di kotak dialog Korelasi Bivariat.... Sebagai gantinya, aktifkan penghitungan korelasi Spearman. Perhitungan ini akan memberikan hasil sebagai berikut. Koefisien korelasi peringkat sangat dekat dengan nilai koefisien Pearson yang sesuai (variabel asli berdistribusi normal).

titkova-matmetody.pdf hal. 45

Metode korelasi peringkat Spearman memungkinkan Anda menentukan kekencangan (kekuatan) dan arah

korelasi antara dua tanda atau dua profil (hierarki) tanda-tanda.

Untuk menghitung korelasi peringkat, diperlukan dua baris nilai,

yang dapat diurutkan. Rangkaian nilai tersebut dapat berupa:

1) dua tanda diukur dengan cara yang sama kelompok mata pelajaran;

2) dua hierarki karakteristik individu, diidentifikasi dalam dua subjek menggunakan yang sama

serangkaian fitur;

3) dua hierarki kelompok karakteristik,

4) individu dan kelompok hierarki fitur.

Pertama, indikator-indikator tersebut diberi peringkat secara terpisah untuk masing-masing karakteristik.

Biasanya, peringkat yang lebih rendah diberikan pada nilai atribut yang lebih rendah.

Dalam kasus pertama (dua karakteristik), nilai individu diberi peringkat menurut yang pertama

karakteristik yang diperoleh oleh mata pelajaran yang berbeda, dan kemudian nilai individu untuk yang kedua

tanda.

Jika dua karakteristik berhubungan positif, maka subjek memiliki peringkat rendah

salah satu dari mereka akan memiliki peringkat rendah di yang lain, dan subjek yang memiliki peringkat tinggi di dalamnya

salah satu karakteristik juga akan memiliki peringkat tinggi untuk karakteristik lainnya. Untuk menghitung rs

perbedaan perlu ditentukan (D) antara peringkat yang diperoleh subjek tertentu di keduanya

tanda-tanda. Kemudian indikator d ini diubah dengan cara tertentu dan dikurangkan dari 1. Than

Semakin kecil perbedaan antar peringkat, rs akan semakin besar, dan semakin mendekati +1.

Jika tidak ada korelasi maka semua rangking akan tercampur dan tidak ada

tidak ada korespondensi. Rumusnya dirancang sedemikian rupa sehingga dalam hal ini rs akan mendekati 0.

Jika terjadi korelasi negatif peringkat rendah mata pelajaran pada satu dasar

peringkat tinggi pada basis lain akan sesuai, dan sebaliknya. Semakin besar kesenjangannya

antara rangking subjek pada dua variabel maka rs semakin mendekati -1.

Dalam kasus kedua (dua profil individual), masing-masing diberi peringkat

nilai-nilai yang diperoleh masing-masing 2 mata pelajaran menurut tertentu (sama bagi mereka

keduanya) serangkaian fitur. Peringkat pertama akan diberikan pada fitur dengan nilai terendah; peringkat kedua –

tanda dengan nilai lebih tinggi, dll. Jelasnya, semua karakteristik harus diukur

unit yang sama, jika tidak, pemeringkatan tidak mungkin dilakukan. Misalnya saja tidak mungkin

memberi peringkat pada indikator-indikator pada Cattell Personality Inventory (16PF), jika indikator-indikator tersebut dinyatakan dalam

poin "mentah", karena rentang nilainya berbeda untuk faktor yang berbeda: dari 0 hingga 13, dari 0 hingga

20 dan dari 0 sampai 26. Kita tidak bisa mengatakan faktor mana yang menempati urutan pertama

ekspresi sampai kita membawa semua nilai ke satu skala (paling sering ini adalah skala dinding).

Jika hierarki individu dari dua subjek berhubungan positif, maka tandanya

memiliki peringkat rendah di salah satu dari mereka akan memiliki peringkat rendah di yang lain, dan sebaliknya.

Misalnya, jika faktor E (dominasi) suatu subjek memiliki peringkat paling rendah, maka

subjek tes yang lain, seharusnya mempunyai peringkat yang rendah jika salah satu subjek tes mempunyai faktor C

(kestabilan emosi) mempunyai rangking paling tinggi, maka mata pelajaran yang lain juga harus mempunyai

faktor ini memiliki peringkat tinggi, dll.

Dalam kasus ketiga (dua profil grup), nilai rata-rata grup diurutkan,

diperoleh dalam 2 kelompok mata pelajaran menurut himpunan tertentu, identik untuk kedua kelompok

tanda-tanda. Berikut ini alur pemikirannya sama dengan dua kasus sebelumnya.

Dalam kasus 4 (profil individu dan grup), mereka diberi peringkat secara terpisah

nilai individu dari nilai rata-rata subjek dan kelompok untuk himpunan yang sama

tanda-tanda yang diperoleh, sebagai suatu peraturan, dengan mengecualikan subjek individu ini - dia

tidak berpartisipasi dalam profil grup rata-rata yang akan dibandingkan dengan profil individualnya

Profil. Korelasi peringkat akan memungkinkan Anda memeriksa seberapa konsisten individu dan

profil grup.

Dalam keempat kasus tersebut, signifikansi koefisien korelasi yang dihasilkan ditentukan

dengan jumlah nilai peringkat N. Dalam kasus pertama, jumlah ini akan sama

ukuran sampel n. Dalam kasus kedua, jumlah observasi adalah jumlah fitur,

menyusun hierarki. Dalam kasus ketiga dan keempat, N juga merupakan bilangan yang dibandingkan

karakteristik, dan bukan jumlah subjek dalam kelompok. Penjelasan rinci diberikan dalam contoh. Jika

nilai absolut rs mencapai atau melampaui nilai kritis, korelasi

dapat diandalkan.

Hipotesis.

Ada dua hipotesis yang mungkin. Yang pertama berlaku untuk kasus 1, yang kedua berlaku untuk tiga kasus lainnya

Hipotesis versi pertama

H0 : Korelasi antara variabel A dan B tidak berbeda dengan nol.

H2: Korelasi antara variabel A dan B berbeda nyata dari nol.

Hipotesis versi kedua

H0: Korelasi antara hierarki A dan B tidak berbeda dengan nol.

H2: Korelasi antara hierarki A dan B berbeda nyata dari nol.

Keterbatasan koefisien korelasi peringkat

1. Untuk setiap variabel, minimal harus disajikan 5 observasi. Atas

batas pengambilan sampel ditentukan oleh tabel nilai kritis yang tersedia .

2. Koefisien korelasi peringkat Spearman adalah rs untuk sejumlah besar hal yang identik

peringkat untuk satu atau kedua variabel yang dibandingkan memberikan nilai kasar. Idealnya

kedua deret yang berkorelasi harus mewakili dua barisan yang berbeda

nilai-nilai. Jika kondisi ini tidak terpenuhi, maka harus dilakukan amandemen

peringkat yang sama.

Koefisien korelasi peringkat Spearman dihitung dengan menggunakan rumus:

Jika kedua rangkaian peringkat yang dibandingkan berisi kelompok dengan peringkat yang sama,

sebelum menghitung koefisien korelasi peringkat, perlu dilakukan koreksi

Peringkat Ta dan TV:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

Di mana A - volume setiap kelompok barisan yang sama pada barisan barisan A, in volume masing-masing

kelompok peringkat yang identik dalam seri peringkat B.

Untuk menghitung nilai empiris rs digunakan rumus:

38. Koefisien korelasi titik-biserial.

Mengenai korelasi secara umum lihat soal no.36 Dengan. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Misalkan variabel X diukur dengan skala kuat, dan variabel Y diukur dengan skala dikotomis. Koefisien korelasi biserial titik rpb dihitung dengan menggunakan rumus:

Di sini x 1 adalah nilai rata-rata atas X benda dengan nilai “satu” atas Y;

x 0 – nilai rata-rata pada objek X dengan nilai “nol” pada Y;

s x – simpangan baku semua nilai sepanjang X;

n 1 – jumlah benda “satu” di Y, n 0 – jumlah benda “nol” di Y;

n = n 1 + n 0 – ukuran sampel.

Koefisien korelasi biserial titik juga dapat dihitung menggunakan ekspresi setara lainnya:

Di sini x– nilai rata-rata keseluruhan untuk variabel X.

Koefisien korelasi biserial titik rpb bervariasi dari –1 hingga +1. Nilainya nol jika variabelnya satu Y memiliki rata-rata Y, sama dengan rata-rata variabel dengan nol di atas Y.

Penyelidikan hipotesis signifikansi titik koefisien korelasi biserial adalah untuk memeriksa hipotesis nolH 0 tentang persamaan koefisien korelasi umum dengan nol: ρ = 0, yang dilakukan dengan menggunakan uji-t Student. Signifikansi empiris

dibandingkan dengan nilai kritis T A (df) untuk jumlah derajat kebebasan df = N– 2

Jika kondisi | T| ≤ itu(df), hipotesis nol ρ = 0 tidak ditolak. Koefisien korelasi biserial titik berbeda nyata dengan nol jika nilai empirisnya | T| termasuk dalam daerah kritis yaitu jika kondisi | T| > itu(N– 2). Reliabilitas hubungan dihitung dengan menggunakan koefisien korelasi titik biserial rpb, juga dapat ditentukan dengan menggunakan kriteria χ 2 untuk jumlah derajat kebebasan df= 2.

Korelasi titik biserial

Modifikasi selanjutnya dari koefisien korelasi hasil kali momen tercermin dalam titik biserial R. Statistik ini. menunjukkan hubungan antara dua variabel, yang satu dianggap kontinu dan terdistribusi normal, dan yang lainnya diskrit dalam arti sebenarnya. Koefisien korelasi biserial titik dilambangkan dengan R pbis Sejak di R pbis dikotomi mencerminkan sifat sebenarnya dari variabel diskrit, dan tidak dibuat-buat, seperti dalam kasus ini R bis, tandanya ditentukan secara sewenang-wenang. Oleh karena itu, untuk semua tujuan praktis. sasaran R pbis dianggap dalam kisaran dari 0,00 hingga +1,00.

Ada juga kasus di mana dua variabel diasumsikan kontinu dan terdistribusi normal, namun keduanya dikotomi secara artifisial, seperti dalam kasus korelasi biserial. Untuk menilai hubungan antar variabel tersebut digunakan koefisien korelasi tetrakorik R tet, yang juga dibesarkan oleh Pearson. Dasar rumus (tepat) dan tata cara perhitungannya R tet cukup kompleks. Oleh karena itu, dengan praktis Metode ini menggunakan perkiraan R tet,diperoleh berdasarkan prosedur dan tabel yang disingkat.

/on-line/dictionary/dictionary.php?term=511

KOEFISIEN BISERIAL TITIK adalah koefisien korelasi antara dua variabel, yang satu diukur pada skala dikotomis dan yang lainnya pada skala interval. Ini digunakan dalam pengujian klasik dan modern sebagai indikator kualitas tugas tes - keandalan dan konsistensi dengan skor tes keseluruhan.

Untuk mengkorelasikan variabel yang diukur dalam skala dikotomis dan interval menggunakan koefisien korelasi titik-biserial.
Koefisien korelasi point-biserial adalah suatu metode analisis korelasi hubungan variabel yang salah satunya diukur dalam skala nama dan hanya mengambil 2 nilai (misalnya laki-laki/perempuan, jawaban benar/jawaban salah, ciri hadir/tidak hadir), dan yang kedua pada skala rasio atau skala interval. Rumus untuk menghitung koefisien korelasi titik-biserial:

Di mana:
m1 dan m0 merupakan nilai rata-rata X dengan nilai 1 atau 0 pada Y.
σx – simpangan baku semua nilai sebesar X
n1,n0 – banyaknya nilai X dari 1 atau 0 sampai Y.
n – jumlah total pasangan nilai

Paling sering, jenis koefisien korelasi ini digunakan untuk menghitung hubungan antara tugas tes dan skala total. Ini adalah salah satu jenis pemeriksaan validitas.

39. Koefisien korelasi peringkat-biserial.

Mengenai korelasi secara umum lihat soal no.36 Dengan. 56 (64) 063.JPG

harchenko-korranaliz.pdf hal. 28

Koefisien korelasi biserial peringkat, digunakan dalam kasus di mana salah satu variabel ( X) disajikan dalam skala ordinal, dan yang lainnya ( Y) – dikotomis, dihitung dengan rumus

.

Berikut adalah peringkat rata-rata objek yang memiliki satu Y; – peringkat rata-rata objek dengan nol hingga Y, N- ukuran sampel.

Penyelidikan hipotesis signifikansi Koefisien korelasi rank-biserial dilakukan serupa dengan koefisien korelasi biserial titik menggunakan uji Student dengan penggantian dalam rumus Rhal pada Rrb.

Dalam kasus dimana satu variabel diukur pada skala dikotomis (variabel X), dan yang lainnya dalam skala rank (variabel Y), digunakan koefisien korelasi rank-biserial. Kita ingat bahwa variabel X, diukur pada skala dikotomis, hanya mengambil dua nilai (kode) 0 dan 1. Kami menekankan secara khusus: meskipun koefisien ini bervariasi dalam kisaran –1 hingga +1, tandanya tidak menjadi masalah untuk interpretasi nilai hasil. Ini merupakan pengecualian lain terhadap aturan umum.

Koefisien ini dihitung dengan menggunakan rumus:

dimana ` X 1 peringkat rata-rata untuk elemen-elemen variabel tersebut Y, yang sesuai dengan kode (tanda) 1 pada variabel X;

`X 0 – peringkat rata-rata untuk elemen variabel tersebut kamu, yang sesuai dengan kode (tanda) 0 pada variabel X\

N - jumlah total elemen dalam variabel X.

Untuk menerapkan koefisien korelasi rank-biserial, kondisi berikut harus dipenuhi:

1. Variabel-variabel yang dibandingkan harus diukur pada skala yang berbeda: satu X - dalam skala dikotomis; lainnya kamu– pada skala peringkat.

2. Banyaknya karakteristik yang bervariasi pada variabel-variabel yang dibandingkan X Dan Y harus sama.

3. Untuk menilai tingkat reliabilitas koefisien korelasi rank-biserial sebaiknya menggunakan rumus (11.9) dan tabel nilai kritis kriteria Student k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Kasus di mana salah satu variabel direpresentasikan dalam skala dikotomis, dan yang lainnya di peringkat (ordinal), memerlukan lamaran koefisien korelasi peringkat-biserial:

rpb=2 / n * (m1 - m0)

Di mana:
n – jumlah objek pengukuran
m1 dan m0 - peringkat rata-rata objek dengan 1 atau 0 pada variabel kedua.
Koefisien ini juga digunakan saat memeriksa validitas tes.

40. Koefisien korelasi linier.

Untuk korelasi secara umum (dan korelasi linier pada khususnya), lihat soal No.36 Dengan. 56 (64) 063.JPG

KOEFISIEN Tn. PEARSON

R-Pearson (Pearson R) digunakan untuk mempelajari hubungan antara dua metrikvariabel berbeda yang diukur pada sampel yang sama. Ada banyak situasi di mana penggunaannya tepat. Apakah kecerdasan mempengaruhi kinerja akademik di tahun-tahun terakhir universitas? Apakah besar kecilnya gaji seorang karyawan berhubungan dengan keramahannya terhadap rekan kerja? Apakah suasana hati siswa mempengaruhi keberhasilan penyelesaian masalah aritmatika yang kompleks? Untuk menjawab pertanyaan tersebut, peneliti harus mengukur dua indikator minat untuk setiap anggota sampel. Data untuk mempelajari hubungan tersebut kemudian ditabulasikan, seperti pada contoh di bawah ini.

CONTOH 6.1

Tabel tersebut menunjukkan contoh data awal pengukuran dua indikator kecerdasan (verbal dan nonverbal) pada 20 siswa kelas 8.

Hubungan antar variabel tersebut dapat digambarkan dengan menggunakan scatterplot (lihat Gambar 6.3). Diagram tersebut menunjukkan bahwa terdapat hubungan antara indikator-indikator yang diukur: semakin besar nilai kecerdasan verbal, maka (sebagian besar) semakin besar pula nilai kecerdasan nonverbal.

Sebelum memberikan rumus koefisien korelasi, mari kita coba menelusuri logika kemunculannya menggunakan data pada contoh 6.1. Posisi setiap titik / (subjek dengan angka /) pada diagram sebar relatif terhadap titik lainnya (Gbr. 6.3) dapat ditentukan dengan nilai dan tanda penyimpangan nilai variabel yang bersangkutan dari nilai rata-ratanya. : (xj - MJ Dan (pikiran pada ). Jika tanda-tanda penyimpangan tersebut bertepatan, maka hal ini menunjukkan hubungan yang positif (nilainya lebih besar X nilai besar sesuai dengan pada atau nilai yang lebih rendah X nilai yang lebih kecil sesuai dengan kamu).

Untuk mata pelajaran No. 1, penyimpangan dari rata-rata X dan oleh pada positif, dan untuk mata pelajaran No. 3 kedua penyimpangannya negatif. Akibatnya, data dari keduanya menunjukkan hubungan positif antara sifat-sifat yang diteliti. Sebaliknya jika terjadi tanda-tanda penyimpangan dari rata-rata X dan oleh pada berbeda, hal ini akan menunjukkan adanya hubungan negatif antar karakteristik. Jadi, untuk mata pelajaran No. 4, penyimpangan dari rata-rata X negatif, oleh kamu - positif, dan untuk mata pelajaran No. 9 - sebaliknya.

Jadi, jika hasil kali simpangan (x,- M X ) X (pikiran pada ) positif, maka data /-subjek menunjukkan hubungan langsung (positif), dan jika negatif, maka hubungan terbalik (negatif). Oleh karena itu, jika XwY y umumnya berbanding lurus, maka sebagian besar hasil kali deviasinya akan bertanda positif, dan jika berbanding terbalik maka sebagian besar hasil kali deviasinya akan bertanda negatif. Oleh karena itu, indikator umum kekuatan dan arah hubungan dapat berupa jumlah semua produk deviasi untuk sampel tertentu:

Dengan hubungan berbanding lurus antar variabel, nilai ini besar dan positif - bagi sebagian besar subjek, penyimpangannya bertanda sama (nilai besar dari satu variabel sesuai dengan nilai besar variabel lain dan sebaliknya). Jika X Dan pada memiliki umpan balik, maka untuk sebagian besar mata pelajaran, nilai yang lebih besar dari satu variabel akan sesuai dengan nilai yang lebih kecil dari variabel lain, yaitu, tanda produknya akan negatif, dan jumlah produk secara keseluruhan juga akan menjadi besar dalam nilai absolut, tetapi bertanda negatif. Jika tidak ada hubungan sistematis antar variabel, maka suku positif (hasil kali simpangan) akan diseimbangkan dengan suku negatif, dan jumlah semua hasil kali simpangan akan mendekati nol.

Untuk memastikan bahwa jumlah produk tidak bergantung pada ukuran sampel, cukup dengan membuat rata-ratanya. Namun kami tertarik pada ukuran interkoneksi bukan sebagai parameter umum, tetapi sebagai perkiraan yang dihitung - statistik. Oleh karena itu, untuk rumus dispersi, dalam hal ini kita akan melakukan hal yang sama, membagi jumlah hasil kali simpangan bukan dengan N, dan di TV - 1. Hasilnya adalah ukuran koneksi, yang banyak digunakan dalam fisika dan ilmu teknik, yang disebut kovarians (Kebersamaan):


DI DALAM Dalam psikologi, tidak seperti fisika, sebagian besar variabel diukur pada skala yang berubah-ubah, karena psikolog tidak tertarik pada nilai absolut suatu tanda, tetapi pada posisi relatif subjek dalam suatu kelompok. Selain itu, kovarians sangat sensitif terhadap skala (varians) yang mengukur sifat-sifat tersebut. Untuk membuat ukuran hubungan tidak bergantung pada satuan pengukuran kedua karakteristik, cukup dengan membagi kovarians menjadi standar deviasi yang sesuai. Demikianlah diperoleh untuk-Koefisien korelasi Bagal K. Pearson:

atau, setelah mengganti ekspresi dengan o x dan


Jika nilai kedua variabel diubah menjadi nilai r menggunakan rumus


maka rumus koefisien korelasi r-Pearson terlihat lebih sederhana (071.JPG):

/dict/sosiologi/article/soc/soc-0525.htm

KORELASI LINEAR- hubungan linier statistik yang bersifat non-kausal antara dua variabel kuantitatif X Dan pada. Diukur menggunakan "koefisien K.L". Pearson, yang merupakan hasil pembagian kovarians dengan standar deviasi kedua variabel:

,

Di mana S xy- kovarians antar variabel X Dan pada;

S X , S kamu- standar deviasi untuk variabel X Dan pada;

X Saya , kamu Saya- nilai variabel X Dan pada untuk objek dengan nomor Saya;

X, kamu- rata-rata aritmatika untuk variabel X Dan pada.

Koefisien Pearson R dapat mengambil nilai dari interval [-1; +1]. Arti r = 0 berarti tidak ada hubungan linier antar variabel X Dan pada(tetapi tidak mengecualikan hubungan statistik nonlinier). Nilai koefisien positif ( R> 0) menunjukkan hubungan linier langsung; semakin dekat nilainya dengan +1, semakin kuat hubungan garis statistiknya. Nilai koefisien negatif ( R < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения R= ±1 berarti adanya hubungan linier lengkap, langsung atau terbalik. Dalam hal koneksi lengkap, semua titik dengan koordinat ( X Saya , kamu Saya) berbaring pada garis lurus kamu = A + bx.

"Koefisien K.L." Pearson juga digunakan untuk mengukur kekuatan koneksi dalam model regresi linier berpasangan.

41. Matriks korelasi dan grafik korelasi.

Mengenai korelasi secara umum lihat soal no.36 Dengan. 56 (64) 063.JPG

Matriks korelasi. Seringkali, analisis korelasi mencakup studi tentang hubungan bukan antara dua, tetapi banyak variabel yang diukur pada skala kuantitatif dalam satu sampel. Dalam hal ini, korelasi dihitung untuk setiap pasangan kumpulan variabel tertentu. Perhitungannya biasanya dilakukan di komputer, dan hasilnya berupa matriks korelasi.

Matriks korelasi(Korelasi Matriks) adalah hasil penghitungan korelasi satu jenis untuk setiap pasangan dari himpunan R variabel yang diukur dalam skala kuantitatif dalam satu sampel.

CONTOH

Misalkan kita mempelajari hubungan antara 5 variabel (vl, v2,..., v5; P= 5), diukur pada sampel N=30 Manusia. Di bawah ini adalah tabel sumber data dan matriks korelasi.

DAN
data serupa:

Matriks korelasi:

Sangat mudah untuk memperhatikan bahwa matriks korelasi berbentuk persegi, simetris terhadap diagonal utama (takkak,y = /) y), dengan satuan pada diagonal utama (karena G Dan = Gu = 1).

Matriks korelasinya adalah persegi: jumlah baris dan kolom sama dengan jumlah variabel. Dia simetris relatif terhadap diagonal utama, karena korelasinya X Dengan pada sama dengan korelasi pada Dengan X. Satuannya terletak pada diagonal utamanya, karena korelasi fitur dengan dirinya sendiri sama dengan satu. Oleh karena itu, tidak semua elemen matriks korelasi harus dianalisis, melainkan elemen yang terletak di atas atau di bawah diagonal utama.

Jumlah koefisien korelasi, Pfitur yang akan dianalisis ketika mempelajari hubungan ditentukan oleh rumus: P(P- 1)/2. Pada contoh di atas, banyaknya koefisien korelasi adalah 5(5 - 1)/2 = 10.

Tugas utama menganalisis matriks korelasi adalah mengidentifikasi struktur hubungan antara banyak fitur. Dalam hal ini, analisis visual dimungkinkan galaksi korelasi- gambar grafis struktur secara statistikkoneksi yang bermakna, jika koneksi seperti itu tidak terlalu banyak (hingga 10-15). Cara lain adalah dengan menggunakan metode multivariat: regresi berganda, analisis faktor atau klaster (lihat bagian “Metode multivariat…”). Dengan menggunakan analisis faktor atau cluster, dimungkinkan untuk mengidentifikasi pengelompokan variabel yang lebih erat hubungannya satu sama lain dibandingkan dengan variabel lainnya. Kombinasi cara-cara tersebut juga sangat efektif, misalnya jika tandanya banyak dan tidak homogen.

Perbandingan korelasi - tugas tambahan menganalisis matriks korelasi, yang memiliki dua pilihan. Jika perlu membandingkan korelasi pada salah satu baris matriks korelasi (untuk salah satu variabel), digunakan metode perbandingan sampel dependen (hal. 148-149). Saat membandingkan korelasi dengan nama yang sama yang dihitung untuk sampel yang berbeda, digunakan metode perbandingan untuk sampel independen (hal. 147-148).

Metode perbandingan korelasi secara diagonal matriks korelasi (untuk menilai stasioneritas proses acak) dan perbandingan beberapa matriks korelasi yang diperoleh untuk sampel yang berbeda (untuk homogenitasnya) bersifat padat karya dan berada di luar cakupan buku ini. Anda dapat mengenal metode ini dari buku karya G.V.

Masalah signifikansi statistik korelasi. Masalahnya adalah prosedur pengujian hipotesis statistik mengasumsikan satu-banyak pengujian dilakukan pada satu sampel. Jika metode yang sama diterapkan berkali-kali, bahkan jika dikaitkan dengan variabel yang berbeda, kemungkinan memperoleh hasil yang murni kebetulan meningkat. Secara umum jika kita mengulangi metode pengujian hipotesis yang sama sekali dalam kaitannya dengan variabel atau sampel yang berbeda, maka dengan nilai a yang ditetapkan kita dijamin mendapat konfirmasi hipotesis c ah jumlah kasus.

Misalkan matriks korelasi dianalisis untuk 15 variabel, yaitu 15(15-1)/2 = 105 koefisien korelasi dihitung. Untuk menguji hipotesis, ditetapkan level a = 0,05. Dengan memeriksa hipotesis sebanyak 105 kali, kita akan menerima konfirmasi lima kali (!), terlepas dari apakah koneksi tersebut benar-benar ada. Mengetahui hal ini dan memiliki, katakanlah, 15 koefisien korelasi yang “signifikan secara statistik”, dapatkah kita membedakan mana yang diperoleh secara kebetulan dan mana yang mencerminkan hubungan nyata?

Sebenarnya, untuk membuat keputusan statistik, tingkat a perlu dikurangi sebanyak jumlah hipotesis yang diuji. Namun hal ini hampir tidak disarankan, karena kemungkinan mengabaikan koneksi yang sebenarnya ada (membuat kesalahan Tipe II) meningkat dengan cara yang tidak dapat diprediksi.

Matriks korelasi saja tidak cukup sebagai dasaruntuk kesimpulan statistik mengenai koefisien individu yang termasuk di dalamnyakorelasi!

Hanya ada satu cara yang benar-benar meyakinkan untuk menyelesaikan masalah ini: membagi sampel secara acak menjadi dua bagian dan hanya memperhitungkan korelasi yang signifikan secara statistik di kedua bagian sampel. Alternatifnya adalah penggunaan metode multivariat (analisis faktor, klaster, atau regresi berganda) untuk mengidentifikasi dan selanjutnya menafsirkan kelompok variabel yang terkait secara signifikan secara statistik.

Masalah nilai yang hilang. Jika ada nilai yang hilang dalam data, maka ada dua opsi untuk menghitung matriks korelasi: a) penghapusan nilai baris demi baris (Mengecualikankasusberdasarkan daftar); b) penghapusan nilai secara berpasangan (Mengecualikankasusberpasangan). Pada penghapusan baris demi baris pengamatan dengan nilai yang hilang, seluruh baris untuk suatu objek (subjek) yang memiliki setidaknya satu nilai yang hilang untuk salah satu variabel akan dihapus. Metode ini menghasilkan matriks korelasi yang “benar” dalam artian semua koefisien dihitung dari kumpulan objek yang sama. Namun, jika nilai-nilai yang hilang didistribusikan secara acak dalam variabel, maka metode ini dapat mengarah pada fakta bahwa tidak ada satu objek pun yang tersisa dalam kumpulan data yang dipertimbangkan (setidaknya akan ada satu nilai yang hilang di setiap baris) . Untuk menghindari situasi ini, gunakan metode lain yang disebut penghapusan berpasangan. Metode ini hanya mempertimbangkan gap pada setiap pasangan kolom-variabel yang dipilih dan mengabaikan gap pada variabel lainnya. Korelasi untuk sepasang variabel dihitung untuk objek yang tidak terdapat kesenjangan. Dalam banyak situasi, terutama ketika jumlah kesenjangan relatif kecil, misalnya 10%, dan kesenjangan didistribusikan secara acak, metode ini tidak menyebabkan kesalahan serius. Namun, terkadang hal ini tidak terjadi. Misalnya, bias sistematis (pergeseran) dalam penilaian mungkin “menyembunyikan” susunan kelalaian yang sistematis, yang menjadi alasan perbedaan koefisien korelasi yang dibangun untuk himpunan bagian yang berbeda (misalnya, untuk subkelompok objek yang berbeda). Masalah lain terkait dengan matriks korelasi yang dihitung dengan berpasangan penghapusan kesenjangan terjadi ketika matriks ini digunakan dalam jenis analisis lain (misalnya, dalam regresi berganda atau analisis faktor). Mereka berasumsi bahwa matriks korelasi yang “benar” digunakan dengan tingkat konsistensi dan “kesesuaian” tertentu dari berbagai koefisien. Penggunaan matriks dengan perkiraan yang “buruk” (bias) menyebabkan program tidak dapat menganalisis matriks tersebut, atau hasilnya akan salah. Oleh karena itu, jika digunakan metode berpasangan untuk mengecualikan data yang hilang, perlu dilakukan pengecekan apakah terdapat pola sistematis dalam sebaran data yang hilang.

Jika penghapusan data yang hilang secara berpasangan tidak menyebabkan perubahan sistematis dalam rata-rata dan varians (deviasi standar), maka statistik ini akan serupa dengan statistik yang dihitung menggunakan metode baris demi baris untuk menghapus data yang hilang. Jika terdapat perbedaan yang signifikan, maka terdapat alasan untuk berasumsi bahwa terdapat pergeseran dalam perkiraan tersebut. Misalnya, jika rata-rata (atau deviasi standar) dari nilai suatu variabel A, yang digunakan dalam menghitung korelasinya dengan variabel DI DALAM, jauh lebih kecil dari mean (atau deviasi standar) dari nilai variabel yang sama A, yang digunakan dalam menghitung korelasinya dengan variabel C, maka ada banyak alasan untuk mengharapkan adanya kedua korelasi tersebut (ABkita) berdasarkan subkumpulan data yang berbeda. Akan ada bias dalam korelasi yang disebabkan oleh penempatan kesenjangan nilai variabel yang tidak acak.

Analisis korelasi galaksi. Setelah menyelesaikan masalah signifikansi statistik unsur-unsur matriks korelasi, korelasi yang signifikan secara statistik dapat direpresentasikan secara grafis dalam bentuk galaksi atau galaksi korelasi. Galaksi korelasi - Ini adalah gambar yang terdiri dari simpul dan garis yang menghubungkannya. Simpul sesuai dengan karakteristiknya dan biasanya ditandai dengan angka – angka variabel. Garis-garis tersebut sesuai dengan hubungan yang signifikan secara statistik dan secara grafis menyatakan tanda dan terkadang tingkat signifikansi j dari hubungan tersebut.

Galaksi korelasi dapat mencerminkan Semua hubungan yang signifikan secara statistik dari matriks korelasi (kadang-kadang disebut grafik korelasi ) atau hanya bagian yang dipilih secara bermakna (misalnya, sesuai dengan satu faktor berdasarkan hasil analisis faktor).

CONTOH PEMBANGUNAN PLEIADE KORELASI


Persiapan sertifikasi lulusan negara bagian (final): pembentukan database Ujian Negara Bersatu (daftar umum peserta Ujian Negara Bersatu dari semua kategori, menunjukkan mata pelajaran) - dengan mempertimbangkan hari cadangan untuk mata pelajaran yang sama;

  • Rencana kerja (27)

    Larutan

    2. Kegiatan lembaga pendidikan untuk meningkatkan isi dan menilai kualitas mata pelajaran pendidikan sains dan matematika Sekolah menengah lembaga pendidikan kota No. 4, Litvinovskaya, Chapaevskaya,

  • Disiplin “matematika tingkat tinggi” menimbulkan penolakan di kalangan sebagian orang, karena sebenarnya tidak semua orang dapat memahaminya. Tetapi mereka yang cukup beruntung untuk mempelajari mata pelajaran ini dan memecahkan masalah dengan menggunakan berbagai persamaan dan koefisien dapat membanggakan kesadarannya yang hampir sempurna. Dalam ilmu psikologi, tidak hanya fokus kemanusiaan, tetapi juga rumus dan metode tertentu untuk verifikasi matematis dari hipotesis yang diajukan selama penelitian. Berbagai koefisien digunakan untuk ini.

    Koefisien korelasi Spearman

    Ini adalah pengukuran umum untuk menentukan kekuatan hubungan antara dua karakteristik. Koefisien disebut juga metode nonparametrik. Ini menunjukkan statistik komunikasi. Artinya, kita tahu, misalnya, bahwa pada seorang anak, agresi dan lekas marah saling berhubungan, dan koefisien korelasi peringkat Spearman menunjukkan hubungan matematis statistik antara kedua karakteristik ini.

    Bagaimana cara menghitung koefisien peringkat?

    Secara alami, semua definisi atau besaran matematika memiliki rumusnya sendiri untuk menghitungnya. Koefisien korelasi Spearman juga memilikinya. Rumusnya adalah sebagai berikut:

    Sekilas rumusnya tidak sepenuhnya jelas, namun jika dilihat, semuanya sangat mudah untuk dihitung:

    • n adalah banyaknya fitur atau indikator yang diperingkat.
    • d adalah selisih antara dua peringkat tertentu yang berhubungan dengan dua variabel spesifik untuk setiap mata pelajaran.
    • ∑d 2 - jumlah semua selisih kuadrat antara peringkat suatu fitur, yang kuadratnya dihitung secara terpisah untuk setiap peringkat.

    Lingkup penerapan ukuran koneksi matematis

    Untuk menerapkan koefisien peringkat, data kuantitatif suatu atribut perlu diberi peringkat, yaitu diberi nomor tertentu tergantung pada tempat di mana atribut tersebut berada dan nilainya. Telah dibuktikan bahwa dua rangkaian karakteristik yang dinyatakan dalam bentuk numerik agak sejajar satu sama lain. Koefisien korelasi peringkat Spearman menentukan derajat paralelisme ini, kedekatan hubungan antar karakteristik.

    Untuk operasi matematika menghitung dan menentukan hubungan karakteristik menggunakan koefisien yang ditentukan, Anda perlu melakukan beberapa tindakan:

    1. Setiap nilai dari subjek atau fenomena apa pun diberi nomor secara berurutan - peringkat. Ini dapat sesuai dengan nilai suatu fenomena dalam urutan menaik atau menurun.
    2. Selanjutnya rangking nilai ciri dari dua deret kuantitatif dibandingkan untuk mengetahui perbedaannya.
    3. Untuk setiap selisih yang diperoleh, kuadratnya ditulis pada kolom tersendiri pada tabel, dan hasilnya dirangkum di bawah ini.
    4. Setelah langkah-langkah ini, rumus diterapkan untuk menghitung koefisien korelasi Spearman.

    Sifat koefisien korelasi

    Sifat-sifat utama koefisien Spearman adalah sebagai berikut:

    • Mengukur nilai antara -1 dan 1.
    • Tidak ada tanda-tanda koefisien interpretasi.
    • Ketatnya sambungan ditentukan oleh prinsip: semakin tinggi nilainya, semakin dekat sambungannya.

    Bagaimana cara memeriksa nilai yang diterima?

    Untuk memeriksa hubungan antar tanda, Anda perlu melakukan tindakan tertentu:

    1. Hipotesis nol (H0) diajukan yang juga merupakan hipotesis utama, kemudian dirumuskan alternatif lain dari hipotesis pertama (H 1). Hipotesis pertama adalah koefisien korelasi Spearman adalah 0 yang berarti tidak akan ada hubungan. Sebaliknya yang kedua mengatakan bahwa koefisiennya tidak sama dengan 0, maka ada hubungan.
    2. Langkah selanjutnya adalah mencari nilai observasi dari kriteria tersebut. Itu ditemukan menggunakan rumus dasar koefisien Spearman.
    3. Selanjutnya, nilai kritis dari kriteria yang diberikan ditemukan. Hal ini hanya dapat dilakukan dengan menggunakan tabel khusus, yang menampilkan berbagai nilai untuk indikator tertentu: tingkat signifikansi (l) dan angka penentu (n).
    4. Sekarang Anda perlu membandingkan dua nilai yang diperoleh: nilai yang dapat diamati dan nilai kritis. Untuk melakukan hal ini, perlu dibangun wilayah kritis. Anda perlu menggambar garis lurus, tandai titik-titik nilai kritis koefisien dengan tanda “-” dan tanda “+”. Di sebelah kiri dan kanan nilai kritis, area kritis diplot dalam bentuk setengah lingkaran dari titik-titik tersebut. Di tengah, menggabungkan dua nilai, ditandai dengan OPG setengah lingkaran.
    5. Setelah itu diambil kesimpulan tentang eratnya hubungan antara kedua sifat tersebut.

    Di manakah tempat terbaik untuk menggunakan nilai ini?

    Ilmu pertama yang menggunakan koefisien ini secara aktif adalah psikologi. Bagaimanapun, ini adalah ilmu yang tidak didasarkan pada angka, tetapi untuk membuktikan hipotesis penting mengenai perkembangan hubungan, karakter orang, dan pengetahuan siswa, diperlukan konfirmasi statistik atas kesimpulannya. Ini juga digunakan dalam perekonomian, khususnya dalam transaksi valuta asing. Di sini fitur dievaluasi tanpa statistik. Koefisien korelasi peringkat Spearman sangat cocok untuk bidang penerapan ini karena penilaian dilakukan terlepas dari distribusi variabel, karena variabel tersebut diganti dengan nomor peringkat. Koefisien Spearman secara aktif digunakan di perbankan. Sosiologi, ilmu politik, demografi dan ilmu-ilmu lainnya juga menggunakannya dalam penelitian mereka. Hasilnya diperoleh dengan cepat dan seakurat mungkin.

    Koefisien korelasi Spearman di Excel mudah dan cepat digunakan. Ada fungsi khusus di sini yang membantu Anda dengan cepat mendapatkan nilai yang diperlukan.

    Koefisien korelasi apa lagi yang ada?

    Selain apa yang kita pelajari tentang koefisien korelasi Spearman, terdapat juga berbagai koefisien korelasi yang memungkinkan kita mengukur dan mengevaluasi karakteristik kualitatif, hubungan antara karakteristik kuantitatif, dan kedekatan hubungan di antara keduanya, yang disajikan dalam skala peringkat. Ini adalah koefisien seperti biserial, rank-biserial, kontingensi, asosiasi, dan sebagainya. Koefisien Spearman dengan sangat akurat menunjukkan kedekatan hubungan, tidak seperti semua metode penentuan matematis lainnya.

    Metode korelasi rank Spearman memungkinkan Anda menentukan kedekatan (kekuatan) dan arah korelasi antara dua karakteristik atau dua profil (hierarki) karakteristik.

    Untuk menghitung korelasi peringkat, diperlukan dua baris nilai,

    yang dapat diurutkan. Rangkaian nilai tersebut dapat berupa:

    1) dua tanda yang diukur pada kelompok mata pelajaran yang sama;

    2) dua hierarki sifat individu yang diidentifikasi dalam dua subjek menggunakan kumpulan sifat yang sama;

    3) dua hierarki karakteristik kelompok,

    4) hierarki karakteristik individu dan kelompok.

    Pertama, indikator-indikator tersebut diberi peringkat secara terpisah untuk masing-masing karakteristik.

    Biasanya, peringkat yang lebih rendah diberikan pada nilai atribut yang lebih rendah.

    Dalam kasus pertama (dua karakteristik), nilai individu untuk karakteristik pertama yang diperoleh oleh mata pelajaran berbeda diurutkan, dan kemudian nilai individu untuk karakteristik kedua.

    Jika dua karakteristik berhubungan secara positif, maka subjek dengan peringkat rendah pada salah satu karakteristik tersebut akan memiliki peringkat rendah pada karakteristik lainnya, dan subjek dengan peringkat tinggi pada karakteristik lainnya.

    salah satu karakteristik juga akan memiliki peringkat tinggi untuk karakteristik lainnya. Untuk menghitung rs, perlu ditentukan selisih (d) antara rangking yang diperoleh subjek tertentu untuk kedua karakteristik. Kemudian indikator d ini diubah dengan cara tertentu dan dikurangkan dari 1. Than

    Semakin kecil perbedaan antar peringkat, rs akan semakin besar, dan semakin mendekati +1.

    Jika tidak ada korelasi maka semua rangking akan tercampur dan tidak ada

    tidak ada korespondensi. Rumusnya dirancang sedemikian rupa sehingga dalam hal ini rs akan mendekati 0.

    Dalam kasus korelasi negatif antara subjek dengan peringkat rendah pada satu atribut

    peringkat tinggi pada basis lain akan sesuai, dan sebaliknya. Semakin besar selisih peringkat subjek pada dua variabel, maka rs semakin mendekati -1.

    Dalam kasus kedua (dua profil individu), individu

    nilai-nilai yang diperoleh masing-masing dari 2 mata pelajaran untuk sekumpulan karakteristik tertentu (sama untuk keduanya). Peringkat pertama akan diberikan pada fitur dengan nilai terendah; peringkat kedua adalah fitur dengan nilai lebih tinggi, dan seterusnya. Jelasnya, semua karakteristik harus diukur dalam satuan yang sama, jika tidak, pemeringkatan tidak mungkin dilakukan. Misalnya, tidak mungkin untuk menentukan peringkat indikator pada Cattell Personality Inventory (16PF) jika indikator tersebut dinyatakan dalam poin “mentah”, karena rentang nilai untuk berbagai faktor berbeda: dari 0 hingga 13, dari 0 hingga

    20 dan dari 0 hingga 26. Kita tidak dapat mengatakan faktor mana yang akan menempati urutan pertama dalam hal tingkat keparahan sampai kita membawa semua nilai ke dalam satu skala (paling sering ini adalah skala dinding).

    Jika hierarki individu dari dua subjek berhubungan secara positif, maka fitur yang memiliki peringkat rendah pada salah satu subjek akan memiliki peringkat rendah pada subjek lainnya, dan sebaliknya. Misalnya, jika faktor E (dominansi) suatu subjek memiliki peringkat paling rendah, maka faktor subjek lain juga harus memiliki peringkat rendah, jika faktor C dari satu subjek

    (kestabilan emosi) mempunyai rangking paling tinggi, maka mata pelajaran yang lain juga harus mempunyai

    faktor ini memiliki peringkat tinggi, dll.

    Dalam kasus ketiga (dua profil kelompok), nilai rata-rata kelompok yang diperoleh dalam 2 kelompok mata pelajaran diurutkan menurut seperangkat karakteristik tertentu, yang identik untuk kedua kelompok. Berikut ini alur pemikirannya sama dengan dua kasus sebelumnya.

    Dalam kasus 4 (profil individu dan kelompok), nilai individu subjek dan nilai rata-rata kelompok diberi peringkat secara terpisah sesuai dengan serangkaian karakteristik yang sama, yang biasanya diperoleh dengan mengecualikan subjek individu ini - dia tidak berpartisipasi dalam profil rata-rata grup yang dengannya dia akan dibandingkan dengan profil individu. Korelasi peringkat akan menguji seberapa konsisten profil individu dan kelompok.

    Dalam keempat kasus tersebut, signifikansi koefisien korelasi yang dihasilkan ditentukan oleh jumlah nilai peringkat N. Dalam kasus pertama, angka ini akan bertepatan dengan ukuran sampel n. Dalam kasus kedua, jumlah observasi akan menjadi jumlah fitur yang membentuk hierarki. Dalam kasus ketiga dan keempat, N juga merupakan jumlah fitur yang dibandingkan, dan bukan jumlah subjek dalam kelompok. Penjelasan rinci diberikan dalam contoh. Jika nilai absolut rs mencapai atau melampaui nilai kritis, maka korelasi tersebut dapat diandalkan.

    Hipotesis.

    Ada dua hipotesis yang mungkin. Yang pertama berlaku untuk kasus 1, yang kedua berlaku untuk tiga kasus lainnya.

    Hipotesis versi pertama

    H0 : Korelasi antara variabel A dan B tidak berbeda dengan nol.

    H1 : Korelasi antara variabel A dan B berbeda nyata dari nol.

    Hipotesis versi kedua

    H0: Korelasi antara hierarki A dan B tidak berbeda dengan nol.

    H1: Korelasi antara hierarki A dan B berbeda nyata dari nol.

    Keterbatasan koefisien korelasi peringkat

    1. Untuk setiap variabel, minimal harus disajikan 5 observasi. Batas atas sampel ditentukan oleh tabel nilai kritis yang tersedia.

    2. Koefisien korelasi peringkat Spearman rs dengan sejumlah besar peringkat identik untuk satu atau kedua variabel yang dibandingkan memberikan nilai kasar. Idealnya, kedua rangkaian yang berkorelasi harus mewakili dua rangkaian nilai yang berbeda. Jika kondisi ini tidak terpenuhi, maka perlu dilakukan penyesuaian pangkat yang setara.

    Koefisien korelasi peringkat Spearman dihitung dengan menggunakan rumus:

    Apabila pada kedua deret pangkat yang dibandingkan terdapat kelompok-kelompok yang pangkatnya sama, maka sebelum menghitung koefisien korelasi pangkat perlu dilakukan koreksi terhadap pangkat yang sama Ta dan Tv:

    Ta = Σ (a3 – a)/12,

    Тв = Σ (в3 – в)/12,

    dimana a adalah volume setiap kelompok barisan yang identik dalam deret pangkat A, b adalah volume masing-masing kelompok

    kelompok peringkat yang identik dalam seri peringkat B.

    Untuk menghitung nilai empiris rs digunakan rumus:

    Perhitungan koefisien korelasi rank Spearman rs

    1. Tentukan dua karakteristik atau dua hierarki karakteristik mana yang akan ikut serta

    perbandingan sebagai variabel A dan B.

    2. Rangking nilai variabel A, berikan rangking 1 pada nilai terkecil, sesuai dengan aturan pemeringkatan (lihat P.2.3). Masukkan peringkat pada kolom pertama tabel berdasarkan urutan subjek tes atau karakteristiknya.

    3. Rangking nilai variabel B sesuai dengan aturan yang sama. Masukkan peringkat pada kolom kedua tabel sesuai urutan jumlah mata pelajaran atau karakteristiknya.

    5. Kuadratkan setiap selisihnya: d2. Masukkan nilai-nilai ini di kolom keempat tabel.

    Ta = Σ (a3 – a)/12,

    Тв = Σ (в3 – в)/12,

    dimana a adalah volume setiap kelompok rangking identik pada seri rangking A; c – volume masing-masing kelompok

    peringkat identik di seri peringkat B.

    a) jika tidak ada peringkat yang identik

    rs  1 − 6 ⋅

    b) di hadapan peringkat yang identik

    Σd 2  T  T

    r  1 − 6 ⋅ a dalam,

    dimana Σd2 adalah jumlah selisih kuadrat antar peringkat; Ta dan TV - koreksi untuk hal yang sama

    N – jumlah subjek atau fitur yang berpartisipasi dalam pemeringkatan.

    9. Tentukan dari Tabel (lihat Lampiran 4.3) nilai kritis rs untuk N tertentu. Jika rs melebihi nilai kritis atau setidaknya sama dengan itu, maka korelasinya berbeda nyata dari 0.

    Contoh 4.1 Saat menentukan derajat ketergantungan reaksi konsumsi alkohol terhadap reaksi okulomotor pada kelompok uji, data diperoleh sebelum dan sesudah konsumsi alkohol. Apakah reaksi subjek bergantung pada keadaan mabuk?

    Hasil percobaan:

    Sebelum: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. Setelah: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Mari kita rumuskan hipotesis:

    H0 : korelasi derajat ketergantungan reaksi sebelum dan sesudah minum alkohol tidak berbeda dari nol.

    H1 : korelasi derajat ketergantungan reaksi sebelum dan sesudah minum alkohol berbeda nyata dari nol.

    Tabel 4.1. Perhitungan d2 koefisien korelasi rank Spearman rs ketika membandingkan indikator reaksi okulomotor sebelum dan sesudah percobaan (N=17)

    nilai-nilai

    nilai-nilai

    Karena kita memiliki rangking yang berulang, dalam hal ini kita akan menerapkan rumus yang disesuaikan untuk rangking yang identik:

    Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

    b =((23-2)+(23-2)+(33-3))/12=3

    Mari kita cari nilai empiris dari koefisien Spearman:

    rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

    Dengan menggunakan tabel (Lampiran 4.3) kami menemukan nilai kritis koefisien korelasi

    0,48 (p ≤ 0,05)

    0,62 (p ≤ 0,01)

    Kita mendapatkan

    rs=0,05∠rcr(0,05)=0,48

    Kesimpulan: Hipotesis H1 ditolak dan H0 diterima. Itu. korelasi antar derajat

    ketergantungan reaksi sebelum dan sesudah minum alkohol tidak berbeda dari nol.

    Korelasi peringkat Spearman(korelasi peringkat). Korelasi peringkat Spearman adalah cara paling sederhana untuk menentukan derajat hubungan antar faktor. Nama metodenya menunjukkan bahwa hubungan ditentukan antar rangking, yaitu rangkaian nilai kuantitatif yang diperoleh, dirangking dalam urutan menurun atau menaik. Harus diingat bahwa, pertama, korelasi peringkat tidak disarankan jika hubungan antar pasangan kurang dari empat dan lebih dari dua puluh; kedua, korelasi peringkat memungkinkan untuk menentukan hubungan dalam kasus lain, jika nilai-nilai bersifat semi-kuantitatif, yaitu tidak memiliki ekspresi numerik dan mencerminkan urutan kemunculan nilai-nilai ini dengan jelas; ketiga, disarankan untuk menggunakan korelasi peringkat jika cukup untuk memperoleh data perkiraan. Contoh penghitungan koefisien korelasi peringkat untuk menentukan pertanyaan: kuesioner mengukur X dan Y kualitas pribadi subjek yang serupa. Dengan menggunakan dua kuesioner (X dan Y), yang memerlukan alternatif jawaban “ya” atau “tidak”, diperoleh hasil primer - jawaban 15 subjek (N = 10). Hasilnya disajikan sebagai penjumlahan jawaban afirmatif secara terpisah untuk kuesioner X dan kuesioner B. Hasil tersebut dirangkum dalam tabel. 5.19.

    Tabel 5.19. Tabulasi hasil primer untuk menghitung koefisien korelasi rank Spearman (p)*

    Analisis ringkasan matriks korelasi. Metode korelasi galaksi.

    Contoh. Di meja Gambar 6.18 menunjukkan interpretasi sebelas variabel yang diuji dengan metode Wechsler. Data diperoleh dari sampel homogen berusia 18 sampai 25 tahun (n = 800).

    Sebelum stratifikasi, disarankan untuk menentukan peringkat matriks korelasi. Untuk melakukan ini, nilai rata-rata koefisien korelasi setiap variabel dengan variabel lainnya dihitung dalam matriks asli.

    Kemudian sesuai tabel. 5.20 menentukan tingkat stratifikasi matriks korelasi yang dapat diterima dengan probabilitas kepercayaan tertentu sebesar 0,95 dan n - kuantitas

    Tabel 6.20. Matriks korelasi menaik

    Variabel 1 2 3 4 akan 0 7 8 0 10 11 M(rij) Pangkat
    1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
    2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
    3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
    4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
    5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
    6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
    7 1 0,310 0,388 0,264 0,266 0,310 9
    8 1 0,897 0,363 0,388 0,363 5
    9 1 0,388 0,430 0,846 6
    10 1 0,336 0,310 8
    11 1 0,300 10

    Sebutan: 1 - kesadaran umum; 2 - konseptualitas; 3 - perhatian; 4 - vdataness K generalisasi; b - hafalan langsung (dalam angka) 6 - tingkat penguasaan bahasa ibu; 7 - kecepatan penguasaan keterampilan sensorimotor (pengkodean simbol) 8 - observasi; 9 - kemampuan kombinatorial (untuk analisis dan sintesis) 10 - kemampuan untuk mengatur bagian-bagian menjadi keseluruhan yang bermakna; 11 - kemampuan sintesis heuristik; M (rij) - nilai rata-rata koefisien korelasi variabel dengan variabel observasi lainnya (dalam kasus kita n = 800): r (0) - nilai bidang nol "Membedah" - nilai absolut signifikan minimum dari koefisien korelasi (n - 120, r(0) = 0,236; n = 40, r(0) = 0,407) | r | - langkah stratifikasi yang diperbolehkan (n = 40, | Δr | = 0,558) in - jumlah tingkat stratifikasi yang diperbolehkan (n = 40, s = 1; n = 120, s = 2); r (1), r (2), ..., r (9) - nilai absolut bidang potong (n = 40, r (1) = 0,965).

    Untuk n = 800, kita mencari nilai gtype dan batas gi, setelah itu kita membuat stratifikasi matriks korelasi, menyorot galaksi korelasi di dalam lapisan, atau bagian terpisah dari matriks korelasi, menggambar asosiasi galaksi korelasi untuk lapisan di atasnya (Gbr. .5.5).

    Analisis yang bermakna terhadap galaksi-galaksi yang dihasilkan melampaui batas-batas statistik matematika. Perlu dicatat bahwa ada dua indikator formal yang membantu interpretasi Pleiades secara bermakna. Salah satu indikator penting adalah derajat suatu simpul, yaitu jumlah sisi yang berdekatan dengan suatu simpul. Variabel dengan jumlah tepi terbesar adalah “inti” galaksi dan dapat dianggap sebagai indikator variabel sisa galaksi tersebut. Indikator penting lainnya adalah kepadatan komunikasi. Suatu variabel mungkin memiliki koneksi yang lebih sedikit di satu galaksi, namun lebih dekat, dan lebih banyak koneksi di galaksi lain, namun kurang dekat.

    Prediksi dan perkiraan. Persamaan y = b1x + b0 disebut persamaan umum garis. Hal ini menunjukkan bahwa pasangan titik (x, y) yang

    Beras. 5.5. Galaksi korelasi diperoleh dengan pelapisan matriks

    terletak pada suatu garis tertentu, dihubungkan sedemikian rupa sehingga untuk sembarang nilai x, nilai b yang berpasangan dengannya dapat dicari dengan mengalikan x dengan bilangan tertentu b1 dan menambahkan kedua, bilangan b0 pada hasil perkaliannya.

    Koefisien regresi memungkinkan Anda menentukan tingkat perubahan faktor investigasi ketika faktor penyebab berubah sebesar satu unit. Nilai absolut mencirikan hubungan antara faktor-faktor variabel dengan nilai absolutnya. Koefisien regresi dihitung dengan menggunakan rumus:

    Desain dan analisis eksperimen. Desain dan analisis eksperimen adalah cabang penting ketiga dari metode statistik yang dikembangkan untuk menemukan dan menguji hubungan sebab akibat antar variabel.

    Untuk mempelajari ketergantungan multifaktorial, metode desain eksperimen matematika semakin banyak digunakan akhir-akhir ini.

    Kemampuan untuk memvariasikan semua faktor secara bersamaan memungkinkan Anda untuk: a) mengurangi jumlah eksperimen;

    b) mengurangi kesalahan eksperimen seminimal mungkin;

    c) menyederhanakan pengolahan data yang diterima;

    d) memastikan kejelasan dan kemudahan membandingkan hasil.

    Setiap faktor dapat memperoleh sejumlah nilai berbeda yang sesuai, yang disebut level dan dilambangkan dengan -1, 0, dan 1. Kumpulan level faktor yang tetap menentukan kondisi untuk salah satu eksperimen yang mungkin.

    Totalitas semua kemungkinan kombinasi dihitung menggunakan rumus:

    Eksperimen faktorial lengkap adalah eksperimen yang menerapkan semua kemungkinan kombinasi tingkat faktor. Eksperimen faktorial penuh dapat memiliki sifat ortogonalitas. Dengan perencanaan ortogonal, faktor-faktor dalam eksperimen tidak berkorelasi; koefisien regresi yang pada akhirnya dihitung ditentukan secara independen satu sama lain.

    Keuntungan penting dari metode perencanaan eksperimen matematis adalah keserbagunaan dan kesesuaiannya dalam banyak bidang penelitian.

    Mari kita perhatikan contoh membandingkan pengaruh beberapa faktor terhadap pembentukan tingkat tekanan mental pada pengontrol TV berwarna.

    Eksperimen ini didasarkan pada Desain ortogonal 2 tiga (tiga faktor berubah pada dua tingkat).

    Percobaan dilakukan dengan bagian lengkap 2+3 dengan tiga kali pengulangan.

    Perencanaan ortogonal didasarkan pada konstruksi persamaan regresi. Untuk tiga faktor tampilannya seperti ini:

    Pengolahan hasil pada contoh ini meliputi:

    a) konstruksi tabel denah ortogonal 2 +3 untuk perhitungan;

    b) perhitungan koefisien regresi;

    c) memeriksa signifikansinya;

    d) interpretasi data yang diperoleh.

    Untuk koefisien regresi persamaan tersebut perlu diberikan pilihan N = 2 3 = 8 agar dapat menilai signifikansi koefisien tersebut, dimana banyaknya pengulangan K adalah 3.

    Matriks perencanaan percobaan dikompilasi dan terlihat seperti ini: