Home Tekniikka Monimuuttuja-analyysi

Monimuuttuja-analyysi



Perusjohdanto

monimuuttuja-analyysi on tilastollinen menetelmä, joka sisältää useita tapoja, yksinkertaisin yksimuuttuja-, monimuuttuja-analyysi ja sitten laajennettu.

tilastot on olemassa useita muuttujia (tai tekijöitä, indikaattoreita) tilastollinen analyysi samaan aikaan on tärkeä haara tilastojen, yksimuuttuja tilastollinen kehitys.

tilastollinen monimuuttujatilastollinen analyysi sai alkunsa lääketieteestä ja psykologiasta.

pääsisältö

Yhteiskunta- ja käyttäytymistieteiden tutkimuksessa monimutkaisten monimuuttujatilastomenetelmien ja henkilökohtaisen tietokoneen tutkimusmenetelmien soveltamisen mahdollisuus aineiston analysointiin lisääntyi vastaavasti. Varsinkin viime vuosina valmistuneiden korkeakoulujen määrä kasvaa joka vuosi, koska väitöskirjatarpeen perusteella monimuuttujatilastomenetelmien käyttö ja tilastolliset ohjelmistopaketit ovat tulleet välttämättömäksi valmiudeksi.

Lukujen moninkertainen regressio

kanoninen korrelaatioanalyysi Luku

Luku erotteluanalyysi

Luku Tarkoittaa hypoteesitestiä

viidennen luvun monimuuttujavarianssianalyysi

Luku VI pääkomponenttianalyysi

Tekijäanalyysin VII luku

Klusterianalyysi Luku VIII

IX moniulotteinen skaalausmenetelmä

rakenneyhtälön mallinnus Luku X

XI hierarkkinen lineaarinen tila

< h2> tilastollinen analyysi

(monimuuttujatilastollinen analyysi)

esimerkiksi hypertensio kokki 630 tutkimus-, tarkastuskohdetta, verenpaineen lisäksi on ikä, sukupuoli, paino, kehon rasva ja muut 15 projektia (muuttuva). Jos tarkastellaan verenpaineen ja ylipainon suhdetta yksimuuttujaan, tiedot tehdään tyypillisesti taulukon muodossa. Taulukosta 1, verrattuna ylipainoisiin ja ei-ylipainoisiin, verenpainetaudin esiintyvyys on yli kaksinkertainen. Mutta jos tiedot jaetaan kehon rasvan eikä kehon rasvan mukaan kahteen ryhmään ja sitten tutkitaan ylipainon ja verenpainetaudin esiintyvyyden välistä suhdetta kussakin ryhmässä, he eivät löytäneet ylipainon ja verenpainetaudin esiintyvyydestä mitään selvää yhteyttä. Toisin sanoen yksimuuttujatilastollinen analyysi jättää huomioimatta lisätekijöiden (tässä esimerkissä kehon rasvan ja iän) vaikutuksen. Tiedoksi on olemassa useita muuttujia, jotka vaikuttavat toisiinsa, mutta yksinkertaisen yksimuuttujan tilastollisen analyysin käyttö on kohtuutonta. Monimuuttujatilastollinen analyysi pystyy ottamaan huomioon muuttujien välisen luontaisen yhteyden ja vuorovaikutuksen.

monimuuttujatilastoteoria ja todennäköisyysteorian ja matriisimatematiikan työkalut. Mutta käytännön sovelluksissa, kunhan asianmukainen käsitys tietokoneesta ja ohjelmistopaketista sekä alustava monimuuttujatilastotieto voi käyttää sitä todellisten ongelmien ratkaisemiseen. Monimuuttuja tilastollinen paljon sisältöä, käytännön näkökulmasta, mukaan lukien regressioanalyysi, erotteluanalyysi, tekijäanalyysi, pääkomponenttianalyysi, klusterianalyysi, kuuden suuren haaran selviytymisanalyysi.

regressio

Kun useat muuttujat x1, x2, ..., xm (kutsutaan regressiomuuttujiksi tai argumenteiksi, riippumattomaksi muuttujaksi) vaikuttavat metriikkaan y (kutsutaan riippuvaiseksi muuttujaksi, kun tilastollinen säännöllisyys tai riippuva muuttuja), voidaan suorittaa regressioanalyysi, regressioanalyysi, ensimmäinen tehtävä on löytää regressiomuuttujien vaikutus indeksiin y (kutsutaan myös regressioksi); toinen tehtävä on löytää regressiosta suuri määrä muuttujia, joilla Jotkut voivat vaikuttaa indeksiin y (kutsutaan usein tekijäanalyysiksi tai seulontamuuttujiksi); Kolmas tehtävä (tunnetaan myös nimellä korrelaatioanalyysi) on muiden muuttujien kiinteän (tai eliminoinnin) vaikutuksen jälkeen, tutkimalla kunkin muuttujan regressioindikaattoreita y on korrelaatioaste (kutsutaan osittaiseksi korrelaatiokertoimeksi). Nämä kolme tehtävää liittyvät usein toisiinsa ja voidaan tehdä samanaikaisesti.

regressiomuuttujat x1, x2, ..., yleisin tilastollinen suhde riippuvan muuttujan y xm välillä On olemassa kahta tyyppiä: lineaariset ja epälineaariset mallit. Lineaarisen mallin oletetaan olevan pääosa y:stä (viitataan), x1, x2, xm ilmaistaan ​​lineaarisena

jossa b0, b1, b2, ..., bm ovat tuntemattomia vakioita, joita tarvitaan näytteen estimoimiseen, [epsilon] sen jälkeen, kun virhe on korvattu y:llä. Tämä on yleisimmin käytetty malli, joka tunnetaan moninkertaisena lineaarisena regressiona tai moninkertaisena lineaarisena regressiona. Menetelmä lineaarisen regressiomallin arvioida tuntemattomia vakioita paljon näytteitä, klassinen menetelmä on pienimmän neliösumman menetelmä, se on täydellisempi teoria, tämä menetelmä sopii paremmin välillä regressiomuuttuja korrelaatio ei ole merkittävä. Muut vaatimukset Tuntemattomia vakioita b0, b1, b2, ..., bm harjaregressiomenetelmää myös ominaista juuriregressiota, pääkomponenttiregressiota jne. käytetään yleisesti suuren muuttujan regression välisessä korrelaatiossa.

epälineaarisen regressiomallin pääosa ja x1

y, X2, ..., xm on suhteen epälineaarinen funktio:

jossa ┃ muodostaa tunnettuja, tuntemattomia vakioita α1, α2; ... arvioitavan otoksen kanssa. Lääketiede on yleisin ei-lineaarinen regressiologistinen regressio, sitä käytetään yleisesti sairauksien tutkimuksessa ja kasvu- ja kehitysongelmien hallinnassa.

Edellisessä kokkitutkimuksessa verenpaineesta, käyttäen lineaarista mallia ja tuntemattomia vakioita määritetty pienimmän neliösumman menetelmä, ja valitse sitten regressiomuuttujat, muuttujat voidaan saada 15 seitsemässä muuttujassa ruoanlaittojäsenten diastolisella verenpaineella on merkittävä vaikutus, joka on järjestetty osittaisen korrelaatiokertoimen koon mukaan: Ikä (0,297), lihavuusaste (0,253) kehon, munuaistulehdushistoria (0,162), sukupuoli (0,117), työluokka (0,081), verenpainetautia (0,061) suvussa, suolariippuvuuden aste (0,052). Ulkonäön koon, diastolisen verenpaineen, kehon rasvan ja iän vaikutuksen välisestä korrelaatiosta suunnilleen sama. Voidaan myös nähdä, että: vaikka vaikutustyypit, sukuhistoria ja S. suolainen diastolinen verenpaine, mutta niillä on vain vähän vaikutusta.

Diskriminanttianalyysi

Joidenkin indikaattoreiden mukaan näytteen määrittämiseksi näyte kuuluu luokkaan. Esimerkiksi lääketieteellisessä diagnoosissa sen määrittämiseksi, onko potilaalla akuutti umpilisäke, tämä on syrjintäkysymys. Tähän kysymykseen vastaaminen edellyttää usein, että potilas havaitsee useita indikaattoreita (muuttujia), ja indikaattorien havaintojen perusteella otetaan mukaan potilas, jolla on akuutti umpilisäkkeentulehdus tai luokkiin, jotka eivät kärsi akuutista umpilisäkkeestä. Diskriminanttianalyysi on yleensä ensin määritettävä erotteleva funktio, havaittu arvo korvataan kunkin muuttujan vastaavaan indeksiin ja sen jälkeen tehdään päätös määritys- tai päätöstodennussääntöjen mukaisesti (esim. funktion arvo on suurempi kuin tietty arvo) . Esimerkiksi ryhmän yhdisteiden maha- ja nitriittisuolojen välisen suhteen tutkimiseksi ryhmälle kerrottiin mahakarsinooma (kutsutaan nimellä Hl), atrofinen gastriitti (H2 of), pinnallinen gastriitti (H3) 3 potilasryhmää. seuraavat kuusi mittausindikaattoria (muuttuja): sukupuoli (x1, 1 mies, 0 nainen), ikä (X2), mahalaukun pH-arvo (X3), syljen nitriittipitoisuus (X4), mahanesteen nitriittipitoisuus (X5), mahaneste dimetyyliammoniumnitriittipitoisuus (x6). Diskriminanttianalyysi, voidaan määrittää kuusi indikaattoria (muuttujia) kolmen sairauden ryhmän jakautumisessa on merkittävästi erilainen x1, x2, x4, x6; loput kaksi metriikkaa jakautuvat oleellisesti samanlaisten eri ryhmiin. Jokaista sairausryhmää vastaavasti voidaan määrittää seuraava erottelutoiminto:

u1 = -11,48 + 2,68 x 1 + 0,37 x 2 + 0,04 x 4 + 0,90 x 6 (H1) u2 = -14,06 + 3,79 x 1 + 0,35 x 2 + 0,50 x 4 + 1,82 x 6 (H2) .8 + 1,82 x 6 (H2). x2 + 0,34x4 + 0,84x6 (H3)

Diskriminanttianalyysissä mitatun tapauksen (x1, x2 , x4, x6) arvo, joka korvaa erottelufunktion, funktio arvojoukon u1, u2, u3 saamiseksi. Tässä syrjintäsääntö on: jos u1 maksimi, lause on sairausryhmän H1 tapaus; jos u2 on maksimi, rangaistus on H2; jos u3 maksimi, niin se on H3. Näin diagnoosista tulee tiedonkäsittely ja analyysi, nykyaikaisen sairaalan periaatteet automaattiseen diagnoosiin perustuen tähän. Yleisesti ottaen lääkärin kokemus ja tieto tietokoneeseen, joka on empiirisesti perustaa diagnoosin tietokoneessa ── erotteleva toiminto. Muuttuva kerroin ennen erottelufunktioita sisältävät tärkeää tietoa. x3, x5 kerroin ennen yllä olevia muuttujia ovat 0; ennen kolmea kerrointa x1 (2,68, 3,79, 1,84) F:n suhteen (x1 = 0), mies (x1 = 1) on alttiimpi atrofiselle gastriitille (3,79) tai mahasyövälle (2,68); 3 x2 kerroin ennen kuvausta saman ikäisistä sairastua mahasyöpään, atrofiseen gastriittiin, pinnalliseen gastriittiin suhde 0,37: 0,35: 0,27; ja vastaavat.

tekijäanalyysi

, joka tunnetaan myös nimellä tekijäanalyysi. Lääketiede, biologia ja kaikkien sosiaalisten ja luonnonilmiöiden välillä kussakin muuttujassa (tai asioissa) on usein korrelaatiota tai samankaltaisuutta. Tämä johtuu siitä, että muuttujien välillä (tai asioilla) on usein yhteisiä tekijöitä (tunnetaan nimellä yhteinen tekijä tai yhteinen tekijä), kun taas nämä yhteiset tekijät vaikuttavat eri muuttujiin (tai johonkin). Tekijäanalyysin perustehtävä on useista muuttujista (tai jostain) ulkopuolelta sisälle löytää niiden sisälle piilotettu yhteinen tekijä, joka osoittaa yhteisten tekijöiden pääpiirteet ja mitataan muuttujan todellisella käytöllä. (tai asiat) julkisen rakentamisen tekijä. R- ja Q-tyyppisten pisteiden tekijäanalyysiä, jota kutsutaan R-tyypiksi, käytetään muun muassa Q-tyypiksi kutsuttujen tekijöiden välisten muuttuvien tekijöiden analysointiin.

Esimerkiksi R-moodin tekijäanalyysi, jos näytemuuttujat x1, x2, ..., xm, piilotettu yhteinen tekijä ┃1, ┃2, ..., ┃k. Jokainen muuttuva aikavakio voidaan teoreettisesti kirjoittaa seuraavasti:

ensimmäisen osan oikealla puolella on muuttuva yhteinen tekijä (┃1, ┃2, ..., ┃k) riippumattomien tekijöiden miesosan jälkeen (kutsutaan osittaiseksi riippumattomuudeksi). Tekijäanalyysi on näytteen perustehtävä, jonka määrittää ┃1, ┃2, ..., ┃k ja it-kerroin {α}, jota kutsutaan painokertoimeksi [alpha] it tai kuormituskertoimeksi, kun näyte on normalisoitua dataa keskenään ja oletetaan korreloimaton yhteinen tekijä, paino α on korrelaatiokerroin oikean yhteisen tekijän ┃j muuttujien xi välillä. Tekijäanalyysimenetelmän käyttäminen voidaan päätellä havaitun muuttuvan tekijän pienestä määrästä, jolloin havaittuja selittäviä tekijöitä on mahdollisimman vähän, paljastaen olennaisesti toisiinsa liittyviä asioita. Varsinainen tekijöiden selitys on yhdistettävä asiantuntemusta harjoituskokeeseen. Esimerkiksi kiinalainen tutkija Liang Yuehua, Sun Shangin kaaritekijäanalyysiä käytettiin kuudessa helposti mitattavassa fysiologisessa parametrissa (systolinen verenpaine, diastolinen verenpaine, hengitys, syke, kehon lämpötila ja syljen määrä) yhteisten tekijöiden sisällä. ┃1 ja kokeellinen ┃1 arviointi voivat hyvin edustaa sympaattisen hermon tasapainoa, ja lopuksi ┃1 osoitti TCM:n "kylmän ja lämmön" sen olemuksena on sympaattinen esto tai jännitys.

Pääkomponenttianalyysi on tutkimus siitä, miten yhteen (tai muutamaan) yhdistelmäindikaattoriin (tunnetaan myös pääainesosana) integroituja muuttujia suhteutetaan toisiinsa, ja kattavan indeksin tulee heijastaa havaitut muuttujat tarjotun tiedon maksimoimiseksi. Kuten Hutchison (x1, x2, ..., xm) havaittiin muuttujia, yleinen halu komposiitti indikaattori Z voidaan kirjoittaa.

Z usein itse asiassa pystyy absorboimaan ne m muuttujaa, jotka liittyvät suureen osaan informaatiota (samanlainen kuin tekijäanalyysi ┃1), tämä havaintomuuttuja, kun korrelaatioiden välillä on vähän aikaa, pääkomponentin käyttö analyysi Ei ole tarkoituksenmukaista. Jos havaittujen muuttujien välinen korrelaatio voidaan jakaa useisiin ryhmiin ja jokaisella ryhmällä on vain vähän korrelaatiota, ei voida integroida kaikkien muuttujien pääkomponenttiin, vaan sitä tulisi enemmän ottaa muutama pääkomponentti. Kun

todellinen käyttö, koska pääkomponenttianalyysi ja tekijäanalyysi ovat hyvin samankaltaisia, joten tilastotieteilijöiden määrä molemmissa määrityksissä on usein umpimähkäinen, kutakin nimeä sovelletaan myös.

Pääkomponenttianalyysillä on monia sovelluksia lääketieteellisessä tutkimuksessa, esimerkiksi joillakin 5-vuotiailla ihmisillä on helppo mitata luontaiset (valkoiset täplät, ikääntymispisteet, silmien seisonta-aika, kaari, hampaat pois) integroituna indikaattoriin Z, laskelmat osoittavat, että integroitu arvo Z voi absorboida viisi ikääntymismaksua 43 % kaikesta tiedosta, joka voi kattavasti kuvastaa fyysisen ikääntymisen astetta.

klusterointi

kutsutaan myös taksonomiaksi. Klassinen taksonomia syntyi muutama sata vuotta sitten, kuten fossiilien luokittelu, kasvinäytteiden luokittelu. Aiempi luokittelu perustuu enemmän joihinkin erityisindikaattoreihin. Voimme käyttää monimuuttujatilastollista analyysiä vain, jos sitä tarvitaan asioiden luokitteluun tai jos tiettyä indeksiä ei ole vaikea käyttää. "Klusterianalyysiksi" kutsuttujen matemaattisten menetelmien ja taksonomian käyttöönotto on 60 vuoden kysymys. Sen jälkeen klusterianalyysi kehittyi nopeasti ja saavutti laajan käytön, mutta ei kovin kypsä.

R-klusterointianalyysi voidaan jakaa tyyppiin ja Q-tyyppiin, mainitun muuttujan R luokitustyypin osalta, otos (havainnointiyksikkö, asiat), mainittu Q-tyyppinen luokittelu. Perusluokitus on samankaltaisuus tai etäisyys. Jos kaksi muuttujaa (tai otos) hyvin lähellä toisiaan tai samankaltaisia, luonnollisesti jaettuna samaan luokkaan. Siksi klusterianalyysiä suoritettaessa on määriteltävä samankaltaisuus tai etäisyys. Samankaltaisuuden tai etäisyyden tyypin määrittely Method wide. Esimerkiksi yhteisten muuttujien välinen korrelaatiokerroin, joka edustaa muuttujien välistä samankaltaisuutta, euklidinen etäisyys (ensimmäisenä dimensioton) kahden pisteen välillä, jotka edustavat kahden näytteen välistä geometristä etäisyyttä. Sitten valitaan matemaattisten kaavojen luokittelu niiden luokituksen määrittämiseksi. Näitä kaavoja on myös laaja valikoima. Ei ole olemassa yhtä optimaalista kaavaa. Ammatinharjoittajat käyttävät usein erilaisia ​​laskentataulukoita yhdistettynä asiantuntemukseen luokittelutulosten määrittämiseen.

Eloonjäämisanalyysi

Elämäntaulukko Eloonjäämisanalyysin alkuperä. Biologisen selviytymisajan lisäksi ulkopuolisten vaikutusten terveyteen vaikuttavat myös sosiaaliset tekijät, elinolosuhteet. Selviytymisanalyysi tutkii millä tekijöillä on merkittävä vaikutus "elämään" ja kuinka sen riskitaso. 1900-luvun eloonjäämisanalyysi ei ole ongelma vain ihmiselämän tutkimiselle, vaan myös kaikille yleistetyille "elämän" tai "kuoleman" kysymyksille, kuten moottorin käyttöikä, potilaiden eloonjäämisaika leikkauksen jälkeen, vertaileva analyysi näiden kahden tehosta jne. . Erilaisten mallien eloonjäämisanalyysi, yleisimmin käytetty Cox-regressiomalli, jolle on tunnusomaista: m:n yhteisvaikutusten suhteellinen riski voidaan ilmaista muuttujien tulona, ​​kun suhteellinen riski jokaiselle muuttujalle toimii yksin (se on kutsutaan myös multiplikatiiviseksi malliksi). Toinen perinteinen additiivinen mallimalli, jolle on tunnusomaista: muuttujan m yhteisvaikutusten suhteellinen riski voi edustaa kunkin muuttujan vaikutusta ja erikseen. Millaista mallia määritettäessä tulisi käyttää tiettyjen asioiden asiantuntemusta.

monimuuttujatilastollinen analyysi kuuden päähaaran lisäksi polkuanalyysi ja kanoninen korrelaatioanalyysi ovat myös hyvin yleisiä. Yleinen Regressioanalyysi voidaan laskea vain kullekin muuttujalle (muut muuttujat kiinteät) y-indeksin suoran vaikutuksen suuruudelle ja polkuanalyysi voidaan laskea epäsuorasti jokainen indikaattorimuuttuja y samanaikaisesti (eli siihen y:ssä liittyvän muuttujan vaikutuksesta ). Polkuanalyysillä on monia sovelluksia geneettisissä epidemiologisissa tutkimuksissa. Kanoninen korrelaatioanalyysi on regressioanalyysin jatkokehitys. Useiden indikaattoreiden (y1, y2, ...) ja useiden riippumattomien muuttujien (x1, x2, ...) samanaikainen mittaus kullekin asialle, analyysi korrelaatioanalyysillä ja kattavampi Koodi siitä, miten argumentti liittyy integroidut indikaattorit.

This article is from the network, does not represent the position of this station. Please indicate the origin of reprint
TOP