Home Техника Многовариантен анализ

Многовариантен анализ



Основно въведение

многовариантният анализ е статистически метод, включващ редица начини, най-основният едномерен, многовариантен анализ и след това разширен.

статистика има множество променливи (или фактори, показатели) статистически анализ в същото време има важен клон на статистиката, едномерно статистическо развитие.

статистика многовариантен статистически анализ произхожда от медицината и психологията.

основно съдържание

В изучаването на социалните и поведенческите науки, възможността с популярността на прилагането на сложни многовариантни статистически методи и методи за изследване на персонален компютър за анализ на данните се увеличи съответно. Особено през последните години броят на завършилите университети се увеличава всяка година, въз основа на необходимостта от писане на дисертации, използването на многовариантни статистически методи и статистически софтуерни пакети се превръщат в незаменима способност.

Глава множествена регресия

Глава за каноничен корелационен анализ

Глава дискриминантен анализ

Chapter Mean тестът на хипотезата

петата глава многовариантен дисперсионен анализ

Глава VI Анализ на главните компоненти

Глава VII на факторния анализ

клъстерен анализ Глава VIII

IX многоизмерен метод за мащабиране

моделиране на структурни уравнения Глава X

XI йерархичен линеен режим

< h2> статистически анализ

(многомерен статистически анализ)

например хипертония готвене за 630 разследване, елементи за проверка, в допълнение към кръвното налягане, има възраст, пол, тегло, телесни мазнини и други 15 проекта (променлива). Ако разгледате връзката между кръвното налягане и наднорменото тегло с едномерен статистически анализ, данните обикновено се правят под формата на таблица. От Таблица 1, в сравнение с наднормено тегло и без наднормено тегло, процентът на разпространение на хипертония е повече от два пъти. Но ако данните се разделят по телесни мазнини и не по телесни мазнини в две групи и след това се изследва връзката между наднорменото тегло и разпространението на хипертонията във всяка група, те не успяват да намерят ясна връзка между разпространението на наднорменото тегло и хипертонията. С други думи, едномерният статистически анализ пренебрегва влиянието на допълнителните фактори (в този пример в телесните мазнини и възрастта). За информация има редица променливи обективна реалност, но си влияят една на друга, използването на прост едномерен статистически анализ е неразумно. Многовариантният статистически анализ ще може да отчете присъщата връзка между променливите и взаимодействието.

многовариантна статистическа теория и инструменти на теорията на вероятностите и матричната математика. Но става дума за практически приложения, стига правилното разбиране на компютъра и софтуерния пакет, както и някои предварителни многовариантни статистически познания, могат да го използват за решаване на реални проблеми. Многовариантно статистическо много съдържание от практическа гледна точка, включително регресионен анализ, дискриминантен анализ, факторен анализ, анализ на главните компоненти, клъстерен анализ, анализ на оцеляването на шест големи клона.

регресия

Когато множество променливи x1, x2, ..., xm (наричани регресионни променливи или аргументи, независима променлива) влияят на метрика y (наричана зависима променлива, когато статистическа редовност или зависима променлива), може да се извърши регресионен анализ, регресионен анализ, първата задача е да се намери влиянието на регресионните променливи върху индекса y (наричан още регресия); втората задача е да се намерят голям брой променливи в регресията, някои от които могат да окажат влияние върху индекса y (често наричани факторен анализ или скрининг променливи); третата задача (известна също като корелационен анализ) е след въздействието на фиксирана (или елиминиране) на другите променливи, изследване на всяка променлива регресионни показатели y е степента на корелация (наричана частичен коефициент на корелация). Трите задачи често са взаимосвързани и могат да се изпълняват едновременно.

регресионни променливи x1, x2, ..., най-честата статистическа връзка между зависимата променлива y xm Има два вида: линейни и нелинейни модели. Линейният модел се приема като основна част от y (посочена), чрез x1, x2, xm се изразява като линеен

където b0, b1, b2, ..., bm са неизвестни константи, необходими за оценка на извадката, [epsilon] след като грешката е заменена с y. Това е най-често използваният модел, известен като множествена линейна регресия или множествена линейна регресия. Методът на линейния регресионен модел за оценка на неизвестните константи с много проби, класическият метод е методът на най-малките квадрати, той е по-пълна теория, този метод е по-подходящ за времето между регресионните променливи, корелацията не е значима. Други изисквания неизвестни константи b0, b1, b2, ..., bm регресионен метод на гребен също характерна коренова регресия, регресия на главните компоненти и т.н., обикновено се използват в корелацията между регресия с големи променливи.

основна част и x1

y на нелинейния регресионен модел, X2, ..., xm е нелинейна функция на връзката:

където ┃ образува известни, неизвестни константи α1, α2; ... с пробата за оценка. Медицината е най-разпространената логистична регресия с нелинейна регресия, често се използва при изследване на болести и контрол на проблемите с растежа и развитието.

В горното проучване на готвача за хипертония, използвайки линеен модел и неизвестните константи, определени по метода на най-малкия квадрат, и след това изберете регресионните променливи, променливите могат да бъдат получени в 15 седем променливи членове на готвенето диастолното кръвно налягане има значително влияние, които са подредени според размера на частичния корелационен коефициент: възраст (0,297), степен на мазнини (0,253), история на нефрит (0,162), пол (0,117), категория работа (0,081), фамилна анамнеза за хипертония (0,061), степента на пристрастяване към солта (0,052). От корелацията между размера на външния вид, ефектите върху диастолното кръвно налягане, телесните мазнини и ефекта от възрастта са приблизително еднакви. Може също да се види, че: въпреки че видовете въздействие, фамилната анамнеза и S. солено диастолично кръвно налягане, но имат малък ефект.

дискриминантен анализ

Според някои показатели на извадката за определяне на пробата принадлежи към категорията. Например, в медицинската диагностика, за да се определи дали пациентът е с остър апендицит, това е въпрос на дискриминация. За да се отговори на този въпрос често се изисква пациентът да открие редица показатели (променливи) и въз основа на наблюденията на показателите ще бъдат включени в пациент с остър апендицит или класове, които не страдат от остър апендицит. Дискриминантният анализ обикновено първо установява дискриминантна функция, наблюдаваната стойност се замества в съответния индекс на всяка променлива и след това се прави преценка в съответствие с определяне или правила за удостоверяване на решение (като стойността на функцията е по-голяма от определена стойност) . Например, за да се изследва връзката между стомашните и нитритните соли на съединенията от групата, на групата беше казано стомашен карцином (наричан като Hl), атрофичен гастрит (H2 от), повърхностен гастрит (H3) 3 групи пациенти следните шест показателя за измерване (променлива): пол (x1, 1 мъж, 0 жени), възраст (X2), стойност на рН на стомаха (X3), концентрация на нитрити в слюнката (X4), концентрация на нитрити в стомашния сок (X5), стомашен сок в концентрация на диметил амониев нитрит (x6). Дискриминантен анализ, могат да бъдат определени шест показателя (променливи) в трите разпределението на групата на заболяването е значително различно x1, x2, x4, x6; останалите два показателя, разпределени в различни групи по същество еднакви. В съответствие с всяка група заболявания може да се установи следната дискриминантна функция:

u1 = -11,48 + 2,68x1 + 0,37x2 + 0,04x4 + 0,90x6 (H1) u2 = -14,06 + 3,79x1 + 0,35x2 + 0,50x4 + 1,82x6 (H2) u3 = -6,36 + 1,84x1 + 0,27 x2 + 0,34x4 + 0,84x6 (H3)

при дискриминантния анализ, стойността на измерения случай (x1, x2, x4, x6), заместваща дискриминантната функция, функцията за получаване на набор от стойности u1, u2, u3. Тук правилото за дискриминация е: ако u1 е максимално, изречението е случай на заболяване от група H1; ако u2 е максимум, наказанието е H2; ако u3 е максимум, тогава е H3. По този начин диагнозата се превръща в обработка и анализ на данни, принципи на съвременната болница за автоматична диагностика, базирана на това. Най-общо казано, опитът и познанията на лекаря в компютъра, който е емпирично установяване на диагнозата в компютър ── дискриминантна функция. Променливият коефициент преди дискриминантните функции съдържа важна информация. x3, x5 коефициентът преди горните променливи е 0; преди трите коефициента x1 (2.68,3.79,1.84), описани по отношение на F (x1 = 0), мъжът (x1 = 1) е по-податлив на атрофичен гастрит (3.79) или рак на стомаха (2.68); Коефициент 3 x2 преди описанието на същата възраст да има рак на стомаха, атрофичен гастрит, повърхностен гастрит, съотношение 0,37: 0,35: 0,27; и подобни.

факторен анализ

, известен още като факторен анализ. Медицината, биологията и между всички социални и природни явления във всяка променлива (или неща) често има корелация или сходство. Това е така, защото често между променливите (или нещата) има общи фактори (известни като общ фактор или общ фактор), докато тези общи фактори влияят на различни променливи (или нещо подобно). Основната задача на факторния анализ е от редица променливи (или нещо друго) отвън навътре да се намери техният скрит вътрешен общ фактор, като се посочват основните характеристики на общите фактори и се измерва чрез действителното използване на променливата (или неща) фактор за обществено строителство. Факторният анализ на точки от тип R и Q, наречен R-тип, се използва за анализ на променливи фактори между, сред нещата, наречени за тип Q.

Факторният анализ в режим R, например, предостави примерните променливи x1, x2, ..., xm, скрит общ фактор ┃1, ┃2, ..., ┃k. Всяка променлива времева константа може теоретично да бъде записана, както следва:

от дясната страна на първата част е действаща част с променлив общ фактор (┃1, ┃2, ..., ┃k), след част от мъжката част от независими фактори (наречена частична независимост). Факторният анализ е основната задача на извадката, определена от ┃1, ┃2, ..., ┃k и it коефициента {α}, наричан тегловен фактор [alpha] it или фактор на натоварване, когато извадката е с нормализирани данни помежду си и приемем, че общ фактор не е корелиран, теглото α е корелационният коефициент между десния общ фактор ┃j променливи xi. Използването на метода на факторния анализ може да бъде изведено от малкия брой променливи фактори в наблюдаваното, с минимум променливи фактори за обяснение на наблюдаваното, разкривайки вътрешно свързани неща. Действителното обяснение на факторите трябва да бъде съчетано от експертиза с практически тест. Например китайският учен Liang Yuehua, Sun Shang arch factor анализ е използван за идентифициране на имплицитни в шест лесни за измерване физиологични параметъра (систолично кръвно налягане, диастолично кръвно налягане, дишане, сърдечна честота, телесна температура и количество слюнка) в общите фактори ┃1 и експерименталната ┃1 преценка може да представлява баланса на симпатиковия нерв и накрая ┃1 демонстрира „студа и топлината“ на TCM, неговата същност е симпатиково инхибиране или възбуда.

Анализът на основните компоненти е изследване на това как да се свържат една с друга променливи, интегрирани в един (или няколко) съставен индикатор (известен също като основна съставка), а изчерпателният индекс трябва да отразява наблюдаваните променливи, за да се увеличи максимално предоставената информация. Като Hutchison (x1, x2, ..., xm) се наблюдават променливи, общото желание на съставния индикатор Z може да бъде написано.

Z често действително е в състояние да абсорбира m променливи, свързани с най-голямата част от информацията (подобно на факторния анализ ┃1), тази променлива за наблюдение, когато има малко време между корелацията една с друга, използването на главния компонент анализ Не е подходящо. Ако корелацията между наблюдаваните променливи може да бъде разделена на няколко групи и всяка група има малка корелация, тогава не може да се интегрира с главен компонент на всички променливи, а трябва да се вземат повече няколко основни компонента. Кога

действителна употреба, тъй като анализът на основните компоненти и факторният анализ са много сходни, така че броят на статистиците и в двата анализа често е безразборен, всяко име също се прилага.

Анализът на главните компоненти има много приложения в медицинските изследвания, например някои хора на възраст 5 години лесно се измерват присъщи (бели петна, старчески петна, изправени очи, време на изправяне на краката, дъга, извадени зъби), интегрирани в индикатор Z, изчисленията показват, че интегрираната стойност Z може да абсорбира пет такса за стареене 43% от цялата информация, която може да отразява изчерпателно степента на физическо стареене.

групиране

наричано още таксономия. Класическата таксономия е родена преди няколкостотин години, като класификация на вкаменелости, класификация на растителни образци. Предишната класификация разчита повече на някои от специфичните показатели. Можем да използваме многовариантен статистически анализ само ако е необходим за класифициране на неща или не съществува труден за използване специфичен индекс. Въвеждането на математически методи и таксономия, наречена „клъстерен анализ” е въпрос на 60 години. След като клъстерният анализ се разви бързо и постигна широка употреба, но не и голяма зрялост.

R клъстерният анализ може да бъде разделен на тип и Q-тип, R на споменатата променлива за тип класификация, извадката (единица за наблюдение, неща), каза Q-тип класификация. Основната класификация е сходство или разстояние. Ако две променливи (или извадка) са много близки или подобни една на друга, естествено разделени в един и същ клас. Следователно, когато се извършва клъстерен анализ, трябва да се определи сходство или разстояние. Дефиниция на типа сходство или разстояние Метод широк. Например коефициентът на корелация между общите променливи, представителен за сходството между променливите, Евклидово разстояние (първо безразмерно) между две точки, представително за геометричното разстояние между двете проби. След това изборът на класификация на математическите формули, за да се определи тяхната класификация. Тези формули също са в широка гама. Няма една единствена оптимална формула. Практиците често използват различни електронни таблици с методи, съчетани с експертния опит за определяне на резултатите от класификацията.

Анализ на оцеляването

Произход на анализа на оцеляването на таблицата на живот. В допълнение към времето за биологично оцеляване от външно влияние върху здравето, но също така се влияе от социални фактори, условия на живот. Анализът на оцеляването проучва кои фактори оказват значително влияние върху „живота“ и каква е неговата степен на риск. Анализът на оцеляването на 20-ти век е не само проблем за изучаването на човешкия живот, но също така и за всички обобщени "животни" въпроси или "смърт", като живота на двигателя, времето за оцеляване на пациентите след операция, сравнителен анализ от двете ефикасност и др. Анализ на преживяемостта на различни модели, най-често използваният регресионен модел на Кокс, който се характеризира с: относителният риск от комбинираните ефекти на m може да бъде изразен като продукт на променливи, когато относителният риск за всяка променлива, действаща самостоятелно (това е наричан още мултипликативен модел). Допълнителен модел на конвенционален адитивен модел, който се характеризира с: относителният риск от комбинираните ефекти на променлива m може да представлява ефекта на всяка променлива и поотделно. Какъв вид модел трябва да се използва, за да се определи, трябва да се комбинира експертен опит по конкретни въпроси.

многовариантният статистически анализ в допълнение към шестте основни клона, анализът на пътя и каноничният корелационен анализ също са много често срещани. Общият регресионен анализ може да се изчисли само за всяка променлива (други променливи са фиксирани) величината на прякото действие на индекса y, а анализът на пътя може да се изчисли индиректно за всяка индикаторна променлива y едновременно (т.е. чрез действието на променливата, свързана с нея в y ). Анализът на пътя има много приложения в генетичните епидемиологични изследвания. Каноничният корелационен анализ е по-нататъшното развитие на регресионния анализ. Едновременно измерване на множество индикатори (y1, y2, ...) и редица независими променливи (x1, x2, ...) за всяко нещо, анализът с помощта на корелационен анализ и по-изчерпателен код за това как аргументът е свързан с интегрирани показатели.

This article is from the network, does not represent the position of this station. Please indicate the origin of reprint
TOP