Domov Technika vrátit se

vrátit se



Koncept

Regresní analýza je matematický model. Když má závislá proměnná a nezávislá proměnná lineární vztah, jedná se o speciální lineární model.

Nejjednodušší případ je lineární regrese proměnné, která se skládá z nezávislé proměnné a závislé proměnné, která je zhruba lineárně související; model je Y=a+bX+ε(X je nezávislá proměnná, Y je příčinouProměnná, εje náhodná chyba).

Usuallyassumethatthemeanvalueoftherandomerroris0,andthevarianceisσ^2(σ^2﹥0,σ^2hasnothingtodowiththevalueofX).Ifitisfurtherassumedthattherandomerrorfollowsanormaldistribution,itiscalledanormallinearmodel.Generally,iftherearekindependentvariablesand1dependentvariable,thevalueofthedependentvariableisdividedintotwoparts:onepartisaffectedbytheindependentvariable,thatis,expressedasitsfunction,thefunctionformisknownandcontainsunknownparameters;theotherpartisdeterminedbyOtherunconsideredfactorsandrandomeffectsarerandomerrors.

Whenthefunctionisalinearfunctionwithunknownparameters,itiscalledalinearregressionanalysismodel;whenthefunctionisanonlinearfunctionwithunknownparameters,itiscalledanonlinearregressionanalysismodel.Whenthenumberofindependentvariablesisgreaterthan1,itiscalledmultipleregression,andwhenthenumberofdependentvariablesisgreaterthan1,itiscalledmultipleregression.

Obsah regresní analýzy

Hlavní obsah regresní analýzy je následující:

①Startingfromasetofdata,determinethequantitativerelationshipbetweencertainvariables;Thatis,amathematicalmodelisestablishedandunknownparametersareestimated.Usuallytheleastsquaremethodisused.

②Otestujte důvěryhodnost těchto vztahů.

③Intherelationshipbetweenmultipleindependentvariablesaffectingadependentvariable,judgewhethertheindependentvariablehasasignificantimpact,andselectthesignificantimpactintothemodel,andeliminateinsignificantvariables.Stepwiseregression,forwardregression,andbackwardregressionareusuallyused.

④Usetherequiredrelationshiptopredictorcontrolacertainprocess.

Theapplicationofregressionanalysisisveryextensive,andtheuseofstatisticalsoftwarepackagescanmakevariousalgorithmsmoreconvenient.

Typy regrese

Hlavní typy regrese jsou: lineární regrese, křivočará regrese, binární logistická regrese a vícenásobná logistická regrese.

Applicationofanalysis

Correlationanalysisstudiesthecorrelationbetweenphenomena,thedirectionandclosenessofcorrelation,andgenerallydoesnotdistinguishbetweenindependentvariablesordependentvariables.Regressionanalysisistoanalyzethespecificformsofcorrelationbetweenphenomena,determinethecausalrelationship,andusemathematicalmodelstoexpressthespecificrelationship.Forexample,fromthecorrelationanalysis,wecanknowthatthe"quality"and"usersatisfaction"variablesarecloselyrelated,butwhichvariablebetweenthesetwovariablesisaffectedbywhichvariable,andthedegreeofinfluence,requiresregressionanalysisMethodtodetermine.

Generallyspeaking,regressionanalysisistodeterminethecausalrelationshipbetweendependentvariablesandindependentvariables,establisharegressionmodel,andsolvethevariousparametersofthemodelbasedonthemeasureddata,andthenevaluatewhethertheregressionmodelisItcanfitthemeasureddatawell;ifitcanfitwell,furtherpredictionscanbemadebasedontheindependentvariables.

Forexample,ifyouwanttostudythecausalrelationshipbetweenqualityandusersatisfaction,inapracticalsense,productqualitywillaffectusersatisfaction,sosetusersatisfactionasthedependentvariableandrecorditasY;Qualityistheindependentvariable,denotedasX.AccordingtothescatterplotinFigure8-3,thefollowinglinearrelationshipcanbeestablished:

Y=A+BX+§

where:AandBareundeterminedparameters,andAisregressionTheinterceptofthestraightline;Bistheslopeoftheregressionline,whichrepresentstheaveragechangeofYwhenXchangesbyoneunit;§istherandomerrortermthatdependsonusersatisfaction.

LinearregressioncanbeeasilyimplementedintheSPSSsoftware.Theregressionequationisasfollows:

y=0,857+0,836xÚsečka regresní přímky na ose ysou 0,857a se sklonem 0,836,To znamená,pro každý jeden bod zlepšení kvality,spokojenost uživatelů se zvyšuje o 0,836bodůvprůměru;jinými slovy,příspěvekzlepšeníkaždých 36bodů

Theexampleshownaboveisasimplelinearregressionproblemofoneindependentvariable.Duringdataanalysis,thiscanalsobeextendedtomultipleregressionofmultipleindependentvariables.PleaserefertothespecificregressionprocessandmeaningRefertorelevantstatisticsbooks.Inaddition,intheSPSSresultoutput,R2,FtestvalueandTtestvaluecanalsobereported.R2isalsocalledthecoefficientofdeterminationoftheequation,whichindicatesthedegreeofinterpretationofthevariableXtoYintheequation.ThevalueofR2isbetween0and1.Thecloserto1,thestrongertheinterpretationabilityofXtoYintheequation.R2isusuallymultipliedby100%toexpressthepercentageofYchangeexplainedbytheregressionequation.TheFtestisoutputthroughtheanalysisofvariancetable,andthesignificancelevelisusedtotestwhetherthelinearrelationshipoftheregressionequationissignificant.Generallyspeaking,significancelevelsbelow0.05aremeaningful.WhentheFtestpasses,itmeansthatatleastoneoftheregressioncoefficientsintheequationissignificant,butnotallregressioncoefficientsaresignificant,soaTtestisneededtoverifythesignificanceoftheregressioncoefficients.Similarly,theTtestcanbedeterminedbythesignificanceleveloralook-uptable.Intheexampleshownabove,themeaningofeachparameterisshowninTable1-1.

Test lineární regresní rovnice v tabulce 1-1

indexnávrat

Hodnota

Úroveň významu

Význam

R

0,89

„Kvalita“ vysvětluje 89 % stupně změny v „Spokojenosti uživatelů“

F

276,82

0,001

Lineární vztah regresní rovnice je významný

T

16.64

0,001

Koeficient regresní rovnice je významný

Tento článek je ze sítě, nereprezentuje pozici této stanice. Uveďte prosím původ dotisku
HORNÍ