Statistică

Statistica este o știință care, folosind calculul probabilităților, studiază fenomenele și procesele de tip colectiv (din societate, natură etc.) din punct de vedere cantitativ[1][2] în scopul descrierii acestora și al descoperirii legilor care guvernează manifestarea lor.

Statistica se ocupă de obținerea de informații relevante din datele disponibile într-un volum suficient de mare. Informațiile pot fi folosite pentru a înțelege datele disponibile (statistică descriptivă) sau pentru a descoperi noi informații despre evenimente și relațiile dintre ele (statistică inferențială).

Procesul de obținere a informației din date se numește inferență statistică referitoare la unii parametri statistici, sau chiar întregi distribuții probabilistice. Acesta este punctul de vedere mai general adoptat de teoria neparametrică în statistică. În statistica aplicată clasică este preferată ideea de a construi un model statistic cu care se pot face inferențe; în majoritatea cazurilor acest model nu este verificat, ceea ce poate conduce la concluzii eronate. Statistica aplicată modernă analizează însă date mult prea complexe, cum ar fi imagini sau structura proteinelor, pentru a se putea mărgini la ideea de modelare.

Statistica oferă suport pentru fizică, biologie, psihologie, economie, sociologie etc. Statistica excelează atunci când relațiile deterministe referitoare la evenimentul studiat sunt imposibil ori foarte dificil de aflat.

Pe teritoriul României lucrarea lui Dimitrie Cantemir "Descriptio Moldaviae" (1716) poate fi considerată ca o primă lucrare de statistică. Ea a fost scrisă la cererea Academiei din Berlin și conține toate cunoștințele acumulate în domeniu până la acea dată.

Statistica este considerată, pe de o parte, o parte matematică a științei ce se referă la colectarea, interpretarea sau explicarea și prezentarea datelor [3] și pe de altă parte o ramură a matematicii [4] ce se ocupă cu colectarea și interpretarea datelor. Datorită rădăcinilor ei empirice și a accentului pe aplicații, statistica este considerată cel mai adesea o știinta matematică distinctă mai degrabă decât o ramură a matematicii [5][6]. O mare parte a statisticii care asigură colectarea datelor este luată în considerare într-un mod care produce concluzii valide; codarea și arhivarea datelor pentru a reține informațiile; raportarea rezultatelor si rezumarea lor (tabele și grafice) într-un mod inteligibil celor care trebuie să le folosească.

Statisticienii îmbunătațesc calitatea datelor dezvoltând experimente și studiul prelevarii probelor. Statistica oferă, de asemenea, instrumente pentru prezicerea utilizării datelor și modelelor statistice. Statistica este aplicabilă unei vaste varietăți de discipline academice, incluzând științe naturale și sociale, guvern și afaceri. Consultanții în statistică ajută organizații și companii care nu dispun de expertiza "in-house" relevantă întrebărilor specifice companiilor sau organizațiilor.

"Statistica aplicată" cuprinde statistica descriptivă și statistica dedusă [7]. Statistica teoretică se preocupă cu argumentele logice ce subliniază justificarea abordărilor asupra statisticii deduse.

Pentru a aplica statistica unei probleme știintifice, industriale sau sociale este necesar să se înceapă cu un proces sau o populație de studiat. Populațiile pot avea teme diverse cum ar fi "toate persoanele care trăiesc într-o țară" sau "fiecare atom cuprins într-un cristal". O populație poate fi, de asemenea, compusă din observațiile unui proces la diferiți timpi, fiecare informație din observații folosind drept un număr diferit al grupului în totalitate. Informațiile colectate despre acest tip de "populații" constituie ceea ce se numește serii de timpi.

Din motive practice, un subset al populației ales numit probă este studiat. Odată ce o probă reprezentativă a populației este determinată, informațiile sunt colectate. Aceste date sunt apoi subiectul unor analize statistice, având ca scop descrierea si deducerea lor.

  • Statistica descriptivă rezumă datele populației, descriind ce a fost observat în probă, numeric sau grafic. Descriptorii numerici includ media si deviația standard pentru tipuri de distribuție continuă a probabilității (ca înalțime sau greutate), în timp ce frecvența și procentul sunt mult mai utile din punct de vedere al descrierii datelor categorice.
  • Statistica deductivă utilizează modele în datele probă pentru a extrage deducții despre populația reprezentată. Aceste deducții pot lua formă de: răspunsuri da/nu la întrebări despre date (testarea ipotezei, estimarea caracteristicilor numerice ale datelor (estimare), descrierea (asocieri) între date (corelare) si modelarea relațiilor între date[8].

Conceptul de corelare este de notat, în mod special, pentru aptitudinea de a crea confuzie. Analiza statistică a unui set de date adesea descoperă că două variabile (proprietăți) ale unei populații au tendința de a varia împreună, de parcă ar fi fost relevante una alteia. Un studiu de venit anual care se uită și la vârsta de deces ar putea arăta că oamenii săraci au tendința să trăiască mai puțin decât oamenii cu o stare financiară mai bună. Se presupune că cele două variabile sunt legate; cu toate acestea nu sunt cauza uneia sau celeilalte. Fenomenul de corelare poate fi cauzat de un al treilea fenomen, neconsiderat anterior, numit variabila spectator. Din acest motiv nu există un mod imediat de a deduce existența unei relații între două variabile.

Vezi și

Note

  1. ^ Academia RPR Dicționar Enciclopedic Român, București: Editura Politică, 1962-1966
  2. ^ Academia Română, Institutul de Lingvistică Iorgu Iordan Dicționarul explicativ al limbii române (DEX), București: Editura Univers Enciclopedic, 1998
  3. ^ Moses, Lincoln E. (1986) Think and Explain with Statistics, Addison-Wesley, ISBN 978-0-201-15619-5 . pp. 1–3
  4. ^ Hays, William Lee, (1973) Statistics for the Social Sciences, Holt, Rinehart and Winston, p.xii, ISBN 978-0-03-077945-9
  5. ^ Moore, David (). „Teaching Statistics as a Respectable Subject”. În F. Gordon and S. Gordon. Statistics for the Twenty-First Century. Washington, DC: The Mathematical Association of America. pp. 14–25. ISBN 978-0-88385-078-7. Mentenanță CS1: Utilizează parametrul editori (link)
  6. ^ Chance, Beth L. (). „Preface”. Investigating Statistical Concepts, Applications, and Methods (PDF). Duxbury Press. ISBN 978-0-495-05064-3. 
  7. ^ Anderson, D.R.; Sweeney, D.J.; Williams, T.A.. (1994) Introduction to Statistics: Concepts and Applications, pp. 5–9. West Group. ISBN 978-0-314-03309-3
  8. ^ Breiman, Leo (). „Statistical Modelling: the two cultures”. Statistical Science. 16 (3): 199–231. doi:10.1214/ss/1009213726. MR 1874152. Format:Citeseerx. 

Bibliografie

  • M. Popa, „Statistica pentru psihologie”, Editura Polirom, 2002
  • „Mică Enciclopedie de Statistică”, Marus Iosifescu, Costache Moineagu, Vladimir Trebici, Emiliana Ursianu, Editura Științifică și Enciclopedică, 1984
  • L.B. Iantovics, C. Rotar, F. Morar, "Survey on establishing the optimal number of factors in exploratory factor analysis applied to data mining", Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery 9(2), 2019, e1294.

Legături externe

Puteți găsi mai multe informații despre Statistics prin căutarea în proiectele similare ale Wikipediei, grupate sub denumirea generică de „proiecte surori”:
Definiții și traduceri în Wikționar
Imagini și media la Commons
Citate la Wikicitat
Texte sursă la Wikisursă
Manuale la Wikimanuale
Resurse de studiu la Wikiversitate
Control de autoritate
v  d  m
Statistică
Statistică descriptivă
Date continue
Centrală
 · Media ·  · aritmetică ·  · geometrică ·  · armonică · Mediană · Modul
 · Varianță · Abatere standard · Coeficient de variație · Percentilă · Amplitudine · Amplitudine interquartilă
Forma
 · Teorema limitei centrale · Moment ·  · Asimetria ·  · Indice de aplatizare ·  · L-moment
Contorizarea datelor
 · Indice de dispersie
Tabele rezumate
 · Date grupate · Distribuția frecvențelor · Tabel de contingență
 · Coeficientul de corelație Pearson · Corelarea rangului ·  · Spearman's rho ·  · Kendall's tau · Corelație parțială · Diagrama de dispersie
Grafică
 · Diagramă tip bară · Biplot · Boxplot · Diagramă de control · Corelogramă · Histograma · Forest plot · Histogramă · Graficul proporțiilor · Grafic Q–Q · Graficul grafului · Graficul de dispersie · Stem-plot · Grafic radar
 
Colectarea de date
Tipuri de studii
 · Populație · Statistică · Dimensiunea efectului · Puterea statistică · Determinarea dimensiunii eșantionului · Date lipsă
Metodologia sondajului
 · Eșantionare ·  · Stratificare ·  · cluster ·  · Eroare standard ·  · Sondaj de opinie ·  · Chestionar
 · Proiectarea ·  · control ·  · optim · Proces controlat · Aleatoriu · Repartizarea aleatorie · Replicare · Blocare · Interacțiune · Experiment factorial
Studii necontrolate
 · Știință observațională · Experiment natural · Cvasi-experiment
 
Frecvența inferenței
Teoria statistică
 · Populație · Statistică  · Distribuția probabilităților · Eșantionarea distribuției ·  · Statistica comenzilor · Distribuție empirică ·  · Evaluarea densității · Model statistic ·  · Lp space  · Parametru ·  · poziție ·  · scalari ·  · Formare · Familia parametrică ·  · Probabilitate (monotonie) ·  · Location–scale family ·  · Familie exponențională · Observare statistică · Suficientă · Statistică funcțională ·  · Bootstrap ·  ··  · V  · Decizie optimă ·  · Funcția de cost  · Eficiența · Distanța statistică ·  · divergență  · Asimptotică · Robustețe
Inferența statistică
Estimarea punctelor

Estimarea ecuațiilor  ·  · Verosimilitate maximă (MLE)  ·  · Method of moments  ·  · M-estimator  ·  · Minimum distance  · Unbiased estimators  ·  · Mean-unbiased minimum-variance  ·  ·  · Rao–Blackwellization  ·  ·  · Lehmann–Scheffé theorem  ·  · Median unbiased

 · Plug-in
Estimarea intervalului
 · Interval de încredere · Pivot · Likelihood interval · Prediction interval · Tolerance interval · Resampling ·  · Bootstrap  ·  · Jackknife
Testarea ipotezelor
 · 1- & 2-tails · Power ·  · Uniformly most powerful test  · Permutation test ·  · Randomization test · Multiple comparisons
Parametric tests
 · Likelihood-ratio · Wald · Score
Bayesian inference

 · Bayesian probability  ·  · prior  ·  · posterior  · Credible interval  · Bayes factor  · Bayesian estimator

 ·  · Maximum posterior estimator
 

 · Pearson product-moment  · Partial correlation  · Confounding variable

 · Coefficient of determination
Regression analysis

 · Errors and residuals  · Regression model validation  · Mixed effects models  · Simultaneous equations models

 · Multivariate adaptive regression splines (MARS)
Linear regression

 · Simple linear regression  · Ordinary least squares  · General linear model

 · Bayesian regression
Non-standard predictors

 · Nonlinear regression  · Nonparametric  · Semiparametric  · Isotonic  · Robust  · Heteroscedasticity

 · Homoscedasticity
Generalized linear model

 · Exponential families

 · Logistic (Bernoulli) / Binomial / Poisson regressions
Partition of variance

 · Analysis of variance (ANOVA, anova)  · Analysis of covariance  · Multivariate ANOVA

 · Degrees of freedom