giovedì 6 maggio 2010

numeri in biologia

I numeri e i loro rapporti matematici sono un mezzo con cui vengono presentati i risultati delle ricerche, la rappresentazione degli eventi. In particolare il 3 è un termine di paragone, la riproducibilità di un esperimento (in tutti gli articoli un risultato è creduto quando un esperimento è ripetibile, per tre volte porta ad uguali effetti, ed è verificabile anche presso altri laboratori). Dati 3 numeri leggermente differenti come misura di questi effetti, si calcola quindi il valore medio (rappresentato come l'altezza di un parallelepipedo nei grafici (x, y=fx) e la deviazione standard come un trattino che fluttua sopra e sotto il valore medio come nella figura qui schematizzata: 
In statistica la media  (intesa come media "aritmetica")  viene applicata soltanto nella statistica descrittiva
La formula della media aritmetica semplice N è:
somma dei valori (X1 + X2 + …. Xn) diviso n  Tradurre la statistica ed il rischio in maniera comprensibile da tutti è un modo per bloggare bene e comunicare la scienza  sostenendo l'evidenza attraverso dati quantitativi, qualitativi, o entrambi.
Rischio Individuale verso rischio nella populazione
spesso abbiamo sentito delle  stima nel corso della vita del tumore al seno nelle donne.  La percentuale fluttua in modo vario a seconda della località, mondo occidentale verso pasei in via dis sviluppo, tra il 3% fino al 14%.
Negli USA, è il 12.7 per cento il numero delle donne che avranno questo tumore ad un certo momento della loro vita.   Questa statistica vien spesso riportata come "una donna in otto avrà un cancro al seno". Per i lettori è difficile comprendere il rischio da questi numeri. L' 80% delle donne americane pensa che una donna su otto sarà così diagnosticata ogni anno.
Riportare la statistica 'una su otto' mis-rappresenta il rischio individuale.
Nel corso della vita, in ogni donna l'attuale rischio di tumore al seno  varia per diversi parametri. 
Negli USA  0.43% delle donne comprese  tra 30 e 39 anni (1 su 233) sarà diagnosticata così.  
Nelle donne  tra 60 e 69 anni, il tasso è di 3.65% (1 su 27).
 Stime di rischio assoluto e rischio relativo.  
 Bisogna scegliere se riportare il rischio assoluto o il rischio relativo, perchè la percezione che ne hanno i lettori li fa apparire sostanzialmente differenti.
Absolute risk è semplicemente la probabilità che qualcosa succeda  (per esempio,  il dato una donna su otto).
  Relative risk è il paragone tra il rischio in due situazioni differenti.
Immaginiamo un ostudio che riporti  un nuovo vaccino sulla frebbe di dengue. Lo studio presenta due gruppi  seguiti, di 1000 Brasiliani che hano avuto il vaccino  o un placebo. Dopo 5 anni, una  persona vaccinata contrae la febbre, comparata a 4 persone non vaccinate.
Il rischio assoluto di avere il dengue  dopo il nuovo vaccino e dello  0.1 %, mentre è dello  0.4 % col placebo. I Titoli riportanti "Nuovo vaccino diminuisce il rischio del dengue dello 0.3 per cento" non danno nessuna notizia.
Per il rischio relativo  il dato è molto diverso. Il nuovo vaccino abbassa il rischio relativo del 75 per cento, comparato al placebo. "Nuovo vaccino diminuisce il rischio del dengue del 75 per cent", è un titolo che riceverà molta attenzione nei lettori Brasiliani.
 Analisi rischi/benefici
Questa differenza puè nella realtà essere molto piccola, dipende da quanto comune sia la malattia. Se una malattia colpisce solo 4 persone su un milione, diminuire il rischio del 75% salverà solo  tre persone su un milione. (Fonte: SciDevNet)



Matematica statistica per biologi
Alcune funzioni, calcolabili con un software di statistica, per affermare la significatività dei dati ottenuti (dati statistici vengono richiesti nelle pubblicazioni)
 Il test t di Student viene sempre calcolato sui dati per convalidare i risultati biologici, come una  verifica d'ipotesi su un valor medio  
la varianza di una variabile aleatoria X è un numero Var(X) che fornisce una misura di quanto siano vari i valori assunti dalla variabile, ovvero di quanto si discostino dalla media
La deviazione standard (in inglese: standard deviation) o scarto tipo o scarto quadratico medio è  derivato direttamente dalla varianza, misura la dispersione dei dati intorno al valore atteso.  In statistica la precisione  si può esprimere come deviazione standard, viene rappresentato con la lettera greca σigma.
Significance test
p < 0,005. P inferiore al 0.5%.
In statistica inferenziale il valore p (o p-value, in inglese) di un test di verifica d'ipotesi condotto indica la probabilità di ottenere un risultato pari o più estremo di quello osservato, supposta vera l'ipotesi nulla (l'ipotesi sulla quale si conduce il test). Talvolta viene anche chiamato livello di significatività osservato.
Per condurre un test statistico è importante fissare il livello di significatività prima di calcolare il valore p. Se il valore p venisse calcolato per primo, lo sperimentatore saprebbe quali valori per il livello di significatività conducono ad accettare o rifiutare l'ipotesi nulla, e potrebbe scegliere il livello in funzione del risultato desiderato.
Il valore p viene utilizzato per fornire maggiori informazioni su un test rispetto all'accettazione o al rifiuto per un certo livello di significatività.
Sia, per esempio, 3% (o 0,03) il valore p di un test. Il test condotto con un rischio di errore (o livello di significatività) del 5% induce allora a rifiutare l'ipotesi nulla, mentre lo stesso test condotto con un rischio di errore del 2% induce a non rifiutare l'ipotesi nulla. 
La conclusione "il valore p è 3%" contiene più informazioni delle sole "ipotesi rifiutata con significatività 5%" o "accettata con significatività 2%".
Il Rischio riguarda il valore atteso di uno o più risultati di uno o più eventi futuri. Il rischio, come valore di questi risultati, può essere negativo (downside risk: il sopraggiungere di un costo aggiuntivo), oppure positivo (upside risk: mancato raggiungimento di un beneficio atteso). L’uso generale tende a mettere a fuoco solo i danni che possono sopraggiungere dai futuri eventi.

Nessun commento:

Questo blog non rappresenta una testata giornalistica in quanto viene aggiornato senza alcuna periodicità . Non può pertanto considerarsi un prodotto editoriale ai sensi della legge n. 62 del 7.03.2001