Monday, March 16, 2009

Ezzercizi x il Masta di Biostata

ESERCIZI DI RIEPILOGO 2

Esercizio 1

Rodriguez-Roisin et al. (American Review of Respiratory Disease, 1991) hanno stabilito che lo stimolo dato dall’inalazione della metacolina (MTH) è fino ad ora uno dei più usati strumenti per la diagnosi dell’asma. Hanno studiato le caratteristiche e i tempi della diversità ventilazione-profusione (VA/Q) dopo lo stimolo per definire meglio il modello di stimolo bronchiale MTH in pazienti con asma leggera asintomatica. Tra i dati raccolti su 16 soggetti dello studio c’erano le misure della PaO2 prima (B) e dopo (A) lo stimolo della MTH. I dati sono riportati nel file Mth.dta.
(a) Calcolare il livello medio e la variabilità della PaO2 per i 16 soggetti prima e dopo lo stimolo della MTH. Commentare i risultati ottenuti con esplicito riferimento al problema posto.
(b) Visualizzare i boxplot per i due gruppi B e A: commentare il grafico.
(c) Valutare, tramite un opportuno test statistico, se la differenza tra i valori medi dei due gruppi B e A è significativamente diversa oppure è imputabile ad un semplice effetto del caso. Con questi dati è possibile sostenere che la MTH determina una diminuzione della PaO2?. Considerare .

Risposte:
(a)
. tabstat B A, stats(mean sd)

stats | B A
---------+--------------------
mean | 88.14375 71.0125
sd | 10.97773 4.471372
------------------------------
(b)
. graph box B A


Dal grafico si vede la maggiore variabilità di B rispetto ad A.

( c)

. ttest B=A

Paired t test

------------------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
B | 16 88.14375 2.744433 10.97773 82.29413 93.99337
A | 16 71.0125 1.117843 4.471372 68.62987 73.39513
---------+--------------------------------------------------------------------
diff | 16 17.13125 2.765904 11.06362 11.23586 23.02664
------------------------------------------------------------------------------

Ho: mean(B - A) = mean(diff) = 0

Ha: mean(diff) < 0 Ha: mean(diff) ~= 0 Ha: mean(diff) > 0
t = 6.1937 t = 6.1937 t = 6.1937
P < t = 1.0000 P > |t| = 0.0000 P > t = 0.0000

La differenza tra i valori medi dei due gruppi B e A è significativamente diversa (Ha: mean(diff) ~= 0, P > |t| = 0.0000)
La MTH determina una diminuzione della PaO2 (Ha: mean(diff) > 0, P > t = 0.0000 )


Esercizio 2

Si vuole stimare il numero medio di battiti cardiaci al minuto in una certa popolazione. Il numero medio di battiti al minuto per un campione di 49 soggetti è risultato pari a 90. Se è ragionevole assumere che questi 49 pazienti costituiscano un campione casuale e che il carattere nella popolazione è distribuito normalmente con una deviazione standard pari a 10, si calcoli:
a) l'intervallo di confidenza per  al 90%;
b) l'intervallo di confidenza per  al 95%;
c) l'intervallo di confidenza per  al 99%;
d) si confrontino gli intervalli ottenuti, commentandone la differenza.

Risposte:
a)
. cii 49 90 10, level(90)

Variable | Obs Mean Std. Err. [90% Conf. Interval]
-------------+-------------------------------------------------------------
| 49 90 1.428571 87.60397 92.39603

b)
. cii 49 90 10, level(95)

Variable | Obs Mean Std. Err. [95% Conf. Interval]
-------------+-------------------------------------------------------------
| 49 90 1.428571 87.12766 92.87234
c)
. cii 49 90 10, level(99)

Variable | Obs Mean Std. Err. [99% Conf. Interval]
-------------+-------------------------------------------------------------
| 49 90 1.428571 86.16828 93.83172
d)
Aumentando il valore % dell’intervallo di confidenza aumenta la sua ampiezza.
Esercizio 3

Durante un esperimento con animali di laboratorio, sono stati registrati i flussi sanguigni della corteccia renale in condizioni normali e durante la somministrazione di un certo anestetico. I dati sono riportati nel file Anestetico.dta. Con questi dati è possibile indicare che l’anestetico ritarda i flussi sanguigni della corteccia renale? Si consideri .
Risposte:
(1.1)
. sdtest normali= sommini

Variance ratio test

------------------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
normali | 15 2.662667 .1247262 .4830627 2.395155 2.930178
sommini | 15 2.259333 .1763586 .6830338 1.881082 2.637585
---------+--------------------------------------------------------------------
combined | 30 2.461 .1125385 .6163986 2.230833 2.691167
------------------------------------------------------------------------------

Ho: sd(normali) = sd(sommini)

F(14,14) observed = F_obs = 0.500
F(14,14) lower tail = F_L = F_obs = 0.500
F(14,14) upper tail = F_U = 1/F_obs = 1.999

Ha: sd(1) < sd(2) Ha: sd(1) ~= sd(2) Ha: sd(1) > sd(2)
P < F_obs = 0.1037 P < F_L + P > F_U = 0.2073 P > F_obs = 0.8963

Varianze uguali (P < F_L + P > F_U = 0.2073)
(1.2)
. ttest normali= sommini

Paired t test

------------------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
normali | 15 2.662667 .1247262 .4830627 2.395155 2.930178
sommini | 15 2.259333 .1763586 .6830338 1.881082 2.637585
---------+--------------------------------------------------------------------
diff | 15 .4033333 .1383393 .535786 .1066249 .7000417
------------------------------------------------------------------------------

Ho: mean(normali - sommini) = mean(diff) = 0

Ha: mean(diff) < 0 Ha: mean(diff) ~= 0 Ha: mean(diff) > 0
t = 2.9155 t = 2.9155 t = 2.9155
P < t = 0.9944 P > |t| = 0.0113 P > t = 0.0056

Sì, l’anestetico ritarda i flussi sanguigni (P > |t| = 0.0113)


Esercizio 4

Babaian e Camps (Cancer, 1991) argomentano che l'antigene specifico della prostata (PSA), trovato nelle cellule epiteliali duttali della prostata, è specifico per il tessuto prostatico ed è individuabile nel siero degli uomini con prostata normale e degli uomini con malformazione sia benigna che maligna della ghiandola. I ricercatori hanno determinato i valori di PSA in un campione di 124 uomini sottoposti ad una biopsia della prostata. 67 uomini hanno mostrato elevati valori di PSA (> 4ng/ml). Per 46 di questi è stato diagnosticato un cancro, mentre dei 57 uomini con valori di PSA <=4ng/ml, il cancro è stato diagnosticato per 10 di essi. Sulla base dei dati possiamo concludere che, in generale, la frequenza di cancro alla prostata nella popolazione degli uomini con elevati valori di PSA è superiore a quella presente nella popolazione degli uomini con valori di PSA inferiori? Si consideri .
Risposte:
(1.1)
. display 46/67
.68656716
(1.2)

. display 10/57
.1754386
(1.3)

. prtesti 124 0.68656716 0.1754386, level(99)

One-sample test of proportion x: Number of obs = 124

------------------------------------------------------------------------------
Variable | Mean Std. Err. z P>|z| [99% Conf. Interval]
---------+--------------------------------------------------------------------
x | .6865672 .0416584 16.4809 0.0000 .5792622 .7938722
------------------------------------------------------------------------------

Ho: proportion(x) = .1754386

Ha: x < .1754386 Ha: x ~= .1754386 Ha: x > .1754386
z = 14.965 z = 14.965 z = 14.965
P < z = 1.0000 P > |z| = 0.0000 P > z = 0.0000

Sì, la frequenza di cancro alla prostata nella popolazione degli uomini con elevati valori di PSA è superiore a quella presente nella popolazione degli uomini con valori di PSA inferiori (Ha: x > .1754386, P > |z| = 0.0000)


Esercizio 5

Henning et al. (American Journal of Public Health, 1992) hanno trovato che il 66% di un campione di 670 bambini ha completato la serie dei vaccini per l'epatite B. Possiamo concludere, sulla base di tali dati, che nella popolazione campionata, più del 60% ha completato la serie? Si consideri .
Risposte:

. prtesti 670 0.66 0.60

One-sample test of proportion x: Number of obs = 670

------------------------------------------------------------------------------
Variable | Mean Std. Err. z P>|z| [95% Conf. Interval]
---------+--------------------------------------------------------------------
x | .66 .018301 36.0637 0.0000 .6241308 .6958692
------------------------------------------------------------------------------

Ho: proportion(x) = .6

Ha: x < .6 Ha: x ~= .6 Ha: x > .6
z = 3.170 z = 3.170 z = 3.170
P < z = 0.9992 P > |z| = 0.0015 P > z = 0.0008
Sì, nella popolazione campionata, più del 60% ha completato la serie (Ha: x > .6, P > z = 0.0008)

Esercizio 6

In uno studio di abusi sui minori in pazienti psichiatrici, Brown e Anderson (American Journal of Psychiatry, 1991) hanno trovato che in un campione di 947 pazienti, 166 riferivano storie di abuso fisico e/o sessuale. Costruire un intervallo di confidenza al 90 per cento per la proporzione nella popolazione.
Risposte:
(1.1)
. display 166/947
.17529039
(1.2)

. cii 947 0.17529039, level(90)

-- Binomial Exact --
Variable | Obs Mean Std. Err. [90% Conf. Interval]
-------------+-------------------------------------------------------------
| 947 .1752904 .0123553 .1552086 .1968847
Intervallo di confidenza al 90 per cento per la proporzione nella popolazione (.1552086 - .1968847).


Esercizio 7

Hartgers et al. (American Journal of Public Health, 1992) del Department of Public Health and Environment di Amsterdam, hanno condotto uno studio in cui i soggetti erano consumatori di droga per via endovenosa (IDU). In un campione di 194 consumatori regolari di lungo periodo di metadone (LTM), 145 erano maschi. In un campione di 189 IDU dove non vi erano consumatori di LTM, 113 erano maschi. Valutare, tramite un appropriato test, se le differenze presenti sono significative al 95%. Qual è l’intervallo di confidenza al 95% per la differenza fra le proporzioni di maschi nelle due popolazioni e valutare ?
Risposte:
(1.1)
. display 194+189
383
(1.2)
. display 145/194
.74742268
(1.3)
. display 113/189
.5978836

(1.4)

. prtesti 383 0.7472268 0.5978836

One-sample test of proportion x: Number of obs = 383

------------------------------------------------------------------------------
Variable | Mean Std. Err. z P>|z| [95% Conf. Interval]
---------+--------------------------------------------------------------------
x | .7472268 .0222071 33.6481 0.0000 .7037016 .790752
------------------------------------------------------------------------------

Ho: proportion(x) = .5978836

Ha: x < .5978836 Ha: x ~= .5978836 Ha: x > .5978836
z = 5.961 z = 5.961 z = 5.961
P < z = 1.0000 P > |z| = 0.0000 P > z = 0.0000

Sì, le differenze presenti sono significative al 95% (Ha: x ~= .5978836, P > |z| = 0.0000)

(1.5)

. prtesti 194 0.7472268 189 0.5978836

Two-sample test of proportion x: Number of obs = 194
y: Number of obs = 189

------------------------------------------------------------------------------
Variable | Mean Std. Err. z P>|z| [95% Conf. Interval]
---------+--------------------------------------------------------------------
x | .7472268 .0312026 23.9476 0.0000 .6860708 .8083828
y | .5978836 .0356659 16.7634 0.0000 .5279797 .6677875
---------+--------------------------------------------------------------------
diff | .1493432 .0473884 .0564637 .2422227
| under Ho: .0479256 3.11615 0.0018
------------------------------------------------------------------------------

Ho: proportion(x) - proportion(y) = diff = 0

Ha: diff < 0 Ha: diff ~= 0 Ha: diff > 0
z = 3.116 z = 3.116 z = 3.116
P < z = 0.9991 P > |z| = 0.0018 P > z = 0.0009

Intervallo di confidenza al 95% per la differenza fra le proporzioni di maschi nelle due popolazioni (.0564637 - .2422227).


Esercizio 8

Wada et al. (American Journal of Hematology, 1991) affermano che il fattore di necrosi tumorale (TNF) è una citochinina antitumorale che, per prima, ha catturato l'attenzione come possibile agente antitumorale senza effetti collaterali. Il TNF è considerato anche come possibile mediatore della coagulazione intravascolare diffusa (DIC) e della insufficienza multipla di organi. I soggetti sono volontari sani, pazienti DIC e pazienti non DIC. I dati riportati nel file Tnf.dta mostrano i livelli nel sangue di TNF (U/ml) e il punteggio DIC per soggetti non leucemici.
Rispondere alle seguenti domande:
(a) Qual è la variabile esplicativa? Qual è la variabile risposta? Spiegare brevemente la scelta effettuata.
(b) Descrivere, tramite un opportuno grafico, la relazione generale tra le due variabili.
(c) Qual è il valore medio del TNF? Qual è la sua deviazione standard?
(d) Qual è il punteggio medio DIC per i soggetti non leucemici? E la sua deviazione standard?
(e) Stimare, tramite l’opportuna procedura, i valori dei coefficienti b0 e b1 della retta di regressione. Interpretare i due coefficienti ottenuti nel contesto del problema.
(f) Scrivere l’equazione della retta di regressione ottenuta.
(g) Calcolare il valore del coefficiente di correlazione lineare r e interpretarne il risultato nel contesto del problema.

Risposte:

(a) variabile esplicativa = TNF; variabile risposta = DIC.
Il TNF è considerato anche come possibile mediatore della coagulazione intravascolare diffusa (DIC)







(b)
. graph dic tnf

(c) e
(d)
. tabstat tnf dic, stats(mean sd)

stats | tnf dic
---------+--------------------
mean | .1931915 6.340426
sd | .2463746 2.623279
------------------------------

(e)
. regress dic tnf

Source | SS df MS Number of obs = 47
-------------+------------------------------ F( 1, 45) = 8.81
Model | 51.8208564 1 51.8208564 Prob > F = 0.0048
Residual | 264.732335 45 5.88294078 R-squared = 0.1637
-------------+------------------------------ Adj R-squared = 0.1451
Total | 316.553191 46 6.88159112 Root MSE = 2.4255

------------------------------------------------------------------------------
dic | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
tnf | 4.308017 1.451518 2.97 0.005 1.38451 7.231523
_cons | 5.508153 .4514475 12.20 0.000 4.598892 6.417415
------------------------------------------------------------------------------

b0 = 5.508153
b1 = 4.308017


(f) DIC = 5.508153 + 4.308017 TNF
Vuol dire che DIC risulta pari a 5.508153 + 4.308017 x TNF (cioè al variare di TNF, DIC varierà di 4.308017 volte TNF).

(g)

. correlate dic tnf
(obs=47)

| dic tnf
-------------+------------------
dic | 1.0000
tnf | 0.4046 1.0000

Coefficiente di correlazione lineare r = 0.4046 .

C’è una correlazione positiva tra i due caratteri, che è pari al 40.46% della massima possibile.

1 comment:

Anonymous said...

Ciao Nino, sempre a columbus stai?
daje che te vengo a trova'...
NP