-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathScriptB7.R
95 lines (73 loc) · 2.58 KB
/
ScriptB7.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
install.packages("PairedData") #Paquet PairedData necesari per tractar amb mostres aparellades
B7info <- read.table("clipboard", header = FALSE, dec = ",") #Copiem Les dades que tenim guardades en un excel
#Les 50 primeres dades són de C i les 50 segones són de Python
Ct = B7info$V3[1:50]
Pt = B7info$V3[51:100]
n = 50
#Comprovem la normalitat de la variable diferència
D = Pt - Ct
qqnorm(D)
qqline(D)
#Com que no es compleix la premisa de normalitat treiem logaritmes
D = log(Pt/Ct)
qqnorm(D) #Ara sí que es compleixen les premises de normalitat
qqline(D)
#Càlcul de l'estadístic T. D~N i les mostes són aparellades
#La nostra hipòtesi nula és que el C triga el mateix que Pyton (D = 0)
SD = sd(D)
T = mean(D)/(SD/sqrt(n)) #Segueix una distribució t-stduent amb 49 graus de llibertat
#Càlcul del punt crític i p-valor
pCrit = qt(0.95, n - 1) #Punt crític
pValor = 1 - pt(T, n - 1) #p-valor
#Càlcul de l'Interval de conifança del 95% de la variable diferència
IC95 = c(mean(D) - qt(0.975, n - 1)*(SD/(sqrt(n))),mean(D) + qt(0.975, n - 1)*(SD/(sqrt(n))))
#càlcul de l'interval de confiança del 99.9% de la variable diferència
IC99 = c(mean(D) - qt(0.9995, n - 1)*(SD/(sqrt(n))),mean(D) + qt(0.9995, n - 1)*(SD/(sqrt(n))))
#t.test
t.test(D)
#Tots els gràfics
Cl <- log(Ct) #Traiem logaritmes per poder fer els plots
Pl <- log(Pt)
p <- PairedData::paired(Cl, Pl)
PairedData::plot(p, type = 'BA')
PairedData::plot(p, type = 'correlation')
PairedData::plot(p, type = 'McNeil')
PairedData::plot(p, type = 'profile')
qqnorm(D)
qqline(D)
D = log(Pt/Ct)
plot(Cl, Pl)
stripchart(D)
#Analisis B6
Z = B7info$V4[1:50]
#Traiem les mitjanes del temps en C (variable Y) i la mida del vector (Variable Z)
Y = mean(Pt)
X = mean(Z)
S2x = var(Z)
S2y = var(Pt)
Sx = sqrt(S2x)
Sy = sqrt(S2y)
Sxy = cov(Pt, Z)
rxy = cor(Pt, Z)
b1 = Sxy/S2x
b0 = Y - b1*X
S2 = ((n - 1)*(S2y - b1*Sxy))/(n - 2)
S2b1 = S2/((n - 1)*S2x)
S2b0 = S2*(1/n + (X^2/((n - 1)*S2x)))
#Prova de hipòtesi per veure si la relació pot ser una recta horizontal o realment és creixent
#Ho = b1 = 0
#H1 = b1 > 0
Tb1 = b1/(sqrt(S2b1)) #~t-student amb 48 graus de llibertat
pCritb1 = qt(0.95, n - 2)
pValb1 = 1 - pt(Tb1, n - 2)
#Interval de confiança del 95% per B1
IC95B1 = c(b1 - qt(0.975, n - 2)*sqrt(S2b1), b1 + qt(0.975, n - 2)*sqrt(S2b1))
#Interval de confiança del 95% per B0
IC95B0 = c(b0 - qt(0.975, n - 2)*sqrt(S2b0), b0 + qt(0.975, n - 2)*sqrt(S2b0))
lm(Pt ~ Z)
plot(Pt, Z)
D = Pt - Ct
D = log(Pt/Ct)
plot(D, Z)
plot(1:50, rstandard(lm(Pt~Z)), type = "b")
abline(0, 0)