Cominciamo tracciando i dati e dandoli un'occhiata. Si tratta di una quantità molto limitata di dati, quindi sarà in qualche modo ad hoc con molte ipotesi.
rotten <- c(0,1,1,0,0,0,1,1,1,1,0,0,0)
rotten <- as.factor(rotten)
mass <- c(139.08,
91.48,
74.23,
129.8,
169.22,
123.43,
104.93,
103.27,
169.01,
83.29,
157.57,
117.72,
128.63)
diam <- c(17.28,
6.57,
7.12,
16.52,
14.58,
6.99,
6.63,
6.75,
15.38,
7.45,
13.06,
6.61,
7.19)
plot(mass,diam,col=rotten,lwd=2)
title("Fruits")
Quindi questi sono i dati, i punti rossi rappresentano i frutti marci:

Hai ragione nel dare per scontato che sembrano esserci due tipi di frutti. Le ipotesi che faccio sono le seguenti:
- Il diametro divide i frutti in due gruppi
- I frutti con un diametro maggiore di 10 sono in un gruppo, altri nel gruppo più piccolo.
- C'è solo un frutto marcio nel grande gruppo di frutta. Supponiamo che se un frutto si trova nel grande gruppo, quindi essere marcio non influisce sul peso. Questo è essenziale, poiché abbiamo un solo punto dati in quel gruppo.
- Se il frutto è un piccolo frutto, il marcio influisce sulla massa.
- Supponiamo che le variabili diam e mass siano normalmente distribuite.
Poiché si ritiene che la somma del diametro sia di 64,2 cm, è molto probabile che due frutti siano grandi e quattro piccoli. Ora ci sono 3 casi per il peso. Vi sono 2, 3 o 4 piccoli frutti marci ( un grosso frutto marcio non influenza la massa per ipotesi ). Quindi ora puoi ottenere limiti sulla tua massa calcolando questi valori.
Possiamo stimare empiricamente la probabilità che il numero di piccoli frutti sia marcio. Usiamo le probabilità per ponderare le nostre stime della massa, a seconda del numero di frutti marci:
samps <- 100000
stored_vals <- matrix(0,samps,2)
for(i in 1:samps){
numF <- 0 # Number of small rotten
numR <- 0 # Total number of rotten
# Pick 4 small fruits
for(j in 1:4){
if(runif(1) < (5/8)){ # Empirical proportion of small rotten
numF <- numF + 1
numR <- numR + 1
}
}
# Pick 2 large fruits
for(j in 1:2){
if(runif(1) < 1/5){# Empirical proportion of large rotten
numR <- numR + 1
}
}
stored_vals[i,] <- c(numF,numR)
}
# Pick out samples that had 4 rotten
fourRotten <- stored_vals[stored_vals[,2] == 4,1]
hist(fourRotten)
table(fourRotten)
# Proportions
props <- table(fourRotten)/length(fourRotten)
massBig <- mean(mass[diam>10])
massSmRot <- mean(mass[diam<10 & rotten == 1])
massSmOk <- mean(mass[diam<10 & rotten == 0])
weights <- 2*massBig + c(2*massSmOk+2*massSmRot,1*massSmOk+3*massSmRot,4*massSmRot)
Est_Mass <- sum(props*weights)
Dandoci una stima finale di 691.5183g . Penso che devi fare la maggior parte delle ipotesi che ho fatto per giungere a una conclusione, ma penso che potrebbe essere possibile farlo in un modo più intelligente. Inoltre campiono empiricamente per ottenere la probabilità del numero di piccoli frutti marci, che è solo pigrizia e può essere fatto "analiticamente".