Come posso adattare una regressione vincolata in R in modo che i coefficienti totali = 1?

36

Vedo una regressione limitata simile qui:

Regressione lineare vincolata attraverso un punto specificato

ma il mio requisito è leggermente diverso. Ho bisogno dei coefficienti per sommare a 1. In particolare, sto regredendo i rendimenti di 1 serie di cambi contro 3 altre serie di cambi, in modo che gli investitori possano sostituire la loro esposizione a quella serie con una combinazione di esposizione alle altre 3, ma il loro l'esborso di denaro non deve cambiare e, preferibilmente (ma non è obbligatorio), i coefficienti dovrebbero essere positivi.

Ho provato a cercare una regressione limitata in R e Google, ma con poca fortuna.

r regression

— Thomas Browne
fonte

Sei sicuro che si tratti di un problema di regressione vincolata? Mentre leggo la domanda, cerchi una relazione del modulo (una serie Forex) = (in più, presumo, un quarto termine che rappresenta un tasso di rendimento sicuro prevalente). Questo è indipendente dalla decisione di investimento. Se un cliente desidera investire capitale in

utilizzando

,

e

come proxy, allora investe semplicemente

in

,

in

e

in

y_{4}

$y_4$

β_{1} y_{1} + β_{2} y_{2} + β_{3} y_{3}

$\beta_1 y_1 + \beta_2 y_2 + \beta_3 y_3$

c

$c$

y_{4}

$y_4$

y_{1}

$y_1$

y_{2}

$y_2$

y_{3}

$y_3$

c β_{1}

$c\beta_1$

y_{1}

$y_1$

c β_{2}

$c\beta_2$

y_{2}

$y_2$

c β_{3}

$c\beta_3$

y_{3}

$y_3$ . Ciò non aggiunge alcuna complicazione speciale alla regressione, vero?

— whuber

Lo fa perché se modellerai questo troverai che B1 + B2 + B3> 1 in molti casi (o <1 in altri). Questo perché la valuta che si sta tentando di replicare con i descrittori avrà in genere una volatilità maggiore o minore rispetto alle altre, e quindi la regressione ti darà pesi più o meno grandi in risposta. Ciò richiede che l'investitore non sia completamente investito o che faccia leva, cosa che non desidero. Per quanto riguarda il tasso di rendimento sicuro n. Tutto ciò che stiamo cercando di fare è replicare series1 usando altre variabili. Essendo un ragazzo di finanza e non uno statistico forse ho erroneamente chiamato la mia domanda.

— Thomas Browne,

La ragione per includere un termine per un tasso di rendimento sicuro è che a volte avrà un coefficiente diverso da zero. Presumibilmente, strumenti sicuri (depositi bancari overnight) sono disponibili per tutti a basso costo, quindi chiunque lo ignori come componente del proprio paniere di investimenti potrebbe scegliere combinazioni non ottimali. Ora, se i coefficienti non si aggiungono all'unità, e allora? Investi quanto vuoi nelle proporzioni stimate dalla regressione.

— whuber

giusto ..... così semplice. Grazie. Mi sento un po 'sciocco ora ahah.

— Thomas Browne,

1

Per niente sciocco. Porre semplicemente questa domanda riflette un alto livello di pensiero. Stavo solo controllando la mia comprensione della tua domanda per assicurarmi di avere una risposta efficace. Saluti.

— whuber

35

Se ho capito bene, il tuo modello è con e . Devi ridurre al minimo soggetti a questi vincoli. Questo tipo di problema è noto come programmazione quadratica .

Y = π_{1} X_{1} + π_{2} X_{2} + π_{3} X_{3} + ε,

$Y = \pi_1 X_1 + \pi_2 X_2 + \pi_3 X_3 + \varepsilon,$

\sum_{k} π_{k} = 1

$\sum_k \pi_k = 1$

π_{k} \geq 0

$\pi_k\ge0$

\sum_{i} {(Y_{i} - (π_{1} X_{i 1} + π_{2} X_{i 2} + π_{3} X_{i 3}))}^{2}

$\sum_i \left(Y_i - (\pi_1 X_{i1} + \pi_2 X_{i2} + \pi_3 X_{i3}) \right)^2$

Ecco alcune righe di codici R che danno una possibile soluzione ( sono le colonne di , i valori reali di sono 0,2, 0,3 e 0,5). $X_1, X_2, X_3$ X $\pi_k$

> library("quadprog");
> X <- matrix(runif(300), ncol=3)
> Y <- X %*% c(0.2,0.3,0.5) + rnorm(100, sd=0.2)
> Rinv <- solve(chol(t(X) %*% X));
> C <- cbind(rep(1,3), diag(3))
> b <- c(1,rep(0,3))
> d <- t(Y) %*% X  
> solve.QP(Dmat = Rinv, factorized = TRUE, dvec = d, Amat = C, bvec = b, meq = 1)
$solution
[1] 0.2049587 0.3098867 0.4851546

$value
[1] -16.0402

$unconstrained.solution
[1] 0.2295507 0.3217405 0.5002459

$iterations
[1] 2 0

$Lagrangian
[1] 1.454517 0.000000 0.000000 0.000000

$iact
[1] 1

Non conosco alcun risultato sulla distribuzione asintotica degli stimatori, ecc. Se qualcuno ha dei puntatori, sarò curioso di prenderne alcuni (se lo desideri, posso aprire una nuova domanda su questo).

— Elvis
fonte

Domanda davvero veloce. Non dovrei minimizzare la varianza piuttosto che la somma? Non è ciò che fa una regressione è minimizzare la varianza del quadrato degli errori?

— Thomas Browne,

6

Questo è intelligente, Elvis, ma non potresti realizzare la stessa cosa semplicemente riparando la regressione? Ad esempio, lascia È equivalente a . Le stime e gli errori standard di sono semplici da calcolare dalle stime e dalla matrice var-covar di e .

Y = α_{1} X_{1} + α_{2} X_{2} + (1 - α_{1} - α_{2}) X_{3} + ε

$Y = \alpha_1 X_1 + \alpha_2 X_2 + (1-\alpha_1-\alpha_2)X_3 +\varepsilon$

Y - X_{3} = α_{1} (X_{1} - X_{3}) + α_{2} (X_{2} - X_{3}) + ε

$Y-X_3 = \alpha_1(X_1-X_3) + \alpha_2(X_2-X_3)+\varepsilon$

π_{i}

$\pi_i$

α_{1}

$\alpha_1$

α_{2}

$\alpha_2$

— whuber

6

@whuber Sì, ma con dati più rumorosi o con alcuni vicini a , facilmente il vincolo , che è la parte "difficile" del problema.

π_{k}

$\pi_k$

0

$0$

π_{k} > 0

$\pi_k > 0$

— Elvis,

2

Un coefficiente positivo ti dice di acquistare una valuta estera; un coefficiente negativo ti dice di venderlo. Se non possiedi già quella valuta, devi prenderla in prestito per venderla ("vendita allo scoperto"). Poiché il prestito senza restrizioni può mettere in difficoltà le persone, vi sono vincoli sulla quantità di prestito e sul modo in cui viene pagato ("requisiti di margine" e "costi di trasporto del capitale" e "mark to market"). Pertanto, il prestito è possibile ma è spesso evitato se non dai principali attori nei mercati o a meno che non conferisca grandi vantaggi.

— whuber

2

Mille grazie a tutti per tutto l'aiuto. In realtà solo per fare un commento sui mercati FX in generale, sono più facili da abbreviare rispetto alle azioni o alle obbligazioni perché non è necessario prendere in prestito un titolo prima della vendita allo scoperto. Uno semplicemente lancia le valute denominatore e numeratore. Quindi, ad esempio, vendere EURUSD e vendere USDEUR sono operazioni esattamente equivalenti in termini di dipartimento del rischio, ma ovviamente sono posizioni esattamente opposte. Ecco perché FX è un parco giochi così grande per i trader quantistici perché non devono preoccuparsi molto degli attriti direzionali che sono molto più importanti nelle azioni

— Thomas Browne,

8

Come accennato da whuber, se sei interessato solo ai vincoli di uguaglianza, puoi anche usare la funzione standard lm () riscrivendo il tuo modello:

\begin{array}{rcl} Y & = & α + β_{1} X_{1} + β_{2} X_{2} + β_{3} X_{3} + ϵ \\ = & α + β_{1} X_{1} + β_{2} X_{2} + (1 - β_{1} - β_{2}) X_{3} + ϵ \\ = & α + β_{1} (X_{1} - X_{3}) + β_{2} (X_{2} - X_{3}) + X_{3} + ϵ \end{array}

$\begin{eqnarray} Y&=&\alpha+\beta_1 X_1+\beta_2 X_2+\beta_3 X_3+\epsilon\\ &=& \alpha+\beta_1 X_1+\beta_2 X_2+(1-\beta_1-\beta_2) X_3+\epsilon\\ &=& \alpha + \beta_1( X_1-X_3) +\beta_2 (X_2-X_3)+ X_3+\epsilon \end{eqnarray}$

Ma questo non garantisce che i tuoi vincoli di disuguaglianza siano soddisfatti! In questo caso, tuttavia, si ottiene esattamente lo stesso risultato dell'utilizzo dell'esempio di programmazione quadratica sopra (mettendo X3 a sinistra):

X <- matrix(runif(300), ncol=3)
Y <- X %*% c(0.2,0.3,0.5) + rnorm(100, sd=0.2)
X1 <- X[,1]; X2 <-X[,2]; X3 <- X[,3]
lm(Y-X3~-1+I(X1-X3)+I(X2-X3))

— Matifou
fonte

Nel caso sopra riportato di Matifou, cosa impedisce che il terzo coefficiente sia negativo? Ad esempio, aveva i coefficienti ottimali per e

β_{1} = 0.75

$\beta_1=0.75$

β_{2} = 0.5

$\beta_2=0.5$

(1 - β_{1} - β_{2}) = - 0.25

$(1-\beta_1-\beta_2)=-0.25$

1

Grazie @AS per averlo segnalato. In effetti, questa soluzione funziona solo per i vincoli di uguaglianza, non per quelli di disuguaglianza. Ho modificato il testo di conseguenza.

— Matifou,

1

\bar{\bar{x}} \cdot \bar{b} = \bar{y}

$\bar{\bar{x}} \cdot \bar{b} = \bar{y}$

\sum [\begin{matrix} \bar{b} \end{matrix}] = 1

$\sum \left [ \begin{matrix} \bar{b} \end{matrix} \right ] =1$

$\bar{b}$

$\bar{b}$ $\bar{c}$ $\bar{\bar{T_c}}$ $r$ $1$

\bar{b} = [\begin{matrix} k_{0} \\ k_{1} \\ k_{2} \end{matrix}] = \bar{\bar{T_{c}}} \cdot \bar{c} = [\begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ - 1 & - 1 & 1 \end{matrix}] \cdot [\begin{matrix} k_{0} \\ k_{1} \\ r \end{matrix}]

$\bar{b} = \left [ \begin{matrix} k_0 \\ k_1 \\ k_2 \end{matrix} \right ] = \bar{\bar{T_c}} \cdot \bar{c} = \left [ \begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ -1 & -1 & 1 \end{matrix} \right ] \cdot \left[ \begin{matrix} k_0 \\ k_1 \\ r \end{matrix} \right ]$

k

$k$

u

$u$

\bar{c} = [\begin{matrix} k_{0} \\ k_{1} \\ r \end{matrix}] = \bar{\bar{S_{u}}} \cdot \bar{c_{u}} + \bar{\bar{S_{k}}} \cdot \bar{c_{k}} = [\begin{matrix} 1 & 0 \\ 0 & 1 \\ 0 & 0 \end{matrix}] \cdot [\begin{matrix} k_{0} \\ k_{1} \end{matrix}] + [\begin{matrix} 0 \\ 0 \\ 1 \end{matrix}] \cdot r

$\bar{c} = \left[ \begin{matrix} k_0 \\ k_1 \\ r \end{matrix} \right ] = \bar{\bar{S_u}} \cdot \bar{c_u} + \bar{\bar{S_k}} \cdot \bar{c_k} = \left[ \begin{matrix} 1 & 0 \\ 0 & 1 \\ 0 & 0 \end{matrix} \right] \cdot \left [ \begin{matrix} k_0 \\ k_1 \end{matrix} \right ] + \left [ \begin{matrix} 0 \\ 0 \\ 1 \end{matrix} \right ] \cdot r$ While I could combine the different transform/separation blocks, that gets cumbersome with more intricate models. These blocks allow knowns and unknowns to be separated.

\bar{\bar{x}} \cdot \bar{\bar{T_{c}}} \cdot (\bar{\bar{S_{u}}} \cdot \bar{c_{u}} + \bar{\bar{S_{k}}} \cdot \bar{c_{k}}) = \bar{y} \bar{\bar{v}} = \bar{\bar{x}} \cdot \bar{\bar{T_{c}}} \cdot \bar{\bar{S_{u}}} \bar{w} = \bar{y} - \bar{\bar{x}} \cdot \bar{\bar{T_{c}}} \cdot \bar{\bar{S_{k}}} \cdot \bar{c_{k}}

$\bar{\bar{x}} \cdot \bar{\bar{T_c}} \cdot \left ( \bar{\bar{S_u}} \cdot \bar{c_u} + \bar{\bar{S_k}} \cdot \bar{c_k} \right ) = \bar{y} \\ \bar{\bar{v}} = \bar{\bar{x}} \cdot \bar{\bar{T_c}} \cdot \bar{\bar{S_u}} \\ \bar{w} = \bar{y} - \bar{\bar{x}} \cdot \bar{\bar{T_c}} \cdot \bar{\bar{S_k}} \cdot \bar{c_k}$ Finally the problem is in a familiar form.

\bar{\bar{v}} \cdot \bar{c_{u}} = \bar{w}

$\bar{\bar{v}} \cdot \bar{c_u} = \bar{w}$

— Augi Lynch
fonte

1

Old question but since I'm facing the same problem I thought to post my 2p...

Use quadratic programming as suggested by @Elvis but using sqlincon from the pracma package. I think the advantage over quadrpog::solve.QP is a simpler user interface to specify the constraints. (In fact, lsqlincon is a wrapper around solve.QP).

Example:

library(pracma)

set.seed(1234)

# Test data
X <- matrix(runif(300), ncol=3)
Y <- X %*% c(0.2, 0.3, 0.5) + rnorm(100, sd=0.2)

# Equality constraint: We want the sum of the coefficients to be 1.
# I.e. Aeq x == beq  
Aeq <- matrix(rep(1, ncol(X)), nrow= 1)
beq <- c(1)

# Lower and upper bounds of the parameters, i.e [0, 1]
lb <- rep(0, ncol(X))
ub <- rep(1, ncol(X))

# And solve:
lsqlincon(X, Y, Aeq= Aeq, beq= beq, lb= lb, ub= ub)

[1] 0.1583139 0.3304708 0.5112153

Same results as Elvis's:

library(quadprog)
Rinv <- solve(chol(t(X) %*% X));
C <- cbind(rep(1,3), diag(3))
b <- c(1,rep(0,3))
d <- t(Y) %*% X  
solve.QP(Dmat = Rinv, factorized = TRUE, dvec = d, Amat = C, bvec = b, meq = 1)$solution

EDIT To try to address gung's comment here's some explanation. sqlincon emulates matlab's lsqlin which has a nice help page. Here's the relevant bits with some (minor) edits of mine:

X Multiplier matrix, specified as a matrix of doubles. C represents the multiplier of the solution x in the expression C*x - Y. C is M-by-N, where M is the number of equations, and N is the number of elements of x.

Y Constant vector, specified as a vector of doubles. Y represents the additive constant term in the expression C*x - Y. Y is M-by-1, where M is the number of equations.

Aeq: Linear equality constraint matrix, specified as a matrix of doubles. Aeq represents the linear coefficients in the constraints Aeq*x = beq. Aeq has size Meq-by-N, where Meq is the number of constraints and N is the number of elements of x

beq Linear equality constraint vector, specified as a vector of doubles. beq represents the constant vector in the constraints Aeq*x = beq. beq has length Meq, where Aeq is Meq-by-N.

lb Lower bounds, specified as a vector of doubles. lb represents the lower bounds elementwise in lb ≤ x ≤ ub.

ub Upper bounds, specified as a vector of doubles. ub represents the upper bounds elementwise in lb ≤ x ≤ ub.

— dariober
fonte