Come ordino un vettore in base ai valori di un altro


112

Ho un vettore x, che vorrei ordinare in base all'ordine dei valori nel vettore y. I due vettori non sono della stessa lunghezza.

x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)

Il risultato atteso sarebbe:

[1] 4 4 4 2 2 1 3 3 3

Risposte:


70

Ecco un one liner ...

y[sort(order(y)[x])]

[modifica:] Questo si suddivide come segue:

order(y)             #We want to sort by y, so order() gives us the sorting order
order(y)[x]          #looks up the sorting order for each x
sort(order(y)[x])    #sorts by that order
y[sort(order(y)[x])] #converts orders back to numbers from orders

1
È molto succinto, ma ho difficoltà a capire cosa sta succedendo lì. Potresti approfondire un po '?
Matt Parker

3
Questo è carino e mostra una buona comprensione dei built-in di R. +1
Godeke

6
In generale si potrebbe desiderare di farlo anche se y non è una permutazione di 1: length (y). In quel caso questa soluzione non funziona, ma la soluzione di gd047 sotto, x [order (match (x, y))], funziona.
Rahul Savani

5
In realtà sono sconcertato dal motivo per cui questo ha 40 voti positivi. Fallisce per così tante semplici variazioni su xe y. x <- c(1,4,2); y <- c(1,2,4)per esempio.
recapito

1
@thelatemail Sono d'accordo. Ferma la follia e dai un voto negativo a questa risposta!
Ian Fellows

184

che dire di questo

x[order(match(x,y))]

29
Questo è molto carino, migliore della risposta accettata IMHO in quanto è più generale.
fmark

2
Vorrei arrivare a dire che dovrebbe essere in GNU-R base.
guasto catastrofico

Questa risposta ha funzionato bene per me quando si utilizzano vettori di caratteri sia per x che per y. Aggiungere una decomposizione / leggera elaborazione come nella risposta accettata sarebbe carino
mavericks il

4

Potresti convertire xin un fattore ordinato:

x.factor <- factor(x, levels = y, ordered=TRUE)
sort(x)
sort(x.factor)

Ovviamente, cambiare i tuoi numeri in fattori può cambiare radicalmente il modo in cui reagisce il codice a valle x. Ma dal momento che non ci hai fornito alcun contesto su ciò che accade dopo, ho pensato di suggerirlo come opzione.


1
questa dovrebbe essere la risposta migliore poiché funzionerebbe per i casi non interi; o funziona anche quando ci sono valori xnon nel vettore di ordinamento ycon lievi modifiche:x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3, 6); y <- c(4, 2, 1, 3); as.numeric(as.character(sort(factor(x, unique(c(y, x))))))
rawr

2

Che ne dite di?:

rep(y,table(x)[as.character(y)])

(Quello di Ian è probabilmente ancora migliore)


2

Nel caso in cui sia necessario ottenere l'ordine su "y", non importa se si tratta di numeri o caratteri:

x[order(ordered(x, levels = y))]
4 4 4 2 2 1 3 3 3

A passi:

a <- ordered(x, levels = y) # Create ordered factor from "x" upon order in "y".
[1] 2 2 3 4 1 4 4 3 3
Levels: 4 < 2 < 1 < 3

b <- order(a) # Define "x" order that match to order in "y".
[1] 4 6 7 1 2 5 3 8 9

x[b] # Reorder "x" according to order in "y".
[1] 4 4 4 2 2 1 3 3 3

1

[ Modifica: chiaramente Ian ha l'approccio giusto, ma lo lascerò ai posteri.]

Puoi farlo senza loop indicizzando il tuo vettore y. Aggiungi un valore numerico incrementale a y e uniscili:

y <- data.frame(index=1:length(y), x=y)
x <- data.frame(x=x)
x <- merge(x,y)
x <- x[order(x$index),"x"]
x
[1] 4 4 4 2 2 1 3 3 3

0
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
for(i in y) { z <- c(z, rep(i, sum(x==i))) }

Il risultato in z: 4 4 4 2 2 1 3 3 3

I passaggi importanti:

  1. for (i in y) - Ripete gli elementi di interesse.

  2. z <- c (z, ...) - Concatena a turno ciascuna sottoespressione

  3. rep (i, sum (x == i)) - Ripete i (l'elemento di interesse corrente) sum (x == i) volte (il numero di volte che abbiamo trovato i in x).


0

Inoltre puoi usarlo sqldfe farlo da una joinfunzione sqlcome la seguente:

library(sqldf)
x <- data.frame(x = c(2, 2, 3, 4, 1, 4, 4, 3, 3))
y <- data.frame(y = c(4, 2, 1, 3))

result <- sqldf("SELECT x.x FROM y JOIN x on y.y = x.x")
ordered_x <- result[[1]]
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.