Quante informazioni puoi estrarre da un nome?


11

Un nome: primo, possibilmente un mezzo, e cognome.

Sono curioso di sapere quante informazioni è possibile estrarre da un nome, utilizzando set di dati disponibili pubblicamente. So che puoi ottenere quanto segue ovunque tra una probabilità bassa-alta (a seconda dell'input) usando i dati del censimento degli Stati Uniti: 1) Genere. 2) Gara.

Facebook, ad esempio, ha usato esattamente questo per scoprire, con un discreto livello di accuratezza, la distribuzione razziale degli utenti del loro sito (https://www.facebook.com/note.php?note_id=205925658858).

Cos'altro può essere estratto? Non sto cercando nulla di specifico, questa è una domanda molto aperta per alleviare la mia curiosità.

I miei esempi sono specifici degli Stati Uniti, quindi supponiamo che il nome sia il nome di qualcuno che si trova negli Stati Uniti; ma, se qualcuno conosce set di dati disponibili pubblicamente per altri paesi, sono più che aperto anche a loro.

Non sono del tutto sicuro se questo è il posto giusto per questo, se non lo è, apprezzerei se qualcuno potesse indicarmi un posto più appropriato.

Spero che questa sia una domanda interessante, e questo è il posto giusto!


2
presumibilmente potresti ottenere qualcosa anche sulla posizione geografica, se potessi ottenere i dati di corrispondenza appropriati? Puoi anche utilizzare le informazioni sulla popolarità dei nomi nel tempo (google "nome da mago") per fare inferenze sull'età ...
Ben Bolker,

1
Ho unito la domanda trasferita con il duplicato.

Risposte:


12

Questa non è una risposta seria, ma ho appena ricordato qualcosa di un libro che ho letto un anno fa. C'è un capitolo in Freakonomics dedicato a ciò che puoi dire di una persona dal nome. Il capitolo si basa sul documento di ricerca dell'autore Le cause e le conseguenze di nomi distintamente neri

Penso di aver trovato un estratto o un riassunto di questo in questo articolo

I dati mostrano che, in media, una persona con un nome distintamente nero - che si tratti di una donna di nome Imani o di un uomo di nome DeShawn - ha un esito peggiore in termini di vita di una donna di nome Molly o di un uomo di nome Jake. Ma non è colpa del suo nome. Se due ragazzi neri, Jake Williams e DeShawn Williams, fossero nati nello stesso quartiere e nelle stesse circostanze familiari ed economiche, avrebbero probabilmente esiti simili nella vita. Ma il tipo di genitori che nominano il figlio Jake non tende a vivere negli stessi quartieri o a condividere circostanze economiche con il tipo di genitori che nominano il figlio DeShawn. Ed è per questo che, in media, un ragazzo di nome Jake tenderà a guadagnare più soldi e ottenere più istruzione di un ragazzo di nome DeShawn. DeShawn'


4

Dal nome predire regione, età, stato di immigrazione di prima generazione. Dal cognome potresti predire la posizione geografica del patronimico originale. Per il nome completo potresti predire lo stato sociale ed economico (Thurston Howell III).


+1 solo per la prima menzione su questo sito di un personaggio di Gilligan's Island.
rolando2,

4

Solo per aggiungere altri suggerimenti qui, una delle maggiori fonti di dati sulla famiglia è la zattera di siti di genealogia là fuori. Penso che la maggior parte delle persone occidentali siano probabilmente elencate da alcuni membri della famiglia, distanti o meno su alcuni di essi e ogni inclusione di questo tipo viene fornita con un albero genealogico generalmente comprensivo, completo di luoghi, dettagli sulla nascita, ecc. Molto istruttivo.

Se si incrociano tali dati con i grafici degli amici su Facebook, poiché le persone tendono ad aggiungere fratelli / cugini (e occasionalmente genitori / figli), quindi utilizzare i dati sulla posizione con ruoli e directory elettorali, di solito è possibile individuare le persone anche con nomi comuni, e ottenere una quantità sorprendentemente grande di dati su di essi.


3

L'ultimo capitolo di Freakonomics (2005, Steven D. Levitt e Stephen J. Dubner) ha un'affascinante discussione sui nomi, in particolare per quanto riguarda lo status socio-economico e la razza.

Hanno un elenco di nomi che potrebbero essere correlati o meno all'analisi dei cognomi di FB. Descrivono anche come la scelta del nome sta cambiando in modo diacronico (nel tempo).

Chissà, il nome della selezione dei genitori potrebbe essere più preciso di quello che le persone riportano nel censimento.


3

Hai molti buoni suggerimenti sopra, quindi menzionerò solo un aneddoto interessante. Uno studente estivo (ora un eminente scienziato informatico) in un laboratorio di ricerca aziendale (che rimarrà senza nome) ha esaminato i dati dalla rubrica telefonica online dell'azienda e ha costruito un modello predittivo per il grado di paga utilizzando il carattere n-grammi dai nomi. Il predittore più forte era che ez_ indicava un grado di retribuzione inferiore, una scoperta che immagino non fosse incoraggiato a parlare di ...


2

Probabilmente potresti scoprire:

  1. Professione e possibilmente storia lavorativa, se si partecipa a discussioni professionali (il lavoro corrente di solito può essere scoperto da un nome di dominio tramite e-mail o firma, la ricerca rivelerebbe anche quelli passati)
  2. Parenti, se si mantiene il profilo sui social network.
  3. Posizione attuale, almeno fino alla città.
  4. Origine etnica, se uno ha un nome distinto (cioè qualcuno chiamato "Lubomir" è probabilmente collegato a uno dei paesi europei slavi, ecc.).
  5. Data di nascita dai social network: le persone tendono a congratularsi con una persona intorno alla sua data di nascita e, se sei fortunato, ottieni anche l'anno in cui uno compie 25, 30, 35 ecc., Poiché una delle persone che si congratulano probabilmente lo menzionerebbe se non la persona in questione.
  6. Formazione: da LinkedIn, ecc.
  7. Hobby, squadre sportive preferite, ecc.
  8. Se uno è un amante degli animali domestici, probabilmente avrebbe anche tutti i suoi animali domestici sui social network.

Quale tra l'altro significa che non dovresti mai usare nulla dell'elenco sopra per le tue password, domande segrete, ecc.


Che dire delle persone che hanno lo stesso nome di te ... ci sono un certo numero di "Dean Harding" là fuori, uno di loro era persino un calciatore professionista! "DeanHarding" su Twitter non sono io, ci sono centinaia di "Dean Harding" su Facebook, ecc. Ecc.

Dipende dal caso, ovviamente. Di solito puoi scoprire quale è per professione, posizione, ecc. Anche se ho visto casi in cui c'erano 3 persone con lo stesso nome completo, nella stessa professione e vivevano all'incirca nella stessa area. Poi ovviamente diventa più difficile :)

2

Darden e Robinson (1976) tentarono di trovare una struttura linguistica che guidasse le associazioni delle persone sui nomi degli uomini. Hanno chiesto a due gruppi di soggetti (studenti di sociologia e ufficiali navali) di valutare una serie di nomi americani comuni lungo i differenziali semantici come il duro, il nobile comune e l'urban-rural. Hanno anche chiesto giudizi di somiglianza tra le diverse coppie di nomi e, per convalida, hanno correlato i mezzi dei differenziali semantici con le dimensioni che hanno trovato, sia in soluzioni a tre che a quattro D, usando la procedura MDS TORSCA.

Gli autori hanno trovato che la loro soluzione 3D corrispondeva approssimativamente al classico trio di Osgood di attivazione, valutazione e potenza. In quattro dimensioni, lo spazio si adatta leggermente meglio ai dati, e qui hanno interpretato la struttura come dipendente da "carattere", "maturità", "socievolezza" e "virilità", sebbene queste scale non sembrino così ben definite come il autori suggeriti. Una scoperta sorprendente che venne dallo studio fu che, almeno per questi due piccoli campioni (n = 83 e 21), non apparve alcuna dimensione che corrispondesse alla distinzione tra nome dato e soprannome.

Darden, DK e Robinson, IE (1976). Ridimensionamento multidimensionale dei nomi di uomini: un approccio sociolinguistico. Sociometria, 39 , 4, 422-431.


1

La quantità di informazioni che può essere trovata varia in maniera selvaggia, dalla razza e dal genere, a tutti i tipi di informazioni personali. La soluzione migliore per ottenere le informazioni sarebbero i siti di social network come Facebook, in quanto forniscono generalmente più informazioni rispetto ai database Cencus.


1

C'è una vasta gamma di informazioni che puoi ottenere a seconda delle fonti che usi. I dati del censimento sono evidenti. Puoi anche ottenere informazioni da Facebook, MySpace e altri siti di social network. Probabilmente potresti anche cercare negli archivi di notizie pubbliche le menzioni del loro nome. Forse anche quei siti di proprietà ubclained che alcuni stati hanno.

Se vuoi un esempio del mondo reale di ciò che può essere fatto, dai un'occhiata a pipl.com


Potresti dirci dove (in qualsiasi parte del mondo) possiamo trovare i dati del censimento con nomi ?
whuber

1

Puoi cercare lauree, patente di guida, casellario giudiziario (è la traduzione giusta?). Con Facebook puoi trovare informazioni su hobby, sport, musica piaciuta. Puoi anche cercare la percentuale di altri social media dell'utente con un determinato nome. (Sarei interessato a questi risultati)



0

Se conosci qualcosa sulla posizione dell'individuo, una fonte di informazioni sono i database di registrazione degli elettori. Sono disponibili molti database di registrazione degli elettori (a pagamento; ci sono aziende che li acquistano e forniscono accesso a query online ad essi, a pagamento). Il database di registrazione degli elettori potrebbe avere l'indirizzo e / o la data di nascita dell'individuo. Tali informazioni potrebbero consentire di cercare la persona in altri database.

Tuttavia, ci sono limiti a quanto questo aiuta. Questo potrebbe essere utile se conosci la città o la contea in cui vive la persona e se il suo nome è abbastanza insolito. Ma se questo è un nome comune o se non sai dove vivono, probabilmente non ti aiuterà.


0

una delle maggiori fonti di dati accessibili al pubblico, compresi molti altri utili attributi, è l'ufficio degli impiegati di contea per i registri della proprietà. la questione riguarda il raggruppamento di tutti i dati ... alcuni stati forniscono un database centrale ma altri no.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.