Questo è un post tradotto da IA.
Dati sintetici: le macchine diventano consumatori
- Lingua di scrittura: Coreana
- •
- Paese di riferimento: Tutti i paesi
- •
- Tecnologia dell'informazione
Seleziona la lingua
Testo riassunto dall'intelligenza artificiale durumis
- Il servizio Synthetic Users, lanciato a febbraio, è un servizio di ricerca sugli utenti che utilizza consumatori virtuali, offrendo un notevole risparmio sui costi rispetto alla ricerca su persone reali, ma solleva preoccupazioni sull'impossibilità di riflettere in modo adeguato l'identità e i valori intrinseci dell'essere umano.
- I dati sintetici trovano applicazione in diversi settori, dalla simulazione di veicoli alle cartelle cliniche dei pazienti con COVID-19, e la loro domanda è aumentata esponenzialmente con l'avvento di ChatGPT.
- Per evitare che la rivoluzione dei dati sintetici abbia effetti negativi sulla nostra società, è necessario generare dati sintetici basati su dati reali con una profonda comprensione contestuale e collaborare con esperti di scienze sociali e umanistiche.
"Prova idee e prodotti con utenti sintetici e prendi decisioni con sicurezza."
Synthetic users, un servizio di ricerca sugli utenti senza utenti
Il servizio Synthetic Users, lanciato a febbraio, come suggerisce il nome, offre utenti sintetici come target per la ricerca di prodotto, al posto di persone reali. È possibile condurre interviste e sondaggi con questi utenti sintetici, ottenere feedback sull'esperienza d'uso e persino impostare situazioni specifiche, come una coppia europea che vive un lungo periodo di fidanzamento. Il servizio offre anche un risparmio di costi significativo, ad esempio 380 dollari per 100 set di dati di intervista. Dopo l'introduzione di questo servizio, all'interno delle comunità di antropologi, sociologi e antropologi culturali, si sono susseguite diverse reazioni, tra cui sdegno, preoccupazione e divertimento.
Queste reazioni includono la preoccupazione che, nel caso della ricerca qualitativa, che non si occupa di opere "sintetiche" ma di persone in sé, concetti come l'identità, lo scopo, il piacere e il valore intrinseci degli esseri umani potrebbero essere facilmente copiati e compresi. Si aggiungono anche prospettive scettiche sul fatto che il servizio non riesca a rappresentare in modo completo le complesse situazioni socio-politiche e le reciproche relazioni in cui si formano i problemi che le persone affrontano nella vita reale.
In realtà, questi dati sintetici non sono una novità. Sono particolarmente utili quando è difficile ottenere set di dati, ad esempio per simulare auto virtuali nelle simulazioni di autovetture, con l'obiettivo di imitare il comportamento dei conducenti e addestrare i modelli in un'ampia gamma di situazioni. Oppure, è stato utilizzato un set di dati che riproduceva i record di oltre 2,7 milioni di pazienti con COVID-19 per creare un set di dati con le stesse caratteristiche statistiche ma privo di informazioni identificative, consentendo la condivisione e la ricerca rapida da parte di ricercatori di tutto il mondo.
Tuttavia, la diffusione rapida di ChatGPT in quasi tutti i settori ha portato ad un aumento esponenziale della domanda di dati sintetici, già in forte espansione, tanto da portare alla nascita di servizi che sostengono che persino la vita quotidiana delle persone alla ricerca di informazioni possa essere sostituita dai dati sintetici.
In particolare, il servizio Synthetic Users evidenzia chiaramente le preoccupazioni relative all'uso di dati sintetici, ovvero il "divario con la realtà", ovvero la necessità di ridefinire il concetto di "dati" e "verità".
Viviamo già in un'epoca di disinformazione e comprendere la fonte e il pregiudizio di tutti i dati che vediamo sta diventando sempre più difficile. L'alluvione di dati sintetici che ci aspettano non solo renderà i confini tra "reale" e "artificiale" ancora più sfumati, ma renderà ancora più difficile per i consumatori di dati comuni valutare criticamente la fonte, i metodi di raccolta e manipolazione dei dati originali, e quindi il livello di fiducia da attribuire.
Pertanto, per evitare che la rivoluzione dei dati sintetici crei un mondo che non desideriamo, è fondamentale concentrarsi sui piccoli dati, non sui grandi dati. Oggi molte aziende tendono a concentrarsi sul cosiddetto "data-driven decision making", ovvero prendere decisioni basate su tutti i dati disponibili, anche se sono noti per essere set di dati distorti o incompleti. I dati sintetici dovrebbero quindi derivare dai migliori dati reali che possiamo trovare. Inoltre, dobbiamo fornire set di dati iniziali della migliore qualità possibile, insieme ad una profonda comprensione contestuale di ciò che è importante nei dati e perché.
Se non ci basiamo su una rigorosa comprensione dei fenomeni umani fondamentali, come la differenza tra ciò che le persone dicono e ciò che fanno, o l'impatto inaspettato della vita sulle nostre azioni, corriamo il rischio di simulare un mondo sociale che minaccia la realtà stessa, con conseguenze dannose per le aziende e i singoli individui.
In futuro, i dati sintetici faranno parte sempre più della nostra vita quotidiana. Hanno il potenziale per rimodellare tutto, dagli algoritmi che plasmano le nostre esperienze del mondo alla nostra comprensione dei dati e della realtà stessa. Affidare queste decisioni cruciali, anche se con le migliori intenzioni, solo ad alcuni data scientist è troppo rischioso. È necessaria la collaborazione con esperti di scienze sociali e umanistiche. Questo non perché i dati sintetici siano meno utili o peggiori dei set di dati attuali, ma perché la loro capacità di realizzazione è spaventosa.
*Questo articolo è la versione originale dell'articolo pubblicato il 11 aprile 2023 su colonna del quotidiano elettronico.
Riferimenti