2008/4 Informationswissenschaft: Die Instrumente der Zukunft

L’utilizzatore: da problema a soluzione

Questo articolo si propone di descrivere alcune delle novità che si osserveranno, o si stanno già osservando, nei sistemi di information retrieval. Parte di ciò che si descriverà è già oggi realtà e fa parte della vita quotidiana di milioni di utilizzatori, parte è ancora oggetto di ricerca e, per il momento, è disponibile solo in forma di prototipo nei laboratori di imprese e università.

In entrambi i casi, l’attenzione sarà concentrata su quelle tecnologie che hanno l’utilizzatore come elemento attivo nel proprio approccio. Vale a dire su quelle tecnologie che coinvolgono gli utenti, in modo più o meno esplicito e consapevole, in operazioni normalmente svolte in modo automatico. In questo senso, gli utilizzatori si trasformano da problema a soluzione: se prima erano presenti soltanto attraverso le loro necessità da soddisfare, adesso partecipano attivamente al processo tecnologico di cui fruiscono, spesso con efficacia superiore alle macchine.

Tagging

Da questo punto di vista, la prima importante novità è il tagging, una tecnica già oggi applicata da servizi popolari come Flickr e Youtube, i quali ne hanno fatto un punto di forza del proprio successo. Il tagging permette agli utilizzatori che lo desiderano di associare a dati tradizionalmente difficili da trattare, come immagini o video, delle tags, cioè delle parole chiave che descrivono il contenuto dei dati così come gli utilizzatori stessi lo vedono. Si tratta di un’innovazione importante per il motivo seguente: spesso la fase più difficile in un sistema di information retrieval è l’indexing, cioè la rappresentazione del contenuto dei dati in una forma adatta per il trattamento automatico. Quando si tratta di immagini o video, tale operazione è pressoché impossibile per un computer. Infatti, nessuna tecnica automatica è attualmente in grado di capire e descrivere il contenuto di un’immagine o di un video, se non in casi talmente particolari da avere una scarsa utilità pratica. Non a caso, sistemi come Google e Yahoo, che pure sembrano capaci di descrivere il contenuto dei dati multimediali, si basano per l’indexing sul testo che accompagna i dati, una tecnica che, per quanto efficace, serve più ad aggirare il problema che non ad affrontarlo.

Il tagging altro non è che un’operazione di indexing effettuata dagli utilizzatori, i quali, essendo degli esseri umani, dovrebbero svolgerla con efficacia superiore a quella di un computer. I risultati mostrano che l’idea è effettivamente corretta, ma nello stesso tempo trascura un aspetto importante: proprio perché esseri umani, i taggers, cioè gli utilizzatori che spontaneamente associano le parole chiave ai dati, non sono mossi da criteri tecnologici, ma da motivazioni sociali e personali che spesso finiscono per influenzare negativamente il processo che dovrebbero aiutare. Ecco quindi i taggers «vanitosi» che usano talmente tante tag da avere un’influenza spropositata sul funzionamento del sistema, quelli «egoisti» che usa no tags talmente orientate ai propri fini personali da essere assolutamente inutili per tutti gli altri, o i semplici «vandali» che usano tags, spesso di carattere osceno, che nulla hanno a che vedere con l’effettivo contenuto dei dati.

Pur con tutti i suoi limiti, il tagging si è rivelato un approccio fruttuoso che ha introdotto un importante elemento di novità nel modo di guardare al problema dell’information retrieval. L’utilizzatore, che prima era visto come semplice destinatario finale dell’applicazione, adesso diventa parte attiva del processo e contribuisce al funzionamento di un sistema tanto quanto le componenti automatiche. Questo cambia mento di visione ha dato origine a molteplici linee di ricerca che daranno frutti soltanto tra diversi anni. Il resto dell’articolo descrive quelle che sono, almeno a giudizio dell’autore, le più promettenti e interessanti.

Social computing

Un primo tentativo, in parte già attuato in alcuni servizi online, è quello di raggruppare gli utilizzatori in classi o comunità caratterizzate da comportamenti e interessi comuni. Si tratta di un approccio spesso definito social computing per la sua similitudine con la vita sociale, nella quale è sempre possibile identificare gruppi che vanno dal ristretto nucleo famigliare fino alle intere comunità nazionali. Raggruppare gli utenti in comunità significa eliminare gli aspetti più individuali di ogni utilizzatore in favore di quelli più comuni e quindi più affidabili dal punto di vista statistico. Il servizio che ne risulta è meno centrato sul singolo utilizzatore, che si trova ad avere risposte mediate sul profilo del gruppo cui appartiene, ma nello stesso tempo è molto più robusto rispetto ai problemi del tagging descritti in precedenza («vanità», «egoismo» e «vandalismo»).

Il limite fondamentale dell’approccio risiede nel fatto che ogni utilizzatore resta un individuo e non è possibile identificarlo totalmente con un gruppo. Inoltre, la stessa persona può appartenere a gruppi diversi in momenti diversi e ciò introduce una notevole ambiguità. Alla luce di ciò, una corrente di ricerca ancora in fase embrionale, ma in rapida espansione, mira a rendere i computer capaci di capire le persone così come lo fanno normalmente gli esseri umani. In altre parole, si tratta di insegnare ai computer a cogliere le necessità e le condizioni degli utilizzatori nello stesso modo in cui un buon venditore riesce immediatamente a capire se il cliente ha o no intenzione di comprare e quali sono i migliori argomenti per convincerlo a farlo quando è in dubbio.

Social signal processing

Tale linea di ricerca, nota come social signal processing, fa leva sulla comunicazione non verbale come fonte di informazione circa l’attitudine di una persona rispetto agli altri e agli oggetti (per quanto possa sembrare sorprendente, le persone tendono a rapportarsi con le cose nello stesso modo in cui lo fanno con le persone). Nell’ambito dell’information retrieval, ciò significa che la macchina diventerebbe capace di capire l’utilizzatore, il suo stato d’animo, i suoi bisogni, e tutto quanto necessario per offrire un miglior servizio, nello stesso modo del personale di un buon locale che cerca di far sentire i clienti a proprio agio.

Il social signal processing consiste nell’utilizzare i sensori di cui molti computer sono oggi dotati (microfoni e webcam) per identificare comportamenti non verbali come la postura dell’utilizzatore, la sua espressione facciale, la direzione del suo sguardo, i suoi gesti e quant’altro può essere carpito per via automatica. Secondo le indicazioni di psicologia sociale e antropologia, tali comportamenti sono direttamente correlati con l’attitudine delle persone verso la situazione in cui si trovano, quindi possono fornire indicazioni preziose su quali sono i bisogni degli utilizzatori e su come soddisfarli. In questo senso, l’utilizzatore diventa una volta di più partecipante attivo, per quanto del tutto inconsapevole, del processo tecnologico di cui fa uso.

Laddove tagging e social computing sono già oggi parte della realtà, sebbene a uno stadio diverso di sviluppo e diffusione, il social signal processing è ancora pura ricerca. Tuttavia si apre già un dibattito su quanto sia opportuno rendere le tecnologie capaci di raccogliere informazioni sempre più dettagliate circa gli utilizzatori. La discussione su tale tema esula da questo articolo, ma è sempre bene ricordare che molte tecnologie sulle quali si fa quotidiano affidamento hanno un prezzo in termini di informazioni private che si rilasciano, più o meno consapevolmente, a terzi (carte di credito, prenotazioni online, ecc.).

Poche tecnologie di punta finiscono, come l’information retrieval, per avere un impatto sociale così ampio (non a caso si parla di sociotecnologie). Il loro sviluppo sarà pertanto determinato non solo da fattori puramente tecnici e scientifici, ma anche dal più ampio di battito che tale sviluppo determinerà nella società. I prossimi anni ci diranno se e quanto gli utilizzatori accetteranno di partecipare ai processi tecnologici a scapito della loro privacy.

Dott. Alessandro Vinciarelli

Senior Researcher, IDIAP Research Institute

Abstract

Deutsch
Français

Deutsch

User werden immer mehr von einem Bestandteil eines Problems (sie haben Bedürfnisse, die überautomatisierte Suchanfragen befriedigt werden müssen) zu einem Bestandteil der Lösung (User verbessern dank ihrem interaktiven Beitrag die Qualität der Resultate). Populäre Dienste wie Flickr oder Youtube nutzen schon heute die Technik des Taggings, d.h. schwer zu klassifizierender Inhalt wie etwa Videofilme kann mit Schlüsselwörtern (tags) versehen werden und sind so leichter zu finden. Sie verbessern damit die Indexierung von Inhalten, indem sie den automatischen Moment des Computers durch einen menschlichen ersetzen. Ein Problem entsteht durch ehrgeizige, egoistische oder zerstörerische Tagger, welche das an sich austarierte System durch ihre Aktivitäten verfälschen.

Ein weiterer Ansatz ist der Versuch, User in Interessengruppen oder Klassen einzuteilen («social computing»). Mit der Einteilung werden die eventuell verfälschenden Einflüsse eines einzelnen Users abgeschwächt. Die Schwäche des social computing ist allerdings genau die, dass User eben Individuen sind und sich nie gänzlich einer Gruppe zuordnen lassen.

Mit dem social signal processing wird versucht, User so zu begreifen, wie sich Menschen untereinander verstehen, d.h., der Computer versucht, die «sozialen Signale», die der User aussendet, zu verstehen und «sein» Angebot entsprechend auszurichten. Über Webcams und Mikrofone sollen nonverbale Äusserungen des Users herausgefiltert und interpretiert werden. Dabei entsteht zwangsläufig so etwas wie ein Verkaufsgespräch, der User ist gleichsam der Kunde, und der Computer der Verkäufer.

Das social signal processing ist vorderhand Zukunftsmusik und befindet sich aktuell noch im reinen Forschungsstadium. Die Debatte, wie viel Information ein System sammeln darf und wie viel Information ein Nutzer preisgeben muss, um ein derartiges System überhaupt nutzen zu können, ist bereits angelaufen. Die Zukunft wird zeigen, wie viel «Privacy» die User letztlich bereit sind preiszugeben.

Français

D’élément du problème (il a des besoins qui doivent être satisfaits via des requêtes automatisées), l’utilisateur devient de plus en plus un élément de la solution (grâce à sa contribution interactive, il améliore la qualité des résultats). Les services populaires tels que Flickr ou Youtube utilisent d’ores et déjà la technique du tagging, c’est-à-dire que les contenus difficiles à classer comme les films vidéo, par exemple, peuvent être pourvus de mots-clés (tags ou étiquettes), ce qui permet de les trouver plus facilement. Ils améliorent ainsi l’indexation des contenus dans ce sens qu’ils remplacent le moment automatique de l’ordinateur par un moment humain. Un problème peut survenir lorsqu’un tagger falsifie par ses activités un système en soi équilibré, que ce soit pour des raisons égoïstes ou destructrices.

Une autre approche est d’essayer d’intégrer un utilisateur dans un groupe d’intérêt ou une classe (social computing). Une telle intégration permet d’affaiblir les éventuelles influences néfastes d’un utilisateur mal intentionné. La faiblesse du social computing réside toutefois dans le fait que les utilisateurs sont justement des individus et qu’ils ne se laissent pas complètement subsumer sous un groupe.

Le Social Signal Processing est quant à lui censé permettre de saisir l’utilisateur de la manière dont les individus se comprennent, c’est-à-dire que l’ordinateur essaie de comprendre les «signaux sociaux», que l’utilisateur envoie, et d’orienter «son» offre en conséquence. Les expressions non verbales de l’utilisateur sont filtrées et interprétées via les webcams et les micros. Il en résulte obligatoirement une sorte d’entretien de vente, l’utilisateur devenant en même temps le client, et l’ordinateur le vendeur.

Le Social Signal Processing est pour l’instant encore de la musique d’avenir et se trouve actuellement au stade de la pure recherche. Les débats sur la quantité d’informations qu’un système peut récolter et combien d’informations un utilisateur doit livrer pour pouvoir utiliser un système de ce type sont déjà lancés. L’avenir montrera combien de privacy les utilisateurs seront en fin de compte disposés à abandonner.