Kommentare Abstract
2008/4 Informationswissenschaft: Die Instrumente der Zukunft

L’utilizzatore: da problema a soluzione

Kommentare Abstract

Questo articolo si propone di descrivere alcune delle novità che si osserveranno, o si stanno già osservando, nei sistemi di information retrieval. Parte di ciò che si descriverà è già oggi realtà e fa parte della vita quotidiana di milioni di utiliz­zatori, parte è ancora oggetto di ricerca e, per il momento, è disponibile solo in forma di prototipo nei laboratori di im­prese e università.

In entrambi i casi, l’attenzione sarà con­centrata su quelle tecnologie che hanno l’utilizzatore come elemento attivo nel proprio approccio. Vale a dire su quelle tecnologie che coinvolgono gli utenti, in modo più o meno esplicito e consa­pevole, in operazioni normalmente svolte in modo automatico. In questo senso, gli utilizzatori si trasformano da problema a soluzione: se prima erano presenti soltanto attraverso le loro ne­cessità da soddisfare, adesso partecipa­no attivamente al processo tecnologico di cui fruiscono, spesso con efficacia superiore alle macchine.

Tagging

Da questo punto di vista, la prima im­portante novità è il tagging, una tecnica già oggi applicata da servizi popolari come Flickr e Youtube, i quali ne hanno fatto un punto di forza del proprio suc­cesso. Il tagging permette agli utilizza­tori che lo desiderano di associare a dati tradizionalmente difficili da trattare, come immagini o video, delle tags, cioè delle parole chiave che descrivono il contenuto dei dati così come gli utiliz­zatori stessi lo vedono. Si tratta di un’in­novazione importante per il motivo seguente: spesso la fase più difficile in un sistema di information retrieval è l’indexing, cioè la rappresentazione del contenuto dei dati in una forma adatta per il trattamento automatico. Quando si tratta di immagini o video, tale ope­razione è pressoché impossibile per un computer. Infatti, nessuna tecnica automatica è attualmente in grado di ca­pire e descrivere il contenuto di un’immagine o di un video, se non in casi talmente particolari da avere una scarsa utilità pratica. Non a caso, sistemi come Google e Yahoo, che pure sembrano ca­paci di descrivere il contenuto dei dati multimediali, si basano per l’indexing sul testo che accompagna i dati, una tecnica che, per quanto efficace, serve più ad aggirare il problema che non ad affrontarlo.

Il tagging altro non è che un’opera­zione di indexing effettuata dagli utiliz­zatori, i quali, essendo degli esseri uma­ni, dovrebbero svolgerla con efficacia superiore a quella di un computer. I ri­sultati mostrano che l’idea è effettiva­mente corretta, ma nello stesso tempo trascura un aspetto importante: proprio perché esseri umani, i taggers, cioè gli utilizzatori che spontaneamente asso­ciano le parole chiave ai dati, non sono mossi da criteri tecnologici, ma da mo­tivazioni sociali e personali che spesso finiscono per influenzare negativamen­te il processo che dovrebbero aiutare. Ecco quindi i taggers «vanitosi» che usano talmente tante tag da avere un’in­fluenza spropositata sul funzionamen­to del sistema, quelli «egoisti» che usa­ no tags talmente orientate ai propri fini personali da essere assolutamente inu­tili per tutti gli altri, o i semplici «van­dali» che usano tags, spesso di carattere osceno, che nulla hanno a che vedere con l’effettivo contenuto dei dati.

Pur con tutti i suoi limiti, il tagging si è rivelato un approccio fruttuoso che ha introdotto un importante elemento di novità nel modo di guardare al pro­blema dell’information retrieval. L’uti­lizzatore, che prima era visto come sem­plice destinatario finale dell’applicazio­ne, adesso diventa parte attiva del pro­cesso e contribuisce al funzionamento di un sistema tanto quanto le compo­nenti automatiche. Questo cambia­ mento di visione ha dato origine a mol­teplici linee di ricerca che daranno frut­ti soltanto tra diversi anni. Il resto dell’articolo descrive quelle che sono, almeno a giudizio dell’autore, le più promettenti e interessanti.

Social computing

Un primo tentativo, in parte già attuato in alcuni servizi on­line, è quello di raggruppare gli utilizzatori in classi o co­munità caratterizzate da comportamen­ti e interessi comuni. Si tratta di un approccio spesso definito social computing per la sua similitudine con la vita sociale, nella quale è sempre possibile identificare gruppi che vanno dal ri­stretto nucleo famigliare fino alle intere comunità nazionali. Raggruppare gli utenti in comunità significa eliminare gli aspetti più individuali di ogni utiliz­zatore in favore di quelli più comuni e quindi più affidabili dal punto di vista statistico. Il servizio che ne risulta è meno centrato sul singolo utilizzatore, che si trova ad avere risposte mediate sul profilo del gruppo cui appartiene, ma nello stesso tempo è molto più ro­busto rispetto ai problemi del tagging descritti in precedenza («vanità», «egoi­smo» e «vandalismo»).

Il limite fondamentale dell’approccio risiede nel fatto che ogni utilizzatore resta un individuo e non è possibile identificarlo totalmente con un gruppo. Inoltre, la stessa persona può apparte­nere a gruppi diversi in momenti diver­si e ciò introduce una notevole ambigui­tà. Alla luce di ciò, una corrente di ri­cerca ancora in fase embrionale, ma in rapida espansione, mira a rendere i computer capaci di capire le persone così come lo fanno normalmente gli esseri umani. In altre parole, si tratta di insegnare ai computer a cogliere le ne­cessità e le condizioni degli utilizzatori nello stesso modo in cui un buon ven­ditore riesce immediatamente a capire se il cliente ha o no intenzione di com­prare e quali sono i migliori argomenti per convincerlo a farlo quando è in dub­bio.

Social signal processing

Tale linea di ricerca, nota come social signal processing, fa leva sulla comunicazione non verbale come fonte di infor­mazione circa l’attitudine di una perso­na rispetto agli altri e agli oggetti (per quanto possa sembrare sorprendente, le persone tendono a rapportarsi con le cose nello stesso modo in cui lo fanno con le persone). Nell’ambito dell’infor­mation retrieval, ciò significa che la macchina diventerebbe capace di capire l’utilizzatore, il suo stato d’animo, i suoi bisogni, e tutto quanto necessario per offrire un miglior servizio, nello stesso modo del personale di un buon locale che cerca di far sentire i clienti a proprio agio.

Il social signal processing consiste nell’utilizzare i sensori di cui molti computer sono oggi dotati (microfoni e webcam) per identificare comporta­menti non verbali come la postura dell’utilizzatore, la sua espressione fac­ciale, la direzione del suo sguardo, i suoi gesti e quant’altro può essere car­pito per via automatica. Secondo le in­dicazioni di psicologia sociale e antro­pologia, tali comportamenti sono direttamente correlati con l’attitudine delle persone verso la situazione in cui si tro­vano, quindi possono fornire indicazio­ni preziose su quali sono i bisogni degli utilizzatori e su come soddisfarli. In questo senso, l’utilizzatore diventa una volta di più partecipante attivo, per quanto del tutto inconsapevole, del pro­cesso tecnologico di cui fa uso.

Laddove tagging e social computing sono già oggi parte della realtà, sebbene a uno stadio diverso di sviluppo e diffu­sione, il social signal processing è an­cora pura ricerca. Tuttavia si apre già un dibattito su quanto sia opportuno ren­dere le tecnologie capaci di raccogliere informazioni sempre più dettagliate circa gli utilizzatori. La discussione su tale tema esula da questo articolo, ma è sempre bene ricordare che molte tecno­logie sulle quali si fa quotidiano affida­mento hanno un prezzo in termini di informazioni private che si rilasciano, più o meno consapevolmente, a terzi (carte di credito, prenotazioni on­line, ecc.).

Poche tecnologie di punta finiscono, come l’information retrieval, per avere un impatto sociale così ampio (non a caso si parla di sociotecnologie). Il loro sviluppo sarà pertanto determinato non solo da fattori puramente tecnici e scientifici, ma anche dal più ampio di­ battito che tale sviluppo determinerà nella società. I prossimi anni ci diranno se e quanto gli utilizzatori accetteranno di partecipare ai processi tecnologici a scapito della loro privacy.

Avatar

Dott. Alessandro Vinciarelli

Senior Researcher, IDIAP Research Institute

Abstract

User werden immer mehr von einem Bestandteil eines Problems (sie haben Bedürfnisse, die überautomatisierte Suchanfragen befriedigt werden müssen) zu einem Bestandteil der Lösung (User verbessern dank ihrem interaktiven Beitrag die Qualität der Resultate). Populäre Dienste wie Flickr oder Youtube nutzen schon heute die Technik des Taggings, d.h. schwer zu klassifizierender Inhalt wie etwa Videofilme kann mit Schlüsselwörtern (tags) versehen werden und sind so leichter zu finden. Sie verbessern damit die Indexierung von Inhalten, indem sie den automatischen Moment des Computers durch einen menschlichen ersetzen. Ein Problem entsteht durch ehrgeizige, egoistische oder zerstörerische Tagger, welche das an sich austarierte System durch ihre Aktivitäten verfälschen.

Ein weiterer Ansatz ist der Versuch, User in Interessengruppen oder Klassen einzuteilen («social computing»). Mit der Einteilung werden die eventuell verfälschenden Einflüsse eines einzelnen Users abgeschwächt. Die Schwäche des social computing ist allerdings genau die, dass User eben Individuen sind und sich nie gänzlich einer Gruppe zuordnen lassen.

Mit dem social signal processing wird versucht, User so zu begreifen, wie sich Menschen untereinander verstehen, d.h., der Computer versucht, die «sozialen Signale», die der User aussendet, zu verstehen und «sein» Angebot entsprechend auszurichten. Über Webcams und Mikrofone sollen nonverbale Äusserungen des Users herausgefiltert und interpretiert werden. Dabei entsteht zwangsläufig so etwas wie ein Verkaufsgespräch, der User ist gleichsam der Kunde, und der Computer der Verkäufer.

Das social signal processing ist vorderhand Zukunftsmusik und befindet sich aktuell noch im reinen Forschungsstadium. Die Debatte, wie viel Information ein System sam­meln darf und wie viel Information ein Nutzer preisgeben muss, um ein derartiges System überhaupt nutzen zu können, ist bereits angelaufen. Die Zukunft wird zeigen, wie viel «Privacy» die User letztlich bereit sind preiszugeben.

D’élément du problème (il a des besoins qui doivent être satisfaits via des requêtes automatisées), l’utilisateur devient de plus en plus un élément de la solution (grâce à sa contribution interactive, il améliore la qualité des résultats). Les services populaires tels que Flickr ou Youtube utilisent d’ores et déjà la technique du tagging, c’est-­à-­dire que les contenus difficiles à classer comme les films vidéo, par exemple, peuvent être pourvus de mots-clés (tags ou étiquettes), ce qui permet de les trouver plus facilement. Ils améliorent ainsi l’indexation des contenus dans ce sens qu’ils remplacent le moment automatique de l’ordinateur par un moment humain. Un problème peut survenir lorsqu’un tagger falsifie par ses activités un système en soi équilibré, que ce soit pour des raisons égoïstes ou destructrices.

Une autre approche est d’essayer d’intégrer un utilisateur dans un groupe d’intérêt ou une classe (social computing). Une telle intégration permet d’affaiblir les éventuelles influences néfastes d’un utilisateur mal intentionné. La faiblesse du social computing réside toutefois dans le fait que les utilisateurs sont justement des individus et qu’ils ne se laissent pas complètement subsumer sous un groupe.

Le Social Signal Processing est quant à lui censé permettre de saisir l’utilisateur de la manière dont les individus se comprennent, c’est-­à-­dire que l’ordinateur essaie de com­prendre les «signaux sociaux», que l’utilisateur envoie, et d’orienter «son» offre en conséquence. Les expressions non verbales de l’utilisateur sont filtrées et interprétées via les webcams et les micros. Il en résulte obligatoirement une sorte d’entretien de vente, l’utilisateur devenant en même temps le client, et l’ordinateur le vendeur.

Le Social Signal Processing est pour l’instant encore de la musique d’avenir et se trou­ve actuellement au stade de la pure recherche. Les débats sur la quantité d’informations qu’un système peut récolter et combien d’informations un utilisateur doit livrer pour pouvoir utiliser un système de ce type sont déjà lancés. L’avenir montrera combien de privacy les utilisateurs seront en fin de compte disposés à abandonner.