{"id":2634,"date":"2006-06-01T00:00:00","date_gmt":"2006-05-31T22:00:00","guid":{"rendered":""},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T22:00:00","slug":"2634","status":"publish","type":"post","link":"https:\/\/www.vialattea.net\/content\/2634\/","title":{"rendered":"L&#8217;esistenza dell&#8217;informazione \u00e8 condizionata dalla presenza di un soggetto &#8220;percipiente&#8221; o esiste a prescindere dall&#8217;uomo? Un testo conservatosi in una lingua non pi\u00f9 decodificabile contiene ancora informazione?"},"content":{"rendered":"<p class=\"MsoNormal\">Il concetto <span class=\"GramE\">di <\/span>informazione come messaggio prevede l\u2019esistenza di un\u2019entit\u00e0 trasmittente e di una ricevente. <span class=\"SpellE\">Shannon<\/span> (1948) ha fornito una descrizione formale di questo processo dove concorrono un canale ed un processo di decodifica \/ <span class=\"GramE\">decodifica<\/span>.<\/p>\n<p _moz-userdefined=\"\"\/>\n<p class=\"MsoNormal\">Volendo <span class=\"SpellE\">filosofeggiare<\/span>, qualora il <span class=\"SpellE\">percipiente<\/span> scompaia, oppure il processo di codifica\/<span class=\"GramE\">decodifica<\/span> non sia pi\u00f9 disponibile, l\u2019informazione stessa cessa di esistere <i>per definizione<\/i>.<\/p>\n<p _moz-userdefined=\"\"\/>\n<p class=\"MsoNormal\">Tuttavia, <span class=\"GramE\">risultati<\/span> estremamente interessanti (<span class=\"SpellE\">Yarowsky<\/span>, 1992) nell\u2019ambito della linguistica <span class=\"SpellE\">computazionale<\/span> (NLP \u2013 <span class=\"SpellE\"><i>Natural<\/i><\/span><i> <span class=\"SpellE\">Language<\/span> Processing<\/i>) indicano che \u00e8 possibile applicare un approccio di tipo probabilistico per estrarre informazione da un testo, purch\u00e9 questo sia sufficientemente esteso.<\/p>\n<p class=\"MsoNormal\">L\u2019idea \u00e8 di considerare il testo come sequenza di parole (termini) e di partire dall\u2019assunto che, su un <span class=\"GramE\">grande<\/span> numero di termini, termini dalla semantica (significato) simile, tendono a raggrupparsi intorno a termini cosiddetti \u201c<span class=\"SpellE\">prototipici<\/span>\u201d.<\/p>\n<p class=\"MsoNormal\">L\u2019elenco seguente illustra la serie di categorie di significato, per i nomi, oggi adottata in NLP:<\/p>\n<p class=\"MsoNormal\"><span style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">1<span>      <\/span><span class=\"SpellE\">Tops<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">2<span>      <\/span><span class=\"SpellE\">act<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">3<span>      <\/span><span class=\"GramE\">animal<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">4<span>      <\/span><span class=\"SpellE\"><span class=\"GramE\">artifact<\/span><\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">5<span>      <\/span>attribute<\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">6<span>      <\/span><span class=\"GramE\">body<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span class=\"GramE\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">7<span>      <\/span>cognition<\/span><\/span><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\"><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">8<span>      <\/span><span class=\"GramE\">communication<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">9<span>      <\/span><span class=\"GramE\">event<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">10<span>     <\/span>feeling<\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">11<span>     <\/span><span class=\"GramE\">food<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">12<span>     <\/span><span class=\"GramE\">group<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">13<span>     <\/span><span class=\"GramE\">location<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">14<span>     <\/span><span class=\"GramE\">motive<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">15<span>     <\/span>object<\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">16<span>     <\/span><span class=\"GramE\">person<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">17<span>     <\/span><span class=\"GramE\">phenomenon<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">18<span>     <\/span><span class=\"GramE\">plant<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">19<span>     <\/span><span class=\"GramE\">possession<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">20<span>     <\/span><span class=\"GramE\">process<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">21<span>     <\/span><span class=\"GramE\">quantity<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">22<span>     <\/span><span class=\"GramE\">relation<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">23<span>     <\/span>shape<\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">24<span>     <\/span><span class=\"GramE\">state<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">25<span>     <\/span><span class=\"GramE\">substance<\/span><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\" style=\"FONT-SIZE: 8pt; FONT-FAMILY: Courier\">26<span>     <\/span><span class=\"GramE\">time<\/span><\/span><span lang=\"EN-GB\"><\/p>\n<p _moz-userdefined=\"\"\/><\/span><\/p>\n<p class=\"MsoNormal\"><span lang=\"EN-GB\"><\/p>\n<p _moz-userdefined=\"\">\n<p><\/span><\/p>\n<p class=\"MsoNormal\">Determinare il significato di un testo vuol dire quindi assegnare una classe <span class=\"GramE\">di <\/span>appartenenza per ogni termine <i>w<\/i> in esso contenuto. <\/p>\n<p class=\"MsoNormal\">Un termine \u00e8 detto <span class=\"SpellE\">prototipico<\/span> se per una data classe pu\u00f2 essere assunto come <i>marcatore<\/i>. Ad esempio \u201ccasa\u201d \u00e8 <span class=\"SpellE\">prototipico<\/span> per <span class=\"GramE\">la classe 4<\/span>\/<span class=\"SpellE\">Artifact<\/span> e \u201ccerchio\u201d per la classe 23\/<span class=\"SpellE\">Shape<\/span>. La collezione di termini <span class=\"SpellE\">prototipici<\/span> per una classe \u00e8 detto <span class=\"SpellE\"><i>kernel<\/i><\/span><i> <\/i>della classe.<\/p>\n<p class=\"MsoNormal\">L\u2019assunto di <span class=\"SpellE\">Yarowsky<\/span> prevede che termini appartenenti alla stessa classe tendono a raggrupparsi in aree di testo attigue, definendo quindi come <i>contesto<\/i> la finestra di termini che <span class=\"GramE\">dista<\/span> +\/- n parole da un termine centrale, \u00e8 possibile determinare la probabilit\u00e0 che un termine di significato sconosciuto appaia nei contesti di una classe <i>C<\/i>, come segue.<\/p>\n<p class=\"MsoNormal\">\n<p _moz-userdefined=\"\">\n<\/p>\n<p class=\"MsoNormal\">Si definisce <i>mutua occorrenza<\/i>, la quantit\u00e0:<\/p>\n<p _moz-userdefined=\"\"\/>\n<p class=\"MsoNormal\" style=\"TEXT-ALIGN: center\" align=\"center\">\n<p _moz-userdefined=\"\">\n<p><img decoding=\"async\" alt=\"\" src=\"http:\/\/www.vialattea.net\/spaw\/image\/informatica\/image002%282%29.gif\" align=\"middle\"\/><i><sub><!--Element not supported - Type: 8 Name: #comment--><!--Element not supported - Type: 8 Name: #comment--><!--Element not supported - Type: 8 Name: #comment--><\/sub><!--Element not supported - Type: 8 Name: #comment--><span class=\"GramE\">numero<\/span> di occorrenze del termine v nei contesti del termine w<\/p>\n<p _moz-userdefined=\"\">\n<p><\/i><\/p>\n<p class=\"MsoNormal\"><span class=\"GramE\">allora<\/span>, il numero di occorrenze del termine <i>v<\/i> nei contesti di una classe <i>C<\/i> \u00e8 definito come il numero di volte che il termine <i>v<\/i> appare nel contesto di termini appartenenti al <span class=\"SpellE\">kernel<\/span> per quella classe:<\/p>\n<p class=\"MsoNormal\" style=\"TEXT-ALIGN: center\">\n<p _moz-userdefined=\"\"> <img decoding=\"async\" alt=\"\" src=\"http:\/\/www.vialattea.net\/spaw\/image\/informatica\/image004(2).gif\"\/><\/p>\n<\/p>\n<p class=\"MsoNormal\" style=\"TEXT-ALIGN: center\" align=\"center\"><sub><!--Element not supported - Type: 8 Name: #comment--><!--Element not supported - Type: 8 Name: #comment--><\/sub><\/p>\n<p _moz-userdefined=\"\"\/>\n<p class=\"MsoNormal\" style=\"TEXT-ALIGN: justify\">Secondo <span class=\"SpellE\">Yarowsky<\/span><span class=\"GramE\"> :<\/span> \u201c<i>un termine \u00e8 candidabile alla classificazione in classe C se appare di frequente nei contesti di termini salienti per quella classe<\/i>\u201d. <\/p>\n<p class=\"MsoNormal\" style=\"TEXT-ALIGN: justify\">La definizione formale di termine <i>saliente <\/i>per una classe pu\u00f2 essere costruita sulla base della mutua occorrenza: un termine \u00e8 tanto <span class=\"GramE\">pi\u00f9 saliente<\/span> per la classe <i>C<\/i> quanto pi\u00f9 \u00e8 alta la probabilit\u00e0 di vederlo nei contesti di termini appartenenti al <span class=\"SpellE\">kernel<\/span> di quella classe, pi\u00f9 formalmente:<\/p>\n<p class=\"MsoNormal\" style=\"TEXT-ALIGN: center\" align=\"center\"><sub><!--Element not supported - Type: 8 Name: #comment--><!--Element not supported - Type: 8 Name: #comment--><!--Element not supported - Type: 8 Name: #comment--><\/sub><!--Element not supported - Type: 8 Name: #comment--><span> <\/span><img decoding=\"async\" alt=\"\" src=\"http:\/\/www.vialattea.net\/spaw\/image\/informatica\/image006(1).gif\" align=\"middle\"\/>        [1]<\/p>\n<p _moz-userdefined=\"\">\n<\/p>\n<p class=\"MsoNormal\"><span class=\"GramE\">ovvero<\/span> il grado di importanza di un termine per una classe \u00e8 dato dal numero di volte che questo termine appare nei contesti di quella classe diviso per il numero di volte complessivo che il termine appare nei contesti di tutte le classi.<\/p>\n<p class=\"MsoNormal\">Il lavoro di <span class=\"SpellE\">Yarowsky<\/span> procede oltre e fornisce un metodo completo per <span class=\"SpellE\"><i>riclassificare<\/i><\/span> tutti i termini nel testo, ma il dettaglio \u00e8 matematicamente troppo pesante per questa sede (chi volesse, pu\u00f2 <span class=\"GramE\">contattarmi<\/span> per richiedere il materiale su cui ho svolto la mia tesi di Laurea, proprio in questo ambito).<\/p>\n<p class=\"MsoNormal\">Il problema iniziale \u00e8 quello di identificare un numero di termini sufficienti per definire il <span class=\"SpellE\">kernel<\/span> delle varie classi. Fatto ci\u00f2, si pu\u00f2 procedere per iterazioni, semplificando:<\/p>\n<ol style=\"MARGIN-TOP: 0cm\" type=\"1\">\n<li class=\"MsoNormal\">Si determina la collezione di termini salienti per la classe <i>C<\/i>, ovvero di termini <span class=\"GramE\">per cui<\/span> la probabilit\u00e0 [1] supera una certa soglia.<\/li>\n<li class=\"MsoNormal\">Si opera un processo detto di <span class=\"SpellE\"><i>disambiguazione<\/i><\/span>, ovvero i termini salienti identificati sono caratterizzati da una distribuzione di probabilit\u00e0 lungo le classi. Applicando opportuni algoritmi di filtro \u00e8 possibile stabilire un set di classi <span class=\"GramE\">per cui<\/span> questi termini sono particolarmente rappresentativi.<\/li>\n<li class=\"MsoNormal\">Si aggiungono i termini nel <span class=\"SpellE\">kernel<\/span> delle classi identificate nel passo precedente e si riparte dal punto 1, fino a che non si \u00e8 classificato l\u2019intero campione di termini.<\/li>\n<\/ol>\n<p class=\"MsoNormal\">Risultati successivi, tra cui il filone in cui si colloca la mia tesi di Laurea, mostrano che \u00e8 possibile determinare un <span class=\"SpellE\">kernel<\/span> per le classi utilizzando un dizionario che riporti i termini ad un elenco di candidati in una lingua nota, <span class=\"GramE\">per cui<\/span> la classificazione \u00e8 disponibile. <\/p>\n<p class=\"MsoNormal\">Avendo a disposizione <span class=\"SpellE\"><span class=\"GramE\">un\u2019analogo<\/span><\/span> della stele di Rosetta, \u00e8 quindi possibile determinare una distribuzione di probabilit\u00e0 dei significati che i termini del linguaggio sconosciuto possono assumere.<\/p>\n<p class=\"MsoNormal\">In questo senso, la risposta \u00e8 <span class=\"GramE\">positiva<\/span>: qualsiasi collezione di testo, purch\u00e9 sufficientemente esteso, contiene in s\u00e9 un\u2019informazione <i>intrinseca<\/i>, che pu\u00f2 essere estratta in modo opportuno.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>[&#8230;]<\/p>\n","protected":false},"author":180,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[64],"tags":[],"class_list":["post-2634","post","type-post","status-publish","format-standard","hentry","category-teoria-dei-segnali"],"_links":{"self":[{"href":"https:\/\/www.vialattea.net\/content\/wp-json\/wp\/v2\/posts\/2634","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.vialattea.net\/content\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.vialattea.net\/content\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.vialattea.net\/content\/wp-json\/wp\/v2\/users\/180"}],"replies":[{"embeddable":true,"href":"https:\/\/www.vialattea.net\/content\/wp-json\/wp\/v2\/comments?post=2634"}],"version-history":[{"count":0,"href":"https:\/\/www.vialattea.net\/content\/wp-json\/wp\/v2\/posts\/2634\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.vialattea.net\/content\/wp-json\/wp\/v2\/media?parent=2634"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.vialattea.net\/content\/wp-json\/wp\/v2\/categories?post=2634"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.vialattea.net\/content\/wp-json\/wp\/v2\/tags?post=2634"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}