Cercando un po’ in giro per la Rete, ho provato a vedere quali vocabolari vengono interpretati correttamente dallo strumento recente di parsing dei dati strutturati di Google, per iniziare a chiarirmi le idee. Per far comprendere l’argomento ai neofiti, basta ricordarsi di due elementi per quanto riguarda il dato strutturato:
sintassi: ad oggi ci sono diversi modi per far digerire a Google dei dati strutturati nella propria pagina, ma questo per ora non sembra un problema. La sintassi consigliata è quella dei microdati, una modalità semplificata non ancora standard, nativa della specifica HTML5. L’altra alternativa è usare RDFa ( specie la sua ultima versione RDFa Lite 1.1 ), la stessa sintassi che usa Facebook con lo standard Open Graph. Nella visualizzazione anteprima del tool di Google, vengono mostrate entrambe.
struttura ( schemi e vocabolari ): è questo l’argomento spinoso, in effetti. Per ora il consiglio da dare è usare tutto quello presente su schema.org
Peccato che in Italia pochi abbiano visto la reale sinergia di quello che sta accadendo, e la maggior parte dei post sul tema siano semplici rilanci stampa del comunicato principale. ( Tranne per Guido Vetere che bacchetta gli autori di schema.org perchè forse così è stata definita un minimo di ontologia o schema globale, che tanto si diceva di non voler fare eh eh ) Da apprezzare Mauro Lupi, che sprona ad approfondire la questione, anche dal lato SEO, ed Il Post, che pone la questione all’attenzione di un pubblico più vasto del circolo tecnico. E che cita il fatto che, l’ultima volta che abbiamo avuto un accordo cross motori di ricerca, è stata la volta della creazione delle sitemap.xml, nel 2006. Una maniera condivisa di segnalare ai motori tutti i percorsi URL presenti nei nostri siti, che tanto ci facilitano oggi. Un elemento non scontato. quindi quello dell’accordo tra motori.
E’ sabato, devo fare tante cose, ma questa merita 10 minuti per stendere un post, breve ma incisivo. Una notizia storica, dai contorni poco definiti negli effetti per il Mercato, ma con un potenziale dirompente.
Un po’ come l’adozione degli standard del Semantic Web da parte di Facebook con l’ OpenGraph Protocol, e l’adozione di RDFa che è divenuta mainstream a livello di rich snippets, adesso si aprono scenari davvero intriganti.
Over time we’ve improved search by deepening our understanding of queries and web pages. **The web isn’t merely words—it’s information about things in the real world, and understanding the relationships between real-world entities can help us deliver relevant information more quickly. **Today, we’ve acquired Metaweb, a company that maintains an open database of things in the world. Working together we want to improve search and make the web richer and more meaningful for everyone.
With efforts like rich snippets and the search answers feature, we’re just beginning to apply our understanding of the web to make search better. Type [barack obama birthday] in the search box and see the answer right at the top of the page. Or search for [events in San Jose] and see a list of specific events and dates. We can offer this kind of experience because we understand facts about real people and real events out in the world. But what about [colleges on the west coast with tuition under $30,000] or [actors over 40 who have won at least one oscar]? These are hard questions, and we’ve acquired Metaweb because we believe working together we’ll be able to provide better answers.
Finalmente anche Google lascia definitivamente il concetto di pagine e di parole, delle care keywords, ed inizia a parlare di informazioni relative alle cose del mondo reale. E’ il Web my dear .)
Una chiusa finale: le persone chiave che lavoravano all’interno del gruppo del MIT a cui sono tanto affezionato, il gruppo SIMILE che ha rilasciato il framework Exhibit per gli open data e la loro visualizzazione, sono passate a Freebase da un anno abbondante o anche più. Adesso sono di fatto in Google.
**Il Web diventa semantico, si dota di significato e passa dalle pagine ai dati: e l’evoluzione del Web in senso lato è l’unica cosa che emergerà alla fine. Non più 2.0, non più 3.0: il Web al suo massimo potenziale, e niente più divisioni nette tra Web e Semantic Web. ** La divisione sarà nella persona che avrà consapevolezza di quello che potrà fare con il Web, ma il mezzo ormai avrà un solo nome :)
Attivista Open Data prima, studioso di Civic Hacking e dell’importanza del ruolo delle comunità in seguito, vengo dalle scienze dell’informazione, dove ho scoperto il Software libero e l’Open Source, il Semantic Web e la filosofia che guida lo sviluppo degli standard del World Wide Web e ne sono rimasto affascinato. Il lavoro (dal 2018 in poi) mi ha portato ad occuparmi di Legal Tech, di Cyber Security e di Compliance, ambiti fortemente connessi l’uno all’altro e decisamente sfidanti.