[ninux-dev] Una classe per fare le ricerche su Wikipedia e ottenere dati semantici

Alessandro Gubitosi gubi.ale at gotanotherway.com
Wed Mar 5 05:46:44 CET 2014


Ciao a tutti,
mi serviva di fare questa classe per Ninuxoo così l'ho aggiunta alle API
per condividerla con tutti.

Vi capita mai di fare un'applicazione e aver bisogno di qualche dato da
Wikipedia pulito e filtrato? Magari giusto per non dover passare qualche
settimana in meno sui codici a fare parser delle sue API o peggio di
pagine html?
Beh, tana libera tutti, almeno per gli scopi in comune.
Grazie a questa "sciocchezzuola" ogni NAS avrà la stessa API
interrogabile liberamente per fare ricerche su Wikipedia e ottenere in
cambio un bel po' di dati semantici (non ricorsivi) relativi a quello
che si cerca.
Troppo complicato?
Ecco qualche esempio:
* http://192.168.36.210/API/Semantic_data/?film=marchese%20del%20grillo
* http://192.168.36.210/API/Semantic_data/?album=the%20wall
* http://192.168.36.210/API/Semantic_data/?format=array&person=Obama
* 192.168.36.210/API/Semantic_data/?person=Bo%20marley
*
http://192.168.36.210/API/Semantic_data/?format=array&book=Commedia%20divina

Il sorgente della classe è disponibile qui:
https://github.com/gubi/Ninuxoo-2.0/blob/master/common/include/classes/get_semantic_data.class.php

La documentazione "dev" generata dai commenti nel codice sta qui:
http://192.168.36.210/doc/classes/semantic_data.html

Qui un esempio di utilizzo del codice:
https://github.com/gubi/Ninuxoo-2.0/blob/master/API/semantic_data.php

E qui la documentazione sulle API:
https://github.com/gubi/Ninuxoo-2.0/wiki/Ricerche-semantiche-su-Wikipedia


Naturalmente il tutto è già parte di Ninuxoo e sarà nativo in ogni NAS,
ciò significa che se attiviamo i DNS Anycast le API saranno pure quelle
anycast :D

L'unica pecca è il tempo necessario per caricare i risultati: questo è
dato perché il parser "parsa molto" e poi anche perché dbpedia è lenta
di suo.
Comunque un consiglio è quello di ricorrere al caching, che non fa mai
troppo male ;)


Me la sono guadagnata questa prima assegnazione dell'IP 10.10.10.10 per
il mio proxy anycast? :D

Gubi

-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 555 bytes
Desc: OpenPGP digital signature
URL: <http://ml.ninux.org/pipermail/ninux-dev/attachments/20140305/3db29800/attachment-0001.sig>


More information about the ninux-dev mailing list