Ricordo la Treccani, come il nome di una delle più autorevoli enciclopedie che nella mia adolescenza erano anche sinonimo di un enorme quantità di tomi dal prezzo spropositato (complessivamente l’Enciclopedia consta di 62 volumi, per un totale di 56.000 pagine con circa 50 milioni di parole, anche se quest’anno ha lanciato una edizione speciale in soli 3 volumi) e stampata su carta speciale garantita 200 anni, che avrebbe dovuto contenere, nelle intenzioni forse troppo ambiziose dei suoi autori, tutto lo scibile dell’umanità. Non ho mai posseduto la Treccani e mai l’ho potuta consultare per le mie ricerche scolastiche, e sono quindi contento di constatare che finalmente potrò farlo ora che ha deciso di pubblicare gratuitamente sul web una porzione consistente dell’opera globale delle enciclopedie e dei dizionari Treccani. Se, infatti, in passato il sito dell’Enciclopedia Treccani era una semplice vetrina web, oggi tutti possono finalmente consultare liberamente oltre 160mila lemmi.
E’ interessante notare, però, che il nuovo sito web 2.0 della Treccani, non mette solo online parte del suo vasto patrimonio enciclopedico, ma anche una serie di strumenti utili e interattivi, come widget, toolbar e feed rss per categoria, per farne un punto di riferimento del sapere in Rete, attorno al quale creare una sorta di social network della cultura italiana. E’ infatti possibile, commentare le voci enciclopediche, segnalare contenuti per arricchire il patrimonio Treccani, inserire parole chiave (tag) utili a creare percorsi tematici e ricerche incrociate, e si potranno scaricare widget per consultare le risorse enciclopediche direttamente dal proprio sito.
Infine, è possibile anche creare un proprio profilo personale per salvare percorsi di navigazione e link utili, scambiarsi messaggi, intervenire in dibattiti, ricevere aggiornamenti e porre quesiti alla redazione.
Come nelle enciclopedie cartacee non mancano i riferimenti da una voce all’altra, anche nel portale Treccani l’ipertestualizzazione è pervasiva: ogni parola dei lemmi delle enciclopedie e del vocabolario è un rimando, ogni rimando è un approfondimento. Basta, infatti, come avviene avviene per il dizionario De Mauro, fare un doppio click su una qualsiasi parola del testo e si verrà subito rimandati alla relativa voce del Vocabolario online o della Enciclopedia online.
Pensate che, la progettazione e l’avvio del portale hanno richiesto un investimento di meno di 500mila euro per due anni di lavoro, e il coinvolgimento di sei persone dello staff che lavorano quotidianamente sul portale. Niente male per un paese abituato a fare i conti con futuristici portali alla stregua di Italia.it, costato ben 45 milioni di euro!
Il fuggevole del Dizionario De Mauro
E se una nuova enciclopedia, pronta a collaborare o a sfidare Wikipedia, è nata, ecco che per un attimo la Rete ha tremato alla notizia che la famosa versione online del Dizionario italiano De Mauro Paravia, stava per sparire per fare posto, nell’homepage del sito, al Dizionario dei sinonimi e contrari De Mauro Paravia. Infatti, come sarà noto a tutti, il De Mauro è l’unico dizionario italiano completo di tutti i lemmi, tanto da essere un riferimento web per moltissimi utenti Internet, da anni linkato da blog e siti per la sua comodità di utilizzo. Certamente, esistono da tempo molte alternative, come il Vocabolario Treccani, il dizionario Garzanti (accessibile, però, dietro registrazione), il nuovo ed internazionale Google Dictionary (tanto da permettere di cercare il significato di una parola in circa 21 lingue, realizzando anche le corrispondenze tra una lingua e l’altra), e i collaborativi Dizionario Italiano e, forse più famoso, Wikizionario, ma tutti sono ancora troppo giovani per essere completi e diffusi sul web come il De Mauro. Infatti, sulla sua scia, sono nati moltissimi plugin per le toolbar, estensioni per firefox, e barre di ricerca che interrogavano direttamente questo database, e da anni veniva linkato da moltissimi siti web.
Fortunatamente, si è scoperto che, almeno per ora, il dizionario italiano aveva solo cambiato indirizzo web. Ora si trova su old.demauroparavia.it e grazie alla collaborazione del webmaster, tutte le richieste provenienti search plugin di Firefox e che puntavano al vecchio demauroparavia.it, ora vengono automaticamente rigirate su old.demauroparavia.it.
I benefici dei siti Wiki che non potranno mai cessare di esistere
Insomma, per ora il pericolo è stato scongiurato, ma sicuramente è stato utile a molti, me compreso, ad aprire gli occhi sulla caducità delle informazioni su internet. Se è vero che se una cosa c’è su internet è probabile che una sua traccia sarà disponibile per sempre, è anche vero che se sparisce un database enorme, come il De Mauro appunto, sarà ben difficile rimpiazzarlo in poco tempo con un altro di pari livello. E’ per questo che progetti come il Wikizionario, e in generale, Wikipedia sono le migliori soluzioni per tutti, in quanto, proprio per la loro natura collaborativa e free, possono crescere costantemente nel tempo, migliorandosi e perfezionandosi, e possono essere liberamente replicate su qualsiasi sito o supporto. Infatti, è possibile scaricare l’intero contenuto e struttura di Wikipedia (un enorme dump XML del database), da https://static.wikipedia.org/downloads/ (qui la versione italiana di 1.6 GB aggiornata al Giugno 2008), mentre è possibile scaricare l’intero contenuto del Wikizionario da questa pagina: https://download.wikimedia.org/itwiktionary/. Basterà quindi installare il software con licenza GNU GPL MediaWiki su un qualsiasi sito web (ma anche localmente su un qualsiasi pc) per replicare all’infinito l’informazione contenuta nella più grande enciclopedia della Rete!
Ecco finalmente il mio secondo plugin per WordPress: Filter Badwords Comment.
Nato soprattutto per l’esigenza di censurare alcune parole offensive presenti nei commenti su questo sito (specie nella calda sezione Xbox 360 vs PlayStation 3) ho deciso di renderlo pubblico per dare ad altri webmaster e blogger la possibilità di proteggere i propri lettori dalla lettura di parole che potrebbero offendere la sensibilità personale.
Caratteristiche del plugin
Filter Badwords Comment, è stato strutturato in modo da essere altamente personalizzabile anche dal Pannello di Amministrazione di WordPress. Infatti presenta, sotto il menu Impostazioni, una sezione “Filter Badwords Comment” in cui, è presente una textarea con elencate tutte le parole da filtrare. Inizialmente questa area è nascosta, per evitare di offendere la sensibilità delle persone.
Solo dopo aver visualizzato sul tasto Show (Visualizza nel caso abbiate la versione di WordPress localizzata in italiano) verrà visualizzata una area di modifica del dizionario delle parole, una per riga, da censurare.
Qui sono presenti sia singole parole (per quanto possibile nella loro versione al plurale e al singolare e in quelle artefatte) e sia da parole composte (le classiche frasi fatte offensive).
Per il plugin ho realizzato 2 vocabolari: badwords_IT.txt e badwords_EN.txt. Entrambi contengono parole offensive nelle rispettive lingue ITALIANO e INGLESE. A seconda di quale database di base scegliete dovete rinominarlo nell’unico file che il plugin legge: badwords.txt (che di default ho comunque incluso e contiene solo le parole italiane). Ovviamente nulla esclude che potete creare un vostro nuovo file con le parole da censurare: quello che ho fatto io è solamente di fornirvi tutti gli strumenti in modo da avere una base di partenza su cui far funzionare il plugin per wordpress.
Per i blog multilingua, potete benissimo realizzare un file unico che racchiuda entrambe le lingue anche se lo sconsiglio perché le parole inglesi potrebbero essere facilmente trovate in parte di quelle italiane (un esempio è: “mettere in ballo” in cui la parola “ball” verrebbe censurata).
Anche nel caso di parole italiane vi potrebbero essere problemi di censure parziali delle parole perché, magari, in mezzo è stata trovata una parola da censurare (è il caso, per esempio, di grafica“).
Per come ho sviluppato il plugin, che usa la funzione php di str_replace() su tutto il testo del commento e non tiene in considerazioni le sentence, il problema non è facilmente risolvibile. Per cui ho risolto eliminando quelle parole da censurare che potrebbero essere facilmente confondibili con altre di uso comune.
Se avete qualche suggerimento per migliorare questo plugin siete sempre i benvenuti!
Come funziona
Il plugin Filter Badwords Comment non fa altro che, ogni volta che WordPress deve visualizzare un commento, interrogare un file di testo e ricercare le relative corrispondenze. Una volta trovate le parole da censurare, queste vengono nascoste dietro degli asterischi solo in visualizzazione (le parole rimangono comunque inalterate nel database). So che la soluzione del file di testo non è la soluzione più veloce di interrogazione di un elenco di dati, ma sicuramente era quella più veloce e funzionale, perché, a differenza di un array interno al plugin o di un campo in una tabella mysql, è facilmente modificabile ed esportabile in quanto è un semplice file di testo in ASCII. Per semplificare la modifica online del parole da censurare ho, comunque, previsto la possibilità di poter modificare il file dal Pannello di Amministrazione di WordPress.
Da qui, inoltre, è possibile anche scegliere se censurare l’intera parola da fltrare con tutta una serie di asterischi pari al numero di lettere di cui è composta, oppure, per lasciare intendere il senso della frase, di lasciare visibile solo la prima e l’ultima lettera.
Compatibilità
Il plugin Filter Badwords Comment è stato testato sul mio blog per diversi giorni ed è compatibile con tutte le versioni di WordPress, quindi anche con la release 2.5.1. In ogni caso, il plugin agisce solo nell’area commenti e non fa altro che lavorare sulla sola visualizzazione senza alterare alcun dato. Il plugin è stato rilasciato esclusivamente in lingua inglese ma presumo che le sue funzionalità e caratteristiche siano abbastanza chiare.
Possibili evoluzioni
Una possibile evoluzione del plugin potrebbe essere quello di non permettere l’inserimento dei commenti se sono presenti parole da censurare. In questo modo si risolverebbe il problema a monte e si educherebbero i commentatori a non scrivere parole offensive! Il problema è che questo non può essere l’unica soluzione ma solo una caratteristica in più, da abbinare alla censura in visualizzazione delle parole, poiché, specie nei siti attivi da più anni e con diversi migliaia di commenti, bisogna comunque filtrare le parole offensive.
L’origine della badlist
Ci tengo a precisare che la lista italiana delle parole da censurare è stata tratta quasi integralmente, ad eccetto di alcune aggiunte da me, dal sito di Clarence che riportava una gaffe notata su un CD di Infinito che aveva lasciato visibile un file badlist.txt con tutte le parole da censurare durante la registrazione, compresi alcuni nomi di partiti italiani.
Supporto
Il plugin può essere testato nella sezione dei commenti di questa pagina. Se avete suggerimenti, domande o segnalazioni di anomalie, potete commentare qui sotto, oppure, contattarmi direttamente per mail dalla sezione Contattami.
Download
[ITALIANO]
Nome Plugin: Filter Badwords Comment
Autore: Antonio Troise
Descrizione: Questo plugin permette di censurare dai commenti le parole che risultano essere offensive prelevandole da un database italiano o inglese. Il plugin agisce solo sulla visualizzazione dei commenti dove è possibile nasconderle completamente dietro una serie di asterischi pari al numero di lettere di cui sono composte, oppure, per lasciare intendere il senso della frase, è possibile lasciare visibile solo la prima e l’ultima lettera.
Versione: 1.0.2
Installazione:
[ENGLISH]
Plugin Name: Filter Badwords Comment
Author: Antonio Troise
Description: This plugin allows to filter the bad words present in the comments with asterisk from italian/english dictionary. When the comments get displayed, WordPress gives the comment content to the comment filter plugin and returns the modified content that replace the bad word with asterisk.
Release: 1.0.2
Usage: