Levysoft
  • Home
  • Portfolio
  • WordPress Plugin
  • Contattami

Dal 2004 il blog di Antonio Troise

RSS FeedTwitterFacebook
Dic 17 2008

Mentre l’enciclopedia Treccani diventa aperta e web 2.0, il dizionario italiano De Mauro ha rischiato di sparire. Spiegazione del perché Wikipedia e il Wikizionario non correranno mai il rischio di cessare di esistere!

Posted by Antonio Troise
Tweet

Ricordo la Treccani, come il nome di una delle più autorevoli enciclopedie che nella mia adolescenza erano anche sinonimo di un enorme quantità di tomi dal prezzo spropositato (complessivamente l’Enciclopedia consta di 62 volumi, per un totale di 56.000 pagine con circa 50 milioni di parole, anche se quest’anno ha lanciato una edizione speciale in soli 3 volumi) e stampata su carta speciale garantita 200 anni, che avrebbe dovuto contenere, nelle intenzioni forse troppo ambiziose dei suoi autori, tutto lo scibile dell’umanità. Non ho mai posseduto la Treccani e mai l’ho potuta consultare per le mie ricerche scolastiche, e sono quindi contento di constatare che finalmente potrò farlo ora che ha deciso di pubblicare gratuitamente sul web una porzione consistente dell’opera globale delle enciclopedie e dei dizionari Treccani. Se, infatti, in passato il sito dell’Enciclopedia Treccani era una semplice vetrina web, oggi tutti possono finalmente consultare liberamente oltre 160mila lemmi.

E’ interessante notare, però, che il nuovo sito web 2.0 della Treccani, non mette solo online parte del suo vasto patrimonio enciclopedico, ma anche una serie di strumenti utili e interattivi, come widget, toolbar e feed rss per categoria, per farne un punto di riferimento del sapere in Rete, attorno al quale creare una sorta di social network della cultura italiana. E’ infatti possibile, commentare le voci enciclopediche, segnalare contenuti per arricchire il patrimonio Treccani, inserire parole chiave (tag) utili a creare percorsi tematici e ricerche incrociate, e si potranno scaricare widget per consultare le risorse enciclopediche direttamente dal proprio sito.
Infine, è possibile anche creare un proprio profilo personale per salvare percorsi di navigazione e link utili, scambiarsi messaggi, intervenire in dibattiti, ricevere aggiornamenti e porre quesiti alla redazione.

Come nelle enciclopedie cartacee non mancano i riferimenti da una voce all’altra, anche nel portale Treccani l’ipertestualizzazione è pervasiva: ogni parola dei lemmi delle enciclopedie e del vocabolario è un rimando, ogni rimando è un approfondimento. Basta, infatti, come avviene avviene per il dizionario De Mauro, fare un doppio click su una qualsiasi parola del testo e si verrà subito rimandati alla relativa voce del Vocabolario online o della Enciclopedia online.

Pensate che, la progettazione e l’avvio del portale hanno richiesto un investimento di meno di 500mila euro per due anni di lavoro, e il coinvolgimento di sei persone dello staff che lavorano quotidianamente sul portale. Niente male per un paese abituato a fare i conti con futuristici portali alla stregua di Italia.it, costato ben 45 milioni di euro!

Il fuggevole del Dizionario De Mauro

E se una nuova enciclopedia, pronta a collaborare o a sfidare Wikipedia, è nata, ecco che per un attimo la Rete ha tremato alla notizia che la famosa versione online del Dizionario italiano De Mauro Paravia, stava per sparire per fare posto, nell’homepage del sito, al Dizionario dei sinonimi e contrari De Mauro Paravia. Infatti, come sarà noto a tutti, il De Mauro è l’unico dizionario italiano completo di tutti i lemmi, tanto da essere un riferimento web per moltissimi utenti Internet, da anni linkato da blog e siti per la sua comodità di utilizzo. Certamente, esistono da tempo molte alternative, come il Vocabolario Treccani, il dizionario Garzanti (accessibile, però, dietro registrazione), il nuovo ed internazionale Google Dictionary (tanto da permettere di cercare il significato di una parola in circa 21 lingue, realizzando anche le corrispondenze tra una lingua e l’altra), e i collaborativi Dizionario Italiano e, forse più famoso, Wikizionario, ma tutti sono ancora troppo giovani per essere completi e diffusi sul web come il De Mauro. Infatti, sulla sua scia, sono nati moltissimi plugin per le toolbar, estensioni per firefox, e barre di ricerca che interrogavano direttamente questo database, e da anni veniva linkato da moltissimi siti web.

Fortunatamente, si è scoperto che, almeno per ora, il dizionario italiano aveva solo cambiato indirizzo web. Ora si trova su old.demauroparavia.it e grazie alla collaborazione del webmaster, tutte le richieste provenienti search plugin di Firefox e che puntavano al vecchio demauroparavia.it, ora vengono automaticamente rigirate su old.demauroparavia.it.

I benefici dei siti Wiki che non potranno mai cessare di esistere

Insomma, per ora il pericolo è stato scongiurato, ma sicuramente è stato utile a molti, me compreso, ad aprire gli occhi sulla caducità delle informazioni su internet. Se è vero che se una cosa c’è su internet è probabile che una sua traccia sarà disponibile per sempre, è anche vero che se sparisce un database enorme, come il De Mauro appunto, sarà ben difficile rimpiazzarlo in poco tempo con un altro di pari livello. E’ per questo che progetti come il Wikizionario, e in generale, Wikipedia sono le migliori soluzioni per tutti, in quanto, proprio per la loro natura collaborativa e free, possono crescere costantemente nel tempo, migliorandosi e perfezionandosi, e possono essere liberamente replicate su qualsiasi sito o supporto. Infatti, è possibile scaricare l’intero contenuto e struttura di Wikipedia (un enorme dump XML del database), da http://static.wikipedia.org/downloads/ (qui la versione italiana di 1.6 GB aggiornata al Giugno 2008), mentre è possibile scaricare l’intero contenuto del Wikizionario da questa pagina: http://download.wikimedia.org/itwiktionary/. Basterà quindi installare il software con licenza GNU GPL MediaWiki su un qualsiasi sito web (ma anche localmente su un qualsiasi pc) per replicare all’infinito l’informazione contenuta nella più grande enciclopedia della Rete!

Tag:cultura, database, demauroparavia, dizionario, treccani, vocabolario, Web 2.0, wikipedia
CONTINUE READING >
6 comments
Lug 9 2008

WordPress Plugin: Filter Badwords Comment

Posted by Antonio Troise
Tweet

Ecco finalmente il mio secondo plugin per WordPress: Filter Badwords Comment.
Nato soprattutto per l’esigenza di censurare alcune parole offensive presenti nei commenti su questo sito (specie nella calda sezione Xbox 360 vs PlayStation 3) ho deciso di renderlo pubblico per dare ad altri webmaster e blogger la possibilità di proteggere i propri lettori dalla lettura di parole che potrebbero offendere la sensibilità personale.

Caratteristiche del plugin

Filter Badwords Comment, è stato strutturato in modo da essere altamente personalizzabile anche dal Pannello di Amministrazione di WordPress. Infatti presenta, sotto il menu Impostazioni, una sezione “Filter Badwords Comment” in cui, è presente una textarea con elencate tutte le parole da filtrare. Inizialmente questa area è nascosta, per evitare di offendere la sensibilità delle persone.

Badwords - Screenshot 1

Solo dopo aver visualizzato sul tasto Show (Visualizza nel caso abbiate la versione di WordPress localizzata in italiano) verrà visualizzata una area di modifica del dizionario delle parole, una per riga, da censurare.

Badwords - Screenshot 2

Qui sono presenti sia singole parole (per quanto possibile nella loro versione al plurale e al singolare e in quelle artefatte) e sia da parole composte (le classiche frasi fatte offensive).
Per il plugin ho realizzato 2 vocabolari: badwords_IT.txt e badwords_EN.txt. Entrambi contengono parole offensive nelle rispettive lingue ITALIANO e INGLESE. A seconda di quale database di base scegliete dovete rinominarlo nell’unico file che il plugin legge: badwords.txt (che di default ho comunque incluso e contiene solo le parole italiane). Ovviamente nulla esclude che potete creare un vostro nuovo file con le parole da censurare: quello che ho fatto io è solamente di fornirvi tutti gli strumenti in modo da avere una base di partenza su cui far funzionare il plugin per wordpress.

Per i blog multilingua, potete benissimo realizzare un file unico che racchiuda entrambe le lingue anche se lo sconsiglio perché le parole inglesi potrebbero essere facilmente trovate in parte di quelle italiane (un esempio è: “mettere in ballo” in cui la parola “ball” verrebbe censurata).
Anche nel caso di parole italiane vi potrebbero essere problemi di censure parziali delle parole perché, magari, in mezzo è stata trovata una parola da censurare (è il caso, per esempio, di grafica“).
Per come ho sviluppato il plugin, che usa la funzione php di str_replace() su tutto il testo del commento e non tiene in considerazioni le sentence, il problema non è facilmente risolvibile. Per cui ho risolto eliminando quelle parole da censurare che potrebbero essere facilmente confondibili con altre di uso comune.
Se avete qualche suggerimento per migliorare questo plugin siete sempre i benvenuti!

Come funziona

Il plugin Filter Badwords Comment non fa altro che, ogni volta che WordPress deve visualizzare un commento, interrogare un file di testo e ricercare le relative corrispondenze. Una volta trovate le parole da censurare, queste vengono nascoste dietro degli asterischi solo in visualizzazione (le parole rimangono comunque inalterate nel database). So che la soluzione del file di testo non è la soluzione più veloce di interrogazione di un elenco di dati, ma sicuramente era quella più veloce e funzionale, perché, a differenza di un array interno al plugin o di un campo in una tabella mysql, è facilmente modificabile ed esportabile in quanto è un semplice file di testo in ASCII. Per semplificare la modifica online del parole da censurare ho, comunque, previsto la possibilità di poter modificare il file dal Pannello di Amministrazione di WordPress.

Da qui, inoltre, è possibile anche scegliere se censurare l’intera parola da fltrare con tutta una serie di asterischi pari al numero di lettere di cui è composta, oppure, per lasciare intendere il senso della frase, di lasciare visibile solo la prima e l’ultima lettera.

Badwords - Screenshot 3
Compatibilità

Il plugin Filter Badwords Comment è stato testato sul mio blog per diversi giorni ed è compatibile con tutte le versioni di WordPress, quindi anche con la release 2.5.1. In ogni caso, il plugin agisce solo nell’area commenti e non fa altro che lavorare sulla sola visualizzazione senza alterare alcun dato. Il plugin è stato rilasciato esclusivamente in lingua inglese ma presumo che le sue funzionalità e caratteristiche siano abbastanza chiare.

Possibili evoluzioni

Una possibile evoluzione del plugin potrebbe essere quello di non permettere l’inserimento dei commenti se sono presenti parole da censurare. In questo modo si risolverebbe il problema a monte e si educherebbero i commentatori a non scrivere parole offensive! Il problema è che questo non può essere l’unica soluzione ma solo una caratteristica in più, da abbinare alla censura in visualizzazione delle parole, poiché, specie nei siti attivi da più anni e con diversi migliaia di commenti, bisogna comunque filtrare le parole offensive.

L’origine della badlist

Ci tengo a precisare che la lista italiana delle parole da censurare è stata tratta quasi integralmente, ad eccetto di alcune aggiunte da me, dal sito di Clarence che riportava una gaffe notata su un CD di Infinito che aveva lasciato visibile un file badlist.txt con tutte le parole da censurare durante la registrazione, compresi alcuni nomi di partiti italiani.

Supporto

Il plugin può essere testato nella sezione dei commenti di questa pagina. Se avete suggerimenti, domande o segnalazioni di anomalie, potete commentare qui sotto, oppure, contattarmi direttamente per mail dalla sezione Contattami.

Download

Italiano[ITALIANO]

Nome Plugin: Filter Badwords Comment
Autore: Antonio Troise
Descrizione: Questo plugin permette di censurare dai commenti le parole che risultano essere offensive prelevandole da un database italiano o inglese. Il plugin agisce solo sulla visualizzazione dei commenti dove è possibile nasconderle completamente dietro una serie di asterischi pari al numero di lettere di cui sono composte, oppure, per lasciare intendere il senso della frase, è possibile lasciare visibile solo la prima e l’ultima lettera.
Versione: 1.0.2
Installazione:

  1. Scaricate il plugin, decomprimetelo e fate l’upload della dictory badwords nella directory dei plugin di WordPress (wp-content/plugins/).
  2. Rinominate badwords_IT.txt o badwords_EN.txt nel DB file di default: badwords.txt
  3. Attivate il plugin “Filter Badwords Comment” plugin da “Gestione plugin” nell’Area di Amministrazione di WordPress.
  4. Configurate la lista delle parole da censurare e la modalità di mascheramento degli asterischi da Impostazioni » Filter Badwords Comment
download Scarica filter_badwords_comment.zip 1.0.2
Dimensione: 6.6 KB

English[ENGLISH]

Plugin Name: Filter Badwords Comment
Author: Antonio Troise
Description: This plugin allows to filter the bad words present in the comments with asterisk from italian/english dictionary. When the comments get displayed, WordPress gives the comment content to the comment filter plugin and returns the modified content that replace the bad word with asterisk.
Release: 1.0.2
Usage:

  1. Download the plugin, unzip and upload in the directory of plugin of WordPress (wp-content/plugins/).
  2. Rename badwords_IT.txt or badwords_EN.txt in default DB file: badwords.txt
  3. Activate “Filter Badwords Comment” plugin from Manage Plugin in the Administration Area of WordPress
  4. Configuration: Options » Filter Bad Words Comment.
download Download filter_badwords_comment.zip 1.0.2
Size: 6.6 KB
Tag:Blog, censura, commenti, database, dizionario, download, Mysql, Php, Plugin, Wordpress
CONTINUE READING >
14 comments
Feb 6 2008

Come pronunciare correttamente termini dall’accentazione dubbia usando il DOP online, ovvero il Dizionario italiano multimediale e multilingue d’ortografia e di pronuncia

Posted by Antonio Troise
Tweet

Fonetica La nostra lingua è bella perché capricciosa: oltre a trasformarsi continuamente come tutto ciò che è vivo, ha regole contraddette da eccezioni. Spesso, quindi, capita di avere dei dubbi su dove far cadere gli accenti per parole tipo rubrica, utensile, regime, amaca, baule, edile, caduco, cosmopolita, impari, pudico, ossimoro, robot, o zaffiro poiché, a volte, anche il dizionario “De Mauro” (Paravia) consultabile su Internet non prevede una pronuncia univoca, assegnando indifferentemente l’accento sulla penultima o sulla terzultima sillaba, senza alcuna preferenza.

Se non volete girare per internet alla ricerca di una risposta da parte di autorevoli esperti di fonetica che vi spiegano la correttezza o meno delle pronuncia piana o sdrucciola e non volete imparare a leggere correttamente gli accenti sul sito dell’Accademia della Crusca (che elenca tutti i termini dall’accentazione “dubbia”) potete fare un salto sul primo Dizionario multimediale di ortografia e pronuncia (DOP) della lingua italiana, uno strumento importante per imparare la corretta ortografia e la perfetta pronuncia delle parole della nostra lingua.

DOP Rai

Un lavoro realizzato dalla RAI davvero interessante che si fa forza delle oltre 129.000 voci (di cui 92.000 voci italiane e e 37.000 di altre lingue) con oltre seimila citazioni d’autore, tutte ascoltabili in formato audio (grazie alla tecnologia Flash), che ha richiesto 8 anni di lavoro e 5000 ore di registrazione presso le sedi RAI.
Questa edizione multimediale oltre ad essere uno strumento di unificazione linguistica e di riappropriazione della lingua madre è, anche, un innovativo strumento di consultazione che è insieme rigoroso e semplice, perché alle trascrizioni fonetiche, del resto assai chiare e intuitive, s’accompagna anche la lettura ad alta voce: un sussidio essenziale per chi non conosce gli oltre sessanta segni dell’alfabeto fonetico.

Tra i lemmi troviamo parole ordinarie e termini tecnici, nomi propri di persone, di luoghi, d’istituzioni e altro. La versione online del “DOP” è accessibile gratuitamente in tutto il mondo ed è uno strumento utilissimo per tutti, indispensabile per gli studenti, per gli studiosi della lingua italiana e per i professionisti del microfono. La versione multimediale è aggiornata da una redazione di studiosi, incaricata di seguire le mutazioni della lingua parlata e scritta, di vagliare i suggerimenti del pubblico e di accogliere le proposte di nuove voci.

Per la resa dei simboli fonetici sullo schermo non sono stati utilizzati caratteri speciali perché la visualizzazione in rete degli alfabeti fonetici richiede solitamente l’installazione nel computer di un insieme di font speciali, necessariamente dipendenti dal sistema operativo del computer: una soluzione macchinosa e poco affidabile, che, qualora fosse stata adottata, avrebbe escluso dalla fruizione del “DOP” una sezione significativa del suo pubblico potenziale. La soluzione messa a punto per il “DOP” consiste nel trasformare ogni singola trascrizione fonetica in un’immagine. Si ottiene così l’importante risultato di render possibile la consultazione del dizionario coi browser tradizionali e con qualsiasi tipo di sistema operativo, nonché gli aggiornamenti futuri, garantendo la tipificazione dei dati informatici.

Voice Il sito, oltre ad avere utili guide fonetiche ed ortografiche, ha anche un veloce motore di ricerca che fornirà l’esatta grafia e pronuncia della parola ricercata.

Il DOP, ossia il “Dizionario italiano di Ortografia e Pronunzia“, venne messo a punto per la prima volta nel 1969 dalla Rai, figlio diretto del “Prontuario di pronunzia e di ortografia per gli annunciatori radiofonici” pubblicato nel 1939, dall’EIAR, l’ente radiofonico di Stato, con lo scopo di diffondere un italiano corretto e ben pronunciato.

Ora che ne è stata realizzata una versione digitale, disponibile su Internet, può di certo affiancarsi con onore ad altri dizionari online come il De Mauro e il milione di frasi in 22 lingue diverse messe a disposizione dalla Commissione Europea per tutti i programmi di traduzione automatica (sembra che finalmente le varie istituzioni stiano iniziando a saper sfruttare al meglio la potenza di Internet); da non dimenticare, per gli anglofoni, un altro servizio simile al DOP nostrano, si chiama HowjSay e, con i suoi 89.257 termini, permette di ascoltare rapidamente la pronuncia corretta di una parola inglese.

Tag:accenti, dizionario, rai
CONTINUE READING >
4 comments
Mag 24 2007

I neologismi del Web 2.0: cosa significa il termine Mashup?

Posted by Antonio Troise
Tweet

MashupIeri, nell’articolo sui nuovi Mashup di Google Maps ho più volte usato il termine mashup, dando per scontato che tutti sapessero il suo significato. Purtroppo è un problema comune riproporre nuovi termini, neologismi, senza approfondirne il significato o l’origine, anche perché spesso è difficile trovarli.

Letteralmente, il termine “mashup” significa “poltiglia” e la sua origine deriva da un genere musicale che mescola varie tendenze in un’unica melodia. In pratica, aggregando frammenti di brani diversi e mixandoli si ottiene un nuovo prodotto.

In ambito tecnologico, un mashup è un’applicazione che usa contenuto da più sorgenti per creare un servizio completamente nuovo.
Il contenuto dei mashup è normalmente preso da terzi via API (Application Programming Interface), tramite feed (RSS o Atom) o Javascript.
Come i blog hanno rivoluzionato l’editoria online, i mashup stanno rivoluzionando lo sviluppo del web permettendo a chiunque di combinare dati da siti diversi in modi innovativi. L’abbondanza di semplici e leggere API hanno reso i mashup dei servizi relativamente semplici da progettare: richiedono minime conoscenze tecniche e quindi sono solitamente creati da innovatori inusuali.

C’è anche chi definisce il blog come il mashup per eccellenza: infatti, il mashup, può essere considerato anche la tendenza ad aggregare risorse e fonti dinamiche del web per riproporle attraverso il proprio filtro, la propria scelta. Appunto, come un blog!

Attribution Image CC: ‘Tad not drinking wine‘

Tag:api, Blog, dizionario, feed, google_maps, mashup, rss
CONTINUE READING >
2 comments
SeguiPrezzi - Risparmia con Amazon.it

Categorie

Commenti Recenti

  • Antonio Troise on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Fioredicollina on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Antonio Troise on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Emanuele on UltraEdit: per i programmatori esigenti il miglior editor di testo per Windows, Mac OS e Linux
  • Luca on iDatabase: la valida alternativa di Bento per macOS e iOS per i database personali

Meta

  • Accedi
  • Entries RSS
  • Comments RSS
  • WordPress.org

Friends Link

  • GamerTagMatch
  • SeguiPrezzi.it – Risparmia con Amazon.it
  • Trendy Nail

Seguimi su:

  • facebook
  • twitter
  • rss
Creative Commons License
Levysoft by Antonio Troise is licensed under a Creative Commons Attribuzione-Non commerciale 2.5 Italia License.
© Copyright 2004 - 2014 - Levysoft by Antonio Troise