Gadget per extreure el text pla d'un article de la Viquipèdia
Wikipedia Plain Text Extractor és un gadget de la Viquipèdia que permet extreure el text pla d'un article (sense format ni marques de referències) i guardar-lo al porta-retalls directament per després utilitzar-lo amb altres eines, per exemple la de resums automàtics de Softcatalà.

Imatge :


Una altra possible aplicació seria analitzar mitjançant eines d'anàlisi semàntica la facilitat de lectura de cada paràgraf (com fa l'aplicació anglesa Hemingway), per tal de detectar problemes de redactat al llarg d'un determinat article. Per veure altres possibles utilitats, consulteu el llistat d'eines informàtiques catalanes.

El codi es pot incloure mitjançant Tampermonkey (per qualsevol usuari) o bé com a Javascript personalitzat de la mateixa Viquipèdia, a l'apartat d'aparença de les preferències (només usuaris registrats).

Concretament, el codi utilitza l'API principal de la Viquipèdia, MediaWiki, per obtenir el text pla de l'article actual. De la mateixa manera, es pot modificar per aconseguir dades similars, o bé per canviar-ne el format resultant. En altres paraules, el codi és lliure d'ús i lliure de modificació.

Codi

Codi:

// ==UserScript==
// @name         Wikipedia Plain Text Extractor
// @namespace    http://tampermonkey.net/
// @version      1.0
// @description  Add a button on Wikipedia that allows to copy the article's content as a plain text
// @author       Wecoc
// @include      http*://*wikipedia.org/wiki/*
// @require      https://code.jquery.com/jquery-3.2.1.min.js
// @icon         https://en.wikipedia.org/favicon.ico
// @grant        none
// ==/UserScript==

// Obtenir el llenguatge actual
var langWiki = window.location.href.match(/\/\/(.*)\.wikipedia/)[1];
var buttonText = { "ca": "Copiar text pla" };
if (langWiki in buttonText) { buttonText = buttonText[langWiki] } else { buttonText = "Get plain text" }

// Funció per obtenir el text pla
function getPlainText() {
    var title = window.location.pathname.split('/wiki/')[1];
    var url = 'https://' + langWiki + '.wikipedia.org/w/api.php?action=query&format=json&prop=extracts&exlimit=max&explaintext&titles=' + title;
    $.ajax({
        crossOrigin: false,
        dataType: 'json',
        url: url,
        success: function(data) {
            // Obtenir text pla
            var pageID = Object.keys(data.query.pages)[0];
            var content = data.query.pages[pageID].extract;
            // Aplicar canvis de format addicionals al text

            // Enviar el text al Clipboard mitjançant un textarea
            var textArea = document.createElement("textarea");
            textArea.value = content;
            textArea.style.top = "0";
            textArea.style.left = "0";
            textArea.style.position = "fixed";
            document.body.appendChild(textArea);
            textArea.focus();
            textArea.select();
            document.execCommand('copy');
            console.log("Text has been copied successfully");
            textArea.style.display = "none";
        }
    });
}

// Afegir el botó per obtenir el text pla (esperar a que es carregui el botó "purge")
setTimeout(function() {
    document.getElementById(langWiki + "-purge").parentNode.innerHTML +=
       '<li class="mw-list-item mw-list-item-js" id="' + langWiki + '-plaintext"><a><span>' + buttonText + '</span></a></li>';
    document.getElementById(langWiki + "-plaintext").onclick = function() { getPlainText() };
}, 1000);


Registre de canvis

01-02-2022 - v1.0 - Codi bàsic per extreure el text pla d'un article

Aquesta aplicació ha estat creada per l'usuari Wecoc