El següent codi pel Query de WikiData permet obtenir aquells personatges catalanoparlants en els quals el nom de l'article català no correspon al nom de l'article anglès.
Codi:
# Get all Catalan people in Wikipedia where the name in Catalan and English isn't the same
SELECT ?item ?itemLabel ?caName ?enName ?itemDescription
WHERE {
?item wdt:P31 wd:Q5 . # Humans
?item wdt:P27 wd:Q29 . # Country of Citizenship: Spain
?item wdt:P1412 wd:Q7026 . # Language Spoken: Catalan
?item ^schema:about ?caArticle .
?caArticle schema:isPartOf <https://ca.wikipedia.org/>;
schema:name ?caName . # Get Catalan article name
?item ^schema:about ?enArticle .
?enArticle schema:isPartOf <https://en.wikipedia.org/>;
schema:name ?enName . # Get English article name
SERVICE wikibase:label
{
bd:serviceParam wikibase:language "ca" .
?item rdfs:label ?itemLabel .
?item schema:description ?itemDescription .
}
# Filter out those that have the same name
FILTER ( STR(?caName) != STR(?enName) )
}
Això no significa que cadascun dels 2771 casos obtinguts amb el codi sigui un cas de castellanització injustificada del nom, en molts de casos és una diferència a l'hora d'especificar els dos cognoms o només un, un canvi en el sobrenom, o la professió inclosa en parèntesi.
Per aquest motiu, s'han descarregat els resultats i filtrat manualment aquells més sospitosos de tractar-se d'una castellanització, és a dir aquells en els que es compleix alguna d'aquestes condicions:
- El nom a la versió catalana de l'article és en català i a la versió anglesa no.
- El nom a la versió catalana de l'article és en català però el nom utilitzat a WikiData no.
Podeu consultar la taula filtrada aquí: Noms castellanitzats
Alternativament, la podeu descarregar en format TSV a aquest enllaç: query_catalan_people.tsv
Això ens deixa amb 788 casos sospitosos de castellanització de noms catalans a la Viquipèdia anglesa.
Eines addicionals :
Podeu trobar altres filtres similars que poden ser útils per la Viquipèdia en català aquí.
També incloc aquí un codi que permet fer el mateix però amb noms de llocs catalans. Tot i això, aquest cop no s'ha trobat cap cas de castellanització a la versió anglesa.
També incloc aquí un codi que permet fer el mateix però amb noms de llocs catalans. Tot i això, aquest cop no s'ha trobat cap cas de castellanització a la versió anglesa.
Codi:
# Get a list of Catalonia regions
SELECT DISTINCT ?item ?caName ?enName WHERE {
hint:Query hint:optimizer "None".
VALUES ?territory {
wd:Q5705 # Catalunya
wd:Q7194 # Província de Girona
wd:Q13904 # Província de Lleida
wd:Q98392 # Província de Tarragona
wd:Q81949 # Província de Barcelona
wd:Q33146843 # Llista de municipis de Catalunya
wd:Q11917457 # Llista de divisions territorials de Catalunya (barris de Barcelona, etc.)
wd:Q937876 # Llista de comarques de Catalunya
}
?item wdt:P31* ?territory .
?caArticle schema:about ?item ; schema:isPartOf <https://ca.wikipedia.org/> ; schema:name ?caName .
?enArticle schema:about ?item ; schema:isPartOf <https://en.wikipedia.org/> ; schema:name ?enName .
# Filter out those that have the same name
FILTER ( STR(?caName) != STR(?enName) )
}