[ninux-dev] nodeshot db encoding

Giuseppe De Marco demarcog83 at gmail.com
Fri Nov 29 09:50:21 CET 2013


Attenti che se la colonna/tabella ha un encoding diverso storare encoding
su encoding gonfia bytes di cacca.

Per capire che encoding è una stringa, o comunque provarci sperando bene.
La seguente è un esempio su csv adattabile per tutto, la librerie che fà il
gioco è BeautifulSoup.

<code>
from BeautifulSoup import BeautifulSoup

f = open('elenco_ comuni_italiani_30 giugno_2013.iso-8859-9.csv', 'r')
r = f.readlines()
f.close()

l = []
for i in r:
    l.append(i.decode('iso-8859-9').encode('utf-8'))

In [18]: a = BeautifulSoup(r[0])

a.originalEncoding
Out[19]: 'windows-1252'

b = BeautifulSoup(l[0])
b.originalEncoding
Out[21]: 'utf-8'

f = open('elenco_ comuni_italiani_30 giugno_2013.utf-8.csv', 'wb')
f.writelines(l)
f.close()
</code>

ps = sta su mysql ?


Il giorno 28 novembre 2013 18:14, nemesis <nemesis at ninux.org> ha scritto:

> On Thu, 28 Nov 2013 17:13:23 +0100, leonardo <mail at leonardo.ma> wrote:
>
>> è normale che ci siano alcuni nomi dei nodi codificati ascii e altri
>> codificati ISO-8859-2 ?
>>
>> nodeid  nome    codifica
>> 6920    Scirč   ISO-8859-2
>>
>
> La risposta è: "BOH, chissericorda che minkia abbiamo combinato?"
>
> Forse.. è un nodo molto vecchio che è stato importato dal vecchio DB che
> aveva una codifica diversa?
>
> Fed.
> _______________________________________________
> ninux-dev mailing list
> ninux-dev at ml.ninux.org
> http://ml.ninux.org/mailman/listinfo/ninux-dev
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://ml.ninux.org/pipermail/ninux-dev/attachments/20131129/60bf6043/attachment-0001.html>


More information about the ninux-dev mailing list