doswin
Conversioni dei formati di testo.
Francesco Melis e Carlo Merisio  su uictech,dal  01\04\2013, h. 22.39.

Un saluto alla lista,
avendo avuto la necessità di aiutare delle persone non vedenti anziane,
che usano esclusivamente il sistema operativo Ms-Dos, è sorto il
problema di convertire dei files di testo dal formato txt di Windows al
formato txt di Ms-Dos.
Normalmente faccio questa operazione aprendo il file di testo Windows
con Microsoft Word e facendo la conversione con:
salva con nome - tipo file - testo normale - (con conferma conversioni
all'apertura attivato), - testo Ms-Dos
Orbene, si verifica che la conversione dal formato txt di Blocco Note al
formato txt di Ms-Dos, fatta in questa maniera, avviene in maniera molto
approssimativa. In particolare diversi caratteri fondamentali non
vengono resi correttamente; per esempio l'apostrofo e le virgolette basse.
Al loro posto compaiono nel testo Dos convertito dei generici punti
interrogativi che quando si sostituiscono all'apostrofo, per esempio,
rendono la lettura molto penosa. Oltre a questo ho notato molte parole
spezzate e queste non erano parole a fine riga che in qualche modo si
sarebbero giustificate con la sillabazione del nero.
Insomma un testo convertito scadente, per i miei gusti.
Ho cercato qualche tool per la conversione dal testo Windows al testo
Dos ma, per il tempo che ci ho dedicato, non ho trovato nulla.
Allora mi sono rimboccato le maniche e, partendo dal sorgente di un
programmino che feci in passato per la conversione dal Dos a Windows, ho
creato un programmino Dos per la conversione Windows-Dos.
Chi fosse interessato può prelevare dal mio deposito dropbox un file
compresso con i due programmini ed un file leggimi.txt con le
indicazioni d'uso.

https://dl.dropboxusercontent.com/u/28369839/Programmini%20conversione%20da%20txt%20Dos%20a%20Windows%20e%20viceversa.rar
Naturalmente, essendo programmi dos puri, girano solo in finestra dos
dei sistemi Windows a 32 bit.
Di seguito il testo del file leggimi.txt

Leggimi.txt
Questi due programmini hanno lo scopo di effettuare la conversione del
formato di testo dal formato del mondo Ms-Dos al formato del mondo
Windows e viceversa.
capita di ritrovarsi dei vecchi files di testo in formato Ms-Dos e di
volerli convertire nel formato del blocco note di Windows e viceversa,
in particolare nel caso di persone che usano ancora i computers con il
sistema operativo Ms-Dos e vorrebbero leggere correttamente dei testi
originariamente creati in ambiente Windows.
La necessità di creare questi programmini, in particolare il programma
che riporta dal formato Windows a quello Dos, è nato dall'osservazione
che la conversione effettuata mediante Microsoft Word per windows non
converte correttamente il testo dal formato txt Windows al formato
Ms-Dos. In particolare vengono convertiti in maniera completamente
sballata il segno di apostrofo, le virgolette basse ed alte ecc... al
loro posto appaiono in Ms-Dos dei generici segni di punto interrogativo
che rendono la lettura in Dos molto scadente.
I programmi girano in finestra Dos dei sistemi operativi Windows a 32 bit.

Descrizione:
Il programma Dos2Win.exe converte i files di testo dal formato txt del
sistema operativo Ms-Dos al formato txt del blocco note di Windows.
Uso del programma:
Dos2Win nome_del_file_txt_dos
Verranno prodotti due files aventi lo stesso nome del file originale:
quello con estensione txt è il file convertito nel formato txt di
windows e l'altro file, con estensione .bak, è lo stesso file originale
inalterato ma con estensione .bak

Il programma Win2Dos.exe converte i files di testo dal formato txt del
blocco note di Windows al formato txt del sistema operativo Ms-Dos .
Uso del programma:
Win2Dos nome_del_file_txt_windows
Verranno prodotti due files aventi lo stesso nome del file originale:
quello con estensione txt è il file convertito nel formato txt di Ms-Dos
e l'altro file, con estensione .bak, è lo stesso file originale
inalterato ma con estensione .bak

(Francesco Melis - 2014)

Carlo Merisio:

I tuoi programmini sono interessanti, ma ti volevo segnalare che dal 2008 Giuseppe Di Grande ha 
fatto textconv che fa le stesse operazioni creando una voce sulla barra dei menu con la quale puoi 
fare le due conversioni. Il programma funziona in Windows, naturalmente.

Non ho mai notato errori nella trasformazione sia da Dos che da Windows.

www.digrande.it/
***
Francesco Melis:
ti ringrazio della segnalazione.
Il problema è sorto durante la conversione di un file di un libro che
avevo scansionato.
In effetti neanche a me era mai capitato che Word fallisse nella
conversione, però questa volta non si sa per quale arcano motivo le cose
non sono andate bene.
Il file che ho convertito era stato generato dalla scansione con
finereader 11 di un libro che tra l'altro ho anche mandato alla
biblioteca digitale. L'impostazione di finereader era per produrre testo
word come "copia modificabile" senza conservazione dei ritorni a capo,
né della grafica.
Ho salvato il file in formato word ed ho fatto una prima conversione in
formato ascii Dos con Word 2003, con la funzione salva non nome - testo
normale. Avendo impostato la conferma della conversione all'apertura dei
files ho poi settato il pulsante radio su "formato Ms-Dos". La
conversione ha dato i problemi di cui parlavo: mancavano tutti gli
apostrofi ed al loro posto vi erano dei punti interrogativi.
Sono andato a vedere il valore del codice ascii di questi punti
interrogativi e, purtroppo per me, il loro codice era proprio quello dei
punti interrogativi!
Perché "purtroppo"?
Perché se il codice fosse stato quello di un carattere che solo a video
appare come un punto interrogativo ma diverso come valore dal codice del
punto interrogativo, avrei potuto fare una sostituzione globale di
questo codice per rimettere a posto in tutto il file il codice ascii
dell'apostrofo. Se avessi fatto tout-court una sostituzione del punto
interrogativo con l'apostrofo avrei distrutto anche tutti i veri punti
interrogativi. Del resto non c'era neanche la possibilità di "salvare"
in una stringa ausiliaria, preventivamente, tutti i veri punti
interrogativi presenti dato che collidevano come codice con quei punti
interrogativi spuri al posto dell'apostrofo.
A quel punto ho fatto da Word anche un salvataggio in formato ascii
windows e questa conversione è avvenuta correttamente. Il problema
quindi era solo nella conversione verso il formato ascii Dos.
Ho fatto la conversione del file word anche con altre versioni di word:
la 2010 e la vecchissima, ma preziosissima per me, versione word '97, ma
il problema permaneva.
[Nota: word '97 per me è molto utile poiché in questa vecchia versione,
che io mantengo installata su uno dei miei computers, sono ancora
presenti i filtri per la conversione dai vecchi formati ormai obsoleti
del dos come i formati wordstar e molti altri e quindi posso fare le
conversioni in formato word dei vecchi files in formato dos. Inoltre con
questo word posso, servendomi dapprima del "Wsconvert" del wordstar 7,
importare in word, in due passi, anche i files del vecchissimo IBM
Writing Assistant, (chi se lo ricorda?)].

Il problema dell'apostrofo non era neanche l'unico problema manifestato
dato che anche le virgolette a caporale erano sballate e molte parole
erano divise, ma non erano parole che nel nero capitavano a fine riga, o
al cambio pagina, per cui si sarebbe potuto pensare ad una cattiva
gestione dei ritorni a capo in caso di parole sillabate a fine riga.
A quel punto mi sono messo a fare una ricerca con Google di qualche tool
per la conversione in formato Dos partendo dal formato Ascii windows,
che era corretto, ma perdevo solo del tempo e non trovavo nulla.
Allora sono andato a ripescare il codice sorgente del programmino che mi
ero già fatto in passato, Dos2win.exe, e ci ho lavorato su per adattarlo
a fare la conversione Windows-Dos.
Per fare ciò ho creato dapprima un file di testo con il blocco note di
windows e ci ho messo i codici numerici da 32 a 255, uno per riga.
Accanto ad ogni codice numerico ci ho messo il carattere ottenuto con
alt + codice numerico per avere il carattere a video con quel codice.
Inoltre ho aggiunto a parole anche la descrizione del carattere del
tipo: u minuscola con dieresi.
Poi ho salvato e riaperto il file con un computer con Ms-Dos puro ed ho
messo, in terza colonna, a fianco del codice ottenuto in ambiente
Windows, il carattere ottenuto in ambiente Ms-Dos sempre con alt +
codice numerico.
In questo modo potevo avere a video, in terza colonna, il carattere
ottenuto in dos con alt ed il codice numerico della prima colonna e
verificare dalla descrizione verbale se a video il carattere era proprio
quello.
Naturalmente, come tutti sanno, in ambiente windows anche se si scrive
un carattere digitando alt + codice numerico, dentro il file nella
realtà viene immesso un altro codice numerico che è diverso dal codice
digitato. Nel Ms-Dos invece il byte immesso è proprio il codice immesso
con alt + codice.
Si verifica quindi che in Dos si leggono bene i codici in terza colonna
e questi corrispondono alla descrizione verbale messa a fine riga.
Naturalmente i caratteri in seconda colonna appaiono del tutto sballati
dato che sono stati generati in ambiente windows.
Viceversa, visualizzando quello stesso file in ambiente windows i
caratteri che si leggono bene sono quelli della seconda colonna e
ovviamente corrispondono alle descrizioni verbali. Ed ovviamente
sembrano sballati i codici dos della terza colonna.
A questo punto mi sono creato un altro file nel quale sostituivo ai
caratteri in seconda e terza colonna i loro valori numerici presenti nel
file ottenibili attraverso un programma di editing esadecimale.
Per esempio: la e con accento circonflessa che si scrive con alt 136,
nella parte dos in terza colonna è riportata come valore 136 mentre
nella seconda colonna windows è riportato come valore 234 anche se uno
per avere la e con accento circonflesso in windows deve sempre digitare
alt + 136.
In questo modo disponevo in seconda e terza colonna delle corrispondenze
dei codici per la trasformazione-conversione.
Sapevo a quel punto "qual è il codice che devo immettere affinché il
carattere in un ambiente appaia esattamente come appare nell'altro
ambiente, e queste corrispondenze si trovavano in seconda e terza
colonna". Mmmmhhh!... non so se sono stato chiarissimo...
Riguardo al fatto, che mi dici, dello strumento di Giuseppe di Grande di
cui non ero a conoscenza ne terrò conto, però i miei strumentini si
prestano meglio alle mie esigenze che sono:
1) avere uno strumento Dos che gira in ambiente Ms-Dos a beneficio delle
persone che seguo che usano il dos ed hanno quindi bisogno di strumenti dos.
2) Avere uno strumento che mi consenta di fare in un colpo solo
conversioni anche di centinaia di files dal momento che i programmini
possono essere inseriti in un file batch per l'automazione della
procedura di conversione multipla.
Uno strumento come quello che mi dici, se non ho inteso male, ti obbliga
a fare le conversioni una per una, ferma restando la validità dello
strumento di cui non ho motivo di dubitare.
Torna all'indice