Bonjour, je cherche "le manuel de l'oric atmos" dans un format office. Il est trouvable sur internet au format PDF, grossièrement scanner à l'envers, mais il n'existe plus de logiciels gratuits traitant le format PDF avec OCR, comme il existait sur XP et devenus introuvables.
Antoine
Bonsoir,
Si par "format office" vous entendez un fichier au format Microsoft Word ou Microsoft Office, alors il n'y en a pas dans la mesure où, à ma connaissance, aucun scanner ne produit de fichier dans ce format.
Je ne comprends pas ce qu'est "un logiciel traitant le format PDF avec OCR"
Bonjour, je cherche "le manuel de l'oric atmos" dans un format office. Il est trouvable sur internet au format PDF, grossièrement scanner à l'envers, mais il n'existe plus de logiciels gratuits traitant le format PDF avec OCR, comme il existait sur XP et devenus introuvables.
Antoine
Au lieu de cracher sur ceux qui ont fait le boulot, même imparfaitement en regard de l'évolution informatique 15 ans après qu'ils auraient sans doute dû prévoir, vous pourriez montrer la voie en vous sortant les doigts du fion, en achetant le manuel d'occasion, en le scannant selon vos exigences malpolies, et en le partageant.
👍
@ toniau
vous n’êtes pas sans ignorer, vous qui utilisez les logiciels gratuits, qu'il existe Libre Office, suite bureautique en Open Source, permettant facilement d'ouvrir, de traiter un fichier PDF et de le sauvegarder sous format 'Word' (ou autre au besoin).
libre office est une vrai saloperie et non, ce que vous dites n'est pas possible. J'utilise OOO4kids qui est bien mieux et invalide l'utilisation de libre office.
Allez c'est "surprise surprise", on va voir débarquer Marcel Béliveau, là ?
Simon, on t'a reconnu, pas la peine de te créer un compte pour faire des blagues 🙂
Bonjour Antoine, peux tu m'expliquer pourquoi tu veux faire de la reconnaissance de caractères sur le fichier? Je viens de le télécharger et je l'ai ouvert avec Adobe acrobat dc qui est gratuit et après avoir fait un quart de tour à l'ensemble des pages la lecture devient aisée.
libre office est une vrai saloperie et non, ce que vous dites n'est pas possible. J'utilise OOO4kids qui est bien mieux et invalide l'utilisation de libre office.
Pour information, OOo4Kids n'est ni plus ni moins que OpenOffice version 3.2, qui date de 2011, à laquelle il a été enlévé une grande partie des possibilités pour que ce soit utilisable par des enfants de 7 à 12 ans.
LibreOffice est tout simplement la continuité du développement de OpenOffice.
Il n'y a pas de nouvelles versions de OOo4Kids depuis des années, mais si il y en avaient elles seraient donc probablement basées sur LibreOffice.
Conclusion OOo4Kids est une version minimaliste de LibreOffice figée en 2011 et ce que vous dites n'a donc aucun sens.
@assinie Je l'ai téléchargé pour voir s' il ouvrait les fichiers docx mais il n'arrive pas à ouvrir toutes les pages. Du coup le fichier "manuel de l'oric atmos" est illisible dessus. Dommage pour notre ami mais je peux toujours lui prêté le manuel pour qu'il puisse nous le scanner entre deux post de remerciement pour le temps qu'on passe à lui trouver des solutions.
Allez c'est "surprise surprise", on va voir débarquer Marcel Béliveau, là ?
Simon, on t'a reconnu, pas la peine de te créer un compte pour faire des blagues 🙂
Faudrait vraiment être un beauf qui n'a que ça à faire ^^
Ce qu'il me faut c'est un OCR gratuit parce que je me vois mal saisir le texte, je n'en ai pas trouvé. Je voudrais le refaire dans un format le plus standard et ouvert possible (évidemment pas PDF) et le mettre en auto-édition pour ceux qui le voudraient au format papier. Curieusement les OCRs gratuits étaient courant dans la période windows XP.
Il existe tesseract-ocr qui est open source et gratuit, le package est disponible dans la plupart des distributions Linux.
Avec un logiciel OCR vous perdez les illustrations au passage et, dans certains cas, ça ne fonctionne pas très bien pour des listings de programmes suivant l'imprimante utlisée et la qualité d'impression du livre.
Les documents sur plusieurs colonnes posent également des problèmes.
Il faudra donc retravailler le document.
J'ai un peu de mal à comprendre cette obsession pour un logiciel OCR surtout si c'est pour pouvoir ensuite le mettre en auto-édition ce qui n'est d'ailleurs peut-être pas possible à cause du droit d'auteur.
De ce que j ai compris, Tesseract ne serait qu'un "moteur", ou on doit entrer des formules dans le terminal, il faut rajouter une interface graphique.
Il peut s'utilser en ligne de commande ou au travers de son API, il existe également une version javascript pour l'intégrer directement dans une appli web.
On peut trouver des interfaces graphiques: https://tesseract-ocr.github.io/tessdoc/User-Projects-%E2%80%93-3rdParty.html
Merci pour vos non-solutions, pour ce qui est des droits d'auteurs, dans ce cas je veux bien l'acheter neuf, pouvez-vous me dire où ? Parce-que la maison d'édition n'existe plus. Donc les droits d'auteurs, je m'assois dessus.