[Open XML] Projet OSS du convertisseur des formats binaire d'Office vers Open XML
Le projet de conversion des formats binaires (doc, xls et ppt) est enfin ouvert sur sourceforge : http://b2xtranslator.sourceforge.net/ . Notez que la licence est celle de BSD, ce qui permet à tout le monde y compris les entreprises, de pouvoir utilsier/réutiliser/modifier ce projet pour ses propres besoins.
Ce projet était une requête de plusieurs National Bodies dans le cadre de la normalisation du format Open XML. Bien que cette requête sortait du cadre de la normalisation du format, Microsoft s'était engagé à :
Initiate a Binary Format-to-ISO/IEC JTC 1 DIS 29500 Translator Project on the open source software development web site SourceForge (http://sourceforge.net/ ) in collaboration with independent software vendors. The Translator Project will create software tools, plus guidance, showing how a document written using the Binary Formats can be translated to DIS 29500. The Translator will be available under the open source Berkeley Software Distribution (BSD) license, and anyone can use the mapping, submit bugs and feedback, or contribute to the Project. The Translator Project will start on February 15, 2008.
Make it even easier to get access to the Binary Formats documentation by posting it and making it available for a direct download on the Microsoft web site no later than February 15, 2008. The Binary Formats have been under a covenant not to sue and Microsoft will also make them available under its Open Specification Promise (see www.microsoft.com/interop/osp) by the time they are posted.
Ce projet étant évidemment tout neuf, vous ne pourrez pas faire grand chose pour le moment puisqu'aucun code n'est actuellement disponible. Vous ne pourrez donc pour le moment prendre connaissance que de la roadmap et de la documentation (mapping entre les formats). Première livraison de l'outil prévue pour le 1er Avril (blague à part) :
-
Milestone 0 (February 15th, 2008): Launching the project on SourceForge
- outline of the anatomy of binary Office documents (Compound file format, streams inside, ...)
- brief description of the streams in Word documents
- initial doc/docx mappings, e.g. for the main character and paragraph attributes
-
Milestone 1 (April 1st, 2008): First results
- technical specification how to read and parse Office documents, in particular Word documents
- a first version of a parser (command line tool) being able to read and interprete the individual components (streams) of a binary Word document
- enhanced doc/docx mapping documentation
- detailed scope of the translator to be implemented for the next milestone
-
Milestone 2 (June 30th, 2008): Final Word translator and more
- translator which reads binary Word documents and creates Open XML Word documents
- final documentation on binary Word documents and doc/docx mapping
- preliminary documentation on binary PowerPoint and Excel architecture and ppt/pptx,xls/xlsx mapping
A quand un outil pour faire l'inverse pendant la période de migration des formats binaire vers Open XML ?
Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :