Bienvenue à Blogs CodeS-SourceS Identification | Inscription | Aide

Atteint de JavaScriptite Aiguë [Cyril Durand]

Expert ASP.net Ajax et WCF, Cyril Durand parle dans son blog de point techniques sur ASP.net, ASP.net Ajax, JavaScript, WCF et .net en général. Cyril est également consultant indépendant, n'hésitez pas à le contacter pour de l'assistance sur vos projets

Actualités

  • Blog de Cyril DURAND, passionné de JavaScript, Ajax, ASP.net et tout ce qui touche au developpement Web Client-Side.

    Consultant freelance, n'hésitez pas à me contacter pour vos projets .net : architecture, accompagnement, formation, ...

    View Cyril Durand's profile on LinkedIn
    hit counters


    Expertise Commerce server et BizTalk

DOCX2HTML : conversion d'un fichier Word 2007 en HTML

Comme vous l’a annoncé Neodante, mercredi dernier s’est déroulé un mercredi du développement sur OpenXML, j'ai eu le privilége de présenter un de mes projets : DOCX2HTML.

Ce projet est né d’une idée de Nix lorsqu’il a découvert le nouveau format de Word 2007 : un zip qui contient pleins d'infos.

Depuis toujours la publication d’article sur internet est une tâche compliqué et fastidieuse. Lorsque nous avons conçue TechnoS-SourceS : un site orienté professionnels de l’informatique où vous pouvez retrouver des articles techniques pointus écrit par tous les membres de la communauté, nous avions besoin de mettre en place un système de publication de contenu.

Jusqu'à récemment nous utilisons un système « classique » : la FreeTextBox avec une galerie d’image mais cela pose plusieurs problèmes :

  • Envoie des images une à une 
  • Rédaction dans un navigateur
    • Fenêtre de petite taille
    • Pas de sauvegarde
    • Pas « d’aperçu avant impression »
  • Pas de mis en forme commune
  • etc... (ceux qui ont déjà écrit des articles via la FTB savent de quoi je parle ;-))

OpenXML résoud ces problèmes en effet un document enregistré sous le format « Word 2007 » n’est qu’un zip qui contient le contenu et les styles dans un format XML et les images. En plus on peut enregistrer un document docx avec Word 2007 mais aussi avec Word 2003 grâce à un add-in ou encore avec OpenOffice.

Parmi les avantages de ce format on retrouve :

  • La facilité de publier un article (on envoie seulement le zip)
    • Plus besoin d'envoyer les images une à une
    • Correcteur orthographique
    • Utilisations d'un vrai éditeur de texte
  • Une mis-en-forme commune : Le format OpenXML sépare le contenu de la présentation, il nous suffit alors de conserver seulement les titres etc... Cela nécessite évidement que l'utilisateur utilises les styles "standard" de Word 2007.

Je me suis donc lancé sur la création d'un convertisseur docx vers HTML, après quelques cours sur le fonctionnement du format OpenXML (merci Neodante) j'ai commencé un proto et j'ai eu quelques choses de fonctionnels très rapidement (un week end (de geeks...)) puis une semaine (les soirs) pour avoir quelques choses de correct, travailler avec OpenXML avec .net 3 est vraiment très simple et rapide.

Depuis une semaine ce nouveau système est en production sur TechnoS-SourceS en plus de la classique FreeTextBox. Attention il s'agit d'un service beta (Web 2.0 ? ;-)) donc il est possible qu'il y ait quelques problèmes ...

Voici une démo du projet :

Vous trouverez en pièce jointe de ce post les slides de ma présentation et bientôt en WebCast.


Petit update : je viens de voir le post de Doug Mahugh le product manager d'OpenXML qui était présent avec nous lors de cette démo : Vive la Révolution Open XML

Posted: lundi 11 décembre 2006 00:35 par cyril
Attachment(s): Docx2HTML.pptx
Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :

Commentaires

coq a dit :

Ah ba voilà :-)

Bravo, j'attend le webcast du coup.

# décembre 11, 2006 07:59

Bidou a dit :

Quand ça fonctionnera bien, faudra voir pour l'importer sous CodeS-SourceS ;-)

Bon boulot!

# décembre 11, 2006 10:13

Benjiiim a dit :

Est-ce que ce projet passera un jour open source ?

Tu nous a fais envi là ! :-)

# décembre 11, 2006 13:49

cyril a dit :

Pour l'instant le projet n'est pas Open-Source car trop "beta" plus tard ce projet sera surement disponible mais je ne sais pas encore la licence que je vais utiliser.

# décembre 11, 2006 14:10

malek a dit :

Tu as adopte finalement toi aussi la "beta" experiences ;O)

# décembre 12, 2006 21:02

cyril a dit :

Non je fais des application "Web 2.0", quid de beta ?

# décembre 12, 2006 21:36

malek a dit :

c'etait une boutade :b ...

# décembre 13, 2006 08:12
Les commentaires anonymes sont désactivés

Les 10 derniers blogs postés

- Silverlight 3 : Communication et multicast par Kévin Gosse le il y a 4 heures et 20 minutes

- [Perso] Découvertes estivales : Linux (Part I) par Le blog de FremyCompany le il y a 7 heures et 2 minutes

- [Refactoring] ReSharper pour Visual Studio 2010 (Preview) par Thomas Jaskula le il y a 21 heures et 38 minutes

- [Refactoring] Analyser vos exceptions avec ReSharper Exceptional par Thomas Jaskula le il y a 22 heures et 52 minutes

- SharePoint 2007 : patterns & practices SharePoint Guidance par Philippe Sentenac [MVP SharePoint] le 07-03-2009, 09:56

- [Visual Studio 2010] Les tests cases c’est bien, mais je vais devoir tout réécrire ? par Etienne Margraff le 07-03-2009, 09:00

- MVP[Gribouillon].AddYear par The Grib's Lair [Sébastien PICAMELOT - MVP SharePoint] le 07-03-2009, 08:45

- Clinique INSIA - Projet de fin d’Etudes (Silverlight 3 MVVM et OutOfBrowser, WCF, TFS) - Part 1 par David REI le 07-02-2009, 23:38

- C’est la crise ? Bah pourquoi cramer du budget pub alors ? par Nix's Blog le 07-02-2009, 15:31

- Soyons MVP ! par TheSaib .NET blog le 07-02-2009, 12:15