Bienvenue à Blogs CodeS-SourceS Identification | Inscription | Aide

SQL Server : Indexer les documents Office 2007 et les PDF

Je viens de découvrir 2 téléchargements qui datent un peu, mais utile dans le contexte de la recherche Full Text (texte intégral) dans les produits Microsoft.

Les iFilter sont des composants servant à déchiffrer le contenu de certains fichiers stockés dans le cas de SQL Server à même les champs de type binaire.

Microsoft met à disposition les composants permettant de déchiffrer le contenu des documents Office 2007, les fichiers ZIP. Le téléchargement est disponible ici en 32 bits et 64 bits pour SQL Server 2005 et 2008 :
http://www.microsoft.com/downloads/details.aspx?FamilyID=60c92a37-719c-4077-b5c6-cac34f4227cc&DisplayLang=en

De plus Adobe a mis à disposition un article dans sa base de support pour utiliser son iFilter pour les documents PDF en 64 bits :
ttp://labs.adobe.com/wiki/index.php/PDF_iFilter_8_-_64-bit_Support

Sinon vous pouvez vous retourner vers le iFilter de Foxit dont j'avais parlé qui est nativement 64 bits :
http://blogs.codes-sources.com/christian/archive/2007/07/18/sql-server-et-autres-ifilter-pour-le-pdf-en-64-bits.aspx

Bon téléchargement...

Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :
Publié dimanche 4 mai 2008 23:45 par christian
Classé sous : ,

Commentaires

lundi 5 mai 2008 08:33 by ROMELARD Fabrice

# re: SQL Server : Indexer les documents Office 2007 et les PDF

La différence est que celui de Foxit est payant alors que celui d'Adobe est gratuit.

Ca c'est une bonne nouvelle, je vais pouvoir mettre à jour mes serveur 64 ;)

Merci mon Christian

Fabrice

lundi 5 mai 2008 09:41 by christian

# re: SQL Server : Indexer les documents Office 2007 et les PDF

Effectivement tu as raison...

Mais il y a une différence quand même entre les 2 en termes de perfs :

http://blogs.msdn.com/ifilter/archive/2007/11/14/foxit-vs-adobe-pdf-ifilter-32-bit-only.aspx

Celui de Foxit semble être plus rapide que celui d'Adobe... Après est ce que celà justifie le prix ? Je ne peux pas dire.

lundi 5 mai 2008 11:18 by ROMELARD Fabrice

# re: SQL Server : Indexer les documents Office 2007 et les PDF

A mon avis, le besoin de performance sur des serveurs d'indexation dépend réellement de la ferme SharePoint prévue.

Pour ma part, avec les plateforme que j'ai, les serveurs sont largement sur dimensionnés donc les perf moindres sont compensées.

Fabrice

Les commentaires anonymes sont désactivés

Les 10 derniers blogs postés

- ssdl view et TPT par Matthieu MEZIL le il y a 15 heures et 59 minutes

- L'injection SQL n'est PAS un problème QUE pour les développeurs web ! par CoqBlog le il y a 16 heures et 55 minutes

- Un outil pour réaliser des animations WPF basées sur des équations de Bézier par Perspective le il y a 20 heures et 18 minutes

- Sandcastle et CodePlex : le verdict par CoqBlog le il y a 21 heures et 9 minutes

- ssdl view et TPH par Matthieu MEZIL le il y a 22 heures et 51 minutes

- Webcasts sur le Parallel Framework disponibles par Matthieu MEZIL le 07-04-2008, 17:26

- [Silverlight] - Comprendre et Débuter avec Silverlight par Danuz le 07-04-2008, 12:41

- SharePoint : Nouvel article sur l'exportation et Importation de sites SharePoint par Blog Technique de Romelard Fabrice le 07-04-2008, 01:00

- ImagineCup 2008 Final in Paris: Day 1 par Richard Clark le 07-03-2008, 22:48

- PowerShell : Comment utiliser un ENUM .NET dans un script PowerShell par Blog Technique de Romelard Fabrice le 07-03-2008, 18:09