<?xml version="1.0" encoding="UTF-8" ?>
<?xml-stylesheet type="text/xsl" href="http://blogs.msdn.com/utility/FeedStylesheets/rss.xsl" media="screen"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:wfw="http://wellformedweb.org/CommentAPI/"><channel><title>Identifying tokens: Is word-breaking so easy?</title><link>http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2005/12/07/identifying-tokens-is-word-breaking-so-easy.aspx</link><description>What is a word? It’s basically a question we linguists have to answer when we develop spell-checkers, grammar checkers, when we do automatic dictionary look-up, when we try to interpret (and expand) queries for a search engine, etc… I recently wrote a</description><dc:language>fr</dc:language><generator>CommunityServer 2.1 SP1 (Build: 61025.2)</generator><item><title>correcteur orthographe word xp</title><link>http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2005/12/07/identifying-tokens-is-word-breaking-so-easy.aspx#514334</link><pubDate>Wed, 18 Jan 2006 19:23:45 GMT</pubDate><guid isPermaLink="false">91d46819-8472-40ad-a661-2c78acb4018c:514334</guid><dc:creator>myriam</dc:creator><description>Bonjour,&lt;br&gt;J'ai pos&amp;#233; la question suivante sur le forum Microsoft Word :&lt;br&gt;&amp;quot;Sur Word XP, un utilisateur tape un mot en majuscule au pluriel. Ex : DOCUMENTS. Word souligne en rouge (donc probl&amp;#232;me orthographe et non grammaire) le mot et propose DOCUMENT sans S. &lt;br&gt;L'option Ignorer les mots en MAJUSCULE est bien &amp;#233;videmment d&amp;#233;coch&amp;#233;e. &lt;br&gt;Word souligne tous les mots au pluriel tap&amp;#233;s en majuscule.&amp;quot;&lt;br&gt;J'ai lu que vous &amp;#233;tiez tr&amp;#232;s au point sur le correcteur orthographique et grammatical de word. Pouvez-vous m'aider ?&lt;br&gt;Merci &lt;br&gt;D'autre part, votre blog existe t'il quelque part en version fran&amp;#231;aise ?&lt;br&gt;&lt;br&gt;</description></item><item><title>re: Identifying tokens: Is word-breaking so easy?</title><link>http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2005/12/07/identifying-tokens-is-word-breaking-so-easy.aspx#514351</link><pubDate>Wed, 18 Jan 2006 20:02:30 GMT</pubDate><guid isPermaLink="false">91d46819-8472-40ad-a661-2c78acb4018c:514351</guid><dc:creator>OrthoFR</dc:creator><description>Bonjour Myriam,&lt;br&gt;&lt;br&gt;Merci pour votre question. Je viens de voir les r&amp;#233;ponses sur le forum de Word et j'avoue ma perplexit&amp;#233;. Je ne suis pas parvenu &amp;#224; reproduire ce comportement avec Office 2003 SP2, mais il s'agit comme vous le savez d'un correcteur diff&amp;#233;rent de celui que vous utilisez (Office XP) et donc plus r&amp;#233;cent, avec toutes les am&amp;#233;liorations d&amp;#233;crites sur ce blog. Je vais essayer de me renseigner. Il s'agit probablement d'un bug extr&amp;#234;mement rare (puisque personne ne semble l'avoir constat&amp;#233; jusqu'&amp;#224; pr&amp;#233;sent) et il a &amp;#233;t&amp;#233; r&amp;#233;solu dans les versions suivantes, puisque le nouveau correcteur ne pr&amp;#233;sente pas ce probl&amp;#232;me.&lt;br&gt;&lt;br&gt;S'agissant du blog, il est dans les deux langues. Le dernier billet concernant cet article est effectivement en anglais parce que l'article lui-m&amp;#234;me sur &amp;quot;Identifying tokens&amp;quot; est r&amp;#233;dig&amp;#233; en anglais pour une publication scientifique dans un livre. Mais les autres billets concernant la description du correcteur, la f&amp;#233;minisation des noms de m&amp;#233;tier, la r&amp;#233;forme de l'orthographe, le label de qualit&amp;#233; qu'il a re&amp;#231;u, comment installer le nouvel outil, etc sont en fran&amp;#231;ais (&amp;#224; l'exception des &amp;#233;valuations de notre correcteur par rapport &amp;#224; la Toolbar de Google et &amp;#224; OpenOffice parce que les &amp;#233;valuations sont d&amp;#233;crites en fran&amp;#231;ais sur le blog du Professeur Jean V&amp;#233;ronis, qui les a effectu&amp;#233;es et elles &amp;#233;taient donc d&amp;#233;j&amp;#224; disponibles en fran&amp;#231;ais). Plusieurs billets sur ce blog sont en fait identiques et ne diff&amp;#232;rent que par la langue dans laquelle ils sont r&amp;#233;dig&amp;#233;s: &lt;a rel="nofollow" target="_new" href="http://blogs.msdn.com/CorrecteurOrthographiqueOffice/default.aspx"&gt;http://blogs.msdn.com/CorrecteurOrthographiqueOffice/default.aspx&lt;/a&gt; &lt;br&gt;&lt;br&gt;Merci,&lt;br&gt;&lt;br&gt;Thierry Fontenenelle [MSFT]&lt;br&gt;</description></item><item><title>re: Identifying tokens: Is word-breaking so easy?</title><link>http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2005/12/07/identifying-tokens-is-word-breaking-so-easy.aspx#516330</link><pubDate>Mon, 23 Jan 2006 21:57:16 GMT</pubDate><guid isPermaLink="false">91d46819-8472-40ad-a661-2c78acb4018c:516330</guid><dc:creator>OrthoFR</dc:creator><description>Myriam, &lt;br&gt;puis-je vous demander de me donner le num&amp;#233;ro de la version du fichier MSSP3FR.DLL que vous utilisez quand vous voyez ce probl&amp;#232;me? (en cliquant sur le nom du fichier avec le bouton droit de la souris, vous pourrez acc&amp;#233;der au num&amp;#233;ro de la version)&lt;br&gt;&lt;br&gt;Normalement, le bug a &amp;#233;t&amp;#233; r&amp;#233;solu pour Office XP SP2, me dit-on, mais je suis en train de creuser... Il est certain que le probl&amp;#232;me n'existe plus dans la version la plus r&amp;#233;cente.&lt;br&gt;&lt;br&gt;Merci,&lt;br&gt;Thierry &lt;br&gt;</description></item><item><title>Fran&amp;amp;#231;ais qu&amp;amp;#233;b&amp;amp;#233;cois, trait d’union et correcteur orthographique</title><link>http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2005/12/07/identifying-tokens-is-word-breaking-so-easy.aspx#625747</link><pubDate>Sun, 11 Jun 2006 01:09:42 GMT</pubDate><guid isPermaLink="false">91d46819-8472-40ad-a661-2c78acb4018c:625747</guid><dc:creator>CorrecteurOrthographiqueOffice</dc:creator><description>&amp;amp;amp;nbsp;&lt;br&gt;J’&amp;amp;#233;tais il y a quelques jours au congr&amp;amp;#232;s de l’ACFAS &amp;amp;#224; Montr&amp;amp;#233;al, o&amp;amp;#249; je participais au symposium...</description></item><item><title>re: Identifying tokens: Is word-breaking so easy?</title><link>http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2005/12/07/identifying-tokens-is-word-breaking-so-easy.aspx#652787</link><pubDate>Sat, 01 Jul 2006 01:02:04 GMT</pubDate><guid isPermaLink="false">91d46819-8472-40ad-a661-2c78acb4018c:652787</guid><dc:creator>Merle Tenney</dc:creator><description>Thierry,&lt;br&gt;&lt;br&gt;If I may add a short correction to your first footnote. &amp;nbsp;The use of exclamation points in (American) English product names goes back many years. &amp;nbsp;Consider, for example, the chocolate chip cookies Chips Ahoy! and the famous musical comedy Oklahoma! &amp;nbsp;Both are incorrect without the exclamation point.&lt;br&gt;&lt;br&gt;It behooves us to consider that this trend in coining product neologisms in English may be with us for a while. &amp;nbsp;Perhaps we need to make sure that exclamation points can be allowed in the lexicon for such terms. &amp;nbsp;And since I also work at Microsoft and have my office just around the corner from yours, perhaps we can work on this together. &amp;nbsp;:-)</description></item><item><title>Français québécois, trait d’union et correcteur orthographique</title><link>http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2005/12/07/identifying-tokens-is-word-breaking-so-easy.aspx#4623540</link><pubDate>Wed, 29 Aug 2007 07:53:29 GMT</pubDate><guid isPermaLink="false">91d46819-8472-40ad-a661-2c78acb4018c:4623540</guid><dc:creator>CorrecteurOrthographiqueOffice</dc:creator><description>&lt;p&gt;J’&amp;#233;tais il y a quelques jours au congr&amp;#232;s de l’ ACFAS &amp;#224; Montr&amp;#233;al, o&amp;#249; je participais au symposium sur la&lt;/p&gt;
</description></item><item><title>Le mariage de la linguistique et de l’informatique dans “Spirit of Management”</title><link>http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2005/12/07/identifying-tokens-is-word-breaking-so-easy.aspx#5751669</link><pubDate>Mon, 29 Oct 2007 04:04:10 GMT</pubDate><guid isPermaLink="false">91d46819-8472-40ad-a661-2c78acb4018c:5751669</guid><dc:creator>CorrecteurOrthographiqueOffice</dc:creator><description>&lt;p&gt;Lors de mon passage en Belgique il y a quelques mois, j’ai eu le plaisir de retrouver quelques enseignants&lt;/p&gt;
</description></item><item><title>Why is chef-d’œuvre my favorite French word?</title><link>http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2005/12/07/identifying-tokens-is-word-breaking-so-easy.aspx#9471327</link><pubDate>Thu, 12 Mar 2009 07:53:14 GMT</pubDate><guid isPermaLink="false">91d46819-8472-40ad-a661-2c78acb4018c:9471327</guid><dc:creator>Office Natural Language Team Blog</dc:creator><description>&lt;p&gt;In this post, I would like to share with you the reasons why I love the French word chef-d’œuvre (=masterpiece).&lt;/p&gt;
</description></item></channel></rss>