元 MVP リード 小板公一のブログ

コミュニティ サポート サービス, 元 MVP リード 小板公一のブログです。

Browse by Tags

Tagged Content List
  • Blog Post: Bing - ニュース検索でWebスライス

    まだ検索するときに B のちょっと左上を押すこともあるのですが、「とりあえず生!」な感覚で「とりあえず Bing 」です。 あまりニュース検索を使ったことがなかったので仕組み自体がわからない ( どうやってニュースか判断してるんだろう・・・サイトリストで管理しているんでしょうか? ) のですが、今日使ってみてトップ記事に Web スライスが適用されていることに気がつきました。といってもマウスオーバーするとすぐにわかります(^-^; ちょっと不思議だったのはなぜかトップ記事のみに適用されていること。やはり何事もトップじゃないと駄目ということでしょうか。ところが実は 2 ページ目に移動するとここでもトップ記事...
  • Blog Post: MSDN / TechNet フォーラムで良く使われる単語2 - 表示するのかしないのか

    前回 MSDN / TechNet フォーラムで良く使われる単語を紹介しましたが「使用」や「表示」だけでは「使用する」のか「使用しない」のか「表示できる」のか「表示できない」のかまではわかりません。もしフォーラムに質問をしたユーザーがどのような問題に困っているのかを理解しようとすると「しない」や「できない」といった否定表現に注目するのが良いかもしれません。 そのためには MeCab の辞書を充実させれば・・・と考えてしまいますが実際に投稿される質問の表現は無数にあるためあまり現実的ではなく、プログラムである程度なんとする必要があります。 例えば「使用」直後の動詞、助動詞...
  • Blog Post: Webページを解析する4 - その他の細かい点

    さて、入力が掲示板のタイトルのように一行 ( 改行がないという意味 ) で文自体も短い場合は今までの処理を施した後に MeCab に流せばよかったのですが、一般的な掲示板の本文は複数行で文もそこそこ長いものになります。また HTML では通常の改行コード (\n) ではなく <br /> などが改行コード?になっています。 そこで掲示板本文を解析する前にいくつかの処理をする必要があります。 例 ) 私が MSDN フォーラムを解析してどのような単語が頻出単語かを調べる場合 署名の削除 引用部を置換 <br /> タグの置換 ...
  • Blog Post: Webページを解析する3 - 大文字小文字と全角半角

    期待する結果を得るためには MeCab で処理をする前に大文字小文字の統一、全角半角の統一が必要になります。私の場合は「英数字は半角小文字」「カタカナは全角」で統一することにしました。 ある程度入力データが小さく、全角または半角どちらか一方にのみ統一する場合は Excel の JIS または ASC 関数を使うことができるのでプログラムが面倒な場合はこちらを利用すると楽だと思います。 ( 私も最初はそうしていました ) では C# で実際にプログラムすると・・・結構大変なようです。そこで VB.NET の StrConv を使う事にしました。ソリューションに...
  • Blog Post: Webページを解析する2 - 表記ゆれへの対応

    Web ページを解析する上でもっとも大変なのは表記ゆれにどのように対応するかにあると思います。 例えば Windows 7 の場合、 IPA の辞書のみを利用していると前回の投稿のように Windows 7 という切り出しができませんし、その他にも Win7 といった単語が Windows 7 とは別の扱いになってしまいます。 そこで MeCab のユーザー辞書に windows 7,0,0,10,Microsoft,Windows,7,*,*,*,Windows 7 windows7,0,0,10,Microsoft,Windows,7,*,*,*,Windows...
  • Blog Post: Webページを解析する - MeCab & MeCabSharp & C#

    MeCab は京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発されたオープンソース形態素解析エンジンです。 ( 公式ページから抜粋 ) 詳しくは以下のサイトをご覧ください。 http://mecab.sourceforge.net/ 特徴の中に各種スクリプト言語バインディングの項目があり C# も記載されています。ちなみに C# はスクリプト言語・・・ではないです (^-^; ちょっと面白そうなので実際に C# でプログラムを組み、使ってみることにしました。下準備が大変かと思ったのですが、さすがに公式ページで紹介されているだけあって...
  • Blog Post: Microsoft Expression Blend - 違いのわかる・・・ Blend

    Tech Ed もいよいよ来週にせまり MVP チームも大忙しの毎日です。 MVP リードは審査中ということで大忙しです^^ さて Tech Ed といえば最新の製品やテクノロジの動向に関する多くのセッションに参加できますが、スペシャルプログラムの Birds of a Feather in Yokohama, Usergroup Street Live! など MVP さんやコミュニティメンバーによるプログラムも実施されます。 原水のコミュニティ通信でもご紹介しておりますが、今回の Tech Ed では日本の MVP プログラム 5 周年記念冊子もお配りしておりますので...
  • Blog Post: Log Parser のチャート出力とテンプレート出力

    @IT Windows Server Insider に第二回目の Log Parser の記事が公開されています。特にテンプレート出力は HTML への加工を自動化できるのでバッチ処理で走らせれば Web サイト上で月次で統計情報などを確認できるページを公開できるようになるのではと思います。(あまりサイトトラフィック公開している事例はないかもしれませんが) 多彩なLog Parserの出力機能 Log Parser ファンの方はぜひご覧ください! そろそろ PowerShell とかガジェットとか新しい技術との組み合わせなども試していきたいですね・・・
  • Blog Post: Outlook さん、そんなに謝らなくても大丈夫です - OneNote でメモが便利 2

    今日 OneNote 2007 を使っていて気がつきました。 Outlook 2007 で受信メールを開くとリボンに [OneNote に送る ] というボタンがあります。 これをクリックすると OneNote の落書きノートに以下のようなページが自動的に作成されます。 ( 本メールの内容は架空のミーティングの議事録です。横幅調整のため一部の文字が表示されていません ) むむむ。これは便利! マイクロソフトは非常にメールでのコミュニケーションが多く、私は返信するのを忘れないようにメールを開いたままの状態にして、後で返信をすることが多いのです...
  • Blog Post: OneNote でメモが便利

    Office 2007 が RTM されたこともありますので、ちょっと Office の話を。 今ブログのネタ帳として OneNote を使っています。 使ってみるといろいろと便利な機能があるのですが、一番のお気に入りはズバリ! Web のスクラップ作成機能 ( 正式名称知らないのでした^^; ) これは例えばある Web ページの画像や文言をコピーすると参照元の URL も自動でコピーしてくれる機能です。 ペーストするとこんな感じです。(詳しくはリンク先をご覧ください) 貼り付け元 < http://www.microsoft...
  • Blog Post: Log Parser の記事紹介

    青木さん (MVP for Visual Developer - Slutions Architect) の記事はすでにご存じかと思いますが Log Parserでログを統合的に扱い運用保守に役立てる(基本編) Log Parserでログを統合的に扱い運用保守に役立てる(実践編) 先週、私の記事が公開されましたので宣伝させていただきます^^ 第 1 回 Log Parser の概要 最近では Visual Log Parser というツールも出てきてますます盛り上がっているようで Log Parser ファンとしてもうれしいかぎりです。皆さんもぜひ Log...
Page 1 of 1 (11 items)