SEO的に見た選挙におけるひらがな表記

現在参議院に関係するプロジェクトにかかわっているのですが、候補者のデータベースを作っていると、通称としてひらがなで氏名表記をしている人が多く見られます。

データベースを作る側から見ると何が面倒かっていうと表記ゆれ。
漢字の名前と両方が置いてあったりするとどっちを登録すればいいのか迷います。

んで、SEO的にこういうのはどうなのよって話。

表記ゆれがあるってのは、SEO的にはあまりよろしくないのですが、それよりも形態素解析をするときに誤爆をする可能性があることのほうが問題かなと思います。

GoogleYahoo!クラスの検索エンジンだと形態素解析エンジンも賢いし、N-gramでもインデックスを付けているようなのであまり問題にならないかもしれないのですが、簡単に全文検索エンジンを作ろうと思ったらLuceneとかSennaとか使うわけで、IPAの辞書とMecab形態素解析をすることになります。その場合、ひらがなが連続していると、たまに副詞や助詞に間違われることがあるわけです。

ひらがなにすると人間には分かりやすくなるかもしれませんが、機械的にはどうよって話でした。