意見分析エンジン―計算言語学と社会学の接点

意見分析エンジン―計算言語学と社会学の接点
大塚 裕子 乾 孝司 奥村 学
コロナ社
売り上げランキング: 46467


意見分析エンジンというと真っ先に思いつくのが、今はもう終了してしまったブログウォッチャーやgooブログ検索Yahooブログ検索などの、ポジティブ・ネガティブな記事の割合やどのようなキーワードでそう判断したのかといった情報を表示してくれる機能です。
アンケートなどの自由作文などで自動的に意見抽出しようという試みは結構前からありましたが、感想や意見が多く書き込まれるブログの普及に伴って、研究・ビジネスの両方で一気に注目が高まっています。ただ、Webで提供されているレベルだと一部を除いて、すごく高度なことをしてるわけでもないので、どのくらい実用で使えるのかは疑問ですが、逆に少し勉強すれば簡単なものならなんとなく作り方がわかると思います。
本書は、評判・意見を分析するための仕組みについて、技術論だけでなく、社会学的な視点からも語られているのが特徴です。工学よりの視点だと技術ありきで考えてしまうので、それが社会的にどういうニーズやメリットがあるのか、ということでバランスを取ることが重要です。

個人的に面白かった章

意見分析へのニーズと背景(1章)

本論に入る前に、意見とはなんぞ?という内容を取り扱っています。
また、問題をシンプルにすることが意見分析の出発点になっているけれども、それを当たり前として捉えているようになったら問題であるとしています。これは自分でも反省すべきところで、SNSを例にとって考えると、その仕組みは現実世界の人間関係を誰かがモデル化した結果生まれたもののはずで、それを当たり前のものとして捉えるようになったら革新的なサービスを思いつくことができなくなります。
また、裁判員制度などの市民参加においても意見分析の仕組みが必要になってくるとしています。

意見分析エンジンの要素技術(4章)

約40ページぐらいが意見分析に使われる技術の簡単な内容です。なので、研究などで評判分析をやっている人が見ると知っている内容ばかりだと思います。
しかし、機械学習、文書分類、特徴ベクトルの抽出、評価語辞書の作り方、そして評価分析の手法と一通りまとまっているので、ちょっとこの分野に興味があるけどまず何からはじめればいいかわからないという人にはちょうどいい内容だと思います。
また、課題として、よいか悪いかの2極化をさけるための中立クラスや、「買ってすぐに動かなくなった」のような明示的でない評判について取り上げています。

テキストマイニングの勉強したい人なら

一読の価値はあるのではないかと思います。