データの視点から見たWebサービスの種類

データの視点から見ると、Webサービスは大きく2種類に分けることができます。
1つ目が、ユーザがコンテンツを追加していくサービス。SNSSBMWikipediaのようなサービスが代表的な例になると思います。サービス開始当初はデータがなくても問題ありません。
2つ目は、大量のコンテンツを元にユーザに情報を提供するサービス。GoogleYahoo!のような検索エンジンbuzztterKizasiがあげられます。サービス開始の前にある程度のデータの蓄積が必要になります。

ユーザ追加型サービス

こちらほうが一般的によく作られるWebサービスです。アイデアさえあれば、作ることができるので、初期投資をそれほど必要せず、企業や個人でもこういったサービスを公開している事例は少なくありません。
基本的にユーザに集まる場を提供するサービスなので、人が集まらなければサービスとして機能しませんので、いかに人を集めるプロモーションができるかが成功の肝となります。
ニコニコ動画TwitterMixiぐらいアクセスがあるとどうやってスケーラビリティを確保するかが重要になってきますが、普通は最初からサーバが落ちるほどのアクセスがあることは滅多にないので、ユーザの増加にあわせて対策をしていけばよいのではないかと思います。

事前収集型サービス

研究開発の成果によって実現されたサービスが多いです。
データを加工したり、検索したりするためには、まずデータの確保が必要になります。そのため、自社で前者のサービスをやっていてデータを持っている企業以外は、最初にWeb上をクローリングしたり、集めた大量のデータを保持するためのストレージが必要になるので、多くの初期投資が必要になってきます。
また、テキストマイニング、情報検索などの技術や現実的にサービスとして公開できる速度で処理を行うようにする必要があるので開発にも時間がかかります。
注意すべき点としては、一発芸のようなサービスになってしまう可能性があることがあげられます。研究開発ベースなのでニーズよりもシーズよりなアイデアが多く、そのためリリース当初は注目されても長期的に使われないサービスが多いように感じます。

事前収集型サービスを促進するWeb API

去年当たりからWeb APIが注目されるようになり、事前収集型サービスのネックであった大規模データの問題が、マッシュアップという形で解決されるようになりました。
少し凝ったことをしようと思うと、やはり自分でデータを蓄積する必要が出てきますが、Web APIRSSのようなXMLの形で情報を提供してくれるので、以前に比べると情報の収集が容易になりました。そのため、以前は時間をかけて集めていたデータが、すこしプログラムをかじったことのある人ならば簡単に収集できるようになり、Webの研究の分野においては研究者とそれ以外の人を隔てる障壁が少し低くなったように思います。

終わりに

事前収集型サービスのもう一つのネックは、データを蓄積してWebサービスに利用することが著作権法上問題になる可能性があるということです。国内検索エンジンを作っても今の著作権法だと使えないので改正する必要があるという話もありますし、GoogleYahoo!大手の検索エンジンのサーバは日本には置いていません(厳密には海外にサーバを置いていても問題があるようですが)。
最近リリースされたサービスでもいくつかWeb上のデータを蓄積するタイプのものがありますが、海外にサーバを確保するのはコストがかかるので、対策はしていないのではないかと思います。リスクがあることを念頭にサービスを公開する必要がありますが、こんなことを開発するときに悩みたくないので、ぜひ著作権法を改正してほしいものです。