Google Adsenseの導入

銀行口座の登録がまだ完了していないのですが、一応導入できました。
以下のGIGAZINEの記事が参考になりました。

Google AdSenseの始め方 その1「審査を突破する」 - GIGAZINE
Google AdSenseの始め方 その2「広告を最適化する」 - GIGAZINE

何度か審査で落とされたが、審査のポイント3の「連絡先の表示」が原因だったみたいです。
その2の記事で、続きますみたいなことを書いてるんですが、その3の記事はないようです。

動的なページに貼り付けたところ最初は公共広告ばかりでしたが、一度表示して10分もするとちゃんと関連のある広告が出るようになりました。

しかし、英語の広告ばかりでした。
ググったところ、以下のような記事が見つかったので、
Webdog - Online

<script type="text/javascript"><!--
google_ad_client = "hogehoge";
google_ad_width = 728;
.
.
.
-->
</script>

<script type="text/javascript"><!--
google_language = 'ja';
google_ad_client = "hogehoge";
google_ad_width = 728;
.
.
.
-->
</script>

と追加したら日本の広告が出るようになりました。

AdSense コードを変更しないでください。」って書いてあったのですが、XHTML的には

<script>
<!--
.
.
.
-->
</script>

のような書き方はできないので、外部ファイルで参照できるようにしてもらえるとありがたいです。

個人的に気になったのは、「競合となる広告とサービス」を一緒に置いたら駄目だというところ。
Amazonおまかせリンク」のようなものもだめなのかな?
どのあたりまでが大丈夫なのかわかりませんが、アドセンスと一緒にいろいろ広告を置いているブログも多いので気になるところです。

結局どうやって全文を取得するかだと思うんだが

RSS全文配信推進派の人達が、はてなブックマークのRSSが部分配信な事に文句を言わないのはどうしてなんだろう。
http://awasete.oshira.se/経由
上記の記事では著作権的な視点から、はてなブックマークが全文配信をしない理由を推測されています。
ここで書いてあるような理由もあると思いますが、はてブの全文配信で問題なのはむしろ、どうやってはてブされた記事から記事の本文を抽出するかということではないでしょうか。


多くのサイトでは、本文があるところ以外にも、サイドバーに広告などを載せています。
検索エンジンが検索精度を上げるためには、いかに余分な部分を削って本文を抽出するかが重要になってきます。
本文の推定には、RSSなどを利用できますが、基本的にヒューリスティックなルールを取り入れていくしかありません。
ブログの本文の推測は比較的簡単ですが、世の中にはひどいHTMLを書く人もいるので油断はできません。


はてブの人気エントリのRSSのdescriptionを眺めてみると、はてながどういう方法をとっているのかわかりませんが、大部分がうまく本文を取れているようです。しかし、失敗しているものもいくつかあります。
また、先頭から途中までしか表示されていないので、うまく本文の終了まで取れているのかはここからだけでは推測できません。


ということで、もしはてなブックマークが全文を配信しようと思ってもちゃんと全文が取れない可能性があるということになります。
そういった意味で、元から記事の本文を持っているブログの全文配信の話と同じに考えるのはどうかな?と感じました。
まあ今ぐらいの精度があれば、少々誤爆してようが気にならない程度かもしれませんが。

参考:
ブログの記事本文を抽出するスクリプトをつくってみた