ざーX日記  投稿
ざーX日記
1投稿者:上武梨太郎  投稿日:2007年10月27日(土) 12:26:53
スクリプトをいじった記録など。

715上武梨太郎 2010/10/26(火) 23:07:42
Googleのサイト内検索が今イチ有効に働いていないような気がして、
それはなぜかと考えたら、全てのスレッドを
ロボットが拾える状態になっていないからだと考えた。
そこで、スレッド1000に加えてスレッド全部を作ろうと思った。
新しいスレッドは板上の最新スレッドとかスレッド1000から容易に拾えるので、
その更新は一日一度程度で充分だと思った(週一でもいいぐらいかも)。
多少負荷がかかるだろうから、深夜に自動で更新出来るといいと思った。
それでcron。
んで、スクリプト出来たので、最下層付近のスレを改めて検索してみると、
これが予想に反して結構ヒットする。
昔のデータをGoogle側で保持しているようだ。
また無駄なものを作ってしまったのかと思ったが、ヒットしない物もある。
そこで実験。
これがスレッド全部へのリンク(2.49MBあります重いです)
http://amezor-x.net/kalobby/all.html
実験対象ワード
"買う方も相当なアホだとは思うけどさ"
http://www.google.co.jp/search?q=%22%94%83%82%A4%95%FB%82%E0%91%8A%93%96%82%C8%83A%83z%82%BE%82%C6%82%CD%8Ev%82%A4%82%AF%82%C7%82%B3%22
近日中にこのワードがGoogleでヒットするようになれば、スレッド全部は有効、
ヒットしないようならスレッド全部は無駄なもの。
さて。

716上武梨太郎 2010/10/26(火) 23:08:53
考えたら〜考えた、とか、変な日本語

717ヾ(゚д゚)ノ゛ニッキー 2010/10/27(水) 00:20:49
cronは何時頃に動作させてますか?

718上武梨太郎 2010/10/27(水) 00:33:09
まだ、「スレッド全部」が意味のあることなのかがわからないので、
導入はしていませんが、
導入するときは、夜中の3時〜5時あたりにしようと思っています。

719ヾ(゚д゚)ノ゛ニッキー 2010/10/28(木) 19:24:37
いわゆる廃人タイムですね。良いと思います。

720上武梨太郎 2010/10/28(木) 20:22:22
なんか、all.htmlそのものは読みに来てくれてるんだけど、
それ以上を読み取ってくれてないっぽい。
ううむ

721上武梨太郎 2010/10/30(土) 17:54:36
階層が問題なのかな?と思って、試しにトップページにallへのリンクを貼ってみた。

722上武梨太郎 2010/11/02(火) 23:11:21
だめですねどうも。全然拾われる様子がない。
と言うか、ヤフーではこのスレが拾われてるのに、
グーグルではそれすら拾われてないのはなぜ。

723ヾ(゚д゚)ノ゛ニッキー 2010/11/03(水) 20:47:48
謎ですねえ。

724ヾ(゚д゚)ノ゛ニッキー 2010/11/03(水) 21:37:18
2010年5月検索文字列ランキング
1 929 11.96% カロビー x
2 173 2.23% 獣姦
3 142 1.83% ニロビーx
4 134 1.73% 加藤真輝子
5 84 1.08% カロビーx
6 81 1.04% カロビー
7 62 0.80% tube8
8 48 0.62% 無縦正 画像
9 45 0.58% 亀頭攻め
10 35 0.45% ヌードになった芸能人
11 32 0.41% 女子高生 太もも
12 30 0.39% 外字警察
13 30 0.39% 今すぐ最新flashをインストール! このコンテンツを聴いたり見るには、最新版のflashplayerが必要です。
14 27 0.35% 堀之内 チョンの間
15 26 0.33% カロビx
16 25 0.32% 女子高生のふともも
17 22 0.28% おばちゃんとセックス
18 22 0.28% 資本欠損 債務超過
19 19 0.24% トロtube
20 18 0.23% flashutil10b.exe エントリポイントが見つかりません

スレ一覧   レス全部   前の10個   次の10個
投稿者

メール