という訳で本題。
昨日、部屋に戻ってくるとき、ついでに佐藤くんに聞いたんだけど、やっぱ、(参照)共起してる場所の距離を有効に表現でき、かつ、現実的に計算可能な尺度っていうのは、難しいのかなぁ。
これは単に、キーワードをandで喰わせた時すんげえ離れた所でマッチしたページが当たるのがウザイ(を、Googlewhackだ)問題に対応するためだけではなく、いわゆるひとつの、木實さんがpp-mlで言ってた『Tommy february6の"everyday at the bus stop"の00分30秒-00分50秒あたりってNew Orderの某曲に似てますよね。…、曲名が思い出せないので…』ってサーチしても簡単には分からないですよね問題は、誰かかどこかで『"bizarre love triangle"にクリソツー、でもそれってfrente!のカバーでしょ?』って書いていれば発見出来るんじゃん?手法に繋がるのではないか、という思いがずっとあるのだけど(お前はこのネタ1年も温めていたんか :-)、何とかなんないもんかね。
Googleもそこら辺、イマ3だよな。イマ3とはいえ、Googleツールバーなしでは最早生きていけない体になりつつあるし、最近は、Googleを以て常識と為す、感がますます増加してるし。
ということで、Googleで驚いた私の常識/非常識:
うう、リンク張り、疲れた。ちょっと遊び過ぎ…
つーことで更に話は飛躍するが、Google、というか、検索エンジンだ。検索エンジンは基本的にはtext searchをするものだ。しかしtext searchは破綻するものではなかったのか? scaleしないものである筈ではなかったのか? Hypertextが世界を征する筈だったのに、なぜtext searchが人類を支配しているのだ? (.*DBは何も制覇してないけどね、へへ :-b)
とはいえ、そもそもPageRankの有効性(実のところは解らないけど)が一例を示しているように、Hyperlinkこそが現在のtext searchの有用性の鍵であるようにも見える。軒先貸して母屋を取られる? そんな単純な話ではないよな。もうちょっと考えよ、っと。
ということで話を戻すと、単語の共起なのか参照の共起なのかという問題も深そうで、結局よーわからん、となって現在に至る、みたいな。
さて、「表題」も2002年9月6日の時点では存在しないけど、果たして…
[index]