今日もガクリ('A`)
きっと明日もまたガクリ?('A`)
2011 / 01
« «  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31  » »
archive for 2011年01月
Badware サイト的なサイトを検索エンジンの検索結果から消えてもらう

Badware サイト的なサイトというのは、私にとってはそう見えるからこのような表現をしています。これはどのような意味かと言いますと、インターネット上(特に WWW で) で配布されているオンラインソフトウェアを作者に無断で転載し、また、オリジナルの配布形態を改竄して、ダウンロードできるようなサイトの事です。特に最近、この種のサイトの検索結果が本家本元サイトより上位に来るようになってウザイ事この上ないので、では、その種の検索結果を抹消してしまおうというものです

実態調査

Google 検索結果 1
Google 検索結果 1

では、先ずは、実態調査です。比較的メジャーなオンラインソフト CPU-Z を Google で検索して見ます。ウェブ全体から検索 での結果だと、上位 3位が本家本元サイトとなっていますが、赤い枠で囲まれたのが件の問題のサイトです。つまり、私のブラウザ表示領域での検索結果表示で、まともなのが、上位 3つの本家本元サイトと、インプレスの窓の杜のレビュー記事だけという事になります


Google 検索結果 2
Google 検索結果 1

では、今度は日本語のページを検索にて検索して見まし…た…が…('A`) この検索結果は酷いですな。本家本元サイトがひとつも表示されていません。最悪な事に最悪なサイトが検索上位 3位を占めるという結果になっています


Badware 配布サイト
Badware 配布サイト

では、この Badware サイト的なサイトとはどんな所なのか覗いて見ましょう。前述の検索結果で必ず出ていた brothersoft.jp ドメイン名から構成されるこのサイトを覗いて見ましょう。どんな所なのか、詳細を知るために Adblock PlusNoScript は切った状態で閲覧して見ました…

左右両端に表示されているスクロールしてもくっついてくる広告がウザ過ぎます。右側のナビゲーション部分を見ると、色んなソフトを無断配布している様がわかります。しかも、ここのアドレスが http://cpu-z.brothersoft.jp/ と、サブドメインにソフトウェア名を使用し、いかにも本家を装っている所がずる賢いですな


まぁ、結果は大体わかってますが、ダウンロードリンク をクリックして見ましょう…

Badware のダウンロードを試みる
Badware のダウンロードを試みる

はい。アウトです。とっととキャンセルします。さて、ここまででわかった事を纏めてみましょう

  • サブドメインを使用して、本家っぽく装っている
  • やたらと、広告が多い
  • いかにも、どこかの団体が、作者の許可を得て、ソフトウェアを配布しているサイトのように見えるデザイン
  • バージョン番号、リリースした日付、配布するファイルのハッシュ情報 1 等の記載がない
  • 上記のダウンロードダイアログウィンドウからもわかるように、オリジナルの配布形態を改竄している 2

対策

手っ取り早いのが、検索語にそのサイトを覗くキーワードを加えてやればいいのですが…

cpu-z -site:brothersoft.jp

こうする事によって、Google 等の検索エンジンが検索語からどれだけのサイトが除外(嫌われている) されているのか、わかるので、多くの人がこのサイト除外部分を検索語に入れる事によって、検索結果の順位も変わってくるだろうと予想しています。しかし、これでは、検索エンジンサイトの対応待ちとなるので、私のように必要な情報だけを素早く欲しい場合には向きません。また、この様なサイトは 1つや 2つだけじゃないので、その度に検索語に追加していかなければなりません


フィッシングサイトの報告
フィッシングサイトの報告

まぁ、これも即応的なものじゃないのですが、Firefox のヘルプ→偽装サイトを報告で報告してみるのも一つの手段ですね。配布形態を改竄している時点で偽装と言われても致し方ないでしょう 3

さて、ようやく、ここからが本題なんですが…前述した対策が根本的な解決に近いかもしれないが、時間が掛かり、解決できるのか不確定なので、即応的な対処で行こうと思います。つまり…検索結果は受信してしまうけど、ブラウザで非表示にしてしまおうという事です

ここで、登場するのが、私が普段常用している Proxomitron です


と、言う訳で手っ取り早くProxomitron のフィルターです

[Patterns]
Name = "Google | IgnoreList SearchResult"
Active = TRUE
Multi = TRUE
URL = "[^/]++.google.[^/]++/"
Limit = 4096
Match = "<!--m--><li class=$AV(g * w0) * > * <a * href=$AV(*$LST(BadWare)*) * <!--n-->"
        "$SET(0=<!-- Kill BadWare -->)"
Replace = "\0"
[Patterns]
Name = "search.goo.ne.jp"
Active = TRUE
Multi = TRUE
URL = "[^/]++search.goo.ne.jp"
Limit = 5120
Match = "<div class=$AV(res) > <a href=$AV(*$LST(BadWare)*) * > $NEST(<div*>,</div>) * </div>"
        "$SET(0=<!-- Kill BadWare -->)"
Replace = "\0"

フィルターの中で参照している BadWare リストを作ります。取り敢えず、この位入れて置く

#
# BadWare site
#
updatestar.com
japanese.trailsframework.org
++brothersoft.(jp|com)
all-freesoft.net
altech-ads.com
cowscorpion.com
filehippo.com
downpanda.com
dll-download-system.com
dll-files.com
softpicks.net
dll-download-jp.com
dlldump.com
seesaa.net
afterdawn.com

結果

Google 検索結果 3
Google 検索結果 3

ウェブ全体から検索 の結果です。すっきりしましたね


Google 検索結果 4
Google 検索結果 4

日本語のページを検索 の結果です。考えて見れば、日本語のページを検索 なので、ここに本家本元の検索結果が出ることはおかしいんですよね…それは、それとして、奇麗な検索結果となりました

参照


  1. 最近は徐々に増えてきましたが、配布ファイルのハッシュ情報を記載する人はまだまだですね
  2. この様に配布形式を改竄、しかも、実行ファイル形式なので、このファイルを実行するにはリスク覚悟になるでしょう
  3. 配布形式が、アーカイブから、実行形式に改竄されている時点で偽装と言ってもいいでしょう。この実行形式ファイルを実行するにはリスクが伴うし、そんなリスクを侵してまで改竄されているのかどうかの確認は不要でしょう

更新履歴

日付内容
2011/02/13 (日)
  • Badware サイトリスト更新
 
  • Proxomitron フィルターの goo バージョンの所で Replace が抜けていました
internet, PC, softwareno commentsno trackbacks(5,070)
contents
most viewed (1183835)
categories
archives
recent posts
recent updates
recent comments
recent trackbacks
912T ASUSTeK ASUSTeK Crosshair IV Extreme blog CSS DARK SOULS DARK SOULS 3 Darksouls3 DarksoulsIII DARK SOULS III DISM Euro Truck Simulator 2 Everquest II firefox foobar2000 game Install internet KB2990941 KB3087873 mod panels ui PCゲーム PHP PX-Q3PE Raid skin SoftBank software SpeedFan Spinel Steam TPS trailer truck TvRock TVTest Windows Windows 7 Win Toolkit WordPress インストール ダークソウルズ 初音ミク 窓辺ななみ
mobile
qrcode:home
profile
曇り札幌市中央区 ‘ 曇り
気温: 10℃ ‘ 湿度: 66%
recommends
Valid XHTML 1.0 Transitional Valid CSS X.X
RSS 2.0 RSS 0.92
RDF/RSS ATOM
get Firefox 2 get Opera
ie