パクリサイト対策

リライトサイトについて

お気づきの方もいらっしゃるかもしれませんが、
当サイトのパクリサイトが存在します
パクリサイトにはご注意ください
何がって、パクリサイトの内容には間違いが多いからです。

検索エンジンも日々進化しているので、
丸々コピーしたようなページは、ほとんど検索結果に表示されなくなりました。
問題は、リライト、つまり書き直したページです。
WELQで問題になったように、他からパクった記事をリライトしてSEOを頑張れば、
現時点(2017年11月)では検索結果上位に表示できてしまうのです。
※参考: DeNAリライトマニュアルの巧妙すぎる手法 - 東洋経済オンライン

リライト自体が問題なのではなく、著作権侵害を回避する目的でリライトしていることが問題
それって何の価値も生みませんし、ただの脱法行為だと思うんですけど。

「マネはするな。マネされるぐらいのものを作らないといけない。」
井村屋創業者の井村二郎さんの言葉ですが、色々と考えさせられます。

パクリサイトの見つけ方

パクリサイトを見つけるには、自分から能動的に見つけに行く方法と、
受動的だけど結果として見つかる方法とがあります。

Google検索には、類似ページを検索する機能があります。
やり方は、「related:」に続けて、検索対象のURLを入力します。
※検索結果ページで、プルダウンメニューから「類似ページ」をクリックした状態と同じ。
たとえば、

related:https://pctrouble.net

と入力して検索すると、当サイトのトップページに似たページが列挙されます。

注意点として、ページ単位の類似性です。
サイト(ドメイン)単位ではありません
各ページの類似ページを調べるには、それぞれのページのURLを入力して検索します。

また、あくまでもGoogleが似ていると判定したページが表示されるだけです。
ほとんどは真っ当に運営されているサイトだと思いますが、
リライトしたパクリサイトがあれば、大体この方法で見つかります。

ユーザーからの連絡

個人的には、ユーザーからの連絡でパクリサイトの存在を知ることが多いです。
掲示板やメールで、身に覚えのないことを指摘されるのです。
「そんなこと書いたっけなぁ」と思って、
指摘されたフレーズで検索すると、パクリサイトが見つかるという。

パクリサイトも丸パクリでは明らかな著作権侵害になるので、リライトしなければなりません。
自分の言葉で書き直す必要があるわけですが、
もともと自分の考えではないので、内容の本質を理解していません。
知ったかぶりして書いてるので、非常に間違いが多いです。
お客さん相手にしてたら、クレームになるレベル。

ユーザーは、最も適切な回答をくれそうな所に質問します
結果的に、パクリサイトの内容を読んで誤解した人が、当サイトに質問や意見を寄せてくるのです。

パクリサイトに関する情報は、自然と元ネタサイトに集まってきます。
これは、パクリサイト運営者にはわからないことだと思います。
これらの情報を得るためにも、お問い合わせフォーム等、
ユーザーからのフィードバックを受ける仕組みを用意しておいたほうがいいと思います。

「Fetch as Google」を使う

パクリサイトは、ネタ元サイトの状況を監視し、
更新があったらすぐさまパクリコンテンツを追加する傾向があります。
要は、ほぼ同時期に公開することで、どちらがオリジナルかわかりにくくするわけです。

パクリサイトのターゲットにされているのが明らかな場合は、
サイトを更新すると同時に「Fetch as Google」で「取得」すべきです。
「Fetch as Google」は、Googleの「Search Console」の機能で、
強制的にGoogleにクロールしてもらうものです。

手順としては、

  1. Search Console」にアクセス
  2. 対象のドメインを選択
  3. クロール > 「Fetch as Google」を選択
  4. 対象URLを入力して「取得」

で、Googleにクロールされます。
「取得してレンダリング」というのもありますが、
ここではGoogleに更新したことを伝えるのが主目的なので、割愛します。

また、新規ページの追加でまだインデックスに登録されていない(検索結果に表示されない)場合は、
続けて「インデックス登録をリクエスト」をクリックすると、
Googleにインデックスへの登録を要求できます。
ただし、文字通りリクエストなので、
Googleに対してこちらの要望を伝えるだけで、実際にインデックスされるかどうかは別問題です。
インデックスに登録された場合は、ただちに検索結果に反映されます。

こちらが先に公開したコンテンツであることを、Googleにはっきり伝えることが重要です。
そうすれば、Googleもオリジナルを判断しやすくなります。

魚拓を取る

パクられた証拠を残しておくために、Web魚拓を利用します。
特に、コンテンツをパクる人は、何度も繰り返しパクり続ける傾向にあります
自分ではコンテンツを作れないからパクってるわけで。

二度あることは三度あるので、複数回パクっているサイトがあれば、都度Web魚拓で保存します。
特に、こちらが新規ページを公開した後にパクリサイトがパクリページを追加という時系列が重要なので、
自サイトの状況とあわせて保存します。
つまり、

  1. 新規ページ公開と同時に自サイトの魚拓を取る
  2. 直後にパクリサイト関連ページの魚拓を取る ※類似コンテンツがこの時点で存在しないことの証明。
  3. パクリコンテンツが追加されれば、それの魚拓を取る

ということ。

幸い、パクリサイトは新規追加ページが大好きです。
パクリサイトにとってのエサだからです。
私が新規コンテンツを追加して、数日後にはパクリページができあがってたりします。
従って、時系列を追ってWeb魚拓に保存していくだけで、コンテンツをパクっている証拠を残せます。

以下、主たるWeb魚拓サービスを挙げます。

archive.is

基本的には、このWebサービスを利用しておけばいいと思います。
URLを入力して、魚拓の保存と、魚拓の検索ができます。
海外のサイトですが、だからこそ削除されにくいです。

ただし、まれに不安定で魚拓を保存できないことがあります。(キューに入れられたままになってしまう)
動いてさえいれば、非常に便利な魚拓サービスです。

ウェブ魚拓

日本のWeb魚拓サービス。
「archive.is」よりも動作が安定していると思います。
ただし、比較的削除されやすいみたいです。

有料で非公開の魚拓を保存できます。
有料サービスでは魚拓の魚拓を保存できるので、
過去に取った魚拓を非公開魚拓で保存しておけば、削除の心配はありません。

魚拓を取ったら、そのスクリーンショットをローカルにも保存しておくといいです。
Web魚拓のサイトが常にアクセスできるとも限らないので。

Googleに通報する

現在のWeb検索は、Googleがすべてといっても過言ではありません。
パクったコンテンツで検索結果上位表示を狙うというのは、Webスパムでしかないので、
Googleに報告すれば、それなりの対応をしてくれます。

DMCA侵害の申し立て

パクリサイトの著作権侵害が明らかな場合は、
それをGoogleに申し立て、パクリサイトを検索結果から削除することができます。
Googleに申し立てが承認されると、対象のページは検索結果からすぐさま削除されます
この手続きは、DMCAというアメリカの法律に基づいて行われます。

著作権侵害による削除 - Google Search Console ※要ログイン。

詳細はリンク先をよく読んでください。
注意すべき点はたくさんあります。

まず、すべての申し立てが承認されるわけではありません
丸々コピーした内容なら著作権侵害は明らかですが、
リライトしてあるページはグレーゾーンなので、Googleの判断になります。

従って、何がどう無断転載されているのか、個別具体的に書くことが重要です。
※上記リンク先の例文には「無断で引用」とありますが、「無断転載」のほうが正しい用語と思います。
しかもいつの間にやら、500文字の文字数制限が設けられました。
要点のみ、わかりやすく書くべきです。

文章がリライトしてあっても、大部分の表現が共通していれば、Googleは削除対応してくれます
ただし、DMCA自体がアメリカの法律であり、
判断しているのもアメリカの部署と思われる(英文で返答がくる)ので、
できれば英語で説明したほうがいいです。

また、GoogleにDMCA侵害の申し立てが承認されると、その旨が検索結果に表示されます。
その際、氏名が公開されます
リンクをたどると、なぜ検索結果から削除されたのか、申し立て内容が氏名込みで表示され、
万人が閲覧できるようになっています。
真っ当なことをしていれば、まったく問題ないわけですが。

ただし、DMCA侵害の申し立ては、以下に述べるスパム報告とは異なる手続きなので、
Googleの検索エンジンによるスパム判定を促進させる意味では、
あえてDMCA侵害を申し立てないほうがいい場合があります。
DMCA侵害の申し立てが承認されると、検索結果からは削除されてしまうので、
検索エンジンに対してスパムページの材料を提供できなくなるからです。

スパムレポートの送信

Googleはスパムサイトの撲滅に取り組み続けており、
その一環として、ユーザーからの報告を受け付けています。
Webスパムに関しては、下記フォームから報告できます。

ウェブスパムレポート - Google Search Console ※要ログイン。

ここでも、内容を具体的に書くことが重要です。
指摘したURLが、どういうスパムで、何が問題なのか

ただし、即効性はありません
送信したスパムレポートが反映されたかどうかもわかりません。
スパムレポートの送信は、Googleがアルゴリズムを改善するための材料を提供しているにすぎないからです。
従って、送信されたスパムレポートが本当にスパムなのかどうかはGoogleの判断次第です。

でも、パクリスパムが捕捉されると、同様のページが芋づる式に検出され、検索結果に反映されるので、
DMCA侵害申し立てのように、いちいち個別に対応する必要がなくなります。
本来、こういうのはアルゴリズムで対応すべきことです。

検索結果ページから「フィードバックを送信」

スパムレポートの送信と似ていますが、こちらは検索結果ページから直接送信するものです。
やり方は簡単で、検索結果ページの一番下にある「フィードバックを送信」というリンクをクリックします。
あとは、同様に問題点を記入して送信するだけ。

前述のスパムレポートと違うのは、スパムに限ったものではないのと、
スクリーンショットを含めて送信できること。
検索結果の表示内容がおかしい場合は、具体的にどこがおかしいのかを図示できるのです。

パクリサイトで一番問題になるのが、
オリジナルページよりも、パクリページのほうが上位表示されてしまうことだと思います。
このような場合は、検索結果ページからフィードバックを送信したほうが、具体例を示せます。

どーでもいーはなし

フィードバックの送信は、Web検索に限らず、Googleのサービスで広く使われています。
個人的には、Web検索以外のサービスでGoogleにフィードバックを送信していることのほうが多いです。
自分の提案が反映されたこともあります。

決してお世辞ではなく、Googleはユーザーからのフィードバックによく目を通していると思います。
Googleのサービスが使いやすくなると、結果的に自分も得をするので、
おかしな点、使いにくい点は、どしどしフィードバックを送信したほうがいいと思います。

パクりにくいサイトにする

以上、パクリサイトへの対応策を書いてきましたが、これらは建設的な作業じゃないんですよね。
マイナス方向の対応というか。
正直、疲れます。
個人的にも、同じ時間があったらユーザーの方を向いていたいです。

そこで、自サイトのオリジナリティを高め、パクりにくくする方法を考えます。
これならポジティブな作業ですし、結果的にユーザーに提供する価値も高くなります

サイト名を固有名詞にする

このサイトは当初、「パソコントラブルと自己解決」という名前でした。
「自己解決」ってちょっとおかしな日本語を使ってたのは、
当時その言葉をタイトルに使っているサイトが存在しなかったからです。
サイトの識別子になるだろうと。

ところが、当サイトの知名度が上がり、
「パソコントラブル」の検索で上位表示されるようになると、いろいろと弊害が。(2013~2015年は1位でした。)
「パソコントラブル」で検索した時の候補として、
「パソコントラブル 自己解決」というのが上位表示されるようになったのです。(最終的には1番目に・・・)
すると、このキーワードを狙って、タイトルに「パソコントラブル 自己解決」を含めたサイトが増えだしました。

これで困ったのが、ユーザーに他サイトと混同されるようになったのです。
タイトルの模倣自体は違法でも何でもないですけどね。
でも、違法ではないけど不適切です。
結果として、パクリサイトの尻拭いを私がしなければならない状況になり、
サイト運営に対するモチベーションは一気に低下しました。

いまだに、「パソコントラブル 自己解決」で検索すると、
当サイトが1番目に表示される(2017年11月時点)のは、その時の名残です。
もう「自己解決」とは書いてませんけどね。
今では、「パソコントラブル 自己解決」という検索候補も出てこなくなりました。
つまり、そういうことです。

どのようなサイト名にするかは、サイト運営上とても重要です。
サイト名には、大きく分けて2通りあります。

  • キーワードを重視した普通名詞の組み合わせ
  • オリジナリティを重視した固有名詞

それぞれ一長一短あります。

検索からの流入は、普通名詞を使ったサイト名のほうが多くなります
当然です。
SEOを考えると、ユーザーが検索で使う普通名詞をサイト名に入れたほうがいいです。
当サイトでも、サイト名を変更した時に、アクセスが約2割減少しました。

それでも、パクリサイトと区別したいのであれば、サイト名を固有名詞にすべきです。
SEOだけ考えてサイト名を決めると、みんな似たり寄ったりになっちゃうんですよね。
実際、自分が検索していても、どこのサイトを見てるのかわからないことが多いですから。

必要であれば、商標登録もしたほうがいいです。
普通名詞の組み合わせは商標として登録されにくいので、この点でも固有名詞のほうが有利です。
登録商標であれば、サイト名をパクられたとしても、容易に差止請求できます。

実務経験に基づくコンテンツを作る

「自分の経験」というだけじゃ弱いです。
誰でもそう言えますから。
「実務経験」であることが重要
アマチュアよりも、プロの話を聞きたいからです。
どういう仕事をして、その中でどういう経験をしてきたのか。

間違いなく、パクリサイトの運営者には、実務経験がありません
自分の中に引き出しがないから、パクってくるしかないわけで。

パソコンの修理サポートは、決してカッコいい仕事ではありません。
はっきり言って、修理業はクレーム産業です。

ちょっと考えてもらえればわかると思います。
買い物に来るお客さんは、比較的上機嫌なことも多いです。
一方、修理品を持ち込むお客さんは、来店したときから半分キレてたりします。
お客さんの気持ち的に、マイナスからのスタートなんです。
だからこそ、お客さんに鍛えられます

私は、すべてを文章にすることはできないと思っています。
言葉にするときに、多くの情報は捨てられます。
最適な言葉を選んではみるけど、自分が思っているそのものじゃない。

つまり、サイト上に書いてあるのは氷山の一角なんです。
表現できなかったり、書く必要がないと判断した部分は、すっぱり切り落とされています。
でも、そういう見えない礎は絶対必要だと思うんですよ。

パクリサイトの文章は、どうしてもハリボテになります。
見えない部分はパクれないからです。
どこかに書いてあることをなぞってるだけ。
ある程度わかってる人には、判別できると思います。

個人的には、お客さんを相手にしているという感覚は変わってなくて、
場所が店からWeb上に移っただけと捉えています。
お客さんと向き合った経験がなければ、お客さんが求めているものはわからないと思います。
無理難題を言われたこともありますけど、それらも含めて、すべてはお客さんが教えてくれたものです。

他人と同じ人生を歩んできた人はいません
同じテーマを扱うにしても、人の数だけ違う見方があるはずです。
人それぞれバックグラウンドが違うからです。
独自の見方ができないとしたら、それは苦労してきてないからだと思います。

ユーザーとコミュニケーションをとる

ユーザーとのコミュニケーションはとても大切です。
店で働いてた頃は目の前にお客さんがいましたが、
Web上では相手の顔が見えないので、ひとりよがりになってしまいがちです。
ユーザーからの反応は、それらをいましめ、サイト運営の指針となり得るものです。

当サイトでは、主に掲示板でユーザーとのコミュニケーションをとっていますが、
SNSでも、コメント欄でも、何でもいいです。
とにかく、ユーザーとの意志疎通ができれば。
ただし、それぞれ一長一短あるので、
サイトの目的に適した手段を選んで提供することが、サイト運営者の役割だと思います。

しかも、ただ開設するだけでは意味がなく、情報交換の場として機能させることが重要です。
ここが、本物と偽物の差がつくところです。

やってみるとわかりますが、フォーラムの運営は、実際の経験がないとできません
一般的な内容ならネットで調べられるかもしれませんが、それでは個別の事案に対応できないからです。
そもそも、検索しても情報が見つからないから、質問してきているわけで。
どれだけ現場で揉まれてきたかが試されます。

情報のある所に情報は集まります
ユーザーが求める情報って、ユーザーから直接聞かれたもの以上のものはないと思うわけです。
それがかつては店頭や客先であり、今はこのサイトを通じて得られた情報が、
サイトを運営していくうえでの原動力になっています。

パクリサイトかどうかはユーザーも判断している

結局、私が言いたかったことはこれに尽きます。
パクリサイトかどうかは、ユーザーも判断しています
だからこそ、パクリサイトの情報を元ネタサイトに問い合わせてくる人がいるのです。

パクリサイトに特に敏感なのは、サイト運営者です。
既存のWeb上にないコンテンツを提供する、優良なサイトほど、
パクリサイトの被害にあいやすい運命にあります。
従って、優れたサイト運営者ほど、リンク先サイトの信憑性を気にします。
そのサイトが一次情報かどうか。
間違ってパクリサイトにリンクを張ると、自サイトの信用を失うことにもつながりかねません。

これは、SNSでも同じことが言えます。
SNSで紹介したコンテンツは、間接的にその人の人となりを表します。
コンテンツ制作者ほどではないにしろ、コンテンツの信頼性を担保しているのは事実です。

やっぱり、最終的に判断しているのは人なんです。
リンクもソーシャルブックマークも、元ネタサイトに集まります
だから、サイト運営者はパクリサイトを気にせずに更新を続けたほうがいいと思います。

パクリサイトを気にするなと言われても、それが心情的に難しいのはわかります。
でも、パクリサイトに個別に対応していても、
モグラ叩きみたいなもんで、きりがないんです。
Googleのアルゴリズムが対応するのを待ったほうがいいと思います。
長期的に見れば、パクリサイトが取り締まられていくのは必然です。

偽物なのに本物のふりをするのがパクリサイトの本質なので、
パクリサイトはユーザーに迷惑をかけています
ここは、パクリサイトを相手にするのではなく、ユーザーを味方につけるべきです。
ユーザーのためになるコンテンツを提供する方向に注力したほうが、サイト運営者としても楽しいはずですから。

サイト上で告知する

パクられるサイトというのは、そこそこアクセスがあるはずなので、
目につく場所にパクリサイト対策を書いておくといいです。
パクリサイトへの対処法をサイト上に書き、それらを実行します。
すると、その記事自体がパクリサイト対策になります

注意点は、感情的になって、相手を特定して個人攻撃をしないこと。
名誉毀損とか、そういう話になってきますから。
あくまでも、パクリサイトへの対処法を書く。

パクリサイト対策に関してサイトの知名度が上がれば、なお効果的です。
「パクリサイト対策」で検索するのは、パクリサイトに困っている人、
つまり優良サイトの運営者
だからです。
私としても、Web上にない情報を公開するサイト運営者の力になりたいですし、
パクリサイトで埋め尽くされた検索結果は見たくないです。
そのためにも、パクリサイト対策に関して新しい情報を得られれば、ここに追記していきます。

また、パクリサイトに困っている人は、ご連絡いただければ、私の知りうる範囲で回答します。
私は法律の専門家ではありませんが、サイト運営者の立場からできることもあると思います。
DMCA侵害申し立て承認、その後取り消しとか、弁護士さんや弁理士さんのお世話になったり、
一応いろいろとやってきましたので。